Ohse AI LabOHSE AI LAB
한국어 AI 연구 일러스트
🤖 AI 연구

한국어 AI의 현재와 미래: KULLM에서 KURE까지

오세랩··3분 읽기

한국어 AI의 현실

글로벌 AI 시장에서 한국어는 **저자원 언어(low-resource language)**에 해당합니다. 이는:

  • 고품질 한국어 학습 데이터가 영어에 비해 부족
  • 한국어 특유의 문법·문화적 맥락 반영 필요
  • 도메인 특화 데이터셋의 중요성

을 의미합니다.

AI 발전 타임라인 — 초기 모델부터 현대 LLM까지의 진화

KULLM: 한국어 오픈소스 LLM

KULLM(Korean Universal Language Model)은 한국어에 특화된 명령어 튜닝 LLM입니다.

주요 특징

  • 한국어 대화 능력 최적화
  • 오픈소스로 공개하여 연구 생태계 기여
  • 다양한 다운스트림 태스크 성능 검증
# KULLM 사용 예시
from kullm import KULLMModel

model = KULLMModel.from_pretrained("kullm-3b")
response = model.generate("가족법인 설립 절차를 설명해주세요.")
print(response)

KURE: 진실성·일관성 연구

KURE는 생성 AI의 **진실성(truthfulness)**과 **일관성(consistency)**을 연구하는 국가 100대 R&D 프로젝트입니다.

연구 목표

  1. 할루시네이션 검출: AI가 생성한 허위 정보를 자동으로 식별
  2. 사실 기반 생성: 신뢰할 수 있는 출처에 기반한 응답 생성
  3. 일관성 평가: 동일 질문에 대한 답변의 일관성 측정

MMTEB: 다국어 임베딩 벤치마크

MMTEB(Massive Multilingual Text Embedding Benchmark)는 ICLR 2025에 채택된 다국어 텍스트 임베딩 평가 프레임워크입니다.

  • 100개 이상 언어 지원
  • 한국어 포함 다양한 태스크 벤치마크
  • 표준화된 평가 방법론 제시

오세랩의 AI 연구 방향

오세랩은 단순한 AI 연구를 넘어, 실용적인 제품으로의 전환을 추구합니다:

연구제품 적용상태
KULLMERP 자연어 질의개발 중
KURE콘텐츠 신뢰성 검증연구 단계
MMTEB검색 품질 평가적용 완료

AI 기술은 연구실에서 끝나지 않아야 합니다. 실제 문제를 해결하는 도구로 만들어야 합니다.

AI 기술이 궁금하신가요?

오세에이아이연구소의 AI 연구와 제품에 대해 문의해주세요.

문의하기

관련 글