한국어 거대언어모델(LLM) 평가 체계 'Open Ko-LLM 리더보드' 개편 > 과학

과학

한국어 거대언어모델(LLM) 평가 체계 'Open Ko-LLM 리더보드' 개편

페이지 정보

작성자 TISSUE 작성일 24-08-13 00:40 댓글 0

본문

한국어 거대언어모델(LLM) 평가 체계 Open Ko-LLM 리더보드 개편

newspaper_51.jpg

1. 'Open Ko-LLM 리더보드'가 12일 전면 개편됨.
2. 총 9개의 새로운 벤치마크 추가.
3. 리더보드는 LLM의 문제해결 능력 등에도 집중.
4. 모든 LLM에 적용될 예정.

[설명]
국내 최대 개방형 한국어 거대언어모델(LLM) 평가 체계인 'Open Ko-LLM 리더보드'가 새로운 벤치마크를 추가하면서 전면 개편되었습니다. 이에 총 9개의 새로운 지표가 도입되었는데, 대학원 수준 추론, 상식 추론, 초등 수학, 감성, 지시 이행, 한국어 신뢰성, 사회적 가치, 무해성, 실용성 등이 포함됩니다. 이번 리더보드 개편은 LLM의 기본 언어능력뿐만 아니라 문제해결 능력 등 실용적인 부분에 집중하며, 새로운 벤치마크는 미래에 제출될 모든 LLM에 적용될 예정입니다.

[용어 해설]
- 거대언어모델(LLM) : 대규모 텍스트 데이터를 사용하여 자연어 처리 및 이해를 위한 모델
- 벤치마크 : 성능이나 효율성을 측정하기 위한 기준 또는 비교 대상

[태그]
#KoreanLanguageModel #LLM #한국어_모델 #언어처리 #한국어평가 #AI #사회적가치 #산업분야적용 #한국어지원 #언어모델