한국 KAIST 연구진, 시각 성능 높이는 멀티모달 대형언어모델 개발 성공
페이지 정보
작성자 TISSUE 작성일 24-06-20 18:04 댓글 0본문
1. KAIST 연구진, 미국 오픈AI의 모델을 넘는 공개형 멀티모달 대형언어모델 개발.
2. 이미지 분할 기술 '크레용 프롬프트'로 시각 성능 향상.
3. 추가 3개 컴퓨터 비전 모델 개발로 이미지 분석 기술 혁신.
[설명]
한국과학기술원(KAIST) 연구팀이 미국 오픈AI의 모델을 능가하는 공개형 멀티모달 대형언어모델을 개발했습니다. 이들은 시각 성능을 향상시키는 새로운 이미지 분할 기술인 '크레용 프롬프트'를 제안했고, 이를 통해 이미지 내의 배경과 물체를 더 정확하게 분리할 수 있게 되었습니다. 또한, 3개의 추가 컴퓨터 비전 모델을 개발하여 이미지 분석 기술을 혁신적으로 발전시켰습니다. 이러한 연구는 자연어 처리 분야에서도 뛰어난 성과를 얻어 국제 학회에서 소개되었습니다.
[용어 해설]
- 멀티모달 대형언어모델(LMM): 텍스트와 이미지 등 여러 모드의 정보를 함께 처리하는 대규모 언어 모델.
- 크레용 프롬프트: 이미지 분할 기술로, 배경과 물체를 정확히 구분해내는 방법.
[태그]
#KAIST #멀티모달대형언어모델 #이미지분석 #크레용프롬프트 #컴퓨터비전 #인공지능 #한국과학기술원 #연구개발 #기술혁신 #자연어처리 #인공지능모델 #시각인식
관련링크
추천0 비추천 0
댓글목록 0
등록된 댓글이 없습니다.