업스테이지, 새로운 OCR 기술 '도큐먼트 파스' 출시
페이지 정보
작성자 TISSUE 작성일 24-10-17 11:17 댓글 0본문
1. 업스테이지가 차세대 OCR 모델 '도큐먼트 파스'를 출시했다.
2. 도큐먼트 파스는 복잡한 문서도 정확히 분석해 데이터 자산화 가능하게 함.
3. AWS, MS 등 대기업의 서비스보다 5% 이상 높은 성능을 보임.
4. 도큐먼트 파스는 1분에 100장을 처리해 AWS Texttract보다 10배 빠르다.
[설명]
업스테이지가 새로운 차세대 OCR 모델 '도큐먼트 파스(Document Parse)'를 선보였다. 이 모델은 복잡한 형태의 문서도 정확히 분석하여 데이터 자산화를 가능하게 한다. DP-Bench 테스트에서도 AWS와 MS를 포함한 대기업 5개사의 서비스보다 높은 성능을 보여주었다. 또한 도큐먼트 파스는 AWS Texttract보다 10배 더 빠른 속도로 1분에 100장을 처리할 수 있다. 이 모델은 기업들이 기존 문서를 정확하게 자산화시켜 실제 업무에 효율적으로 활용할 수 있게 해준다.
[용어 해설]
- OCR (Optical Character Recognition) : 광학문자인식 기술. 이미지나 문서를 컴퓨터가 읽을 수 있는 텍스트로 변환하는 기술.
- LLM (Large Language Model) : 대규모 언어 모델을 의미하며, 많은 양의 데이터를 이용하여 학습된 언어 모델을 말함.
[태그]
#OCR #언어모델 #데이터자산화 #성능향상 #문서처리 #데이터분석 #업스테이지 #도큐먼트파스 #차세대기술 #문서자산화 #속도개선 #AWS
관련링크
추천0 비추천 0
댓글목록 0
등록된 댓글이 없습니다.