고문헌 한자를 인공지능이 읽어준다!
[우리문화신문=김영조 기자] 지능형 데이터 전문기업 ㈜누리아이디티(대표 배성진)는 6월 1일 인공지능 기반의 고문헌 한자 문자인식(OCR) 서비스를 출시했다. 누리IDT가 한문 고문헌 자료의 토털 솔루션으로 개발하고 있는 <고문헌한자시스템>의 대표 서비스로 개발하여 출시한 <고문헌 한자 OCR 서비스>는 우리나라의 고문헌 자료에 특화된 고성능 한자 자동인식 모델이다. 사용법은 간단해서, 화면의 원문 이미지 입력 창에 원문 한 면(JPG, PNG 포맷)씩을 올리면 인공지능(AI)이 이미지 속의 글자를 자동인식하고 곧바로 한자 텍스트로 출력해 준다. 인공지능 기반 평균 인식률 98%의 고성능 <고문헌 한자 OCR 서비스> 이 서비스의 개발 과정에서 인공지능 모델은 형태와 크기가 다양한 고문헌 속 한자를 3,000만 자 이상 학습하였다. 그 결과 일반적인 고문헌 형태, 곧 가장 많이 쓰이는 해서체나 행서체 글자에 세로쓰기로 제작된 목판본 자료에 대해서는 95~100%(평균 98%)란 높은 인식률을 구현하고 있다. 또한 손글씨로 작성된 필사본의 경우에도 전문가도 판독하기 어려운 초서 자료가 아니라면 상당한 수준의 인식률을 보이고 있다