'정확도 100%' 시각장애인 점자 번역 엔진
KAIST 가현욱 교수 연구팀이 개발
가현욱 교수 본인이 선천 중증 시각장애인
"한영 혼용표현, 괄호, 띄어쓰기까지 이해해 점자로 완벽히 번역"
뉴시스
[파이낸셜뉴스] KAIST(한국과학기술원)는 융합인재학부 재활인공지능연구실(Assistive AI Lab) 가현욱 교수 연구팀이 일반 글자(묵자)를 시각장애인이 읽을 수 있는 점자로 변환하는 차세대 점자 번역 엔진 ‘K-Braille(케이-브레일)’을 개발하고 성능 검증을 완료했다.
16일 KAIST에 따르면 ‘점역(點譯, Braille translation)’은 책, 문서, 웹페이지 등 일반 문자로 작성된 정보를 점자 체계에 맞게 변환하는 과정으로 시각장애인의 정보 접근을 위해 필수적인 기술이다. 그러나 한국어 점자 규정은 띄어쓰기, 기호, 외국어 표기 등 다양한 예외 규칙이 존재해 정확한 자동 점역이 쉽지 않다.
현재 시각장애인들이 사용하는 기존 점역 프로그램들은 문자나 기호를 단순 규칙에 따라 변환하는 방식이어서, 다국어(영문 등)·한글 혼용 표현이나 복합 단위 기호, 괄호 띄어쓰기 등 복잡한 규정 처리에서 오류가 발생하는 경우가 있었다.
연구팀이 개발한 K-Braille 엔진의 가장 큰 특징은 ‘문장을 이해하는 점역 시스템’이라는 점이다. 기존 점역 프로그램이 문자나 기호를 단순히 바꾸는 치환 방식이라면, K-Braille은 형태소 분석과 문장 구조 분석(AST, Abstract Syntax Tree)을 통해 문장의 구조와 맥락을 분석해 의미를 이해한 뒤 점자로 변환하는 기술이다. 이를 통해 외국어와 한글이 혼용된 문장, 복잡한 기호 조합, 단위 표기 등 개정된 점자 규정의 다양한 예외 상황을 보다 정확하게 처리할 수 있다.
점자 규정을 실제로 얼마나 정확하게 따르는지를 나타내는 ‘실질 점역 규정 준수율(True Adjusted Accuracy) ’은 100.0%로 나타났으며, 점자 문장의 구조가 정답과 얼마나 비슷한지를 보여주는 점역 형태소 구조 유사도도 평균 99.81%를 기록해 높은 점역 정확도를 확인했다. 국립국어원의 공식 점역 프로그램 ‘점사랑 6.3.5.8’과 동일 문장 세트를 이용한 비교 검증에서도 K-Braille이 더 높은 점역 일치율을 보였다.
이번 연구를 이끈 선천적 중증 시각장애인 연구자인 가현욱 교수는 “점자는 시각장애인에게 단순한 기호가 아니라 세상을 읽는 언어”라며 “이번 성과를 기반으로 향후 수학 수식과 과학 기호, 나아가 음악 악보까지 처리할 수 있는 차세대 점역 시스템으로 기술을 발전시킬 계획”이라고 말했다.
연구팀은 앞으로 기존 점자 파일 형식(.brf)의 한계를 넘어 새로운 점자 파일 형식을 만들고, 그 파일을 작성·읽기·공유할 수 있는 소프트웨어와 장치 환경을 함께 만드는 차세대 전자 점자 파일 포맷 ‘.brfx(Braille File eXtended)’ 생태계 구축도 추진할 계획이다. 특히 연구팀은 K-Braille 엔진을‘포용적 AI’기술로서 사회에 전면 무상으로 환원할 계획이다.