본문바로가기

한겨레21

기사 공유 및 설정

[한글날] 28글자만써도 손글씨 글꼴 1시간만에

손글씨 글꼴 프로젝트의 네이버 클로바 OCR팀
등록 2020-10-10 02:01 수정 2020-10-10 14:08
네이버 클로바 OCR팀. 앞줄 가운데가 이바도 OCR팀 리더. 네이버 제공

네이버 클로바 OCR팀. 앞줄 가운데가 이바도 OCR팀 리더. 네이버 제공

‘정성을 담았습니다. 맛있게 드세요. 리뷰 꼭 남겨주세요.’ 배달음식 포장에 손글씨 메모가 종종 눈에 띈다. 사장님이 직접 쓴 것이 아니라 인쇄된 손글씨일 때가 많다. 사람의 ‘정성’을 담아낸다는 ‘믿음’에서 ‘손글씨 마케팅’이 생겨났다.

그런데 손글씨를 컴퓨터 글꼴로 만들어내기란 쉽지 않은 일이다. 특히 한글은 초성·중성·종성이 조합되기 때문에 글꼴 제작에 한글 1만1223자(낱글자 포함)에 영문자·숫자·기호를 포함해 1만1317글자가 필요하다. 이 글자들을 모두 그려야 글꼴을 만들 수 있다. 머신러닝(기계학습)이 이 작업을 도와준다. 사람이 몇 글자를 직접 써 인공지능에 학습시키면 손글씨를 글꼴로 바꿔준다. 네이버가 2019년 한글날에 발표한 109종의 손글씨 글꼴은 이런 작업을 거쳐 태어났다.

손글씨 글꼴 생성 프로젝트를 수행한 이들은 네이버 클로바(인공지능) OCR(Optical Character Recognition·광학문자인식)팀이다. OCR는 사진 이미지 등에서 문자가 어디에 있는지, 그 문자가 무엇인지 확인해 디지털 텍스트로 변환하는 기술을 말한다. 9월28일 경기도 성남 네이버 본사에서 만난 이바도 OCR팀 리더의 말을 들어보자. “OCR 성능을 높이려면 실제 데이터로 (인공지능) 학습을 시키는 게 제일 좋은데, 이를 위해선 사람이 일일이 레이블링(그 문자가 무엇인지 라벨을 붙이는 작업)을 해줘야 해서 비용이 많이 든다. 그래서 다양한 이미지에 여러 글꼴의 글씨를 갖다 붙인 합성 데이터를 만들어 학습에 활용한다. 활자체 글꼴은 많지만 손글씨는 많지 않아, 손글씨 글꼴을 만들어보기로 했다.”

사람이 직접 쓴 손글씨(위)를 네이버 클로바 인공지능을 통해 제작한 손글씨 글꼴(아래). 네이버 제공

사람이 직접 쓴 손글씨(위)를 네이버 클로바 인공지능을 통해 제작한 손글씨 글꼴(아래). 네이버 제공

기술 개발 아이디어와 손글씨 글꼴을 갖고 싶다는 소망이 결합된 것이 2019년 네이버 손글씨 글꼴 프로젝트의 출발점이었다. 네이버는 사연과 함께 직접 쓴 손글자 256자를 받았다. 글자가 많을수록 학습할 데이터 양이 늘어나 글꼴 품질이 높아지지만, 초성·중성·종성이 결합하는 한글 구조를 고려해 직접 써야 하는 글자 수를 최소화했다. 우선 ①지원자들이 보낸 손글씨로 인공지능이 ‘선행학습모델’을 만들었다. 선행학습모델로 ②실제 글꼴을 만들 손글씨를 학습시키는 ‘파인튜닝’ 단계를 거친 뒤, 이를 ③다시 집중학습모델에 학습(‘제너레이션’)시켰다. ④후처리 작업까지 마치면 글꼴이 완성된다. 1년 전보다 성능이 발전한 덕분에 현재는 28글자만 써도 한글 손글씨 글꼴을 만들 수 있다. 소요 시간은 “보수적으로 생각해도 1시간 이하”다.(이바도 리더)

손글씨 글꼴 프로젝트를 기획한 박원경 네이버 클로바 기획담당은 “투병 중인 분이나 고려인 등 지원자들의 사연을 읽다보니 글씨에 그 이야기가 스며든 것처럼 보였다. 그것이 손글씨의 힘이라고 생각한다. 이용자가 다양한 손글씨 글꼴을 활용할 수 있도록 서비스 접점을 넓혀나갈 예정”이라고 했다.

박태우 기자 ehot@hani.co.kr

*한글날 특집-글 자 꼴 마 음 꼴
http://h21.hani.co.kr/arti/SERIES/2338/

한겨레는 타협하지 않겠습니다
진실을 응원해 주세요
맨위로