네이버웹툰이 인공지능(AI) 기술을 활용해 웹툰 속 이미지와 대사를 소리 내 읽어 주는 ‘인공지능 대체 텍스트’ 기능을 내년 초 시범 출시한다. ‘2022 널리 웨비나’ 화면 갈무리
네이버웹툰이 인공지능(AI) 기술을 활용해 웹툰 속 이미지와 대사를 소리 내 읽어 주는 ‘인공지능 대체 텍스트’ 기능을 내년 초 시범 출시한다. ‘2022 널리 웨비나’ 화면 갈무리

“시각장애인이 전체 인구의 0.5%도 안 되는데, 이들을 위한 서비스가 다른 것보다 우선하는 게 맞을까?”

윤승섭 네이버웹툰 서비스 기획자는 5일 오후 네이버 주최 ‘4차산업 기술이 적용된 현재 접근성과 미래 기술’을 주제로 연 ‘2022 널리 웨비나’에서 이런 질문부터 던졌다. 그는 이어 “시각장애인 이용자와 일반 이용자의 관계를 대립 관계, 혹은 양자택일 관계로 나누기보다 ‘앤드’(and, 함께) 관계로 보고 접근성 원칙을 추구하기로 했다”고 밝혔다.

네이버웹툰은 시각장애인들도 제약 없이 웹툰 서비스를 즐길 수 있도록 하기 위해 크게 두 가지 도구를 활용했다. 윤 기획자는 “다행히 요즘 출시되는 아이폰이나 안드로이드폰 등 스마트폰에는 모두 ‘문자-음성 변환’(TTS·text to speech) 기능이 기본으로 내장돼 있어 ‘문제의 반은 덜었다’”고 설명했다. 하지만 이 기능으론 텍스트 파일 형태로 된 대사만 읽어줄 수 있을 뿐, 이미지 속에 포함된 대사를 따로 추출해 읽어주거나 인물의 행동과 배경 화면 등을 해설해주기엔 부족하다.

광고

“간단히 생각하면 영화 속 자막 정보처럼 웹툰에도 텍스트 정보를 하나하나 입력하면 되겠죠. 하지만 이미 제공 중인 웹툰 작품 수가 수천 개, 에피소드 단위로는 십수만개에 달하는 데다, 매주 수백 개 에피소드가 새로 추가되는 상황에서 사람이 이 작업을 하나하나 한다는 것은 불가능했습니다.”

그래서 인공지능(AI)의 도움을 구했다. 윤 기획자는 “인공지능 부서와 협업해, 웹툰 속 이미지와 대사를 자동으로 문자로 변환해 주는 ‘인공지능 대체 텍스트’ 기능을 개발했다”고 설명했다. 여러 차례 테스트와 수동 검수를 거쳐 실제 서비스에 적용할 수 있는 수준의 성능을 내기까지 1년 가량의 시간이 소요됐다. 네이버웹툰은 2023년 1월 네이버웹툰 앱을 업데이트하면서 이 기능을 시범 탑재할 예정이다.

광고
광고

실제로 드라마에 이어 웹툰으로도 나온 ‘이상한 변호사 우영우’ 속 한 장면을 들어 봤다. 스마트폰 속 웹툰 앱 화면은 인물과 배경이 분간되지 않을 정도로 흐릿하게 보였지만, “이 사건은 재미있습니다. 제가 좋아하는 고래 퀴즈 같아요. 정답은 ‘고래를 낳을 수 없다’입니다”하는 주인공 우영우의 목소리가 또렷하게 들렸다. 윤 기획자는 “눈으로 보는 것만큼 완벽하게 스토리가 전달되진 않더라도 기본적인 내용을 이해하는 데에는 도움이 된다”며 “이제 막 시작한 단계이지만 큰 진전이라고 생각한다”고 말했다.

네이버웹툰 관계자는 “아직은 웹툰 속 여러 등장인물의 대사를 구분하는 기능이나 인물의 표정, 인물 뒤 배경 등까지 음성으로 전환해 들려주는 기능은 갖추지 못했다”며 “향후 실제 서비스를 제공하면서 시각장애인 당사자들로부터 수렴한 의견을 반영해 가며 기능을 완성해 나가겠다”고 말했다.

광고
네이버웹툰 인공지능 대체 텍스트 서비스 구조도. ‘2022 널리 웨비나’ 화면 갈무리
네이버웹툰 인공지능 대체 텍스트 서비스 구조도. ‘2022 널리 웨비나’ 화면 갈무리

네이버웹툰은 인공지능이 추출한 문자를 사람이 한 번 더 보완할 수 있도록 해주는 운영 도구도 만들었다. 윤 기획자가 웹툰 속 특정 장면을 도구에 넣자, 인공지능이 전체 이미지 파일 중 말풍선이 어디에 있는지 인식한 뒤 검은색 ‘박스’를 쳤다. 이어 박스 속 대사를 추출한 결과값을 말풍선 순서에 따라 텍스트 형태로 보여줬다. 인공지능이 인식한 대사 순서가 매끄럽지 않다면 ‘드래그 앤드 드롭’으로 간단히 수정하거나 삭제도 할 수 있다.

윤 기획자는 “인공지능 대체 텍스트 기능은 시각장애인을 위한 서비스로 출발했지만, 조금 더 고민하면 일반 이용자를 위한 서비스에도 쓰일 수 있을 것”이라고 강조했다. 예를 들어, 한국어 웹툰을 여러 언어로 번역해 해외에 유통하기 위해 필요한 언어 작업에 활용할 수 있도록, 번역가들이 작품 속 대사를 텍스트로 추출해 다운받도록 할 때 이 기능이 쓰일 수 있다. 또 모든 작품의 대사와 그 대사의 위치 정보 데이터를 확보하고 있다 보니, 이용자가 작품 속 대사를 검색하면 바로 해당 장면 이미지를 보여주는 기능도 제공할 수 있다.

이지훈 네이버웹툰 인공지능 개발자는 “인공지능을 활용한 자동화, 특히 인공지능과 사람 사이의 유기적 협업을 통해 지속가능한 접근이 가능해질 것으로 기대한다”며 “접근성을 높이면 장애인뿐 아니라 모든 이가 도움을 받을 수 있다”고 말했다.

네이버는 올해로 열 번째 ‘널리 웨비나’를 열고 정보 접근성을 높이기 위한 기업 및 학계의 경험과 노하우를 사회에 공유해 왔다. 이날 행사에선 네이버웹툰뿐 아니라 다양한 기업과 연구기관이 장애인 등 취약계층의 온라인 서비스 이용 접근성을 높이기 위해 시도해 온 일들을 소개했다. 고려대 연구진은 색약 등 색각 이상자의 웹툰 감상을 돕는 ‘웹툰 색약 교정 알고리즘’ 개발기를 발표했고, 카이스트 연구진은 장애인 게이머가 게임 활동을 매개로 가족·친구·사회와 소통하며 관계 형성에 도움을 받은 사례를 발표했다.

정인선 기자 [email protected]