“우리의 언어-문화로”… 세계는 ‘소버린 AI’ 개발 붐

입력
기사원문
변종국 기자
본문 요약봇
성별
말하기 속도

이동 통신망을 이용하여 음성을 재생하면 별도의 데이터 통화료가 부과될 수 있습니다.

챗GPT선 “독도는 영토분쟁지역”
美빅테크에 가치관 종속 우려
佛 ‘르 챗’ 각광, 삼성전자 등 투자
국내선 네이버가 개발 적극 나서

“한국과 일본 간의 영토 분쟁 지역.”

미국 오픈AI의 생성형 인공지능(AI) ‘챗GPT’에서 ‘다케시마(竹島·일본이 독도를 가리키는 명칭)’를 검색하면 나오는 설명이다. 독도는 대한민국 영토임에도 다케시마로 검색하면 편향된 답변이 나오는 것이다. ‘독도’로 검색을 하면 “대한민국 정부가 실효적으로 지배하고 있다”고 답한다. 정보기술(IT) 업계 관계자는 “챗GPT는 미국에서 만들어진 거대언어모델(LLM)이라서, 특정 지역의 역사나 문화 등을 완전히 이해하지 못하는 일이 있다”고 분석했다.

최근 글로벌 IT 업계에 ‘소버린 AI’가 화두다. 자주, 주권을 뜻하는 ‘소버린(sovereign)’과 AI를 합친 말이다. 자국, 자체 데이터와 인프라로 역량을 갖춰 지역 언어와 문화, 가치관 등을 반영한 LLM을 기반으로 만든 AI 서비스를 말한다. 특히 미국 중심의 빅테크들에 대한 가치관 종속을 우려하는 정부와 기업들이 관련 투자를 강화하는 추세다.

대표 주자는 프랑스의 미스트랄AI다. 7일 업계에 따르면 미스트랄AI는 자체 AI 모델을 개발해 ‘르 챗’이라는 생성형 AI를 개발했다. 지난해 4월 구글 딥마인드, 메타 출신 연구원들이 설립한 미스트랄AI는 스페인어, 프랑스어, 독일어 등 유럽연합(EU) 국가의 언어로 검색과 분석을 할 수 있다 보니, 유럽 사용자들에게 더욱 적합한 분석 결과가 만들어진다는 평가를 받는다. ‘챗GPT의 대항마’란 평가에 삼성전자와 엔비디아, 네이버 등도 투자를 했다. 글로벌 주요 기업들로부터 받은 투자 규모는 1조 원에 달하는 것으로 전해진다.

중국 스타트업 ‘문샷 AI’는 중국어 문장 처리에 특화된 챗봇 ‘키미’를 선보였다. 문샷 AI는 중국 알리바바가 지분 약 36%를 보유하고 있다. 인도 AI 스타트업 크루트림은 현지 인도어를 학습한 LLM ‘크루트림’을 내놨다. 힌디어와 타밀어, 텔루구어 등 10가지 이상의 현지어가 지원된다. 핀란드 스타트업 사일로는 북유럽 언어 기반 LLM인 ‘포로’와 ‘바이킹’을 공개했다.

각국 정부도 소버린 AI 강화에 열을 올리고 있다. 일본은 최근 미국 기술 의존도를 줄이고자 약 725억 엔(약 6200억 원)의 자금을 기업들에 지원하고 나섰다. 일본은 이미 엔비디아와 협력해 일본어 특화 LLM을 개발하고 있다. 지역별 건축 및 지형에 특화된 자연 재해 대응 방법이나 기후 변화 등을 분석하는 식이다.

대만은 올해 1월 중국의 AI 공세에 대응하고자 소버린 AI 강화에 약 7400억 원의 예산을 책정했다. 대만 사람들이 쓰는 번체자로 콘텐츠를 제공하는 AI 챗봇 ‘타이드’ 개발에 집중하겠다는 계획이다.

한국에서는 네이버가 가장 적극적이다. 네이버는 2021년 초거대 AI ‘하이퍼클로바’를 공개하고 지난해 성능을 개선한 ‘하이퍼클로바X’를 공개했다. 자체 개발한 LLM을 바탕으로 한국어 능력을 갖춘 것은 물론이고 한국의 사회·문화적 맥락에 대한 이해도가 높다는 평가를 받는다. 하정우 네이버 퓨처AI 센터장은 “미국 실리콘밸리 빅테크가 만든 생성형 AI는 90% 이상 미국 데이터로 학습해 미국 가치관에 편향돼 있다”며 “기술과 문화 종속, 국가 정체성 약화로 이어질 것을 우려하고 있다”고 말했다.

하지만 아직까지 소버린 AI 시장은 자국 언어 이해 및 처리에 좀 더 집중하고 있는 만큼, AI 모델이 문화와 역사적 맥락을 완전히 이해하는 단계로 발전하기까진 시일이 걸릴 것이라는 진단이 나온다. IT 업계 관계자는 “소버린 AI를 강화하려면 학습이 필수적이다. 정부가 양질의 공공데이터를 많이 제공하려는 노력이 필요하다”며 “기업도 개방된 데이터뿐만 아니라 양질의 저작권 있는 정보를 획득할 수 있도록 투자를 대폭 늘려야 한다”고 강조했다.

기자 프로필

그냥 누군가에게 “저 기자는 참 대단했어. 고마웠어. 멋졌어. 열심히 살았어”라고 기억되는 기자였으면 좋겠습니다.

이 기사는 언론사에서 경제, IT 섹션으로 분류했습니다.
기사 섹션 분류 안내

기사의 섹션 정보는 해당 언론사의 분류를 따르고 있습니다. 언론사는 개별 기사를 2개 이상 섹션으로 중복 분류할 수 있습니다.

닫기
이 기사를 추천합니다
3