↑ 국내 첫 초대규모 AI이자 세계 최대 한국어 언어모델인 `하이퍼클로바` [사진 = 네이버] |
네이버는 25일 온라인으로 연 '네이버 AI 나우( NAVER AI NOW)'에서 국내 첫 초대규모 AI인 하이퍼클로바를 공개했다.
하이퍼클로바는 AI 모델의 크기를 나타내는 파라미터(parameter, 매개변수)가 2040억개로, 일론 머스크 테슬라 최고경영자(CEO)가 주도해 설립한 오픈AI GPT-3의 파라미터(1750억개)를 뛰어 넘는다.
파라미터 수가 높을수록 AI는 더 많은 문제를 해결할 수 있다.
정석근 네이버 클로바 CIC(Company-In-Company) 대표는 "글로벌 기술 대기업들은 대형 AI 모델이 가져올 파괴적 혁신에 대한 기대로 투자를 가속화하고 있다"며 "한국의 AI 기술이 글로벌 플랫폼에 종속되지 않기 위해 이미 공개된 기술을 활용하고 따라잡는 수준에 그칠 수 없다고 판단했다"고 개발 배경을 설명했다.
하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 이상 학습해 현 기준 전세계에서 가장 큰 한국어 언어모델이 됐다.
학습 데이터 대부분이 영어인 GPT-3와 달리 하이퍼클로바의 학습 데이터 중 한국어 비중은 97%에 달한다.
네이버는 "영어 중심의 글로벌 AI 모델과 달리 한국어에 최적화한 언어모델을 개발함으로써 AI 주권을 확보한다는 의미도 있다"고 전했다.
네이버는 이를 위해 지난해 10월 국내에서 처음으로 700 페타플롭(PF) 성능의 슈퍼컴퓨터를 도입해 대용량 데이터 처리를 위한 인프라를 갖췄다. 또한, 5600억개에 달하는 한국어 형태소를 데이터로 구축했다.
하이퍼클로바는 일상 속에서 AI가 더 많이 쓰이도록 다양한 문제에 적용할 수 있다. 예를 들어, 지난 6일 네이버 검색 서비스에 하이퍼클로버가 적용 되면서 사용자가 검색어를 잘못 입력하는 경우 올바른 단어로 전환해 검색하거나 적절한 검색어를 추천해주는 식이다. 네이버는 중소상공인(SME), 크리에이터, 스타트업 등 기술적 도움이 필요한 곳에 AI 전문가가 아닌 누구나 하이퍼클로바를 이용할 수 있도록 지원할 방침이다. 상품을 팔 때 도움이 되는 마케팅 문구를 자동으로 작성해주거나, 공부할 내용을 요약하고 질문에 답하는 것 등에 하이퍼클로바가 쓰일 수 있다.
앞서 네이버는 서울대학교와 '서울대-네이버 초대규모(Hyperscale) AI 연구센터'를 설립하고, 카이스트 AI 대학원과 '카이스트-네이버 초창의적(Hypercreative) AI 연구센터'를 세웠다. 지난 한 해 전세계 AI 컨퍼런스에서 국내 기업 중 가장 많은 43개 정규 논문을 발표했다.
네이버는 앞으로 한국어 외 다른 언어로 모델을 확장하고, 영상과 이미지도 이해하는 '멀티모달(Multimodal) AI'로 하이퍼클로바를 발전시켜나갈 계획이다.
정 CIC 대표는 "이전에 우리가 상상만 했던, 또는 상상하지 못했던 일들마저 가능해지는 새로운 AI의 시대가 열리고 있다"며 "'AI 기술이 필요한 모두에게 새로운 경험을 제공할 것"이라고 말했다.
↑ 지난 17일 온라인으로 열린 LG의 AI 토크 콘서트 현장. 배경훈 LG AI연구원장이 초대규모 AI에 1억달러를 투자한다고 발표하고 있다. [사진 = LG] |
현재 기술 개발의 기준이 되는 것은 미국 AI연구소인 오픈AI가 만든 GPT-3다. 자연스러운 대화가 가능하고 소설 등을 창작할 수도 있으며 상위 1% 전문가 수준의 역량을 보유했다. 이에 맞서 최근 중국 화웨이가 GPT-3을 넘는 2000억개 파라미터의 초대규모 AI인 판구 알파를 내놓기도 했다.
국내에서는 LG가 앞으로 3년 동안 1억 달러(약 1100억원) 이상 투자해 초대규모 AI를 개발하기로 했다. 올 하반기 6000억개 파라미터의 초대규모 AI를 공개하고, 내년 상반기엔 조 단위 파라미터의 초대규모 AI를 선보일 계획이다.
엔씨
[배윤경 매경닷컴 기자 bykj@mk.co.kr]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]