↑ 업스테이지의 김상훈 리더와 김윤수 마스터. [이충우 기자] |
27일 업스테이지에 따르면 이번 AI 경진대회는 미국의 비영리 교육 기술 조직인 커먼릿(CommonLit)이 주최한 '커먼릿 가독성 프라이즈(CommonLit Readability Prize)' 대회다. 초중고 학생의 읽기 수준에 맞는 텍스트를 추천하기 위해 텍스트의 난이도를 자동으로 판별해주는 머신러닝 알고리즘을 구축하는 것이 대회의 목표였다.
업스테이지 팀(김상훈 리더, 김윤수)은 대회 상위 1%에게 주어지는 금메달을 획득했다. 종전 기술은 문장을 구성하는 단어의 개수, 단어의 문자 수, 언어의 품사 정보 등을 활용한 피처를 사용했다. 하지만 이같은 방식이 텍스트 전체의 맥락을 파악하지 못하는 단점이 있었고, 업스테이지에서는 기존 통계적 피처에 텍스트의 맥락을 파악하는 언어 모델을 추가한 알고리즘을 개발했다.
김윤수 마스터는 이번 금메달 획득으로 국내에서 6번째 캐글 그랜드마스터가 됐다. 캐글 글로벌 랭킹 24위에도 안착했다. 캐글은 글로벌 기업들이 해결하고 싶은 과제와 데이터를 올리면, 전 세계 개발자들이 오픈이노베이션 방식으로 해결책을 내놓고 승부를 겨루는 온라인 AI 경진대회 플랫폼이다
특히 김 마스터는 서울대학교 경제학부 4학년에 재학중인 '문과생(외국어고)' 출신으로 개발 영역에서도 독보적인 역사를 쓰고 있다. 그는 업스테이지가 만든 '글로벌 레지던시'라는 1년짜리 인턴제도에 선발돼 일하고 있다. 수학을 좋아하지만, 평범한 문과생이었던 그는 대학 2학년 교양으로 프로그래밍 수업을 듣고 AI에서 적성을 찾았다. 이후 글로벌 온라인 학습 플랫폼 '코세라'의 강의 등을 통해 독학으로 실력을 키워왔다.
김 마스터는 "작년까지만 해도 그랜드마스터는 꿈도 못 꾸는 일이었던 것 같다. 그런데 업스테이지에서 김상훈 리더님을 만나고, 업스테이지의 성능 좋은 GPU 장비를 활용하며 딥러닝을 개발해온 것이 큰 도움이 됐다"고 설명했다. 세상에 정말 필요한 서비스를 만드는 게 궁극적인 목표인 그는 "최신 자료를 찾아볼 때 구글링을 하게 되는데, 대부분 영어 자료로 만들어져있기 때문에 영어를 평소에 열심히 해두는 것은 효과적인 AI공부법 중 하나"라고 덧붙이기도 했다.
한편 이번 대회를 함께 이끈 업스테이지의 김상훈 리더는 2020년 국내 3번째 캐글 그랜드마스터로 등극한 바 있다. 김 리더는 14년 경력의 머신러닝 엔지니어이자 데이터 사이언티스트다. 지금까지 캐글에서 10개의 금메달을 땄고 세계 랭킹 15위에 올라 있다. SK플래닛, 이베이코리아 등 대기업에서 일했던 그는 지난해 10월 김성훈 홍콩과기대 교수가 창업한 업스테이지에 합류했다.
김 교수는 네이버에서 글로벌 AI 연구개발을 총괄했던 세계적인 AI 석학이다. 현재 업스테이지 직원 45명 중 개발직만 약 77%다. 업스테이지는 최근 한국어 자연어 처리 관련 산학계의 전문가들
[홍성용 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]