챗GPT, 91점으로 압도적 1위…바드·빙·하이퍼클로바X 순
"다수 전문가 참여로 평가 신뢰성 높여…충분히 시사점 줄 수 있을 것"
↑ 지난 6월 서울 63스퀘어에서 열린 '파이어사이드 챗 위드 오픈AI'에서 이준표 소프트뱅크벤처스 대표, 조경현 미국 뉴욕대 교수, 샘 올트먼 오픈AI 대표와 그레그 브록먼 공동창업자가 대담하고 있습니다. (연합뉴스 제공) |
지난해 11월 오픈AI의 챗GPT가 불러온 '생성형 AI' 신드롬 이후 MS와 구글, 네이버 등 국내외 IT 공룡들이 잇따라 생성형 AI 프로그램을 내놓으면서 경쟁이 치열해지고 있는 가운데 처음으로 이들의 생성형AI 성능을 비교 평가한 결과가 나와 이목을 끌고 있습니다.
한국AI교육협회가 서울대 스마트그리드연구센터와 숙명여대 AI융합비즈니스연구실과 공동으로 진행한 지난달 31일과 지난 2일 생성형 AI에 대한 성능 평가를 실시한 결과, 챗GPT가 91점(100점 만점)을 받았습니다.
챗GPT가 압도적인 점수 차이로 1위를 차지한 가운데 구글의 바드(79점), MS의 빙(51점), 네이버의 하이퍼클로바X(26점)가 뒤를 이었습니다.
↑ 4대 생성형 AI 성능 비교 평가 결과 |
이번 성능 평가는 ▲AI융합비즈니스 관련 논문 제목 ▲2024년 유망 비즈니스 ▲최근 전력 관련 사업 분야의 이슈 ▲산업 분야 AI 기술 활용 방안 등 총 4개 질문에 대해 5점 척도로 이뤄졌으며, 서울대 연구센터 자문교수와 참여기업 대표 등 10명, 숙명여대 연구원 10명 등 총 20명이 참가했습
이번 평가를 기획하고 총괄한 문형남 한국AI교육협회장은 "분야에 따라 평가 결과가 다소 달라질 수 있으나, 이번 평가에는 다수의 전문가들이 평가에 참여해 평가의 신뢰성이 있다"며 "생성형 AI 경쟁이 치열해지는 만큼, 관련 업계와 사용자에게 충분한 시사점을 줄 수 있을 것"이라고 전했습니다.
[유승오 기자 victory5@mbn.co.kr]