![]() |
미국 커뮤니티 사이트 레딧에 따르면 데이비드 실버 딥마인드 수석 프로그래머는 영국 런던대학교(UCL)에서 지난 24일(현지시간) 가진 강연을 통해 알파고의 현 Elo 레이팅 점수가 약 4500점이라고 밝혔다. Elo 레이팅은 바둑, 체스처럼 사람간 실력을 겨루는 경기에서 승패 결과에 기초해 실력을 평가한 점수 체계다.
놀라운 것은 알파고의 점수다. 바둑 Elo 레이팅 랭킹 사이트인 고레이팅에서 현재 세계 1위인 커제 9단의 점수는 3615점이다. 알파고가 무려 900점 가까이 높다. 900점은 세계 1위와 800등과의 점수 차이로 엄청난 격차다. Elo 점수가 735점 이상 벌어지면 상대를 절대로 이길 수 없는 것으로 추산된다. 즉 지금의 알파고는 커제 9단을 비롯해 어떤 프로기사가 도전해도 절대 이길 수 없는 기력을 보유했다고 볼 수 있다.
고레이팅에서 세계 2위는 이세돌 9단과 대국할 당시의 알파고로 3584점이다. 대국이 지난 15일 끝났다는 점을 감안하면 열흘도 안되는 시간 동안 강화학습을 통해 900점 가까이 올렸다고 추론할 수 있다. 3위는 한국의 박정환 9단, 4위는 일본의 이야마 유타 9단이며 이세돌 9단은 5위로 밀려난 상태다.
그러나 알파고의 Elo 레이팅 점수가 100% 신뢰할 수 있는 결과는 아니라는 것이 데이비드 실버의 설명이다. 인간 프로 기사와의 잇단 대국을 통해 얻은 것이 아니라 내부 테스트로만 산출한 결과이기 때문이다. 알파고는 기보를 분석함과 동시에 알파고끼리 대국을 두는 강화학습으로 기력을 향상시킨다. 이 때 실력이 떨어지는 알파고와 네점 점바둑으로 바둑을 두는 것으로 알려졌다. 이 결과로 Elo 레이팅을 측정한 결과 4500점대로 계산이 됐다는 설명이다.
하지만 프로기사와 승부를 벌인 결과가 아니라 알파고끼리와의 대국이기 때문에 실제 대국시 예상치 못한 변수가 등장한다. 이세돌 9단과의 대국에서 딥마인드는 Elo 레이팅에 기반해 5대 0 승리를 예측했다고 한다. 그러나 막상 대국을 진행하니 이세돌 9단이 1승을 챙겨 4대 1의 결과로 끝났다. 사람만이 보유한 직관, 창의력 등이 아직까지 알파고에게 변수로 작용하며 충분히 반영되지 않았다는 뜻이다. 구글도 이세돌 9단과의 대국이 이를 보완하기 위한 것임을 공공연히 밝힌 바 있다.
한편 알파고의 Elo 레이팅이 이세돌 9단과 대국을 가진 뒤 급격히 늘어났는지, 아니면 대국 당시 이미 4500이었는지는 논란이 있다. 데이비드 실버가 공개한 자료에 따르면 Elo 레이팅 4500대인 알파고의 버전은 v18로 이세돌 9단과 대국 당시와 동일하다. 따라서 이미 Elo 레이팅 4500이라는 막강한 기력을 쌓은 상태에서 이세돌 9단에게 도전했다는 것으로 볼수도 있다. 반면 버전이 동일하다고 기력이 같다고는 볼 수 없으며 당시 데미스 하사비스 딥마인드 최고경영자(CEO)가 경기 중 승률 70%를 언급한 것을 고려할 때 대국 이후 알파고의 기력이 상승한 것으로 봐야 한
딥마인드는 알파고를 온라인 바둑 사이트인 KGS에 데뷔시켜 바둑을 두게 할 것을 고려중인 것으로 알려졌다. 만약 알파고와 온라인에서 대국을 둘 수 있게 된다면 커제, 나아가 인간계와 알파고의 다음 승부를 통해 Elo 레이팅 4500의 기력을 직접 확인할 수 있게 될 전망이다.
[디지털뉴스국 김용영 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]