![]() |
↑ KAIST 이 교수 연구팀에서 개발한 심층 신경망(최신 편향)의 동작 개념도. [사진 제공 = KAIST] |
20일 한국과학기술원(KAIST)은 이재길 전산학부 교수 연구팀이 딥러닝의 예측정확도와 훈련 속도를 각각 최대 21% 및 59% 향상시킬 수 있는 모델 학습 기술을 개발했다고 밝혔다.
이 교수 연구팀이 개발한 기술은 심층 학습 모델의 학습 진행 상황에 맞게 최적의 배치를 구성하도록 하는 기술이다. 심층 학습 모델을 학습하는 과정은 반복적으로 모델의 매개변수를 최적화하는 단계로 이뤄진다. 반복마다 훈련 데이터로부터 일부를 선정해 최적화에 사용하게 된다. 이때 선정된 데이터 샘플을 배치(batch)라 부른다. 무작위로 배치를 선택하면 최고의 정확도가 보장되지 않기 때문에 최근 인공지능 학계에서는 더 나은 배치 선택 방법에 관한 연구가 활발히 진행되고 있다.
연구팀은 새로 개발한 배치 선택 방법론에 '최신 편향(Recency Bias)'이라는 이름을 붙였다. 연구팀은 이 방법론을 이미지 데이터에 널리 활용되는 다양한 합성 곱 신경망(CNN)의 학습에 적용했다. 그 결과 기존 방법론 대비, 예측정확도(이미지 분류 문제)에서 최대 21% 오류를 감소시키는 한편 훈련 속도(심층 신경망 미세 조정 문제)에서는 최대 59% 시간을 단축했다.
이재길 교수도 "이 기술이 텐서플로우(TensorFlow) 혹은 파이토치(PyTorch)와 같은 기존의 심
[이종화 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]