↑ 3차원 형태의 단백질 구조 [사진 제공 = 딥마인드] |
30일(현지시간) 딥마인드는 단백질 구조를 파악하는 AI인 '알파폴드'가 AI들의 단백질 구조 예측 능력을 평가하는 대회인 'CASP'에서 유전정보만으로 과학자들이 실험으로 사전에 밝혀낸 단백질 구조와 90%이상 일치하는 결과를 얻었다고 밝혔다. 알파폴드의 '능력'은 향후 생명과학과 의학연구에 혁신을 가져올 것이라는 게 과학자들의 기대다. 당장 코로나 19 치료제 개발에도 큰 기여를 할 수 있을 것이라는 예측도 나온다. 데미스 하사비스 딥마인드 창업자 겸 최고경영자(CEO)는 "(사회적인) 영향력 측면에서 볼 때 우리가 지금까지 해 낸 일 중에 가장 중요한 성과라고 생각한다"고 밝혔다.
단백질은 아미노산으로 이뤄져있는 '아미노산 사슬'이다. 20종류의 아미노산이 이어져 단백질이 만들어진다. 종류가 다른 아미노산은 서로 당기거나 미는 등의 상호작용을 하는데, 이 상호작용으로 인해 사슬이 서로 접히면서 삼차원 구조의 단백질이 만들어진다. 과학자들은 단백질을 이루는 아미노산을 파악하고, 종류별로 다른 아미노산의 상호작용 에너지를 계산하는 등의 과정을 통해 이들이 실제 어떤 단백질 구조가 되는 지를 예측해왔다. 하지만 워낙 물리적인 변수가 많아 사실상 계산만으로는 예측이 어려웠다. 과학자들은 생화학 분자를 영하 200도 이하의 극저온 상태로 급냉각시켜 정밀 관찰하는 방식의 전자현미경인 극저온전자현미경을 이용하거나 단백질 결정을 만들어 결정에 X선을 쏘는 방식으로 단백질 구조를 예측했다.
딥마인드는 이러한 과정을 거치는 대신 과거 실험을 통해 확인된 단백질의 3차원 구조정보와 DNA 유전 정보를 알파폴드에게 학습시켰다. 수차례 수많은 정보를 반복학습시키는 딥러닝을 통해 알파폴드는 아미노산 서열 정보와 단백질 입체 구조간의 연관관계를 스스로 익혀나갔다.
단백질 구조 예측 기술은 특히 신약 개발에 유용하게 사용된다. 예를 들어 코로나19 바이러스의 표면은 스파이크 단백질이라고 불리는 뾰족한 돌기로 쌓여있는데, 이 스파이크를 통해 인체 세포에 달라붙는다. 단백질 구조 예측 기술을 통해 스파이크 단백질 구조를 예측하고, 스파이크가 인체 세포에 달라붙지 못하게 이 돌기를 감쌀 수 있는 단백질을 디자인 하는 식으로 신약을 개발할 수 있다. 특히 단백질 구조 예측에서 비용과 시간이 크게 절약되면 코로나19를 비롯한 감염병에 신속한 대응이 가능해질 전망이다.
실제 알파폴드는 올해 초 중국에서 코로나19의 유전정보를 공개하자마자 단백질 구조를 예측하는 데 성공했다고 발표하기도 했다.
신약을 개발하는 시간을 획기적으로 줄일 수 있을 뿐 아니라 기존 치료제 중에서 코로나19 바이러스 등 현재 유행하는 바이러스의 단백질에 가장 잘 결합해 바이러스를 무력화 시킬 수 있을 만한 약물을 골라내는 데 활용할 수도 있다.
알파폴드는 지난 10년동안 독일 막스 플랑크 연구소가 알아내려고 시도했지만 번번히 실패했던 박테리아 단백질 구조를 단 30분만에 알아냈다.
영국 구조생물학자이자 CASP 심사위원 경력이 있는 자넷 손튼 박사는 네이처와의 인터뷰에서 "알파폴드를 통해 아직 밝혀내지 못한 수천개 단백질 기능을 알아낼 수 있을 뿐 아니라 사람마다 다른 질병을 일으키는 유전자 변이를 이해하는 데 도움이 될 수 있을 것"이라고 밝혔다.
[이새봄 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]