구글 딥마인드가 유전자 정보를 예측하는 인공지능(AI) 모델을 공개했다. DNA 글자 100만 개를 한 번에 분석할 수 있는 등 기존 모델과 차별화된 기능을 갖췄다.
딥마인드는 26일 공식 블로그를 통해 AI 기반 DNA 서열 분석 모델 '알파지놈(AlphaGenome)'을 연구용 API 형태로 공개했다고 밝혔다. 누구나 비상업적으로 해당 모델을 이용할 수 있다.
알파지놈은 DNA 글자 100만 개를 읽고 각 염기 수준에서 정밀하게 예측할 수 있다. 긴 서열을 높은 해상도로 분석할 수 있어 멀리 떨어진 유전자 조절 영역까지 해석할 수 있다. 딥마인드가 해당 모델에 컨볼루션과 트랜스포머 구조를 탑재해 가능한 기능이다.
데미스 하사비스 구글 딥마인드 공동 창업자 겸 최고경영자(CEO). (사진=구글 딥마인드)
또 유전자가 언제, 어디서, 얼마나 작동하는지 나타내는 다양한 조절 정보를 예측할 수 있다. 변이 서열과 원래 서열의 차이를 빠르게 비교해 유전 변이가 미치는 영향을 1초 안에 평가하는 기능도 갖췄다.
RNA가 잘리는 접합부까지 직접 예측할 수 있어, 스플라이싱 오류로 생기는 희귀 질환 분석에도 활용 가능하다.
알파지놈이 주요 DNA 서열·변이 예측 과제에서 기존 최고 모델들과 비교해 얼마나 성능이 향상됐는지를 보여주는 막대 그래프. (사진=구글 딥마인드 블로그)
딥마인드는 이 모델이 24개 예측 과제 중 22개에서 기존 최고 모델보다 높은 성능을 기록했다고 밝혔다. 조절 효과 예측 과제에서는 26개 중 24개에서 최상위 성능을 보였다고 설명했다.
이 모델은 기존 '엔포머(Enformer)' 기반으로 작동한다. 이용자는 단백질 코딩 영역에 특화된 '알파미스센스(AlphaMissense)'와 모델을 함께 사용할 수 있다. 이에 유전체 98%를 차지하는 비코딩 영역까지 분석할 수 있어 희귀 질환 연구에 활용 가능하다.
모델 학습에는 ENCODE, GTEx, FANTOM5 등 대규모 유전체 데이터가 사용됐다. 사람과 생쥐의 다양한 조직과 세포 데이터도 포함됐다.

관련기사
- 민주당, 김홍일 방통위원장 탄핵 추진..."6월내 통과 목표"2024.06.27
- 김홍일 위원장 "2인 체제 방통위, 바람직하지 않지만 위법 아니다”2024.06.21
- LG 구광모 6년...AI·바이오·클린테크 키운다2024.06.28
- 화재 막는 배터리 진단기술 뜬다...민테크, 상장 후 존재감 '쑥쑥'2024.06.28