기존보다 30배 더 빠른 생명과학 데이터 분석도구 개발

과학입력 :2025-07-03 12:01:36    수정:

기존보다 최대 30배 빠른 생명과학 데이터 분석 도구가 개발됐다.

기초과학연구원(IBS, 원장 노도영)은 의생명 수학그룹 김재경 CI(KAIST 수리과학과 교수) 연구팀이 세포 분류(클러스터링) 결과의 안정성을 수학적으로 평가해 불안정한 결과를 새로운 방법으로 걸러내는 분석 도구 ‘scICE'를 개발하고, 깃허브 사이트에 공개했다고 3일 밝혔다.

이 도구는 깃허브를 통해 누구나 활용이 가능하다.

IBS 연구진. 왼쪽이 김재경 CI(교신저자), 오른쪽이 김현 선임연구원(제1저자)이다.

'scICE'는 한 번의 분석만으로도 얼마나 일관성 있게 결과가 도출됐는지를 수학적으로 평가한다. 새로 도입한 ‘불일치 계수(IC)'(결과값 유사성 판별 기준)를 통해 많은 계산량이 요구되는 연산 없이도 클러스터 간 안정성을 정량적으로 판단할 수 있다.

제1저자인 김현 선임연구원은 "모든 세포를 일일이 비교하던 기존 방식과 달리, 불일치 계수를 활용한 안정성 평가는 클러스터 구조 간 유사성만 평가해 비교 대상을 획기적으로 줄일 수 있어 분석 시간을 크게 단축한다"고 설명했다.

연구팀은 뇌, 폐, 혈액 등 다양한 조직에서 수집된 48개의 실제 및 모의 'scRNA-seq' 데이터에 'scICE'를 적용해 유효성을 입증했다.

기존 분석 결과 중 약 3분의 2는 통계적으로 불안정하며 신뢰하기 어렵다는 사실도 밝혀냈다. 반면, 'scICE'는 신뢰할 수 있는 결과만을 선별해 연구자의 시간과 계산 자원을 절약하면서도 정확도를 한층 높였다.

또한, 'scICE'는 일반적인 클러스터링으로는 놓치기 쉬운 희귀한 세포 유형을 효과적으로 탐지했다. 실제 일부 데이터에서 찾기 어려웠던 희귀 면역세포들을 'scIC'E 기반의 서브클러스터링을 통해 안정적으로 식별해냈다.

김홍일 방통위원장

관련기사