닫기 공유하기

암 관련 유전자, 신속·정확하게 찾는 검색엔진 개발

[편집자주]


국내 연구진이 암 관련 유전자를 빠르고 정확하게 찾을 수 있는 검색엔진을 개발했다. 암 관련 유전자에 대한 방대한 양의 연구문헌을 수집 및 분석하는 데 유용한 도구가 될 것으로 기대된다.

박종철 KAIST 전산학과 교수 연구팀과 이현주 GIST 교수는 미래창조과학부가 추진하는 중견연구자지원사업의 지원을 받아 검색엔진 온코서치(http://oncosearch.biopathway.org)를 개발했다.

암은 수천개 이상 유전자의 비정상적인 변화와 그에 따른 신호전달 체계의 교란이 주요 원인이다. 따라서 암의 원인을 이해하고 치료하기 위해서는 이들 유전자의 변화와 암과의 관련성을 이해하는 것이 중요하다.

연구팀이 개발한 온코서치는 의학 및 생물학 연구문헌에서 유전자의 발현량 변화와 유전자 변화에 따른 암 상태 변화를 기술하는 문장을 찾아낸다. 첨단 텍스트마이닝 기술인 사건 정보 추출 시스템과 최대 엔트로피 분류기(알려진 사전 정보를 기반으로 엔트로피가 최대가 되는 확률분포를 최적으로 선정하는 원리를 기반으로 확률모델을 만들어 이종데이터를 분류하는 분류기)를 사용해 문장의 구조를 심도있게 분석, 유전자 발현량의 증감 및 암의 진행상태를 더 쉽게 파악할 수 있도록 했다.

특히 각 유전자가 암 진행에 기여하는 정도를 문장 구조 분석 및 추론을 통해 파악하는 방식이어서 기존의 암 관련 유전자 정보 수집 기법들과 달리 암 관련 유전자의 역할에 대한 명시적인 표현이 없어도 관련 정보를 파악할 수 있다.

또 생물학 및 의학 연구문헌을 저장하는 데이터베이스인 메드라인에 등재된 모든 논문에서 1700종 이상의 악성종양, 7500개 이상의 유전자와 관련한 문헌정보를 빠르고 정확하게 검색, 대량의 정보를 쉽게 수집할 수 있어 암 연구의 질적 향상에 기여할 것으로 기대된다.

박 교수는 "온코서치가 첨단 텍스트마이닝 기술을 사용해 연구문헌에서 자동으로 수집한 암 관련 유전자에 대한 대량의 정보는 앞으로 자동 추론기술 등을 활용해 암 연구를 위한 새로운 도구로 활용될 수 있다"고 밝혔다.
로딩 아이콘