BioText

Information Extraction from Biological Texts
Based on Markov models


1. Project overview

  현대는 컴퓨터 정보통신의 발달로 인해 학술 관련 분야의 정보 교류 또한 매우 빠르게 그리고 대량으로 이루어지고 있으며, 이에 따라 학자들이 연구를 위한 자료를 얻는 방법이 훨씬 수월해 지고 있다. 하지만, 대량의 문서나 데이터를 수집하였다 하여도 이를 수작업으로 분류하거나 직접 모든 내용을 소화하여 원하는 정보를 얻기에는 그 양이 너무 많으며, 이러한 정보의 과잉 공급은 연구의 효율성을 저해하는 주요 요인으로 지적되고 있다. 이에 따라, 특정분야(domain)에 대하여 수집된 자료에서 원하는 정보만을 추출해 주는 시스템의 필요성이 날로 커지고 있다. 본 연구에서는 원하는 정보에 대한 효율적 추출 알고리즘의 개발을 통해 이러한 시스템의 필요성 문제를 해결하고자 한다.

본 연구에서는 정보추출 기법을 이용하여 메일링 리스트를 통해 전달되는 생물학 관련 학회 정보에서 필요한 정보만을 선택적으로 추출하기 위한 학습 알고리즘을 개발하고 시제품을 구현하여 기능의 타당성을 검증한다.


2. Information Extraction concept

 

3. 연구 목적

인공지능적인 방법론은 실제적인 문서집합에서 정보를 추출하는 문제에 적용하여 기존의 자연언어처리적 방법에 비해 성능향상을 이룬다.


4. Publications
  • Eom, J.-H., Zhang, B.-T., Information Extraction using Hidden Markov Models, Proceedings of The 5th Korea Science and Technology Infrastructure Workshop (KOSTI'2000), pp.132-146, 2000.


Project Title

생물학 관련 텍스트 정보추출 기술 개발

Sponsor

옛 연구계발 정보센터(KORDIC) (현 KISTI)

Duration

2000. 7. 1 - 2000. 12.15

Principal Investigator

Prof. Byoung-Tak Zhang

Researchers

Jae-Hong Eom


Contact

E-Mail

 

Phone

+82-2-880-1847

Fax

+82-2-875-2240


This page is maintained by .
Last update: February 21, 2007.