TREC

Text REtrieval Conference


  인터넷의 발달로 인해 대용량의 문서 집합에서 유용한 정보를 추출하는 기술은 상업적으로도 가치가 있을 뿐 아니라 학문적인 흥미대상이기도 하다. TREC은 대용량 문서 검색 기술의 발전을 도모하기 위해 NIST에서 매년 주최하는 국제 학회로서 1992년에 TREC-1을 개최한 이래 1999년 현재 TREC-8까지 개최되었다. TREC에는 몇 가지 서브 트랙 (Sub-Track)으로 나뉘어 지는데, 이들 중 우리의 주된 관심 대상은 필터링 트랙, Q&A 트랙, 웹 트랙이다. 본 연구에서는 문제 해결 방법으로 기존의 정보 검색적인 접근 방법대신에 인공지능적인 접근 방법을 적용하여 성능향상을 도모하고자 하였다.

 

1. Filtering Track
(연구자: 김유환)

  Filtering Track은 사용자에게 지속적으로 제공되는 정보 중에서 사용자의 정보 요구에 적합하지 않다고 판단되는 정보를 자동으로 제거하고 유용한 정보만을 사용자에게 보여주는 것으로서 개인의 기호 및 취향을 컴퓨터에서 표현하는 것이 중요한 문제가 된다. 또한 개인의 기호는 시간이 흐름에 따라서 변하기 때문에 이러한 취향을 변화를 추적하는 것도 중요한 문제가 된다.

 

2. Question Answering Track
(연구자: 엄재홍)

  Q&A Track은 대용량의 문서집합에서 사용자가 원하는 정보를 문서단위가 아닌 작은 문단이나 문장 또는 정확한 단어로 제시해 주기 위한 것이다. 사용자는 자연언어로 질문을 하게 되고, 시스템은 이에 대한 해답을 정확하게 얻어내는 것을 목적으로 한다. 이는 사용자가 접하는 문서의 수가 기하급수적으로 늘어나는 현 상황에서 사용자의 정보검색 부담을 줄이기 위한 좋은 대안이 될 수 있다.

 

3. Web Track
(연구자: 김선)

  Web Track은 인터넷 상의 문서 정보가 많아짐에 따라 어떻게 하면 웹 문서를 정확하게 검색할 것인가에 초점을 맞춘 트랙이다. 웹 문서는 일반 텍스트 문서와는 다른 특징을 가지고 있는데, 단순한 텍스트의 열거가 아니라 이외에 주요 부분에 대한 태깅이나 다른 페이지 문서와의 링크가 존재한다. 따라서 일반 텍스트 문서에 대한 분석과 이와 같은 부가적인 정보를 사용해 검색도를 높이는 방법을 연구한다.

 

연구 목적

인공지능적인 방법론은 실제적인 문서집합을 처리하는 문제에 적용하여 기존의 방법에 비해 성능향상을 이룬다.



Publications
  • Yu-Hwan Kim, Sang-Yun Hahn and, Byoung-Tak Zhang,Text filtering by boosting naive bayes classifiers, In Proc. ACM-SIGIR-2000, 2000. (submitted).
  • D. H. Shin et al.,SCAI-TREC Experiment results, In Proc. 7th Text Retrieval Conference, 1999
  • D. H. Shin et al., SCAI-TREC Experiment results, In Proc. 7th Text Retrieval Conference , 1998.


Project Title

대학 기초

Sponsor

정보 통신부

Duration

1998-

Principal Investigator

Prof. Byoung-Tak Zhang

Researchers

Yu-Hwan Kim
Sun Kim
Jae-Hong Eom


Contact

Yu-Hwan Kim

E-Mail

yhkim@scai.snu.ac.kr

Phone

+82-2-880-7300

Fax

+82-2-875-2240