글수 65
안녕하세요, 저는 검색 전공으로 대학원 공부를 하고 있는 김진영이라고 합니다.
한국에 이렇게 검색에 관심있는 분들의 커뮤니티가 있다는 사실이 참 기쁩니다.
다음은 제 블로그에 연재중인 글입니다. 부족한 글이나마 도움이 되었으면 합니다.
목차 :
정보 검색 (IR) 연구의 최신 동향
4가지 측면에서 바라본 정보 검색 (IR) 연구의 흐름
검색을 위한 문서 모델링 - 문서에서 검색에 유용한 속성 추출하기
4가지 측면에서 바라본 정보 검색 (IR) 연구의 흐름
검색을 위한 문서 모델링 - 문서에서 검색에 유용한 속성 추출하기
질의어 분석 - 사용자 질의를 남김없이 해부한다
랭킹 함수 (retrieval model) - 검색 엔진의 심장부
검색 결과 평가하기 - 평가 없이는 향상도 없다
검색 연구자들은 어떤 생각을 하고 있을까 - 검색 기술의 미래
작년 2학기에 저는 지도교수이신 Bruce Croft교수님이 주제하는 논문 발표 세미나에 참가하였습니다. 규모는 크지 않았지만 Yahoo! Research의 Rosie Jones와 같은 사람들이 연사로 초청될 정도였습니다. 한학기 내내 최근 검색 연구동향을 대표하는 약 스무편의 논문을 읽고, 저는 검색 개인화(personalization) 관련 내용을 발표(자료 첨부)했습니다.
그간 배운 내용을 정리할 겸 앞으로 몇차례에 걸쳐, 최신 논문에 근거한 IR 연구의 동향을 소개할까 합니다. 각 논문의 기술적인 내용을 다 설명할 수는 없겠지만, 기본 아이디어와 큰 흐름 정도는 전달하려 합니다. 큰 그림은 다음과 같습니다. 시스템 측면에서 문서의 속성(feature)을 추출하여 인덱싱(1)하고 사용자의 질의를 분석(2)하여 최종적으로 각 문서에 대한 점수를 계산(3)하고, 마지막으로 검색 결과의 품질을 평가(4)하여 성능 개선에 활용하는 것입니다.
위 그림이 검색 연구의 전부라고 할 수는 없지만, 대부분의 연구가
문서 모델(document model), 질의어 모델(query model), 검색 모델(retrieval model), 그리고 평가(evaluation) 중 하나의 카테고리에 속하며, 실제 많은 연구가 위에 소개한 기본적인 모델을 특정 분야 (e.g. 웹 검색, 블로그 검색, 데스크탑 검색)에 적용하는 것을 주제로 합니다.
마치며
다음번에는 각 부문별로 최근의 연구 동향을 요약해보겠습니다. 내용에 대한 문의나 제안은 언제든지 환영합니다. ^^
참고 자료
IR 교과서 Stanford / UMass CIIR




올려주신 내용 잘 읽었습니다.
오, IR 최고의 거물인 Bruce Croft 교수님이 지도 교수님 이시군요~ 대단하시네요. 정말 많은 것을 배우실 수 있겠네요.
정말 정말 부럽네요.ㅎ
저희는 현재 졸업하고 Opinion Search, Entity Search
쪽으로 연구개발 하는 회사를 꾸려나가고 있습니다. 앞으로 많은 교류를 나누면 좋을것 같네요 ^^