루씬과 관련된 정보들을 서로 공유하는 게시판입니다.
자신만이 알고 있는 루씬의 활용방법 또는 추가 개발된 모듈들 소개하거나,
질의응답하기 위한 곳으로 활용하시기 바랍니다
자신만이 알고 있는 루씬의 활용방법 또는 추가 개발된 모듈들 소개하거나,
질의응답하기 위한 곳으로 활용하시기 바랍니다
글수 37
아래의 수명 님의 KoreanAnalyzer 를 이용해서 루씬으로 사이트내 검색부분을 만들고 있습니다
사이트 자체 통합검색으로 컨텐츠페이지,게시판의글 등이 모두 디비에 들어가 있어 페이지 인덱셍이 아닌
디비의 내용을 인덱싱 하여 검색부분을 개발하는 중입니다
실시간으로 글,컨텐츠 등록시에 루씬을 이용해서 인덱싱을 하도록(데이타가 그리많지않은관계로)
만들었습니다 수정,삭제시에는 시퀀스 번호를 키값으로 인덱스를 삭제 재인덱싱 하면 될듯 하구요
새글 등록시의 인덱싱,검색까지는 어찌어찌 개발을 해서 테스트 중입니다
그런데 문득 생각나는게 있어서 질문드립니다
건당 인덱싱이아닌 서버에서 주기적으로 인덱싱을 할경우 사이트내 문서전체(디비)의경우 한번 인덱싱 처리후
다음에 인덱싱을 다시할경우 IndexWriter 인자를 true 로 줘 인덱싱을 하는건가요?
검색엔진을 생각해볼때 그많은수의 수집된 정보를 매번 다시 인덱싱 한다는건 좀...
그렇다고 인덱싱후 계속 데이타를 추가한다면 이미 인덱싱된 문서가 바뀌거나 했을경우에는
어떻게 하는건지...
저야 많지않은 데이타라 지금의 입장에서는 매번 새롭게 인덱싱을 해도 무리가 없지만 검색엔진을 만들거나 할때는
어떤식으로 하는지 궁금합니다
인덱싱전 수집된 정보중 수정되거나 삭제된걸 검토하고 그부분의 인덱싱부분만 삭제후 다시 인덱싱을 하는건가
하는 생각도 들고...
어떤식의 방법으로 개발을 하는건지 알려주세요??




false로 하시면 append가 됩니다. 그리고 업데이트는 불가하며, delete후 insert 해야 합니다.
루씬은 이 과정이 생각보다 훨빠릅니다. optimize가 두배의 DISK를 써서 비효율적이긴 하지만 인덱스가 깨지지 않는 확실한 방법이라 봅니다.^^