| 44 |
색인
MultiReader에 관해서.. 질문드립니다.
|
![포인트:61point (67%), 레벨:0/30 [레벨:0]](http://irgroup.org/zbxe/modules/point/icons/default/0.gif) 딴딴한넘 | 91 | | 2010-09-02 |
|
안녕하세요? 루씬으로 검색엔진을 공부중인 개발자 입니다.
1000만건 이상의 데이터를 위해서 이곳에서 나란트님의 증분색인 방식을 적용해 보았습니다.(현재는 100만건정도만 넣어보았습니다.)
그리고 검색시에는 MultiSearcher를 이...
|
| 43 |
색인
멀티 쓰레드 색인에 대해서
|
![포인트:61point (67%), 레벨:0/30 [레벨:0]](http://irgroup.org/zbxe/modules/point/icons/default/0.gif) 딴딴한넘 | 827 | | 2010-07-29 |
|
루씬인 액션 책에 보면 멀티쓰레드로 색인 시에는 IndexWriter의 한 인스턴스를 공유해서 색인을 하면 된다고 나와 있습니다.
그런데 제가 실습을 하는 가운데 문제가 있더라구요. IndexWriter의 락을 푸는 방법은 close함...
|
| 42 |
기타
루씬과 베리티의 성능
2
|
![포인트:17point (18%), 레벨:0/30 [레벨:0]](http://irgroup.org/zbxe/modules/point/icons/default/0.gif) 파란미르 | 995 | | 2010-07-15 |
|
기존 문서검색 시스템에서 사용중인 베리티(Verity K2) 플랫폼이 2000년대 초반에 도입된 것이라 교체를 검토 중입니다. 현재로서 여러가지 안 중에 루씬(Solr) 플랫폼 도입이 가장 좋을 것 같다고 판단되는데, 문제는 성능(속도 ...
|
| 41 |
색인
디비 와의 씽크
|
![포인트:61point (67%), 레벨:0/30 [레벨:0]](http://irgroup.org/zbxe/modules/point/icons/default/0.gif) 딴딴한넘 | 886 | | 2010-07-12 |
|
요번에 루씬에 대해서 프로젝트를 처음 접하게 됬는데요..
공부를 하다 보니 궁금한 점이 생겼습니다.
루씬은 색인을 파일에다 저장을 하게 되는데요. 그렇게 되면 디비와의 씽크 문제가 발생하지 않을까 하는 생각이 들어서요. ...
|
| 40 |
기타
루씬을 활용하여 LinkedIn.com에 적용한 실시간검색
|
![포인트:25point (27%), 레벨:0/30 [레벨:0]](http://irgroup.org/zbxe/modules/point/icons/default/0.gif) 짐승 | 2539 | | 2010-01-07 |
|
안녕하세요. 검개그에서 눈팅만하고 처음 글을 적습니다. 검색엔진에 대해서 관심이 많은 개발자입니다. 실시간검색에 대해서 조사하면서 찾은 재미난 프로젝트를 공유하고 싶어서 이렇게 글을 적게 되었네요. ^^ 그럼 수고하세요~~ ...
|
| 39 |
검색
검색 결과에 대한 질문
2
|
![포인트:22point (24%), 레벨:0/30 [레벨:0]](http://irgroup.org/zbxe/modules/point/icons/default/0.gif) 오스틴 | 8122 | | 2009-02-09 |
|
"나는 그녀를 사랑한다" 이런 검색어가 들어 왔을때 인덱싱된 글에는 2가지가 있다고 가정합니다. 1) "나는 사랑한다 그녀를" 2) "나는 그녀를 사랑한다" 두가지 문서에서 보면 2번째가 점수가 더 높아야 되지 않나요? 헌데 루신의...
|
| 38 |
색인
루씬 스코어 공식에서 normalization factor에 대해서..
|
![포인트:440point (17%), 레벨:2/30 [레벨:2]](http://irgroup.org/zbxe/modules/point/icons/default/2.gif) need4spd | 8318 | | 2008-12-31 |
|
루씬 점수를 내는 공식을 보면.. normalization factor가 있다고 알고 있습니다. 여기저기 찾아보니까.. 이게 루크로 인덱싱 되어있는 파일을 열어보니까 필드마다 점수가 부여되어 있더라구요.. Indexed가 된 필드는 0~1 사이의...
|
| 37 |
색인
add 가 이상해요...
1
|
![포인트:74point (82%), 레벨:0/30 [레벨:0]](http://irgroup.org/zbxe/modules/point/icons/default/0.gif) 남감독 | 8308 | | 2008-12-05 |
|
안녕하세요. Document doc = new Document(); doc.add(field.keywor-d()) 해서 인텍스를 만들었는데요. luke 로 확인해 보니까 10개 밖개 없네요 15개를 만들었는데요. println 으로 찍어보니까 값들은 화면에 다 찍혀 나오는걸...
|
| 36 |
 |
색인
다봇에서 사용하는 증분색인(Incremental Indexing) 방식
2
 |
![포인트:386point (5%), 레벨:2/30 [레벨:2]](http://irgroup.org/zbxe/modules/point/icons/default/2.gif) 나란트 | 8274 | | 2008-11-10 |
|
제 블로그에 올린 글이라... 좀 딱딱할수 있습니다. 이해 부탁드리며 대부분 이방식을 사용하고 있지 않을까 합니다만... 그렇게 수준 높은 글이 못되어 죄송할 따름입니다. ===========================================...
|
| 35 |
색인
주기적으로 인덱싱을 할경우 처리 방법 질문
1
|
![포인트:47point (52%), 레벨:0/30 [레벨:0]](http://irgroup.org/zbxe/modules/point/icons/default/0.gif) 서영아빠 | 9125 | | 2008-10-21 |
|
아래의 수명 님의 KoreanAnalyzer 를 이용해서 루씬으로 사이트내 검색부분을 만들고 있습니다
사이트 자체 통합검색으로 컨텐츠페이지,게시판의글 등이 모두 디비에 들어가 있어 페이지 인덱셍이 아닌 디비의 내용을 인덱싱 하여 ...
|
| 34 |
형태소분석기
루씬 KoreanAnalyzer 올립니다.
5
|
![포인트:22point (24%), 레벨:0/30 [레벨:0]](http://irgroup.org/zbxe/modules/point/icons/default/0.gif) 수명 | 10745 | | 2008-10-15 |
|
루씬 한국분석기를 올립니다. 개인적으로 루씬을 공부하다 성능에 매료되어 한글분석기를 만들어보기로 마음먹고 만들었습니다. 프로젝트하면서 가끔씩 만들다 보니 시간은 무척 많이 걸렸군요. 혹시 함께 오픈소스로 개발에 참여하고...
|
| 33 |
기타
루씬 프로젝트 중에서 질문있습니다.(Regain)
1
|
![포인트:26point (28%), 레벨:0/30 [레벨:0]](http://irgroup.org/zbxe/modules/point/icons/default/0.gif) 조성근 | 13223 | | 2008-08-08 |
|
Regain 이라는 desktop search engine이 있더군요 검색은 루씬 엔진 사용하구요. 가장 큰 궁금증은 UI가 웹브라우저(jsp)형식 인데요 javaw.exe 를 가지고 Was를 띄우는 거 같은데요 어떤 방법 Tomcat과 같은 Was를 직접 띄우지...
|
| 32 |
기타
루씬에서요.
|
![포인트:16point (17%), 레벨:0/30 [레벨:0]](http://irgroup.org/zbxe/modules/point/icons/default/0.gif) IRbada | 13312 | | 2008-07-20 |
|
안녕하세요. 학교에서 프로젝트로 검색엔진을 만들구 있는데 -_-; 헐;;; 너무 어렵네요. 루씬 조금 끄적끄적 하다가 재밌기도 하구 뭐 그러구 있습니다. 다름이 아니라여. 문서를 색인해서 그리고 검색어를 입력해서 벡터공간모델 사...
|
| 31 |
색인
루신 색인 알고리즘 질문드립니다.
10
|
![포인트:40point (44%), 레벨:0/30 [레벨:0]](http://irgroup.org/zbxe/modules/point/icons/default/0.gif) Nuxer | 12400 | | 2008-06-26 |
|
제 방식이 맞는지조차 몰라서 질문드립니다. 우선 예를 들어서 설정을 max buffered docs 1000 ram buffer size 128 이렇게 설정해 놓았다고 가정하고 IndexWriter writer = new IndexWriter(dir, getAnalyzer(), true); ...
|
| 30 |
색인
[질문] 루씬 가중치에 대해서 문의드립니다 ^^
10
|
![포인트:440point (17%), 레벨:2/30 [레벨:2]](http://irgroup.org/zbxe/modules/point/icons/default/2.gif) need4spd | 11843 | | 2008-06-25 |
|
안녕하세요 ^^ 루씬 가중치에 대해서 문의 드립니다. 요즘 질문 너무 많이 올리네요..ㅎㅎ 필드단위의 가중치 혹은 Document 단위의 가중치를 주는 것은 알겠는데요.. 그리고, 키워드 뒤에 ^를 이용해서 가중치를 주는 것도요.. ...
|
| 29 |
색인
루신에서 optimize 에 대하여 설명 부탁드립니다.
6
|
![포인트:40point (44%), 레벨:0/30 [레벨:0]](http://irgroup.org/zbxe/modules/point/icons/default/0.gif) Nuxer | 12635 | | 2008-06-25 |
|
안녕하세요. 가입인사와 더불어 질문드리겠습니다. 이런곳이 있다는걸 이제야 알았네요. 앞으로 잘부탁드립니다. 루신 공부중인데요. 2.0버전에서 좀 하다가 다시보게되니 2.3에서 많은 기능이 추가된것같네요. 하다보니 이해가 잘 안가...
|
| 28 |
검색
다중 필드 검색 질문입니다
3
|
![포인트:47point (52%), 레벨:0/30 [레벨:0]](http://irgroup.org/zbxe/modules/point/icons/default/0.gif) qna | 14606 | | 2008-06-25 |
|
여러 필드로 인덱싱 했을때 다중 필드 서치는 어떻게 하는것인가요? 예를 들어 아래처럼 필드:내용 과 같이 인덱싱 되었을때 doc.add(new Field("이름", 검개그 doc.add(new Field("제목", 검색엔진 개발자 그룹 doc.add(new Fie...
|
| 27 |
기타
루씬 하이라이트 기능에 대해서 다시 질문드립니다.
4
|
![포인트:440point (17%), 레벨:2/30 [레벨:2]](http://irgroup.org/zbxe/modules/point/icons/default/2.gif) need4spd | 14313 | | 2008-06-19 |
|
안녕하세요? 루씬 하이라이트에 대해서 다시 질문 드리고 싶은게 있습니다. 하이라이트기능을 사용하는데... 이게 하이라이트 시키는 .. 형식을 보니까 원문을 처음부터 다시 Analyzer를 이용해 분석해서 각 Term의 위치정보를 가...
|
| 26 |
형태소분석기
한글 검색시 루씬 analyzer 는 선택은..?
7
|
![포인트:47point (52%), 레벨:0/30 [레벨:0]](http://irgroup.org/zbxe/modules/point/icons/default/0.gif) qna | 13722 | | 2008-06-10 |
|
띄어쓰기 없는 "검색엔진개발자그룹입니다" 라는 문장을 인덱싱 하려면 어떤 analyzer가 좋을까요? "검색" "검색엔진" "개발자" "그룹" 이런식의 인덱싱은 안되겠지요....음냥.. Analyzer의 선택(http://lucene.egloo-s.com/1486420) 이란 글을...
|
| 25 |
응용
[질문] 루씬의 하이라이트 패키지 중 SimpleFragmenter에 대해서..
9
|
![포인트:440point (17%), 레벨:2/30 [레벨:2]](http://irgroup.org/zbxe/modules/point/icons/default/2.gif) need4spd | 11456 | | 2008-06-02 |
|
안녕하세요.. 오늘도 루씬과 씨름중인..불쌍한 개발자입니다..;; 질문드릴게 있는데요.. 검색결과 하이라이트 기능을 사용하기 위해 구현을 해봤는데 org.apache.lucene.se-arch.highlight.Simpl-eFragmenter에 fragmentSize를 지정 할 수 있...
|