횡설수설에 있는 글을 보고 생각이 나서 한개 또 올려 봅니다.

구글이 보면 다국어를 지원하는데 이는 UTF-8 기반으로 모든 문서를 변환하여 저장한후

색인을 하는거 같더라구요....

문제는 기존의 인코딩 타입이 전혀 없는 문서에 대해서 인코딩 타입을 알아내는 것이겠지요..

어찌하다 검색하여 찾은 자료를 올립니다.

Open 소스이구요 sf.net 에서 검색하여... 올립니다.

도움 되시기를 바랍니다...
이 게시물을..