[SOLR] SOLR 새버전(1.3) 배포

2008년 9월 15일에 solr 1.3버전이 배포되었으며, 다운로드는 Apache Mirror페이지에서 받을 수 있다.
Release Notes를 대충봐도 정말 많은 새로운 기능과 bug fix가 이루어진것을 알 수 있다.


그럼 대강 어떤 내용들이 바뀌었는지 대강 살펴보자.
빠진 내용이 있으니 절대로 원문을 다시 읽어 보기 바람.

  • lucene이 snowball기반의 stemmer가 업데이트되어 (영문의) 색인추출방식이 달라졌다.  따라서 (주로 영문 문서인 경우에는) 재색인을 추천!!
  • configuration file은 바꿀 필요없음
  • http프로토콜의 "304 Not Modified"를 인식할 수 있도록 설정가능
  • 1.2보다 정교한 DateField 값을 요구
  • python client를 더 이상 배포 하지 않는다.
  • 유사문서 찾기기능을 위해 MoreLikeThisHandler를 추가하였다.
  • 무조건 색인되어야 하는 term를 지정하기 위해 KeepWordFilter를 추가하엿다.(StopFilter의 반대)
  • 한 단어에서 대소문자가 변경되는 지점을 분리하기 위해 WordDelimiterFilter에 splitOnCaseChange옵션을 추가하였다.
    (예 "PowerShot" => "Power" "Shot".)
  • lucene Document infrastructure밖에서 문서들을 표현하기 위해 SolrDocument와 SolrInputDocument를 추가하였다.
  • 한 종류의 java client를 추가하였다. (그래서 2개)
    하나는 HTTP를 통해 연결되는 것이고, 하나는 solr를 직접 연결하는 것
    (아무래도 직접 연결하면 로컬에서 밖에 연결이 않되겠으나, 속도는 좀 더 빠르지 않을까?)
  • random sort하기 위해 RandomSortField를 추가하였다.
    (광고 검색결과의 우선순위를 정하는데 좋을 것 같다는... ^^)
  • UpdateRequestHandler가 복수개의 request를 받을 수 있다.
    (예 <delete><id>1</id><id>2</id></delete>)
  • NGramFilterFactory와 EdgeNGramFilterFactory를 추가
  • UUID문자열 값을 받아 들이기 위해 UUIDField class을 추가
  • sum, product, div, pow, log, sqrt, abs, scale, map과 같은 FunctionQuery를 추가
  • Pluggable query parsers
  • 필드의 지정된 값을 변경하기 위해 외부 파일(external file)을 사용할 수 있음
  • spell checker기능을 위해 많은 기능을 추가 - 자세한 내용은 wiki를 참조
  • 질의응답시간의 정확한 시간 표현
  • SolrCore와 ResourceLoader를 위한 "Aware" 플러그인 지원
  • 동일한 instance에서 복수개의 SolrCores구동 지원
  • query elevation component 추가
  • HTTP를 통한 distributed mode모드 지원 - Querying, field faceting (sorted only), query faceting, highlighting, debug information
    (Indexing이 빠져있다. - solr의 distributed mode index mechanism은 너무 나빠요.. ㅠㅠ)
  • cool admin Ajaxed schema explorer 추가
    (얼마나 COOL한지는 봐야 알 듯....)
  • "tokenize"동의어 파일을 위해 SynonymFilterFactory을 변경
    tokenizer을 쓰기 위해서는 <filter>에 "tokenizerFactory" attribute를 지정
    예를 들어
    <tokenizer class="solr.CJKTokenizerFactory"/>
    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" expand="true" ignoreCase="true" tokenizerFactory="solr.CJKTokenizerFactory"/>
  • 부분적인 optimize기능 제공
  • search timeout support
  • 여러개의 stopwords, keepwords, protwords, synonyms파일 지원
  • Databases, XML files, HTTP data sources로 부터 solr를 보다 쉽게 색인하기 위해 DataImportHandler를 contrib project로 추가
  • Speed up response writers
  • Delete by Query의 성능이 크게 향상
  • 50가지 이상의 bug fix
  • 내부적으로 사용하는 Lucene버전을 업그레이드

희망적인 기능들이 많이 눈에 띄고, 기본적으로 CJKTokenizerFactory를 지원하게 돼서 한글을 쓰기 위해 1.2때 처럼 별도로 컴파일 해줘야 하는 수고가 없어진게 가장 반갑다고 할 수 있겠다.
하지만, distributed mode에서 색인이 지원되지 않는 점은 정말 난감하다. 다음 버전엔 될려나?

by 슈퍼맨 | 2008/09/18 13:32 | 루씬/SOLR/엘라스틴 | 트랙백 | 덧글(0)

트랙백 주소 : http://esconsult.egloos.com/tb/842175
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]

:         :

:

비공개 덧글

◀ 이전 페이지다음 페이지 ▶