본문 바로가기

웹/elasticsearch4

openkoreantext_analyzer start_offset bug openkoreantext_analyzer 를 사용하면서, start_offset 값이 원본과 다르게 나오는 현상이 발생하였다. 처음에는 bug인줄 알았는데 해결방법이 있어서 공유한다. 리셋 DELETE openkoreantext_analyzer { } 세팅 PUT openkoreantext_analyzer { "settings": { "index": { "analysis": { "analyzer": { "openkoreantext-analyzer": { "char_filter": [ "openkoreantext-normalizer" ], "tokenizer": "openkoreantext-tokenizer", "filter": [ "openkoreantext-stemmer", "openkoreantex.. 2019. 10. 9.
한글 형태소 분석기 비교 1. 은전한닢 형태소 분석기 bin/elasticsearch-plugin install https://github.com/javacafe-project/elastic-book-etc/raw/master/plugin/elasticsearch-analysis-seunjeon-6.4.3.zip *인덱스설정 PUT seunjeon_default_analyzer { "settings": { "index": { "analysis": { "tokenizer": { "seunjeon_default_tokenizer": { "type": "seunjeon_tokenizer", "index_eojeol": false } }, "analyzer": { "korean": { "type": "custom", "tokenizer.. 2019. 7. 5.
elasticsearch 에 없는 기능 - return terms elasticsearch(es) 에 없는 기능이 있다. (7.0.0 기준) es는 full text 검색이 가능하다. 입력: 검색 keyword 출력: 검색 keyword가 포함된 full text 리스트 끝. 검색이 되는 건 좋으나 검색 결과로 full text를 포함한 리스트가 포함된다. (문서의 리스트) 난, 그 검색 keyword가 full text 중에서 어느 위치에 있는지 알고 싶은데, 그 위치는 알려주지 않는다. 충분히 가능한데 말이다. 예를 들어 다음의 데이터(문장)와 검색어가 있을 경우 데이터: solr in action, but elasticsearch in action, solr in action 검색어: solr in 결과는 그저 문장 전체가 다시 출력된다. (당연히 검색어를 포함하.. 2019. 4. 26.
test query GET /bookdb_index/book/_search { "seq_no_primary_term": true, "track_total_hits": true, "_source": ["title"], "query" : { "match_phrase": { "title" : "guide" } } } POST /twitter/_mtermvectors { "docs": [ { "_id": "2", "fields": [ "message" ], "term_statistics": true }, { "_id": "1" } ] } POST /_mtermvectors { "docs": [ { "_index": "twitter", "_id": "2", "term_statistics": true }, { "_index": "tw.. 2019. 4. 26.