diff --git a/plugin.xml b/plugin.xml index cd3557306..1089f68fe 100644 --- a/plugin.xml +++ b/plugin.xml @@ -15,12 +15,12 @@ - + - - + + diff --git a/src/main/resources/fess_indices/fess.json b/src/main/resources/fess_indices/fess.json index affc78fea..24d244604 100644 --- a/src/main/resources/fess_indices/fess.json +++ b/src/main/resources/fess_indices/fess.json @@ -487,6 +487,10 @@ "type": "stemmer", "language": "turkish" }, + "vietnamese_stop": { + "type": "stop", + "stopwords": ["bị", "bởi", "cả", "các", "cái", "cần", "càng", "chỉ", "chiếc", "cho", "chứ", "chưa", "chuyện", "có", "có thể", "cứ", "của", "cùng", "cũng", "đã", "đang", "đây", "để", "đến nỗi", "đều", "điều", "do", "đó", "được", "dưới", "gì", "khi", "không", "là", "lại", "lên", "lúc", "mà", "mỗi", "một cách", "này", "nên", "nếu", "ngay", "nhiều", "như", "nhưng", "những", "nơi", "nữa", "phải", "qua", "ra", "rằng", "rằng", "rất", "rất", "rồi", "sau", "sẽ", "so", "sự", "tại", "theo", "thì", "trên", "trước", "từ", "từng", "và", "vẫn", "vào", "vậy", "vì", "việc", "với", "vừa"] + }, "truncate10_filter" : { "type" : "truncate", "length" : 10 @@ -520,6 +524,11 @@ "pos_tagging": false, "user_dict_path": "${fess.dictionary.path}ko/seunjeon.txt" }, + "vietnamese_tokenizer": { + "type": "fess_vietnamese_tokenizer", + "sentence_detector": false, + "ambiguities_resolved": false + }, "unigram_synonym_tokenizer": { "type": "ngram_synonym", "n": "1", @@ -910,6 +919,15 @@ "turkish_stemmer" ] }, + "vietnamese_analyzer": { + "type": "custom", + "tokenizer": "vietnamese_tokenizer", + "filter": [ + "truncate20_filter", + "lowercase", + "vietnamese_stop" + ] + }, "standard_analyzer": { "type": "custom", "char_filter": [ diff --git a/src/main/resources/fess_indices/fess/doc.json b/src/main/resources/fess_indices/fess/doc.json index a4945a278..dbbd82382 100644 --- a/src/main/resources/fess_indices/fess/doc.json +++ b/src/main/resources/fess_indices/fess/doc.json @@ -462,7 +462,7 @@ "match": "*_vi", "mapping": { "type": "text", - "analyzer": "empty_analyzer" + "analyzer": "vietnamese_analyzer" } } },