我正在嘗試創建一個可以回傳所有可能的標記的分析器,例如對于這個單詞AB-12-1993 xyz.pdf,生成的標記將是AB, AB-12, -12-1993, 12-1993, -1993, 1993, AB-12-1993 xyz, xyz, xyz.pdf, AB-12-1993 xyz.pdf,如果生成了任何其他額外的標記,這不是問題。但是這些應該生成。
我已經嘗試使用帶有 ngram 的空白分析器,但這些-12-1993, 12-1993, -1993, 1993沒有生成。
我也試過這個,用不同的分析器,但沒有幫助
我正在使用彈性搜索 8.3.3。有人可以幫我嗎?
uj5u.com熱心網友回復:
您可以將以下定義用于生成所需令牌的分析器
PUT ngram_custom_example
{
"settings": {
"index": {
"max_ngram_diff": 10
},
"analysis": {
"analyzer": {
"default": {
"tokenizer": "keyword",
"filter": [ "2_10_grams" ]
}
},
"filter": {
"2_10_grams": {
"type": "ngram",
"min_gram": 2,
"max_gram": 10
}
}
}
}
}
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/513918.html
標籤:弹性搜索弹性搜索分析器
