ElasticSearch 实战: ES 分析 ( Analysis )
PUT /my_index
{
"settings": {
"analysis": {
"char_filter": {
"my_char_filter": {
"type": "mapping",
"mappings": ["- => _"]
}
},
"filter": {
"my_stopwords": {
"type": "stop",
"stopwords": ["the", "a"]
}
},
"analyzer": {
"my_analyzer": {
"type": "custom",
"char_filter": ["html_strip", "my_char_filter"],
"tokenizer": "standard",
"filter": ["lowercase", "my_stopwords"]
}
}
}
}
}
这个例子展示了如何在Elasticsearch中定义一个自定义分析器,它包括了字符过滤器和停用词过滤器。在这个分析器中,首先使用HTML Strip字符过滤器去除HTML标签,接着使用自定义的映射过滤器替换某些字符(例如,将"-"替换为"\_"),然后使用标准分词器进行分词,并应用小写转换和停用词过滤。这个配置可以根据具体需求进行调整和扩展。
评论已关闭