ES全文检索支持繁简和IK分词检索

作者：System 时间：2024年08月25日分类：所有,elasticsearch 字数：1198

这篇文章距离上次修改已过503天，其中的内容可能已经有所变动。

在Elasticsearch中，使用IK分词器可以支持繁体中文和简体中文的分词。以下是一个使用Elasticsearch DSL（Domain-Specific Language）创建索引并使用IK分词器的示例代码：




from datetime import datetime
from elasticsearch_dsl import Keyword, Text, Date, Integer, connections
from elasticsearch_dsl.analysis import CustomAnalyzer
 
# 连接到Elasticsearch
connections.create_connection(hosts=['localhost:9200'])
 
# 定义一个自定义分词器
ik_analyzer = CustomAnalyzer(
    'ik_analyzer',
    filter=['lowercase'],
    tokenizer='ik_max_word'
)
 
# 定义一个Document类
class Article(Document):
    title = Text(analyzer='ik_analyzer')
    content = Text(analyzer='ik_analyzer')
    publish_date = Date()
    author = Keyword()
    length = Integer()
 
    class Index:
        name = 'articles'
 
# 创建索引
Article.init()
 
# 使用Document类创建一个文档实例
article = Article(
    title='Python Elasticsearch 分词测试',
    content='这是一个测试文档，用来演示Elasticsearch的分词效果。',
    publish_date=datetime.now(),
    author='测试者',
    length=100
)
 
# 将文档保存到Elasticsearch
article.save()

在这个示例中，我们首先定义了一个自定义分词器ik_analyzer，指定了分词器类型为ik_max_word，然后定义了一个名为Article的Document类，在其中使用了ik_analyzer分词器。接着，我们创建了一个Article的实例并保存到Elasticsearch中。这样就实现了使用Elasticsearch DSL结合IK分词器进行文档的创建和保存。

ES全文检索支持繁简和IK分词检索

评论已关闭

推荐阅读