【全文搜索选型】全文搜索 PostgreSQL 或 ElasticSearch

如果您需要在PostgreSQL或ElasticSearch中实现全文搜索功能,以下是简单的代码示例。

PostgreSQL 使用 gin 索引

首先,确保您的 PostgreSQL 版本支持全文搜索。然后,创建一个 gin 索引并进行查询:




-- 创建一个带有全文索引的表
CREATE TABLE documents (
    id serial PRIMARY KEY,
    content text,
    search_vector tsvector
);
 
-- 创建全文索引
CREATE INDEX idx_documents_search_vector ON documents USING gin(search_vector);
 
-- 为文档的 content 字段生成 tsvector 并插入到 search_vector 字段
INSERT INTO documents (content, search_vector)
VALUES (
    'PostgreSQL is a powerful open source object-relational database system',
    to_tsvector('english', content)
);
 
-- 执行全文搜索
SELECT * FROM documents
WHERE search_vector @@ to_tsquery('english', 'PostgreSQL & open');

ElasticSearch 使用 Elasticsearch-DSL

首先,安装 Elasticsearch-DSL 库:




pip install elasticsearch-dsl

然后,使用 Elasticsearch-DSL 定义一个 search 并执行:




from datetime import datetime
from elasticsearch_dsl import Document, Text, Date, Integer, connections
 
connections.create_connection(hosts=['localhost:9200'])
 
class MyDocument(Document):
    title = Text(fields={'raw': Keyword()})
    published_from = Date()
    page_count = Integer()
 
    class Index:
        name = 'my-index'
 
# 添加一个文档
MyDocument(
    title={'en': 'Elasticsearch: The Definitive Guide'},
    published_from=datetime(2015, 5, 1),
    page_count=350
).save()
 
# 执行搜索
s = Search(using='my-index', index='my-index')
s = s.query('match', title__raw='Elasticsearch')
response = s.execute()
 
for hit in response:
    print(hit.title)

在这两个示例中,我们创建了一个表(PostgreSQL)或索引(ElasticSearch),并向其中插入了一些数据。然后,我们执行了全文搜索查询,搜索特定的关键词或短语。这些查询会在文本字段上应用索引,并返回与搜索词匹配的文档。

评论已关闭

推荐阅读

DDPG 模型解析,附Pytorch完整代码
2024年11月24日
DQN 模型解析,附Pytorch完整代码
2024年11月24日
AIGC实战——Transformer模型
2024年12月01日
Socket TCP 和 UDP 编程基础(Python)
2024年11月30日
python , tcp , udp
如何使用 ChatGPT 进行学术润色?你需要这些指令
2024年12月01日
AI
最新 Python 调用 OpenAi 详细教程实现问答、图像合成、图像理解、语音合成、语音识别(详细教程)
2024年11月24日
ChatGPT 和 DALL·E 2 配合生成故事绘本
2024年12月01日
omegaconf,一个超强的 Python 库!
2024年11月24日
【视觉AIGC识别】误差特征、人脸伪造检测、其他类型假图检测
2024年12月01日
[超级详细]如何在深度学习训练模型过程中使用 GPU 加速
2024年11月29日
Python 物理引擎pymunk最完整教程
2024年11月27日
MediaPipe 人体姿态与手指关键点检测教程
2024年11月27日
深入了解 Taipy:Python 打造 Web 应用的全面教程
2024年11月26日
基于Transformer的时间序列预测模型
2024年11月25日
Python在金融大数据分析中的AI应用(股价分析、量化交易)实战
2024年11月25日
AIGC Gradio系列学习教程之Components
2024年12月01日
Python3 `asyncio` — 异步 I/O,事件循环和并发工具
2024年11月30日
llama-factory SFT系列教程:大模型在自定义数据集 LoRA 训练与部署
2024年12月01日
Python 多线程和多进程用法
2024年11月24日
Python socket详解,全网最全教程
2024年11月27日