数据处理神器Elasticsearch_Pipeline:原理、配置与实战指南




from datetime import datetime
from elasticsearch import Elasticsearch
 
# 假设Elasticsearch服务器地址为localhost:9200
es = Elasticsearch("localhost:9200")
 
# 创建或更新索引模板
def create_or_update_index_template(name, index_patterns, template_settings):
    body = {
        "index_patterns": index_patterns,
        "settings": template_settings,
        "mappings": {
            "dynamic_templates": [
                {
                    "strings": {
                        "match_mapping_type": "string",
                        "mapping": {
                            "type": "text",
                            "fields": {
                                "keyword": {
                                    "type": "keyword",
                                    "ignore_above": 256
                                }
                            }
                        }
                    }
                }
            ]
        }
    }
    es.indices.put_template(name=name, body=body, create=True)
 
# 创建或更新pipeline
def create_or_update_ingest_pipeline(name, pipeline_definition):
    body = {
        "description": "Custom pipeline for data enrichment",
        "processors": pipeline_definition
    }
    es.ingest.put_pipeline(id=name, body=body, if_exists="update")
 
# 使用pipeline处理数据
def index_document_with_pipeline(index, document_id, document_data, pipeline_name):
    es.index(index=index, id=document_id, body=document_data, pipeline=pipeline_name)
 
# 示例:使用上述函数
template_name = "data_enrichment_template"
index_pattern = "data_enrichment-*"
index_settings = {
    "number_of_shards": 1,
    "number_of_replicas": 0
}
 
create_or_update_index_template(template_name, index_pattern, index_settings)
 
pipeline_name = "data_enrichment_pipeline"
pipeline_definition = [
    {
        "set": {
            "field": "timestamp",
            "value": datetime.now().strftime("%Y-%m-%dT%H:%M:%S")
        }
    },
    # 可以添加更多处理器
]
 
create_or_update_ingest_pipeline(pipeline_name, pipeline_definition)
 
index_name = "data_enrichment-2023.01.01"
document_id = "document1"
document_data = {
    "content": "Sample document for data enrichment"

评论已关闭

推荐阅读

Vue中使用mind-map实现在线思维导图
2024年08月04日
VUE
Web前端最全Vue实现免密登录跳转的方式_vue怎么样不登录返回首页,最强技术实现
2024年08月04日
VUE
vue3 项目搭建教程(基于create-vue,vite,Vite + Vue)
2024年08月04日
VUE
Vue-颜色选择器实现方案——>Vue-Color( 实战*1+ Demo*7)
2024年08月04日
VUE
Vue项目卡顿慢加载?这些优化技巧告诉你!_vue数据多渲染卡顿
2024年08月04日
VUE
vue中的keep-alive详解与应用场景
2024年08月04日
VUE
Vue、React实现excel导出功能(三种实现方式保姆级讲解)
2024年08月04日
vue-office/docx插件实现docx文件预览
2024年08月04日
VUE
java调用js文件的两种方法(支持V8引擎)
2024年08月04日
JavaScript:解决计算精度问题/mathjs/bignumber.js/big.js/decimal.js
2024年08月04日
两周从爬虫小白变大神 _yjs_js_security_passport
2024年08月04日
JS笔记(对象、函数、数组)
2024年08月04日
Markdown.js:强大的纯JavaScript Markdown解析器
2024年08月04日
Vue项目:js模拟点击a标签下载文件并重命名,URL文件地址下载方法、请求接口下载文件方法总结。
2024年08月04日
vue 父组件怎么获取子组件里面的data数据
2024年08月04日
VUE
个人开发实现AI套壳网站快速搭建(Vue+elementUI+SpringBoot)
2024年08月04日
el-table 表格封装并改造实现单元格可编辑
2024年08月04日
none
nodejs环境下创建vue项目、SSH密钥登陆!!!
2024年08月04日
vue+quill+element-ui实现视频、图片上传及缩放保姆级教程,轻松使用富文本
2024年08月04日
【three.js】22. Imported Models导入模型
2024年08月04日