分类后端技术下的文章

2024-08-14




from datetime import datetime
from elasticsearch import Elasticsearch
 
# 假设日志数据格式如下
log_data = {
    'timestamp': '2023-04-01T12:00:00Z',
    'message': 'GET /search?q=elkstack HTTP/1.1 200 8232',
    'host': 'gateway-node1',
    'client_ip': '192.168.1.1',
    'backend_ip': '192.168.1.10',
    'response_time': 0.082,
    'upstream_response_time': 0.051,
    'request_id': 'abc123'
}
 
# 将日志时间戳转换为datetime对象
log_data['timestamp'] = datetime.fromisoformat(log_data['timestamp'][:-1])
 
# 连接到Elasticsearch
es = Elasticsearch(hosts=['localhost:9200'])
 
# 索引日志数据
res = es.index(index="gateway-logs", document=log_data)
 
# 打印结果
print(res['result'])

这段代码展示了如何将一条日志数据格式化并索引到Elasticsearch中。首先，它将日志的时间戳字符串转换为datetime对象，然后连接到Elasticsearch，并使用index方法将日志数据索引到名为gateway-logs的索引中。最后，它打印出索引操作的结果。这个过程是将网关日志接入Elasticsearch的一个简化示例。

- 阅读更多 -

简单介绍ES中的索引存储类型

System

2024-08-14

所有,elasticsearch

在Elasticsearch中，索引存储类型（Index.Store.Type）是指一个索引中可以包含的不同类型的文档。每种类型都有自己的映射（Mapping），定义了文档中字段的名称和数据类型。

从Elasticsearch 7.0版本开始，引入了一个新的概念，即“flattened”存储类型，用于替代旧的“nested”类型。在Elasticsearch 6.x及以下版本中，常用的存储类型有“nested”和“object”。

“nested”类型适用于内部对象数组，允许其内部元素独立索引，这是处理嵌套数据的理想选择。
“object”类型用于普通对象，但不允许数组内的对象独立索引。

在Elasticsearch 7.0及以上版本，“nested”类型已被废弃，取而代之的是“flattened”类型，它能够索引对象数组中的每个元素，并允许每个元素有自己的字段。

以下是创建一个包含不同存储类型的Elasticsearch索引的示例：




PUT my_index
{
  "mappings": {
    "properties": {
      "my_nested_field": {
        "type": "nested",
        "properties": {
          "name": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          }
        }
      },
      "my_object_field": {
        "type": "object",
        "properties": {
          "name": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          }
        }
      },
      "my_flattened_field": {
        "type": "flattened",
        "properties": {
          "name": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          }
        }
      }
    }
  }
}

在这个例子中，my_nested_field 是一个使用 nested 类型的字段，适用于嵌套结构的数据；my_object_field 是一个使用 object 类型的字段，不适合索引嵌套结构的数据；my_flattened_field 是一个使用 flattened 类型的字段，可以索引对象数组中每个独立元素的字段。

请注意，Elasticsearch索引映射中的字段类型和设置可能会根据您使用的Elasticsearch版本而有所不同。

System

2024-08-14

所有,elasticsearch

在ElasticSearch中，我们可以使用不同的查询来进行搜索。以下是一些常用的查询：

match查询：用于查找字段中包含指定值的文档。




GET /_search
{
  "query": {
    "match": {
      "title": "Elasticsearch"
    }
  }
}

match\_phrase查询：用于查找字段中包含指定短语的文档。




GET /_search
{
  "query": {
    "match_phrase": {
      "title": "Elasticsearch"
    }
  }
}

multi\_match查询：用于在多个字段中查找包含指定值的文档。




GET /_search
{
  "query": {
    "multi_match": {
      "query": "Elasticsearch",
      "fields": ["title", "content"]
    }
  }
}

query\_string查询：用于执行复杂的查询，它可以解析简单的查询语句。




GET /_search
{
  "query": {
    "query_string": {
      "default_field": "content",
      "query": "\"Elasticsearch\" AND \"Logstash\""
    }
  }
}

这些查询可以根据需求进行组合，以实现更复杂的搜索需求。

- 阅读更多 -

Nuxt3 中使用 ESLint

System

2024-08-14

所有,elasticsearch




// nuxt.config.js
 
export default defineNuxtConfig({
  // 其他配置...
 
  build: {
    // 配置 ESLint
    extend(config, { isDev, isClient }) {
      if (isDev && isClient) {
        config.module.rules.push({
          enforce: 'pre',
          test: /\.(js|vue)$/,
          loader: 'eslint-loader',
          exclude: /node_modules/,
          options: {
            // ESLint 配置文件的路径
            configFile: './.eslintrc-nuxt.cjs',
            // 自动修复某些问题
            fix: true,
          },
        });
      }
    },
  },
 
  // 其他配置...
});

在这个配置中，我们使用了Nuxt3的defineNuxtConfig函数来导出配置。在build.extend函数中，我们添加了一个新的规则，这个规则使用eslint-loader来在构建客户端代码时进行预处理，并且在开发环境中生效。我们指定了要排除的node_modules目录，并且通过configFile指定了ESLint的配置文件路径。这样，在开发过程中，每当代码被编译时，ESLint 都会运行，检查代码质量并可能自动修复一些问题。

- 阅读更多 -

ES常用查询命令

System

2024-08-14

所有,elasticsearch

Elasticsearch (ES) 是一个基于Lucene的搜索和分析引擎，它可以对大量数据进行即时的复杂查询。以下是一些常见的ES查询命令：

查询所有数据：




GET /index_name/_search

根据特定查询条件查询数据：




GET /index_name/_search
{
  "query": {
    "match": {
      "field_name": "value"
    }
  }
}

根据ID查询数据：




GET /index_name/_doc/id_value

插入数据：




POST /index_name/_doc/
{
  "field1": "value1",
  "field2": "value2"
}

更新数据：




POST /index_name/_update/id_value
{
  "doc": {
    "field_name": "new_value"
  }
}

删除数据：




DELETE /index_name/_doc/id_value

创建索引：




PUT /index_name

删除索引：




DELETE /index_name

创建一个索引，并指定设置和映射：




PUT /index_name
{
  "settings": {
    "number_of_shards": 3,
    "number_of_replicas": 2
  },
  "mappings": {
    "properties": {
      "field1": {
        "type": "text"
      },
      "field2": {
        "type": "keyword"
      }
    }
  }
}

使用聚合查询：




GET /index_name/_search
{
  "size": 0,
  "aggs": {
    "group_by_field1": {
      "terms": {
        "field": "field1.keyword"
      }
    }
  }
}

这些命令可以通过ES的REST API直接执行。每个命令都有其特定的用途和语法，可以根据实际需求进行使用。

- 阅读更多 -

elasticsearch在ubuntu下的配置以及简单使用

System

2024-08-14

所有,elasticsearch

在Ubuntu系统中配置Elasticsearch并进行简单使用的步骤如下：

导入Elasticsearch公共GPG密钥：




wget -qO - https://artifacts.elastic.co/GPG-KEY-elasticsearch | sudo apt-key add -

添加Elasticsearch到APT源列表：




echo "deb https://artifacts.elastic.co/packages/7.x/apt stable main" | sudo tee -a /etc/apt/sources.list.d/elastic-7.x.list

更新包索引并安装Elasticsearch：




sudo apt-get update && sudo apt-get install elasticsearch

启动Elasticsearch服务并设置开机自启：




sudo systemctl start elasticsearch.service
sudo systemctl enable elasticsearch.service

验证Elasticsearch是否正在运行：




curl -X GET "localhost:9200/"

以上步骤安装了Elasticsearch 7.x版本，您可以通过修改源中的版本号来安装其他版本。使用curl命令来检查Elasticsearch服务是否运行并可以响应。

注意：确保在执行上述命令时拥有管理员权限，并且在执行过程中可能需要通过防火墙开放相应的端口（如9200）。

- 阅读更多 -

CentOS 7 安装 Elasticsearch 7.12.1

System

2024-08-14

所有,elasticsearch

在CentOS 7上安装Elasticsearch 7.12.1，可以遵循以下步骤：

导入Elasticsearch公钥：




sudo rpm --import https://artifacts.elastic.co/GPG-KEY-elasticsearch

创建Elasticsearch的yum仓库文件：




echo "[elasticsearch-7.x]
name=Elasticsearch repository for 7.x packages
baseurl=https://artifacts.elastic.co/packages/7.x/yum
gpgcheck=1
gpgkey=https://artifacts.elastic.co/GPG-KEY-elasticsearch
enabled=1
autorefresh=1
type=rpm-md" | sudo tee /etc/yum.repos.d/elasticsearch.repo

安装Elasticsearch：




sudo yum install --enablerepo=elasticsearch elasticsearch

启动并设置Elasticsearch开机自启：




sudo systemctl start elasticsearch.service
sudo systemctl enable elasticsearch.service

验证安装是否成功：




curl -X GET "localhost:9200/"

以上步骤会安装Elasticsearch 7.12.1并启用服务，你可以通过访问localhost:9200来验证安装是否成功。

- 阅读更多 -

【Elasticsearch管理】网络配置

System

2024-08-14

所有,elasticsearch

在Elasticsearch中，网络配置通常在elasticsearch.yml配置文件中设置。以下是一些常见的网络配置设置：

设置节点名称：




node.name: node1

绑定到特定的网络接口：




network.host: 192.168.1.10

设置节点是否可以成为主节点：




node.master: true

设置节点是否存储数据：




node.data: true

设置对外服务的HTTP端口：




http.port: 9200

设置是否允许跨域请求：




http.cors.enabled: true
http.cors.allow-origin: "*"

设置节点发现：




discovery.seed_hosts: ["host1", "host2"]

设置是否使用内存交换（不建议在生产环境使用）：




bootstrap.memory_lock: false

这些配置项可以根据你的网络环境和需求进行调整。记得在修改配置后重启Elasticsearch服务使设置生效。

- 阅读更多 -

elasticsearch：ES评分规则详解[查询评分规则、自定义评分规则]

System

2024-08-14

所有,elasticsearch

在Elasticsearch中，评分规则决定了文档与搜索查询的匹配程度，并最终影响文档在搜索结果中的排名。Elasticsearch提供了多种方式来调整和理解评分过程。

查询评分规则

Elasticsearch的不同查询类型（如match查询、bool查询等）都有其自己的评分逻辑。

示例：`match`查询




GET /_search
{
  "query": {
    "match": {
      "message": "quick brown fox"
    }
  }
}

在上述查询中，每个匹配的文档都会根据其与查询词条的相关程度被赋予一个得分。

自定义评分规则

通过函数得分（Function Scoring），我们可以对默认评分进行调整。

示例：使用函数得分




GET /_search
{
  "query": {
    "function_score": {
      "query": {
        "match": {
          "message": "quick brown fox"
        }
      },
      "functions": [
        {
          "filter": {
            "match": {
              "title": "Elasticsearch"
            }
          },
          "weight": 2
        }
      ],
      "max_boost": 2.0
    }
  }
}

在这个例子中，我们增加了一个函数得分查询，当文档的title字段包含"Elasticsearch"时，其得分会乘以2。

评分组成

Elasticsearch的最终得分由几个部分组成：

查询部分得分：评分查询子句的结果。
coordination因子：考虑查询中匹配的字段数量。
字段长度因子：考虑字段长度的差异。
查询负荷因子：考虑查询的复杂度。
用户自定义因子：通过函数得分调整。

评分调试

通过在查询中添加explain参数，可以获取文档得分的详细解释：




GET /_search?explain
{
  "query": {
    "match": {
      "message": "quick brown fox"
    }
  }
}

这将返回每个文档的得分解释，帮助理解为什么某个文档得到了特定的分数。

以上是Elasticsearch评分规则的简要介绍和示例。在实际应用中，可以根据具体需求进行不同的查询和评分调整。

- 阅读更多 -

ES多种分页方案以及深分页处理

System

2024-08-14

所有,elasticsearch

在Elasticsearch中，分页可以通过from和size参数实现。但是，随着from值的增加，搜索请求的性能会显著下降，这是因为Elasticsearch需要先遍历from指定数量的文档，然后再返回size指定数量的文档。这种情况被称为深分页，因此需要一种更有效的方法来处理分页。

解决深分页的方法之一是使用有序搜索的方式，并利用Elasticsearch的排序特性。例如，如果你是根据时间排序，你可以使用时间戳作为排序依据，并且你可以使用search_after的方式进行分页，这种方式不需要从头开始遍历文档。

以下是一个使用search_after的示例代码：




from elasticsearch import Elasticsearch
from elasticsearch import helpers
 
es = Elasticsearch()
 
# 假设你已经有了一个排序字段的最后一个值
last_sort_value = [123, '2021-01-01T00:00:00']  # 假设是一个数组，包含了你的排序字段的值
 
# 使用search_after进行分页
def search_with_scroll(scroll_id, scroll):
    res = es.search(
        index='your_index',
        scroll=scroll,  # 设置滚动时间，例如'5m'
        size=100,
        sort=['your_sort_field:asc', 'another_field:asc', ...],  # 根据实际排序字段来定
        search_after=last_sort_value,
    )
    return res
 
# 第一次调用，用于初始化滚动
res = search_with_scroll(None, '5m')
 
# 处理结果
for doc in res['hits']['hits']:
    # 处理文档
    print(doc)
 
# 使用search_after进行后续的搜索
last_sort_value = res['hits']['hits'][-1]['sort']
res = search_with_scroll(res['_scroll_id'], '5m')
 
# 滚动并清除滚动ID
helpers.scroll.clear(es, scroll_id=res['_scroll_id'])

在这个例子中，我们首先定义了一个search_with_scroll函数，它接受滚动ID和滚动时间作为参数，并执行搜索。在每次迭代中，我们都会更新last_sort_value为当前页最后一个文档的排序值，并使用search_after进行下一次搜索。最后，我们使用Elasticsearch的滚动API来清除滚动。

这种方法避免了深分页带来的性能问题，并且可以有效地进行分页，特别是在需要排序的场景中。

- 阅读更多 -

查询评分规则

示例：match查询

自定义评分规则

示例：使用函数得分

评分组成

评分调试

示例：`match`查询