分类 elasticsearch 下的文章

2024-08-14

Elasticsearch (ES) 是一个基于Lucene的搜索和分析引擎，它可以对大量数据进行即时的复杂查询。以下是一些常见的ES查询命令：

查询所有数据：




GET /index_name/_search

根据特定查询条件查询数据：




GET /index_name/_search
{
  "query": {
    "match": {
      "field_name": "value"
    }
  }
}

根据ID查询数据：




GET /index_name/_doc/id_value

插入数据：




POST /index_name/_doc/
{
  "field1": "value1",
  "field2": "value2"
}

更新数据：




POST /index_name/_update/id_value
{
  "doc": {
    "field_name": "new_value"
  }
}

删除数据：




DELETE /index_name/_doc/id_value

创建索引：




PUT /index_name

删除索引：




DELETE /index_name

创建一个索引，并指定设置和映射：




PUT /index_name
{
  "settings": {
    "number_of_shards": 3,
    "number_of_replicas": 2
  },
  "mappings": {
    "properties": {
      "field1": {
        "type": "text"
      },
      "field2": {
        "type": "keyword"
      }
    }
  }
}

使用聚合查询：




GET /index_name/_search
{
  "size": 0,
  "aggs": {
    "group_by_field1": {
      "terms": {
        "field": "field1.keyword"
      }
    }
  }
}

这些命令可以通过ES的REST API直接执行。每个命令都有其特定的用途和语法，可以根据实际需求进行使用。

- 阅读更多 -

elasticsearch在ubuntu下的配置以及简单使用

System

2024-08-14

所有,elasticsearch

在Ubuntu系统中配置Elasticsearch并进行简单使用的步骤如下：

导入Elasticsearch公共GPG密钥：




wget -qO - https://artifacts.elastic.co/GPG-KEY-elasticsearch | sudo apt-key add -

添加Elasticsearch到APT源列表：




echo "deb https://artifacts.elastic.co/packages/7.x/apt stable main" | sudo tee -a /etc/apt/sources.list.d/elastic-7.x.list

更新包索引并安装Elasticsearch：




sudo apt-get update && sudo apt-get install elasticsearch

启动Elasticsearch服务并设置开机自启：




sudo systemctl start elasticsearch.service
sudo systemctl enable elasticsearch.service

验证Elasticsearch是否正在运行：




curl -X GET "localhost:9200/"

以上步骤安装了Elasticsearch 7.x版本，您可以通过修改源中的版本号来安装其他版本。使用curl命令来检查Elasticsearch服务是否运行并可以响应。

注意：确保在执行上述命令时拥有管理员权限，并且在执行过程中可能需要通过防火墙开放相应的端口（如9200）。

- 阅读更多 -

CentOS 7 安装 Elasticsearch 7.12.1

System

2024-08-14

所有,elasticsearch

在CentOS 7上安装Elasticsearch 7.12.1，可以遵循以下步骤：

导入Elasticsearch公钥：




sudo rpm --import https://artifacts.elastic.co/GPG-KEY-elasticsearch

创建Elasticsearch的yum仓库文件：




echo "[elasticsearch-7.x]
name=Elasticsearch repository for 7.x packages
baseurl=https://artifacts.elastic.co/packages/7.x/yum
gpgcheck=1
gpgkey=https://artifacts.elastic.co/GPG-KEY-elasticsearch
enabled=1
autorefresh=1
type=rpm-md" | sudo tee /etc/yum.repos.d/elasticsearch.repo

安装Elasticsearch：




sudo yum install --enablerepo=elasticsearch elasticsearch

启动并设置Elasticsearch开机自启：




sudo systemctl start elasticsearch.service
sudo systemctl enable elasticsearch.service

验证安装是否成功：




curl -X GET "localhost:9200/"

以上步骤会安装Elasticsearch 7.12.1并启用服务，你可以通过访问localhost:9200来验证安装是否成功。

- 阅读更多 -

【Elasticsearch管理】网络配置

System

2024-08-14

所有,elasticsearch

在Elasticsearch中，网络配置通常在elasticsearch.yml配置文件中设置。以下是一些常见的网络配置设置：

设置节点名称：




node.name: node1

绑定到特定的网络接口：




network.host: 192.168.1.10

设置节点是否可以成为主节点：




node.master: true

设置节点是否存储数据：




node.data: true

设置对外服务的HTTP端口：




http.port: 9200

设置是否允许跨域请求：




http.cors.enabled: true
http.cors.allow-origin: "*"

设置节点发现：




discovery.seed_hosts: ["host1", "host2"]

设置是否使用内存交换（不建议在生产环境使用）：




bootstrap.memory_lock: false

这些配置项可以根据你的网络环境和需求进行调整。记得在修改配置后重启Elasticsearch服务使设置生效。

- 阅读更多 -

elasticsearch：ES评分规则详解[查询评分规则、自定义评分规则]

System

2024-08-14

所有,elasticsearch

在Elasticsearch中，评分规则决定了文档与搜索查询的匹配程度，并最终影响文档在搜索结果中的排名。Elasticsearch提供了多种方式来调整和理解评分过程。

查询评分规则

Elasticsearch的不同查询类型（如match查询、bool查询等）都有其自己的评分逻辑。

示例：`match`查询




GET /_search
{
  "query": {
    "match": {
      "message": "quick brown fox"
    }
  }
}

在上述查询中，每个匹配的文档都会根据其与查询词条的相关程度被赋予一个得分。

自定义评分规则

通过函数得分（Function Scoring），我们可以对默认评分进行调整。

示例：使用函数得分




GET /_search
{
  "query": {
    "function_score": {
      "query": {
        "match": {
          "message": "quick brown fox"
        }
      },
      "functions": [
        {
          "filter": {
            "match": {
              "title": "Elasticsearch"
            }
          },
          "weight": 2
        }
      ],
      "max_boost": 2.0
    }
  }
}

在这个例子中，我们增加了一个函数得分查询，当文档的title字段包含"Elasticsearch"时，其得分会乘以2。

评分组成

Elasticsearch的最终得分由几个部分组成：

查询部分得分：评分查询子句的结果。
coordination因子：考虑查询中匹配的字段数量。
字段长度因子：考虑字段长度的差异。
查询负荷因子：考虑查询的复杂度。
用户自定义因子：通过函数得分调整。

评分调试

通过在查询中添加explain参数，可以获取文档得分的详细解释：




GET /_search?explain
{
  "query": {
    "match": {
      "message": "quick brown fox"
    }
  }
}

这将返回每个文档的得分解释，帮助理解为什么某个文档得到了特定的分数。

以上是Elasticsearch评分规则的简要介绍和示例。在实际应用中，可以根据具体需求进行不同的查询和评分调整。

- 阅读更多 -

ES多种分页方案以及深分页处理

System

2024-08-14

所有,elasticsearch

在Elasticsearch中，分页可以通过from和size参数实现。但是，随着from值的增加，搜索请求的性能会显著下降，这是因为Elasticsearch需要先遍历from指定数量的文档，然后再返回size指定数量的文档。这种情况被称为深分页，因此需要一种更有效的方法来处理分页。

解决深分页的方法之一是使用有序搜索的方式，并利用Elasticsearch的排序特性。例如，如果你是根据时间排序，你可以使用时间戳作为排序依据，并且你可以使用search_after的方式进行分页，这种方式不需要从头开始遍历文档。

以下是一个使用search_after的示例代码：




from elasticsearch import Elasticsearch
from elasticsearch import helpers
 
es = Elasticsearch()
 
# 假设你已经有了一个排序字段的最后一个值
last_sort_value = [123, '2021-01-01T00:00:00']  # 假设是一个数组，包含了你的排序字段的值
 
# 使用search_after进行分页
def search_with_scroll(scroll_id, scroll):
    res = es.search(
        index='your_index',
        scroll=scroll,  # 设置滚动时间，例如'5m'
        size=100,
        sort=['your_sort_field:asc', 'another_field:asc', ...],  # 根据实际排序字段来定
        search_after=last_sort_value,
    )
    return res
 
# 第一次调用，用于初始化滚动
res = search_with_scroll(None, '5m')
 
# 处理结果
for doc in res['hits']['hits']:
    # 处理文档
    print(doc)
 
# 使用search_after进行后续的搜索
last_sort_value = res['hits']['hits'][-1]['sort']
res = search_with_scroll(res['_scroll_id'], '5m')
 
# 滚动并清除滚动ID
helpers.scroll.clear(es, scroll_id=res['_scroll_id'])

在这个例子中，我们首先定义了一个search_with_scroll函数，它接受滚动ID和滚动时间作为参数，并执行搜索。在每次迭代中，我们都会更新last_sort_value为当前页最后一个文档的排序值，并使用search_after进行下一次搜索。最后，我们使用Elasticsearch的滚动API来清除滚动。

这种方法避免了深分页带来的性能问题，并且可以有效地进行分页，特别是在需要排序的场景中。

System

2024-08-14

所有,elasticsearch

在Git中，版本回滚是一个常见的操作，它可以让我们在不同的提交之间切换，或者恢复到之前的某个状态。下面是几种常用的版本回滚操作：

git stash：这个命令可以将当前的工作进度暂存起来，使得你可以切换到其他分支或者提交上。使用git stash pop可以恢复之前暂存的工作进度。
git reset：这个命令可以将HEAD指向之前的某个提交，这样就可以修改历史，使得当前分支的状态回滚到指定的提交。这个操作不会改变工作目录中的文件，只会改变HEAD的指向。
git reset --hard：这是一个更强制的回滚操作，它会将工作目录中的文件也回滚到指定的提交状态。
git revert：这个命令用于创建一个新的提交，这个提交会撤销指定的提交所做的更改。这样做的好处是不会修改历史，而是在历史上创建了一个新的“撤销”提交。

下面是这些命令的基本用法示例：




# 暂存当前工作进度
git stash
 
# 回滚到指定的提交（不修改工作目录）
git reset --soft <commit-hash>
 
# 回滚到指定的提交，并修改工作目录
git reset --hard <commit-hash>
 
# 撤销指定的提交更改，创建一个新的“撤销”提交
git revert <commit-hash>

在使用这些命令时，需要替换<commit-hash>为你想回滚到的目标提交的哈希值。注意，使用这些命令会改变历史，如果你的提交已经推送到了远程仓库，那么在使用git reset进行历史更改后，你需要使用git push --force来强制推送到远程仓库，这可能会影响其他协作者。

System

2024-08-14

所有,elasticsearch

这个CMake错误提示通常表明CMake在尝试确定编译器标识时遇到了问题。具体的错误信息被截断了，没有给出具体的错误代码或者是文件路径。不过，通常这种类型的错误可能是由以下几个原因造成的：

CMake无法找到正确的编译器。
编译器不支持当前的CMake版本。
环境变量设置不正确，导致CMake找不到编译器。

解决方法：

确认是否安装了正确的编译器（如GCC、Clang等）。
如果编译器是新安装的，确保环境变量（如PATH、CMAKE_C_COMPILER、CMAKE_CXX_COMPILER）已正确设置。
确保CMake版本与编译器版本兼容。
如果使用的是特殊的交叉编译器，确保正确设置了CMake的交叉编译变量，如CMAKE_SYSTEM_NAME、CMAKE_SYSTEM_PROCESSOR等。

如果你有具体的错误代码或者完整的错误信息，可能会提供更具体的解决方案。

- 阅读更多 -

docker快速安装Es和kibana

System

2024-08-14

所有,elasticsearch

以下是使用Docker快速安装Elasticsearch和Kibana的步骤和示例代码：

安装Elasticsearch:




docker run -d --name elasticsearch -p 9200:9200 -p 9300:9300 -e "discovery.type=single-node" docker.elastic.co/elasticsearch/elasticsearch:7.10.0

安装Kibana:




docker run -d --name kibana -p 5601:5601 --link elasticsearch:elasticsearch docker.elastic.co/kibana/kibana:7.10.0

确保您已安装Docker，并且您的用户有权限运行Docker命令。这些命令将会启动一个Elasticsearch和Kibana的容器，并将它们分别暴露在9200和5601端口。Elasticsearch容器设置为单节点模式，适合开发和测试环境。

- 阅读更多 -

git基础教程(24) git reflog查看引用日志

System

2024-08-14

所有,elasticsearch

Git reflog是一种查看本地仓库中HEAD指针变更记录的方式，这有助于我们理解项目的历史变更。

解决方案：

使用git reflog命令查看HEAD指针的变更记录。

实例代码：




git reflog

使用git reflog show命令查看特定分支的引用日志。

实例代码：




git reflog show master

使用git reflog expire命令清理过期的引用日志。

实例代码：




git reflog expire --expire=now --all

使用git reflog expire命令手动清理过期的引用日志。

实例代码：




git reflog expire --expire=now --expire-unreachable=1.day.ago @{0}

注意：Git reflog命令只适用于本地仓库，不适用于远程仓库。

- 阅读更多 -

查询评分规则

示例：match查询

自定义评分规则

示例：使用函数得分

评分组成

评分调试

示例：`match`查询