分类后端技术下的文章

2024-08-24

ElasticSearch 在实现深度分页时会遇到性能问题，因为它需要遍历大量的数据。这种方式并不高效，因为它会消耗大量的资源。

解决方案：

使用 search\_after 方法：

search\_after 是一种分页方式，它依赖于上一次查询结果的最后一条记录的排序值（\_score或者指定的sort值）。下一次查询时，使用这个值作为 search\_after 参数的值，然后再请求 top N 条记录。

示例代码：




from elasticsearch import Elasticsearch
 
es = Elasticsearch()
 
# 第一次查询
first_query_response = es.search(
    index='your_index',
    size=10,
    body={
        'query': {
            'match_all': {}
        },
        'sort': [
            {'your_field': 'asc'}
        ]
    }
)
 
# 获取下一次查询需要用到的排序字段值
search_after = first_query_response['hits']['hits'][-1]['sort']
 
# 第二次查询
second_query_response = es.search(
    index='your_index',
    size=10,
    body={
        'query': {
            'match_all': {}
        },
        'sort': [
            {'your_field': 'asc'}
        ],
        'search_after': search_after
    }
)

使用 scroll 方法：

scroll API 用于保持一个搜索的状态，而这个状态可以在之后的任何时间进行查询，这样就可以进行深度分页。

示例代码：




from elasticsearch import Elasticsearch
 
es = Elasticsearch()
 
# 初始化 scroll
res = es.search(
    index='your_index',
    size=1000,
    scroll='5m',  # 保持 scroll 的时间
    body={
        'query': {
            'match_all': {}
        }
    }
)
 
# 获取 scroll_id
scroll_id = res['_scroll_id']
 
# 获取初始的数据
hits = res['hits']['hits']
 
# 在之后的查询中使用 scroll 来获取更多的数据
while len(hits) > 0:
    res = es.scroll(
        scroll_id=scroll_id,
        scroll='5m'  # 保持 scroll 的时间
    )
 
    hits = res['hits']['hits']
    # 处理 hits...

注意：

在使用 search\_after 或 scroll 时，尽量减少 size 的值，因为太大的 size 会占用更多的内存。
尽可能地减少每页的大小，只取所需数据。
使用 scroll 时，要注意设置合理的 scroll 参数，避免大量的内存占用。

2024-08-24

报错解释：

NoNodeAvailableException[None of the configured nodes are available: [{#transport#-1}{127.0.0.1}{127.0.0.1:9300}]] 这个错误表明Elasticsearch客户端尝试连接到一个或多个配置好的节点，但是没有一个节点可用。这通常是因为Elasticsearch服务没有运行，或者客户端的配置信息不正确。

解决方法：

确认Elasticsearch服务是否正在运行。可以通过访问Elasticsearch的9200端口（或者你配置的任何端口）来检查服务是否响应，例如使用curl http://localhost:9200。
检查Elasticsearch的配置文件elasticsearch.yml，确保network.host和http.port设置正确，允许客户端连接。
如果你在使用Elasticsearch集群，确保所有的节点都是健康的并且正确同步。
检查客户端连接配置，确保你指定了正确的节点地址和端口。
查看Elasticsearch和客户端的日志文件，以获取更多错误信息。
如果你使用的是Elasticsearch集群，确保集群ID（cluster.name）是正确的，并且客户端尝试连接的集群是可达的。

如果以上步骤都确认无误，但问题依旧，可能需要检查网络设置，防火墙或安全组设置，确保它们没有阻止客户端与Elasticsearch节点之间的通信。

Elasticsearch 角色和权限管理

2024-08-24




// 创建角色的示例请求
PUT /_security/role/my_role
{
  "cluster_permissions": [
    "manage_index_templates"
  ],
  "indices": [
    {
      "names": [
        "my_index"
      ],
      "privileges": [
        "read",
        "index"
      ],
      "query": "{\"match\":{\"feature\":\"true\"}}"
    }
  ],
  "run_as": [
    "other_user"
  ]
}
 
// 创建用户并关联角色的示例请求
PUT /_security/user/my_user
{
  "password" : "my_password",
  "roles" : [ "my_role" ],
  "full_name" : "John Doe",
  "email" : "john.doe@example.com",
  "metadata" : {
    "introduction" : "I am John"
  }
}

这个示例展示了如何在Elasticsearch中创建一个角色并为该角色分配权限，以及如何创建一个用户并将其关联到这个角色。这有助于理解角色和用户管理在Elasticsearch安全中的应用。

ElasticSearch架构介绍及原理解析

2024-08-24

Elasticsearch是一个基于Lucene库的开源搜索和分析引擎，设计用于云计算中，能够达到实时搜索，高可用，扩展性和管理的需求。

以下是Elasticsearch的基本架构和工作原理的简化解释：

节点与集群：
- Elasticsearch可以由多个节点组成一个集群，每个节点可以承担不同的角色（例如：master节点、data节点、ingest节点等）。
分布式架构：
- Elasticsearch采用分布式架构，数据被分布在多个节点上，每个节点处理数据的部分。
索引：
- 索引是Elasticsearch中的基本数据单位，它类似于关系型数据库中的数据库概念。
文档：
- 文档是Elasticsearch中的基本数据单位，它类似于关系型数据库中的行或记录的概念。
分片和副本：
- 索引可以被分成多个分片，数据被分散到不同的分片上。每个分片可以有一个或多个副本。
搜索和分析：
- Elasticsearch支持全文搜索、模糊搜索、地理位置搜索、近实时搜索等，并且可以进行复杂的聚合分析。
Elasticsearch的工作原理：
- 当文档被索引时，Elasticsearch使用一个内置的分词器来分析文本内容，并创建一个反向索引。
- 当进行搜索时，Elasticsearch重新使用相同的分词器来分析搜索词，然后查询反向索引来找到匹配的文档。

以上是Elasticsearch基本架构和工作原理的概述，具体实现细节会涉及到分词器、倒排索引、查询优化等复杂的内部机制，这些需要具体学习和研究。

项目实战：ES的增加数据和查询数据

2024-08-24




from datetime import datetime
from elasticsearch import Elasticsearch
 
# 连接到Elasticsearch
es = Elasticsearch(hosts=["localhost:9200"])
 
# 创建一个新的项目数据
project_data = {
    "name": "Elasticsearch Tutorial",
    "description": "This is a tutorial on Elasticsearch",
    "created_at": datetime.now(),
    "tags": ["elasticsearch", "search", "tutorial"]
}
 
# 索引新的项目数据
index_response = es.index(index="projects", id=1, document=project_data)
print(f"Index response: {index_response}")
 
# 查询刚刚索引的项目数据
query_response = es.get(index="projects", id=1)
print(f"Query response: {query_response}")

这段代码演示了如何使用Elasticsearch Python API连接到Elasticsearch服务器，并创建一个新的项目数据，然后将其索引到名为"projects"的索引中，并给它一个ID为1。接着，它展示了如何查询这个项目的数据。这个例子简单明了，并且使用了Elasticsearch的标准操作，对于初学者来说是非常有帮助的。

2024-08-24

在Elasticsearch中，你可以使用Elasticsearch Mapping API来修改索引的映射，以下是如何使用这些操作的示例代码：

新增字段：




PUT /my_index/_mapping/my_type
{
  "properties": {
    "new_field": {
      "type": "text"
    }
  }
}

修改字段：




PUT /my_index/_mapping/my_type
{
  "properties": {
    "existing_field": {
      "type": "keyword"
    }
  }
}

批量修改字段：




POST /_bulk
{"index": {"_index": "my_index", "_type": "my_type"}}
{"update": {"script": "ctx._source.new_field = 'new_value'}}
{"index": {"_index": "my_index", "_type": "my_type"}}
{"update": {"script": "ctx._source.existing_field = 'updated_value'}}

删除字段：
删除字段不是直接支持的操作，你需要通过更新映射来实现。
删除数据：




POST /my_index/_delete_by_query
{
  "query": {
    "match_all": {}
  }
}

批量删除数据：




POST /_bulk
{"delete": {"_index": "my_index", "_type": "my_type", "_id": "1"}}
{"delete": {"_index": "my_index", "_type": "my_type", "_id": "2"}}

注意：

请确保在执行这些操作之前了解Elasticsearch的版本和映射更新的限制。
删除数据和删除字段的操作可能会影响你的数据和查询性能，所以在执行这些操作之前应该做好充分的测试。

2024-08-24




from elasticsearch import Elasticsearch
from elasticsearch import helpers
 
# 假设已经有了一个Elasticsearch客户端实例
es = Elasticsearch()
 
# 使用search_after进行分页
def search_after_pagination(scroll_id, size):
    # 获取上次查询的最后一条记录的sort值
    last_sort_value = scroll_id
    body = {
        "size": size,
        "query": {
            "function_score": {
                "query": {
                    "match_all": {}
                },
                "functions": [
                    {
                        "random_score": {
                            "seed": 123456,
                            "field": "_seq_no"
                        }
                    }
                ],
                "boost_mode": "replace"
            }
        },
        "sort": [
            {
                "_id": {
                    "order": "asc"
                }
            }
        ]
    }
    if last_sort_value:
        body['search_after'] = last_sort_value
    
    response = es.search(index='your_index', body=body)
    # 返回结果和新的sort值
    return response['hits']['hits'], response['hits']['sort'][0]
 
# 使用scroll进行深度分页
def scroll_pagination(size):
    # 初始查询
    scroll_id = 'initial'
    s = helpers.scan(
        client=es,
        query={
            "function_score": {
                "query": {
                    "match_all": {}
                },
                "functions": [
                    {
                        "random_score": {
                            "seed": 123456,
                            "field": "_seq_no"
                        }
                    }
                ],
                "boost_mode": "replace"
            }
        },
        index='your_index',
        size=size,
        scroll='5m',  # 设置scroll超时时间
    )
    
    for i, response in enumerate(s):
        # 处理返回的结果
        print(response)
        if i == 10:  # 假设我们只需要获取10个结果

linux 离线包安装 pg 数据库（亲测有效）

2024-08-24

所有,linux

在Linux系统中，如果你需要离线安装PostgreSQL（简称pg数据库），你可以从一个在线系统下载PostgreSQL的安装包和依赖，然后将它们传输到你的离线系统上进行安装。以下是步骤和示例代码：

在在线系统上下载PostgreSQL安装包和所需依赖。
将下载的包通过USB驱动器或其他媒介传输到离线Linux系统。
在离线系统上，安装所有传输过来的包。

以CentOS为例，步骤如下：

下载PostgreSQL和依赖包。




# 安装必要的工具
sudo yum install -y yum-utils
 
# 添加PostgreSQL的Yum仓库
sudo rpm -Uvh https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.noarch.rpm
 
# 安装PostgreSQL
sudo yum install -y postgresql12-server

将下载的包拷贝到离线系统。
在离线系统上，使用本地仓库或rpm命令安装PostgreSQL及其依赖。




# 如果你使用本地仓库，你需要将仓库文件复制到离线系统，并配置yum使用本地仓库
sudo yum --disablerepo=* --enablerepo=local install postgresql12-server
 
# 如果你使用rpm命令安装，你需要用rpm命令依次安装所有下载的包
sudo rpm -ivh /path/to/postgresql12-package.rpm

初始化并启动PostgreSQL服务。




# 初始化数据库
sudo /usr/pgsql-12/bin/postgresql-12-setup initdb
 
# 启动PostgreSQL服务
sudo systemctl enable postgresql-12
sudo systemctl start postgresql-12

确保替换上述命令中的路径和版本信息以匹配你下载的文件。这些步骤在大多数基于Red Hat的系统（如CentOS和RHEL）上适用，但是对于其他Linux发行版，如Debian或Ubuntu，你可能需要调整命令以适应相应的包管理系统。

2024-08-24

在vue3-element-admin项目中，要统一前端代码风格，可以使用ESLint、Prettier、Stylelint和EditorConfig。以下是如何配置它们以确保代码风格一致性的步骤：

安装所需依赖：




npm install eslint prettier eslint-plugin-prettier eslint-config-prettier stylelint stylelint-config-standard --save-dev

在项目根目录下创建.eslintrc.js，配置ESLint：




module.exports = {
  extends: [
    'plugin:vue/vue3-essential',
    'eslint:recommended',
    'plugin:@typescript-eslint/recommended',
    'prettier'
  ],
  rules: {
    // 自定义规则
  }
};

创建.prettierrc.js，配置Prettier：




{
  "semi": false,
  "singleQuote": true,
  "trailingComma": "es5",
  "printWidth": 80,
  "tabWidth": 2,
  "useTabs": false,
  "endOfLine": "auto"
}

创建.stylelintrc.js，配置Stylelint：




{
  "extends": "stylelint-config-standard",
  "rules": {
    // 自定义规则
  }
}

创建.editorconfig，配置EditorConfig：




root = true
 
[*]
charset = utf-8
indent_style = space
indent_size = 2
end_of_line = lf
insert_final_newline = true
trim_trailing_whitespace = true
 
[*.md]
trim_trailing_whitespace = false

在package.json中添加lint脚本：




"scripts": {
  "lint": "eslint --ext .js,.vue src && stylelint '**/*.{vue,css,scss}'",
  "lint:fix": "eslint --fix --ext .js,.vue src && stylelint '**/*.{vue,css,scss}' --fix"
}

运行lint脚本检查代码风格，或使用npm run lint:fix自动修复一些问题。

这样就配置了ESLint、Prettier、Stylelint和EditorConfig，它们将共同工作，确保代码风格的一致性。在提交代码或者合并分支时，可以集成到CI/CD流程中自动运行lint检查，以保证代码质量。

Ubuntu手动安装Elasticsearch详细教程

2024-08-24




# 1. 更新包索引
sudo apt-get update
 
# 2. 安装OpenJDK
sudo apt-get install openjdk-11-jdk
 
# 3. 验证Java安装
java -version
 
# 4. 创建Elasticsearch用户
sudo adduser elasticsearch
 
# 5. 添加Elasticsearch PPA
echo "deb https://artifacts.elastic.co/packages/7.x/apt stable main" | sudo tee -a /etc/apt/sources.list.d/elastic-7.x.list
 
# 6. 导入Elasticsearch公钥
wget -qO - https://artifacts.elastic.co/GPG-KEY-elasticsearch | sudo apt-key add -
 
# 7. 再次更新包索引
sudo apt-get update
 
# 8. 安装Elasticsearch
sudo apt-get install elasticsearch
 
# 9. 配置Elasticsearch
sudo nano /etc/elasticsearch/elasticsearch.yml
 
# 在配置文件中设置集群名称和节点名称
# cluster.name: my-cluster
# node.name: node-1
 
# 10. 启动Elasticsearch服务
sudo systemctl start elasticsearch.service
 
# 11. 设置Elasticsearch开机自启
sudo systemctl enable elasticsearch.service
 
# 12. 验证Elasticsearch是否运行
curl -X GET "localhost:9200/"

以上脚本提供了在Ubuntu系统上手动安装Elasticsearch的详细步骤。这包括更新包索引、安装OpenJDK、添加Elasticsearch用户、添加Elasticsearch PPA、导入公钥、安装Elasticsearch、编辑配置文件、启动服务以及设置开机自启。最后，使用curl命令验证Elasticsearch是否成功运行。