分类后端技术下的文章

【Elasticsearch】Elasticsearch的分片和副本机制

System

2024-08-19

所有,elasticsearch

Elasticsearch的分片和副本机制是确保集群高可用性和数据安全性的重要特性。

分片（Shard）是Elasticsearch将数据分布式存储的方式，通过将索引分片，Elasticsearch可以在多个节点上并行处理大数据量的搜索请求。

副本（Replica）是分片的副本，用于提供数据的冗余备份，并在分片或节点失败时提供故障转移。

Elasticsearch中，默认情况下，一个索引会有5个主分片和1个副本，这意味着集群中默认有10个分片（5个主分片和它们的副本）。

以下是创建索引时指定分片和副本的Elasticsearch Mapping配置示例：




PUT /my_index
{
  "settings": {
    "number_of_shards": 3,
    "number_of_replicas": 2
  }
}

在这个例子中，我们创建了一个名为my_index的索引，并设置了3个主分片和2个副本。这意味着集群中将有（3个主分片）+ (2个副本*每主分片) = 7个总分片。

- 阅读更多 -

RedisSearch与Elasticsearch：技术对比与选择指南

System

2024-08-19

所有,elasticsearch




在选择全文搜索引擎时，RedisSearch与Elasticsearch都是广泛使用的候选者。以下是关于它们的对比和选择指南：
 
1. 数据模型：
   - RedisSearch：将数据存储在Redis内存数据库中，使用二进制协议与Redis通信。
   - Elasticsearch：将数据存储在自己的数据存储中，通常通过RESTful API进行通信。
 
2. 数据同步：
   - RedisSearch：数据通常与Redis一起持久化，以确保数据的可靠性。
   - Elasticsearch：数据默认情况下是异步写入到磁盘的，但可以配置为同步。
 
3. 分布式：
   - RedisSearch：是Redis的一个模块，因此可以通过Redis Cluster或Redis Enterprise来实现分布式。
   - Elasticsearch：原生支持分布式搜索，通过添加更多节点来扩展。
 
4. 社区支持和生态系统：
   - RedisSearch：较新，可能还不够成熟，但是正在迅速发展。
   - Elasticsearch：拥有成熟的社区和广泛的生态系统支持，包括许多插件和工具。
 
5. 性能：
   - 在特定场景下，Elasticsearch可能会更快，尤其是在处理大量数据和复杂查询时。
   - RedisSearch在内存中的操作和低延迟方面可能会有优势。
 
6. 许可和成本：
   - RedisSearch：通常与Redis一样，具有免费和付费版本。
   - Elasticsearch：根据需求可能有不同的许可和成本选项。
 
选择时需要考虑到具体的应用需求、数据规模、开发团队的技术栈以及预期的性能、可靠性和可扩展性等因素。如果需要一个更加成熟和稳定的解决方案，可能会倾向于选择Elasticsearch。如果注重性能、内存效率和开发速度，可以考虑RedisSearch。

- 阅读更多 -

PHP防止XSS攻击的方法探讨

System

2024-08-19

所有,php

XSS攻击是一种常见的网络攻击方式，它允许攻击者将恶意脚本注入到网页中，从而在用户的浏览器中执行。为了防止XSS攻击，开发者需要对输入和输出进行适当的处理。

以下是几种PHP防止XSS攻击的方法：

输入过滤和清理：使用内置的 filter_var 或 filter_input 函数来过滤和验证输入数据。




$input = filter_input(INPUT_GET, 'query', FILTER_SANITIZE_STRING);

输出转义：在输出内容到HTML页面之前，使用 htmlspecialchars 函数转义特殊字符。




echo htmlspecialchars($output);

使用预处理语句：在数据库查询中使用参数绑定，避免直接将用户输入拼接到SQL查询中。




$stmt = $pdo->prepare("SELECT * FROM users WHERE username = :username");
$stmt->execute(['username' => $username]);

内容安全策略（CSP）：通过设置HTTP头部的Content-Security-Policy来限制资源的加载，减少XSS攻击面。




header("Content-Security-Policy: default-src 'self'");

使用HTTP-only cookie：设置cookie为HTTP-only，以防止通过客户端脚本访问cookie，减少XSS攻击的可能性。




setcookie("username", $username, ["httpOnly" => true]);

总结，防止XSS攻击的关键是对输入进行适当的过滤和清理，在输出前进行适当的转义，并确保使用安全的数据处理方法，如预处理语句和内容安全策略。

- 阅读更多 -

fastapi 在中间件中获取requestBody

System

2024-08-19

所有,中间件

在FastAPI中，在中间件中直接获取请求体（request body）是不可能的，因为在ASGI应用调用过程中，请求体是一个流，只能被读取一次。如果你需要在中间件中访问请求体数据，你可以在中间件中修改请求对象，将请求体数据缓存起来。

以下是一个示例代码，展示了如何在FastAPI中创建一个中间件来缓存请求体数据：




from fastapi import FastAPI, Request
from starlette.middleware.base import BaseHTTPMiddleware
from starlette.requests import Request
from starlette.responses import JSONResponse
 
app = FastAPI()
 
class CacheBodyMiddleware(BaseHTTPMiddleware):
    async def dispatch(self, request: Request, call_next):
        # 将请求体缓存到属性中
        body = await request.body()
        request.state.body = body
        
        response = await call_next(request)
        return response
 
@app.middleware("http")
async def add_middleware(request: Request, call_next):
    return await CacheBodyMiddleware.dispatch(request, call_next)
 
@app.post("/items/")
async def create_item(request: Request, item: dict):
    # 使用中间件缓存的请求体数据
    cached_body = request.state.body
    return JSONResponse({"body": cached_body, "item": item})

在这个示例中，CacheBodyMiddleware 中间件将请求体数据缓存到了 request.state.body 中。request.state 是一个特殊的属性，FastAPI用来在请求处理的多个阶段共享数据。然后，在路由处理函数中，你可以通过 request.state.body 访问这个缓存的请求体数据。

请注意，这种方法只适合非流式的请求体数据，如果你需要处理大型文件上传，这种方法可能会导致内存消耗和性能问题。在实际应用中，你应该小心使用这种技巧，并确保它不会破坏应用的其他部分，如数据流的处理。

- 阅读更多 -

爬虫综合案例-使用Scrapy爬虫框架

System

2024-08-19

所有,爬虫

以下是一个使用Scrapy爬虫框架的简单示例，用于抓取一个网站上的书籍信息。

首先，创建一个新的Scrapy项目：




scrapy startproject bookscrawler

然后，定义你的Item：




# bookscrawler/items.py
 
import scrapy
 
class BookItem(scrapy.Item):
    title = scrapy.Field()
    author = scrapy.Field()
    price = scrapy.Field()

接着，编写爬虫：




# bookscrawler/spiders/bookspider.py
 
import scrapy
from bookscrawler.items import BookItem
 
class BookSpider(scrapy.Spider):
    name = 'bookspider'
    allowed_domains = ['books.com']
    start_urls = ['http://books.com/books']
 
    def parse(self, response):
        book_selectors = response.css('.book-listing')
        for book_selector in book_selectors:
            item = BookItem()
 
            title = book_selector.css('.book-title::text').extract_first()
            author = book_selector.css('.book-author::text').extract_first()
            price = book_selector.css('.book-price::text').extract_first()
 
            item['title'] = title
            item['author'] = author
            item['price'] = price
 
            yield item
 
        next_page_url = response.css('.next-page::attr(href)').extract_first()
        if next_page_url is not None:
            yield response.follow(next_page_url, self.parse)

最后，设置管道来处理Item：




# bookscrawler/pipelines.py
 
class BookPipeline(object):
    def process_item(self, item, spider):
        with open('books.csv', 'a') as f:
            f.write("{},{},{}\n".format(item['title'].encode('utf-8'), item['author'].encode('utf-8'), item['price'].encode('utf-8')))
        return item

在settings.py中启用管道：




ITEM_PIPELINES = {
    'bookscrawler.pipelines.BookPipeline': 300,
}

现在，运行爬虫：




scrapy crawl bookspider

这个简单的例子展示了如何使用Scrapy框架来创建一个爬取书籍信息的爬虫。它定义了一个Item来存储书籍数据，爬虫BookSpider用于抓取书籍列表页面，并通过管道将数据保存到CSV文件中。这个例子教会了如何组织爬虫代码，并提供了一个基本的数据抓取和存储的实践。

- 阅读更多 -

Python蓝牙开发——跨平台蓝牙库bleak

System

2024-08-19

所有,python

Bleak是一个用于蓝牙通信的跨平台库，它提供了一个简单的接口来连接到蓝牙设备，发现服务，读取和写入特征，监听通知等。

以下是使用Bleak进行蓝牙通信的一些基本示例：

扫描蓝牙设备：




import asyncio
from bleak import discover
 
async def main():
    devices = await discover()
    for device in devices:
        print(f"Device {device.address} - {device.name}")
 
loop = asyncio.get_event_loop()
loop.run_until_complete(main())

连接到蓝牙设备并读取特征：




import asyncio
from bleak import BleakClient
 
async def main():
    # 假设设备的MAC地址是'XX:XX:XX:XX:XX:XX'
    async with BleakClient("XX:XX:XX:XX:XX:XX") as client:
        # 假设特征的UUID是'00002A19-0000-1000-8000-00805F9B34FB'
        result = await client.read_gatt_char("00002A19-0000-1000-8000-00805F9B34FB")
        print(result)
 
loop = asyncio.get_event_loop()
loop.run_until_complete(main())

连接到蓝牙设备并写入特征：




import asyncio
from bleak import BleakClient
 
async def main():
    # 假设设备的MAC地址是'XX:XX:XX:XX:XX:XX'
    async with BleakClient("XX:XX:XX:XX:XX:XX") as client:
        # 假设特征的UUID是'00002A19-0000-1000-8000-00805F9B34FB'
        await client.write_gatt_char("00002A19-0000-1000-8000-00805F9B34FB", bytearray([0x01]))
 
loop = asyncio.get_event_loop()
loop.run_until_complete(main())

连接到蓝牙设备并监听特征通知：




import asyncio
from bleak import BleakClient
 
async def handle_notifications(sender, data):
    print(f"Notification received: {data}")
 
async def main():
    # 假设设备的MAC地址是'XX:XX:XX:XX:XX:XX'
    async with BleakClient("XX:XX:XX:XX:XX:XX") as client:
        # 假设特征的UUID是'00002A19-0000-1000-8000-00805F9B34FB'
        await client.start_notify("00002A19-0000-1000-8000-00805F9B34FB", handle_notifications)
        await asyncio.sleep(10.0)  # 监听一段时间
        await client.stop_notify("00002A19-0000-1000-8000-00805F9B34FB")
 
loop = asyncio.get_event_loop()
loop.run_until_complete(main())

以上代码都是使用async/await语法，这是在Python中编写异步代码的推荐方式。这些例子都是基于假设的设备MAC地址和特征UUID，您需要根据实际的蓝牙设备进行相应的替换。

- 阅读更多 -

PHP台球自助开台系统python+django校园台球厅人员与设备管理系统

System

2024-08-19

所有,php

由于原始查询是关于Python和Django的台球管理系统，以下是一个简化的示例，展示如何使用Django框架创建一个基础的台球厅员工和设备管理系统的模型：




from django.db import models
 
# 员工模型
class Employee(models.Model):
    name = models.CharField(max_length=100)
    email = models.EmailField(blank=True)
    phone = models.CharField(max_length=15)
    is_active = models.BooleanField(default=True)
 
    def __str__(self):
        return self.name
 
# 设备模型
class Device(models.Model):
    name = models.CharField(max_length=100)
    serial_number = models.CharField(max_length=50)
    is_active = models.BooleanField(default=True)
    location = models.CharField(max_length=100)
 
    def __str__(self):
        return self.name
 
# 员工与设备关系模型
class EmployeeDevice(models.Model):
    employee = models.ForeignKey(Employee, on_delete=models.CASCADE)
    device = models.ForeignKey(Device, on_delete=models.CASCADE)
    is_assigned = models.BooleanField(default=True)
 
    def __str__(self):
        return f"{self.employee.name} - {self.device.name}"

这个示例定义了三个模型：Employee、Device和EmployeeDevice。Employee和Device分别用于存储员工信息和设备信息。EmployeeDevice模型用于维护员工与设备之间的关系，表明员工是否被授权使用特定设备。

要运行此代码，您需要一个Django项目环境，并在Django应用中的models.py文件中添加上述代码。然后，您可以使用Django的makemigrations和migrate命令应用这些模型更改到数据库。

请注意，这个示例假设设备和员工信息是简单的，并且不涉及更复杂的权限和日志记录需求。在实际应用中，您可能需要添加更多的字段和相关模型来满足特定的需求。

- 阅读更多 -

PHP中Composer包管理器的使用技巧和常见问题解决方法

System

2024-08-19

所有,php




<?php
// 使用Composer创建一个新的项目
require 'vendor/autoload.php';
 
$composer = new Composer\Composer();
$io = new Composer\IO\NullIO(); // 或者其他IO实现，例如ConsoleIO
$repositoryManager = new Composer\Repository\RepositoryManager();
$installationManager = new Composer\Installation\InstallationManager();
 
// 创建一个安装器
$installer = new Composer\Installer();
$installer->setComposer($composer);
$installer->setIO($io);
$installer->setRepositoryManager($repositoryManager);
$installer->setInstallationManager($installationManager);
 
// 创建并运行命令
$commandEvent = new Composer\Command\CommandEvent(
    $composer,
    new Composer\Command\InitCommand()
);
 
$commandEvent->getCommand()->run($io, $installer);
 
// 以上代码仅为示例，实际使用时需要根据Composer的API和命令实现进行调整。

这段代码展示了如何在PHP代码中使用Composer API来创建一个新的项目。它首先加载了Composer的自动加载文件，然后创建了Composer对象和必要的IO和管理器实例。接下来，它创建了一个Installer实例并配置了所需的依赖，最后运行了InitCommand来初始化一个新的Composer项目。这是一个简化的例子，实际使用时需要处理可能发生的错误和其他复杂情况。

- 阅读更多 -

Linux--进程(一篇博客让你理解操作系统的底层）

System

2024-08-19

所有,linux

在Linux中，进程是运行着的程序的一个实例。每个进程都有自己的地址空间，包括文本、数据和栈区域。进程也拥有自己的系统资源，如文件描述符和信号处理等。

在Linux中，可以使用ps命令查看当前系统的进程状态，ps -aux可以查看所有进程的详细信息，ps -ef可以以全格式显示所有进程。

例如，你可以使用以下命令来查看所有进程：




ps -aux

另外，你可以使用top命令实时查看系统中进程的资源占用情况。

top

如果你想要杀死某个进程，可以使用kill命令，后面跟上进程ID。




kill 1234

其中，1234是你想要杀死的进程的ID。

如果你想要以更强制的方式结束进程，可以使用kill -9，其中的-9表示SIGKILL信号，它会立即结束进程。




kill -9 1234

在编写C/C++程序时，可以使用fork()函数创建一个新的进程，exec()函数族用来执行新的程序。

例如，下面的C程序创建一个子进程，然后用exec()函数族来执行一个新的程序：




#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
 
int main() {
    pid_t pid = fork();
 
    if (pid == -1) {
        // 错误处理
        perror("fork failed");
        exit(EXIT_FAILURE);
    }
    else if (pid == 0) {
        // 子进程
        printf("子进程 PID: %d\n", getpid());
 
        // 用 execlp 替换当前进程的映像，执行新的程序
        execlp("/bin/ls", "ls", (char*)NULL);
 
        // 如果exec函数调用成功，下面的代码将不会被执行
        // 如果exec调用失败，则可以在此处添加错误处理代码
        perror("execlp failed");
        exit(EXIT_FAILURE);
    }
    else {
        // 父进程
        printf("父进程 PID: %d\n", getpid());
        wait(NULL); // 等待子进程结束
    }
 
    return 0;
}

以上代码首先使用fork()创建一个子进程，然后在子进程中使用execlp()执行ls命令列出当前目录下的文件。在父进程中，使用wait()系统调用等待子进程结束。

这只是Linux进程的一个简单介绍，实际上进程管理在操作系统中是一个复杂且重要的部分，涉及到内存管理、进程调度等多个方面。

System

2024-08-19

所有,linux

报错问题：Linux服务器上的宝塔控制面板无法打开，SSH可以链接，输入bt命令无响应。

可能原因及解决方法：

宝塔面板服务未运行：
- 解决方法：使用SSH连接服务器后，尝试重启宝塔面板服务。
```
bt restart
```
  或者使用以下命令：
```
/etc/init.d/bt start
```
防火墙设置问题：
- 解决方法：检查服务器防火墙设置，确保宝塔面板使用的端口（默认为8888）没有被阻止。
```
firewall-cmd --zone=public --list-ports
```
  如果端口被阻止，需要开放端口：
```
firewall-cmd --zone=public --add-port=8888/tcp --permanent
```
  然后重载防火墙规则：
```
firewall-cmd --reload
```
宝塔面板配置文件错误：
- 解决方法：检查宝塔面板配置文件是否存在错误，可以尝试重新配置或恢复默认配置。
服务器资源不足：
- 解决方法：检查服务器资源（如CPU、内存、磁盘空间）是否足够，资源不足可能导致服务无法启动。
宝塔面板版本问题：
- 解决方法：如果是版本问题，考虑更新宝塔面板到最新版本。
```
bt update
```
服务器安全组规则设置：
- 解决方法：如果是云服务器，检查安全组规则是否正确放行了宝塔面板端口。
宝塔面板端口被占用：
- 解决方法：使用netstat -tunlp | grep -w 端口号检查端口是否被其他服务占用，如果是，更换端口或停止占用端口的服务。
宝塔面板登录凭证错误：
- 解决方法：确认是否记错了宝塔面板的登录地址、端口、用户名和密码。

如果以上方法都不能解决问题，可以考虑联系宝塔官方支持寻求帮助。

- 阅读更多 -