分类后端技术下的文章

2024-08-11




const express = require('express');
const multer = require('multer');
const app = express();
 
// 设置 multer 配置项
const storage = multer.diskStorage({
  destination: function (req, file, cb) {
    cb(null, 'uploads/') // 确保这个文件夹已经存在
  },
  filename: function (req, file, cb) {
    cb(null, file.fieldname + '-' + Date.now())
  }
})
const upload = multer({ storage: storage })
 
// 设置接口，使用文件上传
app.post('/upload', upload.single('myFile'), (req, res) => {
  const file = req.file;
  if (!file) {
    return res.status(400).send('No file uploaded.');
  }
  res.send('File uploaded successfully.');
});
 
app.listen(3000, () => {
  console.log('Server is running on port 3000');
});

这段代码首先导入了express和multer，并初始化了一个express应用。然后设置了multer的磁盘存储选项，指定了文件的存储路径和文件名。接下来，设置了一个接口/upload，使用multer中间件处理单个文件上传，并在上传成功后返回相应的响应。最后，应用监听3000端口，并在控制台输出服务启动的日志信息。这样就可以通过Postman或其他API测试工具进行文件上传的模拟测试。

- 阅读更多 -

PHP Laravel 路由、中间件、数据库等例子

System

2024-08-11

所有,中间件




// 在Laravel中定义一个简单的路由
Route::get('/greeting', function () {
    return 'Hello, World!';
});
 
// 使用中间件保护路由
Route::middleware(['auth'])->group(function () {
    Route::get('/dashboard', function () {
        return view('dashboard');
    })->name('dashboard');
});
 
// 使用数据库操作查询数据
Route::get('/users', function () {
    $users = DB::table('users')->get();
    return $users;
});
 
// 创建新用户并保存到数据库
Route::post('/users', function (Request $request) {
    $user = new User();
    $user->name = $request->input('name');
    $user->email = $request->input('email');
    $user->save();
 
    return response()->json(['message' => 'User created successfully'], 201);
});

这个代码实例展示了如何在Laravel框架中定义路由、使用中间件保护路由、操作数据库进行简单的数据查询以及如何创建新用户并保存到数据库。这些操作是Web开发中常见的任务，对于学习Laravel框架有很好的教育意义。

- 阅读更多 -

数据库系列：业内主流MySQL数据中间件梳理

System

2024-08-11

所有,中间件

MySQL数据中间件是位于数据库客户端与数据库服务器之间的组件或服务，它提供额外的服务和功能，以帮助简化数据库的使用。中间件可以处理连接池管理、查询解析、缓存、负载均衡、身份验证、监控等任务。

业内主流的MySQL数据中间件包括但不限于：

MyCat
ShardingSphere
ProxySQL
MaxScale
Atlas
Vitess

以下是一些简短的描述和示例安装命令：

MyCat: 一个开源的分库分表中间件，用于MySQL分布式数据库解决方案。

安装命令（以Linux为例）:




wget https://github.com/MyCATApache/Mycat-download/blob/master/mycat-1.6.7.1-release/Mycat-server-1.6.7.1-release-20200217195857-linux.tar.gz
tar -zxvf Mycat-server-1.6.7.1-release-20200217195857-linux.tar.gz
cd mycat

ShardingSphere: 一个开源的分库分表、读写分离和分布式事务解决方案。
安装（以Maven为例）:
```
mvn -U clean install -Dmaven.test.skip=true
```

ProxySQL: 一个高性能MySQL代理，提供查询分析和负载均衡功能。

安装命令（以Linux为例）:




curl -s https://packages.proxydb.io/proxydb.key | sudo apt-key add -
echo "deb https://packages.proxydb.io/deb/ $(lsb_release -sc) main" | sudo tee /etc/apt/sources.list.d/proxysql.list
sudo apt-get update
sudo apt-get install proxysql

MaxScale: 一个开源的数据库代理，提供自动化故障转移、监控和负载均衡等功能。

安装命令（以Linux为例）:




wget https://downloads.mariadb.com/MaxScale/2.5/maxscale-2.5.10/maxscale-2.5.10-1.centos.7.x86_64.rpm
sudo rpm -Uvh maxscale-2.5.10-1.centos.7.x86_64.rpm

Atlas: 由Qihoo 360公司开发的一个数据库中间件项目，用于在数据库eye/min/max等操作。
安装（以Go语言环境为例）:
```
go get -u github.com/Qihoo360/Atlas
```
Vitess: 一个由YouTube开发的数据库集群解决方案，用于管理大规模的MySQL实例集群。
安装命令（以Linux为例）:
```
curl -s get.vitess.io | bash
```

每个中间件的安装和配置都可能有所不同，具体情况请参考官方文档。

- 阅读更多 -

01.Redis中间件实战1

System

2024-08-11

所有,中间件




from redis import Redis
 
# 假设已经有了Redis实例和配置
redis_host = 'localhost'
redis_port = 6379
redis_db = 0
 
# 连接Redis
redis_client = Redis(host=redis_host, port=redis_port, db=redis_db)
 
# 设置键值对
redis_client.set('key', 'value')
 
# 获取键对应的值
value = redis_client.get('key')
print(value)  # 输出b'value'，因为Redis在存储时会将所有键和值都当作字节串处理
 
# 查询键是否存在
exists = redis_client.exists('key')
print(exists)  # 输出True或False
 
# 删除键
redis_client.delete('key')
 
# 关闭Redis连接
redis_client.close()

这段代码展示了如何使用Python的redis模块来连接Redis实例，设置键值对，获取键对应的值，检查键是否存在，以及删除键。代码中使用了Redis的set, get, exists, 和 delete方法，这些是与Redis交互最常用的方法。

- 阅读更多 -

.NET 复现某多媒体中间件文件上传漏洞

System

2024-08-11

所有,中间件

由于原始代码已经包含了漏洞复现的逻辑，以下是一个简化的代码实例，展示如何在.NET中检查文件路径是否引用了不安全的中间件：




using System;
using System.IO;
 
namespace VulnerabilityReproduction
{
    class UnsafeMiddlewareChecker
    {
        // 不安全的中间件列表
        private static readonly string[] UnsafeMiddlewares = new string[]
        {
            "..",
            "::$DATA",
            "::",
            // 添加更多不安全的中间件
        };
 
        public static bool IsSafePath(string filePath)
        {
            // 获取文件路径中的每个部分
            var parts = filePath.Split(Path.DirectorySeparatorChar, Path.AltDirectorySeparatorChar);
 
            // 检查是否包含不安全的中间件
            return !UnsafeMiddlewares.Intersect(parts).Any();
        }
    }
 
    class Program
    {
        static void Main(string[] args)
        {
            string filePath = args[0]; // 从命令行参数获取文件路径
 
            if (UnsafeMiddlewareChecker.IsSafePath(filePath))
            {
                Console.WriteLine("文件路径安全。");
                // 处理文件上传等操作
            }
            else
            {
                Console.WriteLine("警告：文件路径可能不安全。");
                // 处理不安全路径的情况
            }
        }
    }
}

这段代码定义了一个UnsafeMiddlewareChecker类，它有一个IsSafePath方法，该方法接受一个文件路径作为参数，并检查该路径是否包含不安全的中间件。如果包含不安全的中间件，则认为文件路径不安全。在Main方法中，它从命令行参数获取文件路径，并调用IsSafePath方法来确定路径是否安全。

注意：这个代码示例只是为了展示如何检查文件路径中是否包含不安全的中间件，并不代表实际的安全漏洞。在实际的应用程序中，文件上传和处理应该由专门的安全措施来保护，例如文件权限、输入验证和防病毒扫描等。

- 阅读更多 -

爬虫图片验证码--百度识别图片API

System

2024-08-11

所有,爬虫

要使用百度API识别图片验证码，你需要先注册百度AI开放平台获取应用的API Key和Secret Key。以下是使用Python实现的示例代码：

首先，安装必要的库：




pip install baidu-aip

然后，使用API Key和Secret Key初始化AipOcr对象，并调用通用文字识别接口识别图片验证码：




from aip import AipOcr
 
# 初始化AipOcr对象
APP_ID = '你的App ID'
API_KEY = '你的API Key'
SECRET_KEY = '你的Secret Key'
 
aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY)
 
# 读取图片
def get_text_from_image(image_path):
    with open(image_path, 'rb') as file:
        image = file.read()
 
    # 调用通用文字识别接口
    text_result = aipOcr.generalBasic(image)
    
    if text_result['words_result_num'] > 0:
        return text_result['words_result'][0]['words']
    else:
        return ''
 
# 使用示例
image_path = 'path_to_your_captcha_image.jpg'
captcha_text = get_text_from_image(image_path)
print(f"识别结果：{captcha_text}")

请确保替换image_path为你的验证码图片路径，并且正确填写你的APP_ID、API_KEY和SECRET_KEY。

这段代码首先读取了图片文件，然后使用AipOcr对象的generalBasic方法将图片作为文件读取并发送到百度API进行识别。识别结果中的文字会被提取并返回。

- 阅读更多 -

python某度翻译爬虫js逆向（sign、token、domain）

System

2024-08-11

所有,爬虫

逆向工程通常是一个复杂且耗时的过程，它需要对目标网站的JavaScript有深入的了解。在这里，我们假设你已经找到了生成sign、token和domain的JavaScript代码，并且你想要在Python中重新创建这些值的生成逻辑。

首先，你需要确定生成这些值的JavaScript函数。一旦你有了这些信息，你可以使用PyV8，Node.js，或者其他JavaScript运行时来在Python中执行这些JavaScript代码。

以下是一个使用PyV8在Python中执行JavaScript代码的例子：




import PyV8
 
def get_sign_token_domain(html_content):
    # 创建JavaScript运行环境
    js_env = PyV8.JSContext()
 
    # 将需要的函数定义注入到JavaScript环境中
    js_env.enter()
    js_env.eval("""
        // 这里放置生成sign、token和domain的JavaScript代码
        function getSignature(html_content) {
            // ...
            return signature; // 返回生成的signature
        }
        function getToken() {
            // ...
            return token; // 返回生成的token
        }
        function getDomain() {
            // ...
            return domain; // 返回生成的domain
        }
    """)
 
    # 调用注入的函数并获取结果
    sign = js_env.locals.getSignature(html_content)
    token = js_env.locals.getToken()
    domain = js_env.locals.getDomain()
 
    js_env.leave()
    return sign, token, domain
 
# 使用函数
html_content = "..."  # 这里是你需要处理的内容
sign, token, domain = get_sign_token_domain(html_content)
print(sign, token, domain)

请注意，PyV8可能不再被维护，并且在某些系统上可能需要额外的步骤来安装。另外，这个例子假设你已经知道了生成sign、token和domain的具体JavaScript代码。如果你没有这些信息，你需要先逆向分析目标网站的JavaScript代码以找到它们。这通常涉及到阅读和理解目标网站的JavaScript文件，这是一个复杂且耗时的过程。

- 阅读更多 -

Python通过Lxml库解析网络爬虫抓取到的html

System

2024-08-11

所有,爬虫




from lxml import etree
import requests
 
# 发送HTTP请求获取网页内容
url = 'https://example.com'
response = requests.get(url)
 
# 检查请求是否成功
if response.status_code == 200:
    # 使用lxml解析网页
    html = etree.HTML(response.text)
    
    # 示例：提取所有的段落
    paragraphs = html.xpath('//p/text()')
    for p in paragraphs:
        print(p)
    # 示例：提取所有的链接
    links = html.xpath('//a/@href')
    for link in links:
        print(link)
else:
    print("网页请求失败，状态码:", response.status_code)

这段代码使用了requests库来发送HTTP GET请求，获取网页内容，然后使用lxml.etree来解析HTML，并使用XPath表达式来提取所需的数据，如段落文本和链接。这是一个简单的网络爬虫示例，展示了如何使用Python和lxml库进行基本的网页解析和数据提取。

- 阅读更多 -

Nginx防爬虫

System

2024-08-11

所有,爬虫

Nginx防爬虫通常是指通过配置Nginx来阻止不正当爬虫访问网站，以保护网站的正常运营和用户体验。以下是一个简单的Nginx配置示例，用于实现基本的防爬虫策略：




server {
    listen 80;
    server_name yourdomain.com;
 
    # 其他配置 ...
 
    # 防止爬虫的User-Agent
    if ($http_user_agent ~* (Googlebot|Bing|Yahoo|Slurp|Baidu|DuckDuckBot|Bingbot|YandexBot|Sogou|Exabot|ia_archiver|YandexBot|Sogou|Exabot|ia_archiver) ) {
        return 403;
    }
 
    # 你的其他location配置 ...
}

在这个配置中，我们使用了Nginx的if指令和正则表达式匹配$http_user_agent变量，来检测请求是否来自常见的爬虫。如果用户代理匹配，服务器将返回HTTP状态码403，即禁止访问。

这只是一个基本的防爬虫策略，实际上可以通过更复杂的配置来实现更多高级功能，例如限制请求频率、指定允许的爬虫等。

请注意，应该根据自己网站的具体需求和爬虫政策来调整或增强防爬策略。不应仅仅因为爬虫而阻挡合法用户的访问，可以通过其他方式（例如robots.txt文件）来告诉爬虫哪些内容可以爬取，哪些不可以。

- 阅读更多 -

萌新提问：能否跳过Python直接上手爬虫？

System

2024-08-11

所有,爬虫

在回答这个问题前，我需要澄清一点：“直接上手爬虫”意味着什么。通常，学习编程通常需要从基础语法开始，然后逐步进入更复杂的主题，例如数据结构、算法、数据库操作等，最后才是网络爬虫。

如果你指的是不通过学习Python的基础知识（例如变量、循环、函数等）而直接学习网络爬虫，那么答案是不可取的。网络爬虫是一个复杂的过程，它涉及到发送HTTP请求、解析HTML、提取数据等多个步骤。如果没有Python基础，你将无法理解这些步骤，也无法编写出复杂的爬虫程序。

如果你的目标是学习爬虫，那么你应该按照以下步骤进行：

学习Python基础（例如：变量、循环、函数、类等）。
学习网络编程（例如：使用requests库发送HTTP请求）。
学习HTML和CSS基础，以便理解如何解析和提取数据。
学习使用BeautifulSoup或lxml等库来解析HTML。
学习如何处理异步请求和多线程/多进程（对于更复杂的爬虫）。
最后，进入实战，编写自己的网络爬虫。

如果你已经有了Python基础，并且只想直接开始爬虫部分，你可以直接跳过基础学习步骤，直接学习网络编程、HTML/CSS解析、爬虫库的使用等内容。

注意：虽然直接开始爬虫可以加快学习速度，但是如果遇到技术障碍，可能会导致无法解决的问题，从而影响学习进度。因此，推荐按照上述步骤逐步进行。

- 阅读更多 -