分类数据库下的文章

postgresql创建加密函数

2024-09-04

在PostgreSQL中，您可以创建一个加密函数来保护数据的安全性。以下是一个使用pgcrypto模块的例子，该模块提供了加密和解密的功能。

首先，确保您的PostgreSQL数据库安装了pgcrypto模块。在大多数情况下，它应该默认安装。

然后，您可以创建一个加密函数，如下所示：




CREATE OR REPLACE FUNCTION encrypt_data(input_data TEXT) RETURNS TEXT AS $$
BEGIN
    RETURN pgp_sym_encrypt(input_data, 'your-secret-password');
END;
$$ LANGUAGE plpgsql;

这个函数接收一个input_data作为输入，并使用提供的密码进行加密。

解密函数可以这样写：




CREATE OR REPLACE FUNCTION decrypt_data(encrypted_data TEXT) RETURNS TEXT AS $$
BEGIN
    RETURN pgp_sym_decrypt(encrypted_data, 'your-secret-password');
END;
$$ LANGUAGE plpgsql;

请确保将'your-secret-password'替换为您自己的密钥。

使用这些函数：




SELECT encrypt_data('Your Secret Data');
SELECT decrypt_data('加密数据');

请注意，您应该确保密钥的安全性，并且不要在任何不安全的环境中暴露它。

MongoDB如何实现大于小于查询

2024-09-04

在MongoDB中，你可以使用$gt (greater than) 和 $lt (less than) 操作符来实现大于和小于查询。以下是一个使用MongoDB的Node.js驱动进行大于和小于查询的例子：




const MongoClient = require('mongodb').MongoClient;
const url = 'mongodb://localhost:27017';
const dbName = 'mydatabase';
const client = new MongoClient(url, { useUnifiedTopology: true });
 
async function queryDocuments() {
  try {
    await client.connect();
    console.log('Connected to server');
    const db = client.db(dbName);
    const collection = db.collection('documents');
 
    // 查询大于某个值
    const greaterThanQuery = await collection.find({ age: { $gt: 20 } }).toArray();
    console.log('Documents greater than 20:', greaterThanQuery);
 
    // 查询小于某个值
    const lessThanQuery = await collection.find({ age: { $lt: 30 } }).toArray();
    console.log('Documents less than 30:', lessThanQuery);
 
  } finally {
    await client.close();
  }
}
 
queryDocuments().catch(console.error);

在这个例子中，我们首先连接到MongoDB数据库，然后选择相应的集合。接着，我们使用$gt来查询age字段大于20的文档，使用$lt来查询age字段小于30的文档。最后，我们将查询结果输出到控制台，并在完成后关闭数据库连接。

DBA笔记-第七部分（percona toolkit工具添加索引）

2024-09-04

Percona Toolkit 是一组高级管理 MySQL 和系统的工具，它可以帮助 DBA 执行性能优化、查询分析、系统维护等。以下是使用 pt-online-schema-change 工具来添加索引的示例代码：




# 首先安装 Percona Toolkit
# 在 Debian/Ubuntu 系统上可以使用以下命令安装：
sudo apt-get install percona-toolkit
 
# 然后使用 pt-online-schema-change 工具添加索引
pt-online-schema-change --alter "ADD INDEX idx_column_name(column_name)" D=your_database,t=your_table --execute --charset=utf8 --no-check-replication-filters --alter-foreign-keys-method=auto --max-load=Threads_running=25 --critical-load=Threads_running=100 --recursion-method=none
 
# 参数解释：
# --alter: 指定要执行的 ALTER TABLE 语句，添加索引
# D=your_database,t=your_table: 指定数据库和表名
# --execute: 执行 ALTER TABLE 语句
# --charset=utf8: 指定字符集
# --no-check-replication-filters: 不检查 replication 过滤规则
# --alter-foreign-keys-method=auto: 外键的处理方法
# --max-load=Threads_running=25: 在执行操作之前，如果服务器的 Threads_running 超过 25，则停止
# --critical-load=Threads_running=100: 如果服务器的 Threads_running 超过 100，则停止并报错
# --recursion-method=none: 禁止递归外键检查

确保在执行这些操作之前已经备份了数据库，并且已经安装了 Percona Toolkit。pt-online-schema-change 工具会在线更改表结构，减少对数据库性能的影响。

postgresql：pgsql导出数据

2024-09-04

在PostgreSQL中，您可以使用pg_dump工具来导出数据。以下是一个基本的命令行示例，用于导出整个数据库：




pg_dump -U username -W -F p database_name > outputfile.sql

-U username 指定连接数据库的用户名。
-W 强制pg_dump在执行时提示输入密码。
-F p 指定输出格式为纯文本（默认）。
database_name 是您想要导出的数据库名。
outputfile.sql 是导出的数据将要保存的文件。

如果您只想导出特定的表或者模式，可以使用-t或者-n选项：




pg_dump -U username -W -t table_name database_name > outputfile.sql

或者导出特定的模式：




pg_dump -U username -W -n schema_name database_name > outputfile.sql

请确保在执行pg_dump命令时有足够的权限，并且在执行命令时的当前目录有权写入导出的文件。

爬取央视热榜并存储到MongoDB

2024-09-04




import requests
from pymongo import MongoClient
from lxml import etree
 
# 爬取方法
def crawl_tv_rank(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
    response = requests.get(url, headers=headers)
    if response.status_code == 200:
        return response.text
    return None
 
# 解析方法
def parse_html(html):
    html = etree.HTML(html)
    rank_list = html.xpath('//dl[@class="tv-rank-list"]/dd')
    data_list = []
    for rank in rank_list:
        data = {
            'name': rank.xpath('./a/text()')[0],
            'score': rank.xpath('./p[@class="score"]/text()')[0],
            'rank': rank.xpath('./p[@class="num"]/text()')[0].strip()
        }
        data_list.append(data)
    return data_list
 
# 存储方法
def save_to_mongo(data_list, mongo_url, db_name, collection_name):
    client = MongoClient(mongo_url)
    db = client[db_name]
    collection = db[collection_name]
    collection.insert_many(data_list)
 
# 主函数
def main():
    url = 'http://top.tv.sohu.com/rank_tab_1_3'
    html = crawl_tv_rank(url)
    data_list = parse_html(html)
    save_to_mongo(data_list, 'localhost', 'tv_rank', 'sohu')
 
if __name__ == '__main__':
    main()

这段代码实现了从国内知名视频网站搜狐TV抓取电视剧热榜的功能，并将数据存储到MongoDB数据库中。代码遵循了优秀的编程实践，例如提取了爬取、解析和存储的函数，并在主函数中调用。同时，代码中包含了错误处理和headers设置，这些都是爬虫工程师应当注意的要点。

mongodb 数据库基本操作

2024-09-04

在MongoDB中，基本操作包括连接数据库、选择集合、插入文档、查询文档、更新文档、删除文档等。以下是使用MongoDB的Node.js驱动程序执行这些操作的示例代码：




const { MongoClient } = require('mongodb');
 
// MongoDB连接URL
const url = 'mongodb://localhost:27017';
const client = new MongoClient(url);
 
// 使用connect方法来连接到服务器
async function run() {
  try {
    await client.connect();
    console.log('Connected successfully to server');
 
    // 连接到数据库
    const db = client.db('mydatabase');
 
    // 选择集合
    const collection = db.collection('mycollection');
 
    // 插入文档
    const insertResult = await collection.insertOne({ a: 1 });
    console.log('Insert document:', insertResult);
 
    // 查询文档
    const query = { a: 1 };
    const docs = await collection.find(query).toArray();
    console.log('Found documents:', docs);
 
    // 更新文档
    const updateResult = await collection.updateOne(
      { a: 1 },
      { $set: { b: 2 } }
    );
    console.log('Updated document:', updateResult);
 
    // 删除文档
    const deleteResult = await collection.deleteOne({ a: 1 });
    console.log('Deleted document:', deleteResult);
 
  } finally {
    // 确保在结束程序前关闭数据库连接
    await client.close();
  }
}
 
run().catch(console.dir);

在这个例子中，我们首先创建了一个MongoClient实例，然后使用connect方法连接到MongoDB服务器。接下来，我们选择了数据库mydatabase并且选择了集合mycollection。然后我们分别进行了插入、查询、更新和删除操作。最后，在操作完成后，我们使用close方法关闭了数据库连接。

Django cookie&session - 让浏览器记住你哦

2024-09-04

在Django中，我们可以使用cookie和session来记住用户的浏览器。

使用cookie

Django提供了一个方便的装饰器django.contrib.auth.decorators.login_required，可以用来要求用户登录才能访问某个视图。




from django.contrib.auth.decorators import login_required
 
@login_required
def my_view(request):
    ...

此外，我们也可以在代码中设置cookie：




def my_view(request):
    # 设置cookie
    response = HttpResponse("Hello, World!")
    response.set_cookie('my_cookie', 'cookie_value')
    return response

使用session

Django也提供了session框架，允许我们在多个页面请求中保持状态。




def my_view(request):
    # 设置session
    request.session['my_session'] = 'session_value'
    return HttpResponse("Hello, World!")

在模板中，我们也可以使用session：




{% if request.session.my_session %}
    <p>Session value is: {{ request.session.my_session }}</p>
{% else %}
    <p>There is no session value.</p>
{% endif %}

删除cookie和session




def my_view(request):
    # 删除cookie
    response = HttpResponse("Hello, World!")
    response.delete_cookie('my_cookie')
    return response
 
def my_view(request):
    # 删除session
    if 'my_session' in request.session:
        del request.session['my_session']
    return HttpResponse("Hello, World!")

以上就是在Django中使用cookie和session的基本方法。

Centos安装postgresql

2024-09-04

在CentOS系统上安装PostgreSQL可以通过以下步骤进行：

添加PostgreSQL的官方仓库：




sudo yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-`rpm -E %{rhel}`-x86_64/pgdg-redhat-repo-latest.noarch.rpm

清除缓存：




sudo yum clean all

安装PostgreSQL：




sudo yum install -y postgresql12-server postgresql12

初始化数据库：




sudo /usr/pgsql-12/bin/postgresql-12-setup initdb

启动PostgreSQL服务：




sudo systemctl enable --now postgresql-12

确认服务状态：




sudo systemctl status postgresql-12

登录到PostgreSQL：




sudo -i -u postgres
psql

以上步骤安装了PostgreSQL 12版本，你可以根据需要选择安装其他版本，只需要在步骤1中选择正确的版本rpm文件即可。

Postgresql建分区表步骤sql

2024-09-04

在PostgreSQL中创建分区表需要使用继承（也称为表继承）或者使用PostgreSQL 10引入的分区功能。以下是使用分区功能创建范围分区表的示例SQL代码：




CREATE TABLE measurement (
    city_id         int not null,
    logdate         date not null,
    peaktemp        int,
    unitsales       int
) PARTITION BY RANGE (logdate);
 
CREATE TABLE measurement_y2020m01 PARTITION OF measurement
    FOR VALUES FROM ('2020-01-01') TO ('2020-02-01');
 
CREATE TABLE measurement_y2020m02 PARTITION OF measurement
    FOR VALUES FROM ('2020-02-01') TO ('2020-03-01');
 
-- 以此类推，为每个月创建分区

确保你的PostgreSQL版本是10或更高版本，以支持分区功能。这个例子创建了一个按月分区的表，每个分区代表一个月的数据。注意，分区的范围是左开右闭的，即包含FROM值但不包含TO值的范围。