分类后端技术下的文章

【深度强化学习】Python：OpenAI Gym-CarRacing 自动驾驶 | 提供项目完整代码 | 车道检测功能 | 路径训练功能 | 车辆控制功能

2024-08-12

由于原始代码已经非常简洁，下面提供的代码就是一个精简版本，去除了注释和不必要的空行，以保持简洁。




import gym
import numpy as np
import time
 
env = gym.make('CarRacing-v0')
env.reset()
 
for i in range(300):
    env.render()
    action = np.array([0.5, 1.0])  # 加速和转向
    obs, reward, done, info = env.step(action)
    time.sleep(0.05)
    if done:
        break
 
env.close()

这段代码创建了一个OpenAI Gym的车辆驾驶环境，执行了300次迭代，在每次迭代中，车辆会加速并且转向，并在完成后关闭环境。这是一个简单的示例，展示了如何与Gym环境交互。

- 阅读更多 -

＜Python＞将txt文本转为SRT格式字幕

System

2024-08-12

所有,python

要将txt文本转换为SRT格式字幕，你需要确保txt文本中的每个字幕段落遵循特定的时间戳格式。以下是一个简单的Python脚本，用于将具有时间戳的txt文本转换为SRT格式：




import os
 
def convert_to_srt(input_file, output_file):
    with open(input_file, 'r', encoding='utf-8') as infile, \
         open(output_file, 'w', encoding='utf-8') as outfile:
        lines = infile.readlines()
        timestamp = None
        for i, line in enumerate(lines):
            line = line.strip()
            if not line:
                continue
            # 假设每个字幕段落前都有时间戳
            if "-->".encode('utf-8') in line.encode('utf-8'):
                timestamp = line.split("-->")
                continue
            # 写入字幕行
            if timestamp:
                sub_num = i + 1
                start_time, end_time = timestamp
                outfile.write(f"{sub_num}\n{start_time}\n{end_time}\n{line}\n\n")
 
# 使用方法
input_txt = "subtitles.txt"
output_srt = "subtitles.srt"
convert_to_srt(input_txt, output_srt)

确保你的txt文件中的每个字幕段落都有正确的时间戳，格式如00:01:01,000 --> 00:01:04,000。这个脚本会为每一行文本创建一个新的字幕条目，并为每个字幕编号。

System

2024-08-12

所有,python

由于您提出的问题是关于运行和部署ChatGLM2-6B模型的，但是没有提供具体的错误信息或者代码问题，我无法给出针对性的解决方案。

为了解决您遇到的问题，我建议您首先确认以下几点：

确保您的计算机上安装了Python和Anaconda。
确保您的环境中安装了必要的Python库，如transformers。
确保您有足够的计算资源来运行模型，特别是在GPU上运行时。
如果您是从GitHub获取源代码，请确保您已经正确地安装了所有依赖项。

如果您能提供具体的错误信息或代码问题，我将能够提供更具体的帮助。

- 阅读更多 -

python提取图片型pdf中的文字（提取pdf扫描件文字）

System

2024-08-12

所有,python

要从图片型PDF中提取文本，可以使用Python的pdf2image库和pytesseract库。首先，需要将PDF中的图片页转换为图片，然后使用OCR技术（光学字符识别）来识别图片中的文本。

安装所需库：




pip install pdf2image pytesseract

确保你有Tesseract-OCR安装在你的系统上，并且在你的PATH环境变量中。

以下是一个Python脚本示例，它将提取包含文本的图片型PDF的文本：




import pdf2image as p2i
from pytesseract import image_to_string
 
def extract_text_from_pdf(pdf_path):
    # 将PDF转换为图片
    images = p2i.convert_from_path(pdf_path)
    text = ''
 
    for img in images:
        # 使用Tesseract OCR识别图片中的文本
        text += image_to_string(img)
 
    return text
 
pdf_path = 'scanned_document.pdf'
extracted_text = extract_text_from_pdf(pdf_path)
print(extracted_text)

请注意，OCR的准确性可能会受到图像质量、图像噪声和文本密度的影响。对于复杂或扭曲的文档，结果可能不会非常准确。

- 阅读更多 -

【Pytorch】Anaconda安装Pytorch详解教程（踩坑经验）

System

2024-08-12

所有,python

在Anaconda环境中安装Pytorch通常遵循以下步骤：

打开终端或Anaconda命令提示符。
创建一个新的conda环境（可选，但推荐）。
激活你的环境。
使用conda或pip安装Pytorch。

以下是具体的命令：




# 创建一个名为pytorch_env的新conda环境，并指定Python版本（例如3.8）
conda create -n pytorch_env python=3.8
 
# 激活新创建的环境
conda activate pytorch_env
 
# 使用conda安装Pytorch，你需要找到与你的系统（Linux, Windows, MacOS）、CUDA版本（如果你需要GPU支持）和Python版本相匹配的命令。
# 访问PyTorch官网的安装指南（https://pytorch.org/get-started/locally/），选择合适的配置，并复制对应的conda命令。
# 例如，如果你不需要CUDA支持并且使用Python 3.8，命令可能如下：
conda install pytorch torchvision torchaudio cpuonly -c pytorch
 
# 或者，如果你想使用CUDA（例如CUDA 11.1），命令可能如下：
conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch -c conda-forge

请注意，你需要连接互联网来下载Pytorch及其依赖项，并且确保你的conda和Anaconda是最新版本的，以便无缝工作。

在安装过程中，如果遇到任何问题，可能需要根据你的系统环境（如网络配置、权限问题等）进行故障排除。如果你遇到了安装中的具体问题，请提供具体的错误信息，以便获得更精确的帮助。

- 阅读更多 -

python怎么创建一个文件夹,用python创建一个文件夹

System

2024-08-12

所有,python

在Python中，您可以使用os模块中的mkdir函数来创建一个新的文件夹。以下是创建文件夹的示例代码：




import os
 
# 创建文件夹的路径
folder_path = 'new_folder'
 
# 使用os.mkdir创建文件夹
if not os.path.exists(folder_path):
    os.mkdir(folder_path)
    print(f"Folder '{folder_path}' created successfully.")
else:
    print(f"Folder '{folder_path}' already exists.")

如果您想要创建多级文件夹，可以使用os.makedirs函数：




import os
 
# 创建多级文件夹的路径
folder_path = 'new_folder/sub_folder'
 
# 使用os.makedirs创建多级文件夹
if not os.path.exists(folder_path):
    os.makedirs(folder_path)
    print(f"Folders '{folder_path}' created successfully.")
else:
    print(f"Folders '{folder_path}' already exists.")

- 阅读更多 -

在Python里，执行Shell脚本的4种方法

System

2024-08-12

所有,python

在Python中执行Shell脚本可以通过多种方式实现，以下是四种常见的方法：

使用os模块的system()函数




import os
os.system('./script.sh')

使用subprocess模块的call()函数




import subprocess
subprocess.call(['./script.sh'])

使用subprocess模块的Popen()类




import subprocess
subprocess.Popen(['./script.sh'])

将Shell脚本的内容直接写入到一个文件，并使用os.chmod()函数赋予执行权限，然后使用subprocess模块执行




import os
with open('script.sh', 'w') as f:
    f.write('#!/bin/bashn echo "Hello, World!"')
os.chmod('script.sh', 0o755)
subprocess.call(['./script.sh'])

每种方法都有其特点，可以根据具体需求选择合适的方法。

- 阅读更多 -

从 MySQL 到 SelectDB 的无缝数据迁移（进阶篇）

System

2024-08-12

所有,mysql




-- 假设我们已经有了一个名为 `users` 的表，并且我们想要将其迁移到 `SelectDB` 实例中。
 
-- 步骤1: 在SelectDB中创建与原表结构相同的表
CREATE TABLE `users` (
  `id` INT NOT NULL AUTO_INCREMENT,
  `username` VARCHAR(255) NOT NULL,
  `email` VARCHAR(255) NOT NULL,
  `created_at` TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`)
);
 
-- 步骤2: 使用INSERT INTO SELECT语句复制数据
INSERT INTO `SelectDB`.`users` 
  (`username`, `email`) 
  SELECT 
    `username`, `email` 
  FROM 
    `MySQL`.`users`;
 
-- 注意：上述代码是示例，实际使用时需要根据实际数据库名称和表结构进行调整。

这段代码展示了如何在不同数据库实例之间迁移数据。首先，在SelectDB中创建一个与原数据库中的users表结构相同的表。然后，使用INSERT INTO SELECT语句将MySQL实例中users表的数据复制到SelectDB中的对应表。这个过程不会影响原有数据库的性能，并且可以在数据迁移过程中保持原有数据的一致性。

System

2024-08-12

所有,mysql

在MySQL中，JOIN语句用于在两个或多个表之间的数据进行连接查询。MySQL支持三种类型的JOIN操作：LEFT JOIN、RIGHT JOIN和INNER JOIN。

LEFT JOIN（左连接）：返回左表的所有记录，即使右表中没有匹配的记录。右表中的列将显示为NULL。




SELECT a.column1, b.column2
FROM table1 a
LEFT JOIN table2 b ON a.common_column = b.common_column;

RIGHT JOIN（右连接）：返回右表的所有记录，即使左表中没有匹配的记录。左表中的列将显示为NULL。




SELECT a.column1, b.column2
FROM table1 a
RIGHT JOIN table2 b ON a.common_column = b.common_column;

INNER JOIN（内连接）：只返回两个表中有匹配的记录。




SELECT a.column1, b.column2
FROM table1 a
INNER JOIN table2 b ON a.common_column = b.common_column;

在实际使用中，JOIN操作可能会导致查询性能下降，尤其是在处理大型表时。为了优化JOIN查询，可以考虑以下方法：

确保JOIN操作的列上有索引。
使用WHERE子句来减少JOIN操作前需要处理的数据量。
对于大型数据集，考虑分割表或者使用数据库分区来提高查询性能。

例如，为了优化LEFT JOIN查询：




SELECT a.column1, b.column2
FROM table1 a
LEFT JOIN table2 b ON a.common_column = b.common_column
WHERE a.common_column IN (SELECT common_column FROM table2);

这里，我们通过子查询来减少参与JOIN操作的数据量，仅查询table2中存在的common\_column值来减少左连接的范围。这样可以避免全表扫描，从而提高查询效率。

System

2024-08-12

所有,mysql




from apscheduler.jobstores.sqlalchemy import SQLAlchemyJobStore
from apscheduler.executors.pool import ThreadPoolExecutor, ProcessPoolExecutor
from apscheduler.schedulers.background import BackgroundScheduler
 
# 创建Scheduler并设置作业存储和执行器
scheduler = BackgroundScheduler(jobstores={
    'default': SQLAlchemyJobStore(url='sqlite:///jobs.sqlite')
})
scheduler.add_executor('processpool', ProcessPoolExecutor(max_workers=5))
scheduler.add_executor('threadpool', ThreadPoolExecutor(max_workers=10))
scheduler.start()
 
# 添加作业
job = scheduler.add_job(my_job_function, 'interval', minutes=2)
 
# 运行时，确保调用 scheduler.shutdown() 以关闭调度器

这个示例展示了如何在Django中使用重写的SQLAlchemyJobStore来替代默认的作业存储方式。这里使用了SQLite数据库作为例子，但在生产环境中你可能需要使用更健壮的数据库比如PostgreSQL或MySQL。代码首先创建了一个Scheduler实例，并设置了使用SQLAlchemyJobStore作为作业存储方式，同时添加了进程池和线程池执行器。最后，代码添加了一个示例作业并启动了调度器。在实际应用中，你需要替换my_job_function为你自己的作业处理函数，并设置合适的触发条件。

- 阅读更多 -