分类 AIGC 下的文章

推荐开源项目：Whisper - 实时语音转文本的利器

2024-09-03

Whisper 是一个由 Apple 开发的高精度开源语音识别模型，它可以实时转录口语、保存语音信息，并且不需要专门的硬件设备。它使用了神经网络算法，具有很高的准确性和可扩展性。

以下是一个简单的 Python 示例，展示如何使用 Whisper 来识别语音：




import sounddevice as sd
from whisper import load_model, infer
 
# 加载预先训练好的 Whisper 模型
model = load_model('path_to_your_whisper_model.wisp')
 
# 定义回调函数，当按下 Ctrl+C 时停止录音
def signal_handler(signal, frame):
    print('Stopping...')
    global continue_recording
    continue_recording = False
 
import os
import signal
 
def record_and_infer(model_path, duration=5):
    # 注册 Ctrl+C 信号处理函数
    signal.signal(signal.SIGINT, signal_handler)
    continue_recording = True
 
    # 开始录音
    print("Press Ctrl+C to stop recording.")
    my_recording = sd.rec(int(duration * fs), samplerate=fs, channels=1)
    sd.wait()  # Wait until recording is finished
 
    # 使用 Whisper 模型进行语音识别
    transcription = infer(model, my_recording, fs)
    print(f"Transcription: {transcription}")
 
# 示例：调用函数，开始录音并进行语音转文本识别
record_and_infer('path_to_your_whisper_model.wisp')

在这个示例中，我们首先导入了必要的库，并定义了一个处理语音识别的函数 record_and_infer。我们使用 sounddevice 来录音，并在录音期间捕获 Ctrl+C 信号以停止录音。然后我们加载了预先训练好的 Whisper 模型，并使用 infer 函数将录制的音频转换成文本。

注意：在运行这个示例之前，你需要将 'path_to_your_whisper_model.wisp' 替换为你的 Whisper 模型的实际路径。

Faster-Whisper 实时识别电脑语音转文本

2024-09-03

Faster-Whisper 是一个基于深度学习的语音识别模型，它可以实时地将人的语音转换成文本。要使用Faster-Whisper进行实时识别，你需要一个支持实时转录的库，如streamlit和gradio。

以下是一个使用streamlit的简单示例：




import streamlit as st
from faster_whisper import Whisper
 
# 初始化Whisper模型
model = Whisper(model_path="model_parameters-0000000000.h5", language="chinese")
 
# 运行实时转录
st.title("Faster Whisper Transcription")
audio = st.audio("path_to_your_audio_file.mp3", format="audio/mp3")
transcription = model.transcribe(audio.value)
st.text_area(transcription, height=200)

以下是一个使用gradio的简单示例：




import gradio as gr
from faster_whisper import Whisper
 
# 初始化Whisper模型
model = Whisper(model_path="model_parameters-0000000000.h5", language="chinese")
 
# 定义实时转录的函数
def transcribe_live(audio_data):
    return model.transcribe(audio_data)
 
# 运行实时转录界面
iface = gr.Interface(
    fn=transcribe_live,
    inputs="microphone",
    outputs="text",
    title="Faster Whisper Transcription",
)
iface.launch()

请注意，你需要将model_path替换为你的Faster Whisper模型的实际路径，并将path_to_your_audio_file.mp3替换为你想要转录的音频文件的路径。这些示例假设你已经安装了faster_whisper库和相关的依赖项。

国内Ubuntu安装 stable-diffusion教程，换成国内镜像

2024-09-03

在中国大陆使用Ubuntu进行Stable Diffusion安装时，由于文件下载源可能受到影响，建议使用国内镜像站点以加快下载速度。以下是使用国内镜像源安装Stable Diffusion的步骤：

更新软件源列表。
替换成国内的镜像源。
安装Stable D�usion。

以下是具体的命令和操作步骤：




# 1. 更新软件源列表
sudo apt update
 
# 2. 替换软件源为国内镜像源，例如使用阿里云的镜像源
# 备份原有的源列表
sudo cp -a /etc/apt/sources.list /etc/apt/sources.list.bak
 
# 替换 /etc/apt/sources.list 文件的内容为阿里云镜像源
# 可以使用 nano 或 vim 编辑器打开文件进行编辑
# 或者直接使用下面的命令替换内容（以阿里云为例）
echo "deb http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse" | sudo tee /etc/apt/sources.list
 
# 3. 再次更新软件源列表
sudo apt update
 
# 然后继续安装Stable Diffusion的步骤
# 这里需要具体的Stable Diffusion安装指令，可能会有所不同

请注意，具体的镜像源地址、Ubuntu版本和Stable Diffusion的安装步骤可能会随着时间变化而变化，请根据实际情况选择合适的镜像源和安装指令。如果遇到具体的错误信息，可以进一步查询相关的解决方案。

ComfyUI安装中文(汉化)

2024-09-03

ComfyUI没有官方的汉化版本，但你可以通过以下方法进行简单的汉化：

下载ComfyUI的源代码。
找到源代码中的本地化文件（通常是.po文件，例如messages.po）。
使用专业的翻译软件（如Poedit）打开.po文件，翻译里面的英文字符串。
保存并编译.po文件，生成对应的二进制.mo文件。
替换原程序中的对应.mo文件。
重新编译安装ComfyUI。

注意：这个过程需要你有一定的计算机技术和对源代码有基本的了解。如果你不熟悉这个过程，可能需要寻求有相关经验的人帮助。

以下是使用命令行进行编译.po文件的例子（假设你已经安装了gettext工具）：




msgfmt --output-file=messages.mo messages.po

替换程序中的.mo文件通常需要对程序源代码进行修改，指定新的路径或名称，然后重新编译安装。如果你不熟悉这个过程，建议寻找专业的开发者协助你。

Linux下单网卡配置多个路由ip方法

2024-09-03

在Linux下，您可以使用ip命令来配置单个网卡的多个路由。以下是一个示例，演示如何添加两个不同的路由：

查看当前路由表：




ip route show

添加第一个路由：




sudo ip route add 192.168.1.0/24 via 10.0.0.1 dev eth0

这里，192.168.1.0/24 是目标网络，10.0.0.1 是网关地址，eth0 是网卡接口名称。

添加第二个路由：




sudo ip route add 192.168.2.0/24 via 10.0.0.2 dev eth0

这里，192.168.2.0/24 是第二个目标网络，10.0.0.2 是第二个网关地址。

确保替换实际的网络、网关和网卡名称。这些路由将保持有效，直到被删除或系统重启。

要删除路由，使用以下命令：




sudo ip route del 192.168.1.0/24
sudo ip route del 192.168.2.0/24

这些命令只在当前会话中有效。要使路由设置在系统重启后依然有效，需要编辑网络配置文件，例如/etc/network/interfaces 或 /etc/sysconfig/network-scripts/route-eth0，具体取决于您使用的发行版。

在低配Windows上部署原版llama.cpp

2024-09-03

在低配Windows上部署原版llama.cpp的步骤如下：

确保您的Windows系统满足llama.cpp的运行要求。
从llama.cpp的GitHub仓库（或其他合适的源）克隆或下载源代码。
安装必要的依赖项，如CMake、Python、Git等。
使用CMake构建项目。
编译生成的项目。
运行llama.cpp。

以下是可能的示例步骤：




# 1. 克隆llama.cpp仓库
git clone https://github.com/microsoft/llama.cpp.git
cd llama.cpp
 
# 2. 安装CMake和其他依赖项（例如，使用vcpkg）
# 3. 构建项目
mkdir build && cd build
cmake ..
 
# 4. 编译
cmake --build .
 
# 5. 运行llama.cpp（例如，使用提供的示例查询）
./llama_index --input_path="path_to_data_files" --output_prefix="output_path"

请注意，具体的依赖项安装和构建步骤可能会根据llama.cpp的版本和您的系统环境有所不同。您可能需要查看项目的README文件或者其他文档来获取更详细的指导。

JS逆向批改网实现自动提交作文调用文心一言API自动生成作文

2024-09-03

由于涉及到API调用和隐私问题，以下代码仅为示例，不包含实际的API密钥和请求处理。实际应用中，你需要替换YOUR_API_KEY和utility.generateArticle函数调用为文心一言提供的正确API端点和方法。




// 假设utility.js是一个封装了文心一言API调用的工具库
const utility = require('./utility.js');
 
// 创建一个简单的表单，用于自动提交作文
const fs = require('fs');
const puppeteer = require('puppeteer');
 
async function autoSubmitEssay(essayPrompt, apiKey) {
  // 使用文心一言生成作文
  const generatedEssay = await utility.generateArticle(essayPrompt, apiKey);
 
  // 启动浏览器和新页面
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
 
  // 打开网页
  await page.goto('http://yoursite.com/submit-essay');
 
  // 在对应的输入框中填入作文内容
  await page.$eval('#essay-input', (el, text) => el.value = text, generatedEssay);
 
  // 自动提交表单
  await page.click('#submit-button');
 
  // 等待页面加载完成
  await page.waitForNavigation();
 
  // 关闭浏览器
  await browser.close();
}
 
// 使用示例
const essayPrompt = '写一篇关于爱心的短篇文章。';
const apiKey = 'YOUR_API_KEY';
autoSubmitEssay(essayPrompt, apiKey);

请注意，实际应用中你需要处理好API调用的速率限制、错误处理、浏览器自动化的稳定性以及隐私和安全性问题。这个示例假设你已经有了文心一言的API密钥和正确的API端点，并且utility.generateArticle是一个已经定义好的函数，负责调用文心一言API生成作文。

用Ollama 和 Open WebUI本地部署Llama 3.1 8B

2024-09-02

Ollama 是一个基于LLM（大型语言模型）的聊天应用程序，而 Open WebUI 是一个用于展示和控制 AI 模型的开源工具。要在本地部署 Ollama 和 Open WebUI，您需要按照以下步骤操作：

安装Docker和Docker Compose（如果您还没有安装）。
克隆 Open WebUI 的仓库。
修改 .env 文件以适配您的设置。
使用 Docker Compose 启动所有服务。

以下是一个简化的示例步骤：




# 1. 安装Docker和Docker Compose
curl -fsSL https://get.docker.com -o get-docker.sh
sudo sh get-docker.sh
sudo systemctl --now enable docker
 
# 安装Docker Compose
sudo curl -L "https://github.com/docker/compose/releases/download/v2.13.0/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
sudo chmod +x /usr/local/bin/docker-compose
 
# 2. 克隆 Open WebUI 仓库
git clone https://github.com/sparrow-ai/open-webui.git
cd open-webui
 
# 3. 修改 .env 文件
# 这一步需要根据您的实际情况进行配置，例如设置模型的路径、端口等
 
# 4. 使用 Docker Compose 启动服务
docker-compose up -d

请注意，这只是一个示例，实际步骤可能会根据您的操作系统和环境配置有所不同。您需要根据 Ollama 和 Open WebUI 的官方文档进行详细的配置和部署。

由于涉及到大型模型部署，请确保您拥有足够的硬件资源，并遵循相关法律法规和模型使用规范。

纯C/C++实现的Stable Diffusion项目介绍及快速启动指南

2024-09-02




#include <stdio.h>
 
// 假设的Stable Diffusion项目介绍函数
void introduction_to_stable_diffusion() {
    printf("欢迎使用Stable Diffusion AI工具！\n");
    printf("Stable Diffusion是一种基于深度学习的技术，能够生成高质量的图像。\n");
    // 更多项目介绍内容
}
 
int main() {
    introduction_to_stable_diffusion();
    printf("快速启动指南：\n");
    printf("1. 安装依赖库：确保已安装所有必需的库，如PyTorch等。\n");
    printf("2. 下载模型：从Model Hub下载适合的Stable Diffusion模型。\n");
    printf("3. 运行Stable Diffusion：使用提供的命令行工具或API启动生成过程。\n");
    // 其他启动指南细节
    return 0;
}

这个示例代码提供了一个简单的函数introduction_to_stable_diffusion来介绍Stable Diffusion，并在main函数中提供了一个快速启动指南。这个指南是教用户如何准备和运行一个Stable Diffusion项目的基本步骤。