分类 AIGC 下的文章

基于阿里云PAI部署LLaMA Factory 完成Llama3低代码微调和部署

2024-09-02

在使用阿里云PAI（Platform of Artificial Intelligence）部署LLaMA Factory进行LLM（Large Language Model）微调和部署时，需要遵循以下步骤：

准备数据集：根据LLaMA Factory的要求准备相应的数据集。
配置环境：在PAI平台上配置相应的环境，包括LLaMA的预训练模型和微调所需的资源。
编写代码：使用LLaMA Factory的代码框架编写微调的代码。
提交任务：在PAI平台上提交微调任务并监控进度。
部署模型：微调完成后，将模型部署为一个服务，使其可以进行推理。

以下是一个简化的代码示例，展示如何在PAI上使用LLaMA Factory进行模型微调：




version: "1.0"
name: "llama_factory_train"
type: "ALGORITHM"
comment: "LLaMA Factory Training Job"
params:
  gpu_num: 8
  cpu_num: 32
  memory: "100Gi"
  command: "python -m llama_factory.train"
  data:
    - path: "/data/dataset.json"
      type: "dataset"
    - path: "/data/vocab.json"
      type: "vocab"
  output:
    - path: "/output/model"
      type: "model"
  algorithm_name: "llama_factory"
  algorithm_version: "0.1"
  image: "registry.cn-shanghai.aliyuncs.com/your_repo/llama_factory:v1"
  envs:
    - "ENV_VAR_NAME=ENV_VAR_VALUE"
  args:
    - "--train_file"
    - "/data/dataset.json"
    - "--eval_file"
    - "/data/dataset.json"
    - "--output_dir"
    - "/output/model"
    - "--model_type"
    - "llama"
    - "--model_name_or_path"
    - "your_llama_model"
    - "--tokenizer_name"
    - "your_tokenizer"
    - "--do_train"
    - "True"
    - "--per_device_train_batch_size"
    - "1"
    - "--per_device_eval_batch_size"
    - "1"
    - "--gradient_accumulation_steps"
    - "16"
    - "--learning_rate"
    - "3e-4"
    - "--num_train_epochs"
    - "1"
    - "--overwrite_output_dir"
    - "True"

在这个例子中，我们定义了一个作业配置文件，指定了资源参数、使用的镜像、环境变量、命令和参数。这个配置文件会在PAI平台上启动一个LLaMA Factory的微调作业。

请注意，实际部署时，你需要替换数据集路径、模型路径、Docker镜像地址、环境变量和其他参数以适应你的具体设置。

以上代码仅为一个示例，具体实现可能需要根据LLaMA Factory和PAI平台的具体API进行调整。

System

2024-09-02

所有,AIGC




#!/bin/bash
# 在Linux上安装LLaMA Factory v0.8.3 增量预训练/监督微调
 
# 更新系统包索引并安装依赖
sudo apt-update
sudo apt-get install -y git python3-venv curl
 
# 安装LLaMA Factory
cd /opt
sudo mkdir -p llama-factory
cd llama-factory
git clone https://github.com/huggingface/llama-factory.git
cd llama-factory
git checkout v0.8.3
 
# 创建Python虚拟环境并安装LLaMA Factory
python3 -m venv venv
source venv/bin/activate
pip install --upgrade pip setuptools wheel
pip install -e .
 
# 显示安装成功的消息
echo "LLaMA Factory v0.8.3 已成功安装。"

这段代码首先更新系统包索引并安装必要的依赖项，然后从GitHub仓库克隆LLaMA Factory项目并检出v0.8.3版本。接着，它在/opt/llama-factory目录下创建一个Python虚拟环境，并在其中安装LLaMA Factory。最后，它通知用户LLaMA Factory已成功安装。

System

2024-09-02

所有,AIGC

报错信息不完整，但从给出的部分来看，这个错误与"Torch is not able to use DirectML"有关。Torch是一个用于机器学习的开源Python库，而DirectML是一个DirectX机器学习API，它允许GPU加速机器学习模型的执行。

解释：

这个错误表明Torch试图使用DirectML，但出于某种原因不能正确地做到这一点。可能的原因包括不兼容的软件版本、DirectML未被当前的GPU或驱动支持、系统配置问题等。

解决方法：

确认你的硬件（GPU和驱动程序）支持DirectML。
确保你的Torch版本和PyTorch包是最新的，以确保兼容性。
如果你在Windows上，确保安装了正确的Visual C++运行时库。
如果你在使用的是Linux或其他非Windows系统，请确保DirectML的前置条件已满足。
如果问题依旧存在，尝试在不使用DirectML的情况下运行Torch，通常可以通过设置环境变量USE_DIRECTML=0来实现。
查看Torch和DirectML的官方文档，以获取更多的支持信息和故障排除指南。
如果你是在一个复杂的环境中运行，例如虚拟机或容器中，确保DirectML已被宿主系统正确支持和配置。

如果以上步骤无法解决问题，可能需要更详细的错误信息或者联系Torch社区寻求帮助。

- 阅读更多 -

Lag-Llama：时间序列预测的开源基础模型中文安装与使用指南

System

2024-09-01

所有,AIGC

由于Lag-Llama是一个基于LLaMA的模型，并且专注于时间序列预测，因此安装和使用的步骤主要涉及到LLaMA模型的安装和配置。以下是基于LLaMA的基础模型安装和使用的简化步骤：

克隆Lag-Llama的仓库：




git clone https://github.com/huggingface/lag-llama.git

安装Python依赖：




cd lag-llama
pip install -r requirements.txt

下载LLaMA模型，可以选择13B、33B或65B等不同尺寸的模型。例如，下载13B模型：
```
bash download_model.sh 13B
```

运行预测示例：




from lag_llama.llama_wrapper import LlamaWrapper
 
llama = LlamaWrapper.from_pretrained("13B")
prompt = "世界上有多少种程序设计语言？"
output = llama.generate(prompt)
 
print(output)

请注意，以上代码是基于LLaMA模型的基础使用，并非Lag-Llama特有的功能。Lag-Llama可能还需要安装其他依赖或者使用特定的接口来进行时间序列预测。具体使用时，请参考Lag-Llama的官方文档。

System

2024-09-01

所有,AIGC

解释：

NansException是一个通常在机器学习或深度学习模型中抛出的异常，表示在模型的计算过程中产生了全是NaN（Not a Number，非数字）的tensor。这通常是因为模型参数不稳定，导致无法计算出有效的数值，可能是因为学习率过高、数据预处理问题、模型结构设计不当或者内存不足等原因。

解决方法：

检查数据集：确保输入数据没有异常值或者无法处理的情况。
标准化和归一化：对输入数据进行标准化或归一化处理，确保数据分布的稳定性。
降低学习率：如果是参数更新过程中产生NaN，尝试降低学习率。
检查模型初始化：确保模型权重被适当初始化。
监控梯度爆炸：使用梯度裁剪技术，如TensorFlow中的tf.clip_by_global_norm，以防梯度爆炸。
使用数值稳定的激活函数：如LeakyReLU或Swish代替ReLU。
检查内存和GPU使用情况：确保有足够的内存和GPU资源来支持模型的运行。
分步调试：从最简单的模型开始，逐步添加复杂性，找出导致NaN的确切位置。
查看模型日志：分析模型的日志输出，查找可能的警告信息或者错误提示。
更新库和依赖：确保所有的深度学习库都是最新版本，避免已知的bug。

如果以上步骤无法解决问题，可能需要进一步调试或查看模型的具体实现细节。

System

2024-09-01

所有,AIGC

CopilotKit 是一个开源框架，用于在应用程序内部部署人工智能代理，并使用 Langchain 自动执行任何命令。以下是一个简单的使用示例：

首先，安装CopilotKit：




pip install copilotkit

然后，使用CopilotKit创建一个简单的应用内 AI 代理，例如，一个处理文本查询并使用 OpenAI 的 GPT-3 模型进行响应的代理：




from copilotkit import Copilot, OpenAIProxy
 
# 初始化一个 OpenAI 代理
openai_proxy = OpenAIProxy(
    openai_api_key="YOUR_OPENAI_API_KEY",
    proxy_name="MyAppCopilot"
)
 
# 初始化 Copilot 实例
copilot = Copilot(
    openai_proxy=openai_proxy,
    # 设置代理响应的最大tokens数量
    max_tokens=75,
)
 
# 使用 while 循环来处理用户的输入，并产生相应的响应
while True:
    user_input = input("请输入您的指令：")
    response = copilot.handle_input(user_input)
    print(response)

在这个例子中，我们创建了一个简单的交互式会话，用户输入指令，AI 代理根据指令作出响应。CopilotKit 使用 Langchain 来理解和执行用户的指令。

请注意，你需要自己的 OpenAI API 密钥，并替换 "YOUR_OPENAI_API_KEY" 为你的 API 密钥。

这只是一个基础示例，CopilotKit 支持更复杂的功能，比如使用多个模型、管理用户历史、优化提示等等。

System

2024-09-01

所有,AIGC

这个问题似乎是在询问一个开源项目，它旨在提供 Github Copilot 的本地版本，同时确保隐私和数据保护。

首先，我们需要明确一点，Github Copilot 是一个 AI 辅助编程工具，它可以在编写代码时提供实时建议。这个工具非常受欢迎，但是它需要互联网连接，并且会将一些用户数据发送到 Github 的服务器。

开源项目 "Continue" 应该是一个尝试提供一个本地版本的 AI 辅助编程工具，它可以在不泄露用户数据和隐私的情况下工作。

目前，关于这个项目的具体实现细节还不清楚，因为它还在早期开发阶段，并且还没有一个稳定的版本发布。但是，我们可以根据已有的信息来想象一下这个项目可能的实现方式。

一种可能的实现方式是使用开源的深度学习框架，如 TensorFlow 或 PyTorch，在用户的本地计算机上训练一个 AI 模型。然后，该模型可以在用户编写代码时提供实时的代码建议。

由于所有的数据处理和建议生成都发生在用户自己的设备上，因此不会有数据外泄的问题。

由于这个项目还在开发中，我们可能需要等到它更接近完成才能看到具体的实现和使用方法。

如果你想要跟踪这个项目的进度，你可以通过以下方式：

访问项目的官方网站或 Github 仓库，查看项目的进展。
关注项目的开发者或参与者的社交媒体账号，获取最新的动态。
参与到项目的讨论中来，提供反馈和帮助。

请注意，由于涉及到数据隐私和安全性问题，这个项目可能需要严格的审查流程，并且可能不会被所有人接受。

- 阅读更多 -

rabbitMQ安装与简单demo

System

2024-09-01

所有,AIGC

RabbitMQ是一个消息代理和队列服务器，用于通过可靠消息传递进行异步通信。以下是在Linux系统上安装RabbitMQ并使用Python创建简单的生产者和消费者的步骤和代码示例。

安装RabbitMQ:

对于基于Debian的系统（如Ubuntu）:




sudo apt-get update
sudo apt-get install rabbitmq-server

对于基于RPM的系统（如CentOS）:




sudo yum install rabbitmq-server
sudo systemctl start rabbitmq-server
sudo systemctl enable rabbitmq-server

启动RabbitMQ管理界面（可选）:




sudo rabbitmq-plugins enable rabbitmq_management

通过浏览器访问RabbitMQ管理界面，默认情况下可以在 http://localhost:15672 访问，使用用户名和密码登录。
使用Python创建简单的生产者和消费者:

生产者（发送消息）:




import pika
 
connection = pika.BlockingConnection(pika.ConnectionParameters('localhost'))
channel = connection.channel()
 
channel.queue_declare(queue='hello')
 
channel.basic_publish(exchange='',
                      routing_key='hello',
                      body='Hello World!')
print(" [x] Sent 'Hello World!'")
connection.close()

消费者（接收消息）:




import pika
 
connection = pika.BlockingConnection(pika.ConnectionParameters('localhost'))
channel = connection.channel()
 
channel.queue_declare(queue='hello')
 
def callback(ch, method, properties, body):
    print(f" [x] Received {body}")
 
channel.basic_consume(queue='hello', on_message_callback=callback, auto_ack=True)
 
print(' [*] Waiting for messages. To exit press CTRL+C')
channel.start_consuming()

确保RabbitMQ服务正在运行，然后先运行生产者脚本发送消息，随后运行消费者脚本接收并打印出消息内容。

System

2024-09-01

所有,AIGC




from langchain.llm import LLM
from langchain.vectorstores import Neo4jVectorStore
from langchain.schema import LLMDataRequest
from langchain.vectorstores import Neo4jConfig
from langchain.llms import LLaMAConfig
from graphrag import GraphRAG
 
# 初始化LLaMA 3.1模型
llama_config = LLaMAConfig(version="3.1")
llama = LLM(llama_config)
 
# 初始化Neo4j配置
neo4j_config = Neo4jConfig(uri="bolt://localhost:7687", user="neo4j", password="password")
 
# 初始化向量数据库
vector_store = Neo4jVectorStore(config=neo4j_config)
 
# 创建图谱知识库
graph = GraphRAG(vector_store=vector_store)
 
# 创建向量数据请求
data_request = LLMDataRequest(prompt="What is the capital of France?", llm=llama)
 
# 向图谱知识库添加数据
graph.add_data_request(data_request)
 
# 运行请求并获取结果
response = graph.run()
print(response)

这段代码展示了如何使用GraphRAG库与LLaMA模型和Neo4j向量数据库进行集成，以提供知识图谱驱动的对话功能。代码首先初始化了LLaMA模型，然后定义了连接到Neo4j数据库的配置。接着，代码创建了一个Neo4jVectorStore实例和一个GraphRAG实例。最后，代码创建了一个LLMDataRequest，并将其添加到图谱知识库中，然后运行并打印出响应。

- 阅读更多 -

Hexo搭建个人博客系列- Butterfly侧边栏公众号

System

2024-09-01

所有,AIGC

在Hexo搭建的个人博客中，我们可以在侧边栏添加公众号，这样可以增加和公众号的联系，增加用户的互动。

首先，我们需要在主题配置文件中的_config.butterfly.yml中找到sidebar对应的设置项，然后添加公众号的相关信息。

以下是添加公众号的两种方式：

直接添加公众号

在_config.butterfly.yml文件中找到sidebar对应的设置项，然后添加公众号的相关信息。




sidebar:
  # 公众号
  public_number:
    enable: true
    title: 公众号
    avatar: /images/weixin.jpg
    content: '扫描二维码关注我们'
    sub_content: '每日更新，不错过最新知识'

在这个配置中，title是公众号的标题，avatar是公众号的头像，content是公众号的主要内容，sub_content是公众号的副标题内容。

添加公众号列表

如果你有多个公众号，你可以添加一个公众号列表。




sidebar:
  # 公众号
  public_number:
    enable: true
    title: 公众号
    list:
      - avatar: /images/weixin.jpg
        content: '扫描二维码关注我们'
        sub_content: '每日更新，不错过最新知识'
      - avatar: /images/weixin.jpg
        content: '扫描二维码关注我们'
        sub_content: '每日更新，不错过最新知识'

在这个配置中，list是一个数组，可以包含多个公众号信息。每个公众号信息包含avatar、content和sub_content。

注意：在添加公众号时，你需要将你的公众号二维码保存为图片，并放在你的Hexo项目中对应的images文件夹下。

以上就是在Hexo搭建的个人博客中添加公众号的两种方法。

- 阅读更多 -