一文读懂RDMA: Remote Direct Memory Access(远程直接内存访问)

RDMA,Remote Direct Memory Access,远程直接内存访问,是一种通过网络在两台计算机之间直接传送数据的技术。它允许一台计算机(客户端)直接访问另一台计算机(服务器)的内存,从而避免了标准网络传输中的数据拷贝和上下文切换开销。

RDMA 的工作原理是:

  1. 应用程序在发送端和接收端提前注册内存区域。
  2. 发送端直接将数据放入内存区域,然后通知网卡要发送的数据和接收端的信息。
  3. 网卡接管数据传输,完成后通知应用程序。

RDMA 的优势在于它消除了大量的数据拷贝和上下文切换,因此它能提供更高的网络吞吐量和更低的延迟。

以下是一个简单的RDMA编程示例,使用了InfiniBand RDMA 技术(一种高速网络技术),通常用于高性能计算 (HPC) 环境。




#include <rdma/rdma_verbs.h>
 
// 注册内存
struct ibv_mr *ibv_reg_mr(struct ibv_pd *pd, void *addr, size_t length, int access);
 
// 创建QP (Queue Pair)
struct ibv_qp *ibv_create_qp(struct ibv_pd *pd, struct ibv_qp_init_attr *qp_init_attr);
 
// 绑定QP到端口
int ibv_bind_mw(struct ibv_qp *qp, struct ibv_mr *mr, enum ibv_access_flags access);
 
// 修改QP状态
int ibv_modify_qp(struct ibv_qp *qp, struct ibv_qp_attr *attr, int attr_mask);
 
// 发送RDMA操作
int ibv_post_send(struct ibv_qp *qp, struct ibv_send_wr *wr, struct ibv_send_wr **bad_wr);
 
// 注册信息
struct ibv_ah *ibv_create_ah(struct ibv_pd *pd, struct ibv_ah_attr *attr);
 
// 注册路由信息
int ibv_attach_mcast(struct ibv_qp *qp, const union ibv_gid *gid, uint16_t lid);
 
// 注销路由信息
int ibv_detach_mcast(struct ibv_qp *qp, const union ibv_gid *gid, uint16_t lid);

在实际应用中,开发者需要使用特定的RDMA库和API来创建RDMA连接,配置QP(Queue Pair),绑定内存,以及发送和接收数据。这些操作通常需要管理网络层面的细节,因此通常只有高性能计算领域的专业人员才会涉及。

评论已关闭

推荐阅读

DDPG 模型解析,附Pytorch完整代码
2024年11月24日
DQN 模型解析,附Pytorch完整代码
2024年11月24日
AIGC实战——Transformer模型
2024年12月01日
Socket TCP 和 UDP 编程基础(Python)
2024年11月30日
python , tcp , udp
如何使用 ChatGPT 进行学术润色?你需要这些指令
2024年12月01日
AI
最新 Python 调用 OpenAi 详细教程实现问答、图像合成、图像理解、语音合成、语音识别(详细教程)
2024年11月24日
ChatGPT 和 DALL·E 2 配合生成故事绘本
2024年12月01日
omegaconf,一个超强的 Python 库!
2024年11月24日
【视觉AIGC识别】误差特征、人脸伪造检测、其他类型假图检测
2024年12月01日
[超级详细]如何在深度学习训练模型过程中使用 GPU 加速
2024年11月29日
Python 物理引擎pymunk最完整教程
2024年11月27日
MediaPipe 人体姿态与手指关键点检测教程
2024年11月27日
深入了解 Taipy:Python 打造 Web 应用的全面教程
2024年11月26日
基于Transformer的时间序列预测模型
2024年11月25日
Python在金融大数据分析中的AI应用(股价分析、量化交易)实战
2024年11月25日
AIGC Gradio系列学习教程之Components
2024年12月01日
Python3 `asyncio` — 异步 I/O,事件循环和并发工具
2024年11月30日
llama-factory SFT系列教程:大模型在自定义数据集 LoRA 训练与部署
2024年12月01日
Python 多线程和多进程用法
2024年11月24日
Python socket详解,全网最全教程
2024年11月27日