labelimg标注的VOC格式标签xml文件和yolo格式标签txt文件相互转换

要实现VOC格式标签xml文件和YOLO格式标签txt文件的互相转换,需要编写相应的转换代码。以下是Python代码示例:




import os
import glob
import xml.etree.ElementTree as ET
import numpy as np
 
# VOC标签转YOLO标签
def convert_voc_to_yolo(xml_file, txt_file, classes):
    with open(txt_file, 'w') as f:
        tree = ET.parse(xml_file)
        root = tree.getroot()
        size = root.find('size')
        w = int(size.find('width').text)
        h = int(size.find('height').text)
        
        for obj in root.iter('object'):
            cls = obj.find('name').text
            if cls not in classes:
                continue
            cls_id = classes.index(cls)
            xml_box = obj.find('bndbox')
            xmin = int(xml_box.find('xmin').text)
            ymin = int(xml_box.find('ymin').text)
            xmax = int(xml_box.find('xmax').text)
            ymax = int(xml_box.find('ymax').text)
            x_center = (xmin + xmax) / 2 / w
            y_center = (ymin + ymax) / 2 / h
            width = (xmax - xmin) / w
            height = (ymax - ymin) / h
            f.write(' '.join([str(cls_id), str(x_center), str(y_center), str(width), str(height)]) + '\n')
 
# YOLO标签转VOC标签
def convert_yolo_to_voc(txt_file, xml_file, classes):
    tree = ET.parse(xml_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
    
    with open(txt_file, 'r') as f:
        lines = f.readlines()
    
    for line in lines:
        cls_id, x_center, y_center, width, height = [float(x) for x in line.split()]
        xmin = int((2 * x_center * w) - (width * w))
        ymin = int((2 * y_center * h) - (height * h))
        xmax = int(xmin + (width * w))
        ymax = int(ymin + (height * h))
        
        obj = ET.Element('object')
        name = ET.SubElement(obj, 'name')
        name.text = classes[int(cls_id)]
        bndbox = ET.SubElement(obj, 'bndbox')
        xmin_tag = ET.SubElement(bndbox, 'xmin')
        xmin_tag.text = str(xmin)
        ymi
none
最后修改于:2024年08月13日 18:07

评论已关闭

推荐阅读

DDPG 模型解析,附Pytorch完整代码
2024年11月24日
DQN 模型解析,附Pytorch完整代码
2024年11月24日
AIGC实战——Transformer模型
2024年12月01日
Socket TCP 和 UDP 编程基础(Python)
2024年11月30日
python , tcp , udp
如何使用 ChatGPT 进行学术润色?你需要这些指令
2024年12月01日
AI
最新 Python 调用 OpenAi 详细教程实现问答、图像合成、图像理解、语音合成、语音识别(详细教程)
2024年11月24日
ChatGPT 和 DALL·E 2 配合生成故事绘本
2024年12月01日
omegaconf,一个超强的 Python 库!
2024年11月24日
【视觉AIGC识别】误差特征、人脸伪造检测、其他类型假图检测
2024年12月01日
[超级详细]如何在深度学习训练模型过程中使用 GPU 加速
2024年11月29日
Python 物理引擎pymunk最完整教程
2024年11月27日
MediaPipe 人体姿态与手指关键点检测教程
2024年11月27日
深入了解 Taipy:Python 打造 Web 应用的全面教程
2024年11月26日
基于Transformer的时间序列预测模型
2024年11月25日
Python在金融大数据分析中的AI应用(股价分析、量化交易)实战
2024年11月25日
AIGC Gradio系列学习教程之Components
2024年12月01日
Python3 `asyncio` — 异步 I/O,事件循环和并发工具
2024年11月30日
llama-factory SFT系列教程:大模型在自定义数据集 LoRA 训练与部署
2024年12月01日
Python 多线程和多进程用法
2024年11月24日
Python socket详解,全网最全教程
2024年11月27日