Yolov5多边形标签和JSON数据格式转换
作者:Pandas_007 发布时间:2023-11-06 17:31:24
Labelme简要介绍
通过labelme对图进行标注后,得到的是json文件,而Yolov5对数据进行模型构建的时候,读取需要的是txt格式的文件。所以需要先通过Python进行文件格式的转换
注:labelme是麻省理工(MIT)的计算机科学和人工智能实验室(CSAIL)研发的图像标注工具,人们可以使用该工具创建定制化标注任务或执行图像标注,项目源代码已经开源。
Labelme程序运行,通过标注后如图所示:
图1 Labelme标注
此图片可以得到以下格式的json文件:
文件中的字段如下:
‘version’——版本号
‘shapes’——里面装的是Yolov5需要的数据
‘label’——你在labelme里面设置的类
‘points’——点的坐标
我这里的label如图1所示共有5类,等下进行json转化为txt的时候用
对应这些类创一个字典以便json进行转换
例:name2id={'bike':0,'arrow':1,'crossline':2,'building':3,'car':4,'person':5}
可能某一张图片中可能不存在上述的某个类,所以这里请以某个json中最多的类创建这个字典。
多边形标签的处理方法
由于yolov5 仅支持矩形图形的识别,所以需要通过数据处理,将多边形变换为矩形。
处理原理:遍历该标签所有的坐标,获取最大x_max,y_max,最小x_min,y_min的x和y的坐标。
然后再进行数据的规范化。
转换后的txt格式如下:
第一个是类,比如第一行中的第一个数字是4,我的name2id中car也为4,即这里指代的就是'car'这个标签。
第一行 第二个 和 第三个数字 为数字为图片中心点(x,y)的坐标
第四个数字和第五个数字对应的是 这个标签的 宽和高。
代码实现
多边形标签代码实现方法
x_max=0
y_max=0
x_min=100000
y_min=100000
for lk in range(len(i['points'])):
x1=float(i['points'][lk][0])
y1=float(i['points'][lk][1])
# print(x1)
if x_max<x1:
x_max=x1
if y_max<y1:
y_max=y1
if y_min>y1:
y_min=y1
if x_min>x1:
x_min=x1
bb = (x_min, y_max, x_max, y_min)
json转化为txt的部分代码如下:
def decode_json(json_floder_path,txt_outer_path, json_name):
# json_floder_path='E:\\Python_package\\itesjson\\'
# json_name='V1125.json'
txt_name = txt_outer_path + json_name[:-5] + '.txt'
with open(txt_name,'w') as f:
json_path = os.path.join(json_floder_path, json_name)#os路径融合
data = json.load(open(json_path, 'r', encoding='gb2312',errors='ignore'))
img_w = data['imageWidth']#图片的高
img_h = data['imageHeight']#图片的宽
isshape_type=data['shapes'][0]['shape_type']
print(isshape_type)
#print(isshape_type)
#print('下方判断根据这里的值可以设置为你自己的类型,我这里是polygon'多边形)
#len(data['shapes'])
for i in data['shapes']:
label_name = i['label']#得到json中你标记的类名
if (i['shape_type'] == 'polygon'):#数据类型为多边形 需要转化为矩形
x_max=0
y_max=0
x_min=100000
y_min=100000
for lk in range(len(i['points'])):
x1=float(i['points'][lk][0])
y1=float(i['points'][lk][1])
# print(x1)
if x_max<x1:
x_max=x1
if y_max<y1:
y_max=y1
if y_min>y1:
y_min=y1
if x_min>x1:
x_min=x1
bb = (x_min, y_max, x_max, y_min)
if (i['shape_type'] == 'rectangle'):#为矩形不需要转换
x1 = float(i['points'][0][0])
y1 = float(i['points'][0][1])
x2 = float(i['points'][1][0])
y2 = float(i['points'][1][1])
bb = (x1, y1, x2, y2)
bbox = convert((img_w, img_h), bb)
try:
f.write(str(name2id[label_name]) + " " + " ".join([str(a) for a in bbox]) + '\n')
except:
pass
json_floder——读取json的文件夹的绝对路径
txt_outer_path——保存txt文本的文件夹的绝对路径
json_name——json_name是json文本的名字
读取该类的坐标然后进行数字规范化
数字规范化的代码如下:
def convert(img_size, box):
dw = 1. / (img_size[0])
dh = 1. / (img_size[1])
x = (box[0] + box[2]) / 2.0
y = (box[1] + box[3]) / 2.0
w = abs(box[2] - box[0])
h = abs(box[3] - box[1])#加入绝对值的原因是只需要它的宽和高,以免出现负数
x = x * dw
w = w * dw
y = y * dh
h = h * dh
return (x, y, w, h)
最后附上我的完整代码:
#处理labelme多边形矩阵的标注 json转化txt
import json
import os
name2id={'bike':0,'arrow':1,'crossline':2,'building':3,'car':4,'person':5}
def convert(img_size, box):
dw = 1. / (img_size[0])
dh = 1. / (img_size[1])
x = (box[0] + box[2]) / 2.0
y = (box[1] + box[3]) / 2.0
w = abs(box[2] - box[0])
h = abs(box[3] - box[1])
x = x * dw
w = w * dw
y = y * dh
h = h * dh
return (x, y, w, h)
def decode_json(json_floder_path,txt_outer_path, json_name):
# json_floder_path='E:\\Python_package\\itesjson\\'
# json_name='V1125.json'
txt_name = txt_outer_path + json_name[:-5] + '.txt'
with open(txt_name,'w') as f:
json_path = os.path.join(json_floder_path, json_name)#os路径融合
data = json.load(open(json_path, 'r', encoding='gb2312',errors='ignore'))
img_w = data['imageWidth']#图片的高
img_h = data['imageHeight']#图片的宽
isshape_type=data['shapes'][0]['shape_type']
print(isshape_type)
#print(isshape_type)
#print('下方判断根据这里的值可以设置为你自己的类型,我这里是polygon'多边形)
#len(data['shapes'])
for i in data['shapes']:
label_name = i['label']#得到json中你标记的类名
if (i['shape_type'] == 'polygon'):#数据类型为多边形 需要转化为矩形
x_max=0
y_max=0
x_min=100000
y_min=100000
for lk in range(len(i['points'])):
x1=float(i['points'][lk][0])
y1=float(i['points'][lk][1])
# print(x1)
if x_max<x1:
x_max=x1
if y_max<y1:
y_max=y1
if y_min>y1:
y_min=y1
if x_min>x1:
x_min=x1
bb = (x_min, y_max, x_max, y_min)
if (i['shape_type'] == 'rectangle'):#为矩形不需要转换
x1 = float(i['points'][0][0])
y1 = float(i['points'][0][1])
x2 = float(i['points'][1][0])
y2 = float(i['points'][1][1])
bb = (x1, y1, x2, y2)
bbox = convert((img_w, img_h), bb)
try:
f.write(str(name2id[label_name]) + " " + " ".join([str(a) for a in bbox]) + '\n')
except:
pass
if __name__ == "__main__":
json_floder_path = 'E:\Python_package\\itesjson\\'#存放json的文件夹的绝对路径
txt_outer_path='E:\Python_package\\e1\\'#存放txt的文件夹绝对路径
json_names = os.listdir(json_floder_path)
print("共有:{}个文件待转化".format(len(json_names)))
flagcount=0
for json_name in json_names:
decode_json(json_floder_path,txt_outer_path,json_name)
flagcount+=1
print("还剩下{}个文件未转化".format(len(json_names)-flagcount))
break
# break
print('转化全部完毕')
os.listdir——读取文件下的所有文件。请先创建一个只有json文件的文件夹
记得先修改!!!if __name__==“__main__”后的参数
json_floder_path——改成你自己的json文件夹路径
txt_outer_path——改成你自己的输出文件夹路径
来源:https://blog.csdn.net/qq_57329395/article/details/128079776
猜你喜欢
- 在官网下载python和pycharm的安装包python: https://www.python.org/downloads/window
- 我就废话不多说了,大家还是直接看代码吧~/** 二分幂法 求x^n */// 求整数幂package mainimport (
- 代码如下:CREATE FUNCTION dbo.f_splitstr( @str varchar(8000) )RETURNS
- 本文实例为大家分享了React实现表格选取的具体代码,供大家参考,具体内容如下在工作中,遇到一个需求,在表格中实现类似于Excel选中一片区
- 1 之前我们学习了列表,知道列表可以用来存储一组数据,可以增删改查,可以遍历2 之前我们学习了字典,知道字典可以用来存储键值对,与列表类似,
- 安装laravel框架命令行cd进入指定目录下,执行composer create-project --prefer-dist larave
- 本文实例讲述了php简单获取复选框值的方法。分享给大家供大家参考,具体如下:html:<form id="form1&quo
- 一个已知管用的方法是,使用session_set_save_handler,接管所有的session管理工作,一般是把session信息存储
- 介绍方法之前,我们先说说Python的解释器,由于Python是动态编译的语言,和C/C++、Java或者Kotlin等静态语言不同,它是在
- 本文实例讲述了python实现可将字符转换成大写的tcp服务器。分享给大家供大家参考。具体分析如下:下面的python代码执行后通过tcp监
- 实战场景这次被我们盯上的平台是【SMZDM】。本次目标站点是:aHR0cHM6Ly93d3cuc216ZG0uY29tLw==。正式开始前,
- 目录1.准备工作2. 开始2.1 生成控件2.2 定义输入和计算函数2.3 绑定键盘事件2.4 循环3.全部代码4. 结束语做一个计算器,这
- 一、利用webbrowser.open()打开一个网站:>>> import webbrowser >>>
- 一个常常令设计师和前端开发人员都头疼的事情就是字体的使用,设计师常常在设计稿中使用某些很漂亮的字体,以实现比较酷炫的界面。但这样常常给编码人
- 本文详细介绍了asp中如何使用sql语句删除数据库中的记录,初学asp者来看看!1,首先要明确删除哪条记录无非还就是SQL语句了,比如对应到
- 一、构造dataframeimport pandas as pdimport numpy as npdf=pd.DataFrame(np.a
- 一、问题描述给定两个字符串,求解这两个字符串的最长公共子序列(Longest Common Sequence)。比如字符串1:BDCABA;
- 之前在某本书上看到一个程序,可以通过 Python 记录下全局范围内的键盘事件,使用的是 ctypes 库。后来几经尝试,始终不能成功运行。
- 对其中的参数进行解释plt.subplots(figsize=(9, 9))设置画面大小,会使得整个画面等比例放大的sns.heapmap(
- 本文实例讲述了Python使用itchat模块实现简单的微信控制电脑功能。分享给大家供大家参考,具体如下:#!/usr/bin/python