在下小白,深感自己的代码能力太差劲的,真要是大佬,那不是分分钟写出代码;
我这个是准备跑分类网络,有些模型要求分类的数据集必须是文件夹那种类型已经分好了,我找到的是官网的数据集,没有进行数据预处理;
在我处理数据的时候,在网上搜索关于csv针对多标签处理的时候,发现我没找到好用的代码;
在综合好几个博主的代码放在这里,参考的太多了,没时间就不放了;
实测也可以运行
import pandas as pdimport osimport shutil # 读取表格文件+填写你的csv文件的位置f = open(r"D:\PythonProject\dataset\ISIC_Task3_Training_GroundTruth.csv", "rb") list = pd.read_csv(f)# 进行分类----填写你要分类文件夹的标签,有多少就写多少for i in ['NV','DF','AKIEC','VASC','BKL','MEL','BCC']:if not os.path.exists(i):os.mkdir(i)listnew = list[list["type"] == i]#type是你csv文件里面的你要处理的那一列的列名称l = listnew["image"].tolist()#image这里是你的处理文件的名字的列名称j = str(i)for each in l:#这里是你数据文件放置的位置shutil.copy('D:\\PythonProject\\dataset\\ISIC_Task3_Training_Input\\images\\' + each, j)
在这里放上我的数据csv文件的处理的结果
未处理之前的结果:
代码处理之后的结果
顺便把我使用的数据集链接放在这个地方,
ISIC是一个皮肤损伤数据集,包含10,015张图像和七个标签。每个图像都与其中一个标签相关联,形成一个多类分类问题
ISIC Challenge
我是挂tizi进去的,其他网络不清楚