csv:逗号分隔符文件
tsv:制表分隔符文件
二者本质上都属于类文本文件,一般用excel和文本编辑器均可打开。
如果是在程序中读取,并进行相互转化,可以用pandas这个python库。
直接转换的代码:
import pandas as pdif __name__ == '__main__':# 此处是读取中文数据,如果是英文数据,编码可能是'ISO 8859-1'pd_all = pd.read_csv("./Test_Data.csv", sep=',', encoding='utf-8') # 保存为tsv文件,当然也可以保存为csv文件,二者区别在于sep为'\t'还是','pd_all.to_csv("./Test_Data.tsv", index=False, sep='\t', encoding='utf-8')
需要打乱数据的代码:
import pandas as pdfrom sklearn.utils import shuffle # 用于数据的随机排列,也可不用if __name__ == '__main__':# 此处是读取中文数据,如果是英文数据,编码可能是'ISO 8859-1'pd_all = pd.read_csv("./Test_Data.csv", sep=',', encoding='utf-8') # 打乱数据 pd_all = shuffle(pd_all)# 保存为tsv文件,当然也可以保存为csv文件,二者区别在于sep为'\t'还是','pd_all.to_csv("./Test_Data.tsv", index=False, sep='\t', encoding='utf-8')