代码如下:
#导入包
import pandas as pd
from pandas import DataFrame,Series
#设置路径
path='C:\\Users\\jyjh\\Desktop\\CHROMOSOME_NUMBERS_DATA_OF_GENUS.csv'
#数据列索引
columns_1=['Genus','Latin_name','Error','Gametophytic','Sporophytic','Paresd_n']
columns_2=['Gametophytic','Sporophytic','Paresd_n']
#构建数据表
frame=DataFrame(pd.read_csv(path))
#填充NaN为0
for i in columns_1:
frame[i]=frame[i].fillna(0)
#遍历数据表中的元素
for i in columns_2:
for j in frame.index:
#临时列表
temporary=[]
if isinstance(frame[i].ix[j],int):
temporary=frame[i].ix[j]
else:
for k in frame[i].ix[j].split(','):
temporary.append(int(k.strip()))
#列表元素排序并赋值返回
temporary.sort()
frame[i].ix[j]=temporary
#显示错误的位置
print(i+' '+str(j))
#保存文件
frame.to_csv('data_1.csv')