pandas读csv出现uncodeDecodeError UTF-8问题
1、先看错误提示信息,曾经出过汉字显示问题,于是首先怀疑是否还是汉字显示问题,是否是设置问题。
经检查pycharm设置正确,没问题。
2、import numpy as np
import pandas as pd
#显示所有列
pd.set_option('display.max_columns', None)
#显示所有行
pd.set_option('display.max_rows', None)
#设置value的显示长度为100,默认为50
pd.set_option('max_colwidth',100)
filename = "c:\\gdp.csv"
filename = "c:\\WirelessDiagLog.csv"
df=pd.read_csv(filename,header=None,sep='/t')
经检查 发现 pd.read_csv 少加了 encoding='utf-8' 或者 encoding='gb18030' 参数。
3、运行,结果发现还是有问题,这就比较奇怪了,参数加了
问题依旧!
更换另一个"c:\\gdp.csv"的CSV文件 还是同样问题!
4、检查文件保存类型 发现问题! 适合参数UTF-8不匹配造成的。
按照以下步骤修改之.
1) 记事本打开csv文件
5、2) 打开 文件 菜单 --下拉列表点击 另存文件 ;
在新打开的另存为菜单进行下一步操作。
6、在另存为界面,会看到以下内容:
注意修改:
1)文件类型;
2)编码
7、注意修改:
1)文件类型 为 *.*
2)编码修改ASNI 为 UTF-8
3)保存。
8、然后运行程序
import numpy as np
import pandas as pd
#显示所有列
pd.set_option('display.max_columns', None)
#显示所有行
pd.set_option('display.max_rows', None)
#设置value的显示长度为100,默认为50
pd.set_option('max_colwidth',100)
filename = "c:\\gdp.csv"
filename = "c:\\WirelessDiagLog.csv"
df=pd.read_csv(filename,sep='\t',encoding='utf-8')
print(df)
#print(df.head(3))
终于OK,这个问题开始没有想到是编码问题,耽误了很多时间。