问题:当利用pandas读取csv文件时,由于文件中含有中文,导致程序发生如下报错:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xca in position 0: invalid continuation byte,代码如下:(由于read_csv,encoding参数的默认编码方式为utf-8,即英文的方式)
import pandas as pd
data = pd.read_csv(‘C:\Users\binbin.liu\Desktop\ttdata.csv’,encoding=’gbk’)
print(data)
解题:在read_csv后面的参数中增加encoding=’gbk’;
import pandas as pd
data = pd.read_csv(‘C:\Users\binbin.liu\Desktop\ttdata.csv’,encoding=’gbk’)
print(data)
相关文章
- 常用的POI格式设置以及使用POI生成EXCEL文件并转为MultipartFile类型上传到服务器
- Mac 下Versions的 svn无法上传 .a 文件的问题
- python 中文编码类型 gb2312 gb180_关于Python中的中文编码问题
- Windows下使用创建多层文件夹 SHCreateDirectoryEx 函数需要注意的问题
- python写入txt不覆盖_用python向txt文件中写数据时的追加和覆盖问题
- 转载:基于 Hive 的文件格式:RCFile 简介及其应用---推酷
- Hive:解决Hive创建文件数过多的问题
- 记录我的 python 学习历程-Day02-while 循环/格式化输出/运算符/编码的初识
- while循环 格式化输出 密码本 编码的初识
- 使用CUDA时遇到了缺少文件的问题,可以尝试以下解决方法