标签:utf Python gb2312 invalid decode byte
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb8 in position 0: invalid start byte的解决办法
刚开始接触Python,为了完成学习任务边学习Python基础知识,边应用,最近在学习jieba分词,将指定路径下的文本文件中的内容进行分词并将分好词的内容保存到指定路径下的TXT文件中遇到一个问题:
错误如下:
查了很久终于找到了问题所在:
如果python中所要处理的字符串中包含中文,那么最好要搞懂所用字符的编码,是gbk/gb2312/gb18030,还是utf-8,否则容易出现乱码,以及此处的语法错误。
将utf-8改为gb2312之后写入成功
标签:utf,Python,gb2312,invalid,decode,byte 来源: https://blog.csdn.net/Enola_li/article/details/98092346
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。