Python编解码器错误除外？

2019-08-27 06:58:17 阅读：209 来源： 互联网

File "/usr/lib/python3.1/codecs.py", line 300, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf8' codec can't decode byte 0x92 in position 805: invalid start byte

嗨,我得到了这个例外.如何捕获它,并在我收到此异常时继续读取我的文件.

我的程序有一个循环,逐行读取文本文件并尝试进行一些处理.但是,我遇到的某些文件可能不是文本文件,或者行格式不正确(外语等).我想忽略这些界限.

以下不起作用

for line in sys.stdin:
   if line != "":
      try:
         matched = re.match(searchstuff, line, re.IGNORECASE)
         print (matched)
      except UnicodeDecodeError, UnicodeEncodeError:
         continue

解决方法:

查看http://docs.python.org/py3k/library/codecs.html.当您打开编解码器流时,您可能希望使用其他参数errors =’ignore’

在Python 3中,sys.stdin默认情况下作为文本流打开(参见http://docs.python.org/py3k/library/sys.html),并且具有严格的错误检查.

您需要将其重新打开为容错的utf-8流.这样的东西会起作用：

sys.stdin = codecs.getreader('utf8')(sys.stdin.detach(), errors='ignore')

标签：python,decode,encode
来源： https://codeday.me/bug/20190827/1737979.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

Python编解码器错误除外？