UnicodeDecodeError: ‘gbk’ codec can’t decode bytes in position X-X: illegal multibyte sequence
问题描述
在处理字符串编码时, 报错 UnicodeDecodeError: ‘gbk’ codec can’t decode bytes in position X-X: illegal multibyte sequence
, 处理的字符串中夹杂部分特殊字符。
解决办法
处理的字符的确是GBK
的,但是其中夹杂的部分特殊字符,是GBK
编码中所没有的, 如果有些特殊字符是GB18030
中有的,但是是GBK
中没有的。所以此种情况,可以尝试用和当前编码GBK
所兼容的但所包含字符更多的编码GB18030
去解码。
参考