解决pyshp UnicodeDecodeError的问题

(编辑：jimmy 日期: 2024/11/20 浏览：3 次 )

用最新版本（2.1.0）的pyshp解析shp文件的records时：

records = sf.records()

如果records里面含有中文字段，那么就会报错：

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcc in position 0: invalid continuation byte

这个是编解码的问题，解决方法是把版本降到1.2.12就可以了，虽然records里面的中文字段还需要再次解码，但结果是很清晰的。

没有仔细阅读最新的官方文档，最后有Unicode and Shapefile Encodings说明。

因为最开始我用的是：

sf = shapefile.Reader('data/2009/2009.shp')

最新的版本可以直接设置编码方式，这样就好了：

sf = shapefile.Reader('data/2009/2009.shp', encoding='gbk')

以上这篇解决pyshp UnicodeDecodeError的问题就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

上一篇：Python Pandas 转换unix时间戳方式
下一篇：Pandas-Cookbook 时间戳处理方式