使用非ASCII字符在Python中执行文件I / O.

2019-06-21 14:54:46 阅读：157 来源： 互联网

标签：python file-io localization google-app-engine

我正在研究一个Python脚本,它读取用UTF-8编码的XML文件,对它进行一些操作并将其保存到Google的数据存储区(它是一个App Engine程序).

我正在阅读和解析文件的方式只是使用file.readline()和一些正则表达式.唯一的问题是我正在使用的文件中包含许多不同语言的字符,例如,它可能有é或Å或俄语或希腊字符.

我最初得到这样的错误：“UnicodeDecodeError：’ascii’编解码器无法解码位置0中的字节0xd0：序数不在范围内(128).”然后我尝试将打开的文件上的编码切换为“ISO-8859-15”,它消除了错误,但输出的字符没有正确显示.

所以我的问题是：如何在Python中使用UTF-8编码的文件,而不会让Python卡在文件中的所有特殊字符上？我希望这很清楚,并提前感谢任何建议.

解决方法:

在str.decode上指定UTF-8编码

>>> print '\xe2\x99\x9e'.decode('utf-8')
♞

这应该是一个棋子,但它太小看不到:)

标签：python,file-io,localization,google-app-engine
来源： https://codeday.me/bug/20190621/1256251.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

使用非ASCII字符在Python中执行文件I / O.