标签:utf get character gbk html encode codec browser
一. 问题:在将网络数据流导入文件时,有可能遇到“'gbk' codec can't encode characte”错误。
二. 分析:
1.在windows下面,新文件(即写入的目标文件)的默认编码是gbk。
2.网络数据流的编码是utf-8。
python解释器会用gbk编码去解析utf-8的网络数据流,于是报错。
三.解决如下,指定目标文件的编码格式为utf-8:
browser.get(url) html = browser.find_element_by_xpath("//*").get_attribute("outerHTML") with open('./html','w')as f: f.write(html.encode('utf-8').decode('utf-8')) #改为 browser.get(url) html = browser.find_element_by_xpath("//*").get_attribute("outerHTML") with open('./html','w',encoding='utf-8')as f: f.write(html)
标签:utf,get,character,gbk,html,encode,codec,browser 来源: https://www.cnblogs.com/ericyjchung/p/16390448.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。