标签:uxxxx File sre python py parse Python36 Unicode line
原文链接:https://blog.csdn.net/qq_40695895/article/details/82882751今天碰到一个很有意思的问题,需要将普通的 Unicode字符串转换为 Unicode编码的字符串,如下:
将 \\u9500\\u552e 转化为 \u9500\u552e 也就是 销售 。
乍一看感觉挺简单的,用 re 库将前面的反斜杠去掉即可,但是在替换的过程中会抛出如下错误:
Traceback (most recent call last):
File "<pyshell#15>", line 1, in <module>
re.sub(r"(\)\u", r'', t)
File "D:\Python36\lib\re.py", line 191, in sub
return _compile(pattern, flags).sub(repl, string, count)
File "D:\Python36\lib\re.py", line 301, in _compile
p = sre_compile.compile(pattern, flags)
File "D:\Python36\lib\sre_compile.py", line 562, in compile
p = sre_parse.parse(p, flags)
File "D:\Python36\lib\sre_parse.py", line 855, in parse
p = _parse_sub(source, pattern, flags & SRE_FLAG_VERBOSE, 0)
File "D:\Python36\lib\sre_parse.py", line 416, in _parse_sub
not nested and not items))
File "D:\Python36\lib\sre_parse.py", line 765, in _parse
p = _parse_sub(source, state, sub_verbose, nested + 1)
File "D:\Python36\lib\sre_parse.py", line 416, in _parse_sub
not nested and not items))
File "D:\Python36\lib\sre_parse.py", line 502, in _parse
code = _escape(source, this, state)
File "D:\Python36\lib\sre_parse.py", line 362, in _escape
raise source.error("incomplete escape %s" % escape, len(escape))
sre_constants.error: incomplete escape \u at position 3
大概意思就是去掉前面的反写杠之后剩下的 \u 不能组成完整的字符。
到这里问题好像有点难以解决了,这时候我们会放弃吗?
当然不会,到谷歌上搜一下,发现还真有人碰到过这个问题,解决方法也是十分的巧妙。
竟然还可以使用 json 库的 loads 方法 ...
解决方法如下:
import json
s = '\\u9500\\u552e'
---------------------
版权声明:本文为CSDN博主「渔父歌」的原创文章,遵循CC 4.0 by-sa版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_40695895/article/details/82882751
标签:uxxxx,File,sre,python,py,parse,Python36,Unicode,line 来源: https://blog.csdn.net/emmaczw/article/details/99114749
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。