标签:object sub lib 05 review 09 re 2021 string
TypeError: expected string or bytes-like object
4136 else:
4137 values = self.astype(object)._values
-> 4138 mapped = lib.map_infer(values, f, convert=convert_dtype)
4139
4140 if len(mapped) and isinstance(mapped[0], Series):
pandas\_libs\lib.pyx in pandas._libs.lib.map_infer()
<ipython-input-13-5098f813e7d3> in review_without_stop(review)
5 all_stop_words = set(stop_word) # 删除停用词中重复的项
6 # 短评中的非中文字符替换为''
----> 7 review = re.sub("[^\u4e00-\u9fa5]",'',review)
8 # 去除全角空白字符
9 review = review.replace("\u3000","")
c:\program files\python37\lib\re.py in sub(pattern, repl, string, count, flags)
190 a callable, it's passed the Match object and must return
191 a replacement string to be used."""
--> 192 return _compile(pattern, flags).sub(repl, string, count)
193
194 def subn(pattern, repl, string, count=0, flags=0):
TypeError: expected string or bytes-like object
遇到这个问题时,可以根据代码执行的步骤寻找问题,根据箭头显示,找到问题所在review = re.sub("[^\u4e00-\u9fa5]",'',review)
,类型出错,所以只要改成review = re.sub("[^\u4e00-\u9fa5]",'',str(review))
,就可以就是将数据类型改成字符型
我真的上网搜了好多答案,但是居然是str()加错了位置,记录一下,希望也可以帮助跟我一样遇到困难的人。
标签:object,sub,lib,05,review,09,re,2021,string 来源: https://blog.csdn.net/blue20191110/article/details/120118768
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。