ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

正则匹配字符串中汉字及中文标点符号

2022-06-23 11:34:41  阅读:27  来源: 互联网

标签:匹配 正则 标点符号 str 字符串 reg


问题: 在写项目时遇到需要匹配字符串中所有的汉字并且包括简单的中文标点符号

比如:匹配下面这个完成的字符串

let str = '上传文件,你好呀,我很好';

网上能够查到很多匹配汉字的正则

let reg = /[\u4e00-\u9fa5]+/g;

console.log(str.match(reg));
// 结果如下
['上传文件', '你好呀', '我很好']

从结果可以看出上面写的正则没有匹配到标点符号,所以将完整的字符串(str)分隔开了

又从网上查找匹配中文标点的正则

// 匹配中文标点的正则
\u3002|\uff1f|\uff01|\uff0c|\u3001|\uff1b|\uff1a|\u201c|\u201d|\u2018|\u2019|\uff08|\uff09|\u300a|\u300b|\u3010|\u3011|\u007e

// 可以匹配以下中文标点符号(顺序是一一对应的)
// `。 ? ! , 、 ; : “ ” ‘ ’ ( ) 《 》 【 】 ~`

Ps: 如果上面没有想要的标点符号,可以上网查找将中文符号转换成Unicode编码添加在表达式中即可

将刚才编写的正则表达式进行下简单的修改

let reg = /[(\u4e00-\u9fa5)(\u3002|\uff1f|\uff01|\uff0c|\u3001|\uff1b|\uff1a|\u201c|\u201d|\u2018|\u2019|\uff08|\uff09|\u300a|\u300b|\u3010|\u3011|\u007e)]+/g

console.log(str.match(reg));
// 打印结果
['上传文件,你好呀,我很好']

可以看到这次结果是我们想要的形式,整个字符串都匹配到了~

这里进行一下记录,完美解决问题。

转载自:https://blog.csdn.net/qq_43432158/article/details/124047193

标签:匹配,正则,标点符号,str,字符串,reg
来源: https://www.cnblogs.com/zhangdanyang95/p/16404409.html

专注分享技术,共同学习,共同进步。侵权联系[admin#icode9.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有