ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

c#中的正则表达式

2021-09-08 15:01:54  阅读:228  来源: 互联网

标签:字符 匹配 c# 尽可能少 正则表达式 任意 重复


正则表达式:又称规则表达式,英文名为Regular Expression,

 在代码中常简写为regex、regexp或RE

正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。

通俗理解:正则表达式是用于进行文本匹配的工具。

1.0简单的正则表达式
例:him,history,high,hi 在这个字符串中匹配出hi
正则表达式:hi
若要精确的匹配出hi,正则表达式:\bhi\b
\b是正则表达式规定的一个特殊代码,我们把它叫做元字符,
单词的开头或结尾,也就是单词的分界处,它只匹配一个位置。

1.1元字符的讲解
  代码    说明
    .       匹配除换行符以外的任意字符
  \w      匹配数字或字母或下划线或汉字
  \s      匹配任意的空白符
  \d      匹配数字
  \b      匹配单词的开始或结束
  ^       匹配字符串的开始
  $       匹配字符串的结束

1.2字符转义'\':如果你想查找元字符本身的话,
比如你查找.,或者*,就出现了问题:你没法指定它们,
因为它们会被解释成其它的意思。这时你就必须使用\来
取消这些字符的特殊意义。因此,你应该使用\.和\*。
当然,要查找\本身,你也得用\\.

1.3常用的限定符(重复)
               代码    说明
 *        重复零次或更多次
 +        重复一次或更多次
 ?        重复零次或一次
{n}        重复n次
{n,}        重复n次或更多次
{n,m}    重复n到m次

1.4:如何匹配下列字符串A-G的大写字符?
 字符串:A正则表v达r式的“鼻祖”AS或许可一SF直y追FD溯到oS科学家对C
人类S神经F系统工S作原t理的E早中期p研究
正则表达式:[A-G]
\d 等价于 [0-9]   [指定范围]
问题2:写一个正则表达式用于匹配几种格式的电话号码
例如(010)88886666,或022-22334455,或02912345678
答案:\(?0\d{2}[)-]?\d{8}  

1.5反义
代码/语法    说明
\W    匹配任意不是字母,数字,下划线,汉字的字符
\S    匹配任意不是空白符的字符
\D    匹配任意非数字的字符
\B    匹配不是单词开头或结束的位置
[^x]    匹配除了x以外的任意字符
[^aeiou]    匹配除了aeiou这几个字母以外的任意字符

解释:<a[^>]+>   匹配用尖括号括起来的以a开头的字符串  <adfg>dt>wer

1.6替换 |
问题2:写一个正则表达式用于匹配几种格式的电话号码
例如(010)88886666,或022-22334455,或02912345678
正则表达式:\(0\d{2}[)]\d{8}|0\d{2}[- ]?\d{8}
               
特别说明:使用替换时,顺序是很重要的
\d{5}-\d{4}|\d{5}这个表达式用于匹配美国的邮政编码。
美国邮编的规则是5位数字,或者用连字号间隔的9位数字
如果你把它改成\d{5}|\d{5}-\d{4}的话,
那么就只会匹配5位的邮编(以及9位邮编的前5位)。
原因是匹配替换时,将会从左到右地测试每个分枝条件,
如果满足了某个分枝的话,就不会去管其它的替换条件了。
               
Windows98|Windows2000|WindosXP这个例子是为了告诉we
替换不仅仅能用于两种规则,也能用于更多种规则

1.7分组语法
零宽断言
(?=exp)        匹配exp前面的位置
(?<=exp)        匹配exp后面的位置
(?!exp)        匹配后面跟的不是exp的位置
(?<!exp)    匹配前面不是exp的位置
例子:<img οnlοad="AutoResizeImage(200,200,this)"src="/Document/Title/Temp/2017-12-114bc5.png" >
请匹配出:οnlοad="AutoResizeImage(200,200,this)"    正则表达式onload.+(?=src)
请匹配出:2017-12-114bc5.png   正则表达式:(?<=Document/Title/Temp/).+(?=\")

1.8贪婪与懒惰
               贪婪:当正则表达式中包含能接受重复的限定符时
           ,通常的行为是
               (在使整个表达式能得到匹配的前提下)
           匹配尽可能多的字符
               这被称为贪婪匹配。
               懒惰:有时,我们更需要懒惰匹配,
           也就是匹配尽可能少的字符。
               如果将前面给出的限定符转化为懒惰匹配模式,
           只要在它后面加上一个问号?
               表5.懒惰限定符
               *?    重复任意次,但尽可能少重复
               +?    重复1次或更多次,但尽可能少重复
               ??    重复0次或1次,但尽可能少重复
               {n,m}?    重复n到m次,但尽可能少重复
               {n,}?    重复n次以上,但尽可能少重复
               例如上面1.7中的例子:
               <img οnlοad="AutoResizeImage(200,200,this)"src="/Document/Title/Temp/2017-12-114bc5.png" >
               <img οnlοad="AutoResizeImage(200,200,this)"src="/Document/Title/Temp/2017-12-114bc5.png" >
               <img οnlοad="AutoResizeImage(200,200,this)"src="/Document/Title/Temp/2017-12-114bc5.png" >
               上面的正则表达式为:(?<=Document/Title/Temp/).+(?=\")
                                       onload.+(?=src)
               正确正则匹配法:(?<=Document/Title/Temp/).+?(?=\")
                                onl oad.+?(?=src)

标签:字符,匹配,c#,尽可能少,正则表达式,任意,重复
来源: https://blog.csdn.net/P7295/article/details/120179862

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有