标签:匹配 正则表达式 Hive 转义 获取 hive 斜杠 regexp
首先可以明确的是(已验证),hive中的正则表达式需要两个斜杠:比如\\d才可以匹配数字。
\\w:英文字母、数字、下划线
\\u4E00-\\u9FFF:中文汉字
{m,n}:匹配m~n次
{m,}至少匹配m次
+:匹配一次或多次,和{1,}等价
*:匹配0次或多次
?:非贪婪模式;可选匹配
(?:):非获取匹配
(?<=):非获取匹配,以……开头
(?<!):非获取匹配,不以……开头
(?=):非获取匹配,以……结尾
(?!):非获取匹配,不以……结尾
\\:转义,已经在hive_cli、lapras尝试过,regexp_extract()、regexp_replace()都只能使用两个斜杠转义,一个斜杠都是转义失败的。
标签:匹配,正则表达式,Hive,转义,获取,hive,斜杠,regexp 来源: https://www.cnblogs.com/ylwcafe/p/15054978.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。