博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
ACM中的正则表达式
阅读量:4960 次
发布时间:2019-06-12

本文共 5015 字,大约阅读时间需要 16 分钟。


layout: post

title: ACM中的正则表达式
author: "luowentaoaa"
catalog: true
mathjax: true
tags:
- 正则表达式


总结

正则表达式 , 又称规则表达式 , 英文名为 Regular Expression , 在代码中常简写为 regex , regexp 或 RE , 是计算机科学的一个概念 ; 正则表通常被用来检索 , 替换那些符合某个模式 (规则) 的文本 ;

正则表达式是对字符串 (包括普通字符 , 例如 : a 到 z 之间的字母) 和特殊字符 (称为 “元字符” ) 操作的一种逻辑公式 , 就是用事先定义好的一些特定字符 , 及这些特定字符的组合 , 组成一个 “规则字符串” , 这个 “规则字符串” 用来表达对字符串的一种过滤逻辑 ; 正则表达式是一种文本模式 , 模式描述在搜索文本时要匹配的一个或多个字符串 ;

C++对正则表达式的支持

#include 
using namespace std;

运用规则

其实运用规则和Java非常相似!!! 几乎可以完全类推! 附上一些规则: {n}匹配确定的n次 {n,}至少匹配n次(注:请不要擅自加空格上去) {n,m}最少n次,最多m次. *匹配前面的子表达式0次或多次 = {0,} +匹配前面的子表达式1次或多次 = {1,} ?匹配前面的子表达式1次或两次 = {1,2} ()表示一个整体 []表示一位 {}表示匹配多少次 .匹配除换行符之外的任意字符 \w匹配单字字符(a-z,A-Z,0-9以及下划线) \W匹配非单字字符 \s匹配空白字符(空格,制表符,换行符) \S匹配非空白字符 \d匹配数字字符 \D匹配非数字字符 ^指示从行的开始位置开始匹配(还有声明不在字符集指定范围内) $指示从行的结束位置开始匹配 \b匹配单词的开始或结束位置
2.速记理解. [ ] ^ $四个字符是所有语言都支持的正则表达式,所以这四个是基础的正则表达式。正则难理解因为里面有一个等价的概念,这个概念大大增加了理解难度,让很多初学者看起来会懵,如果把等价都恢复成原始写法,自己书写正则就超级简单了,就像说话一样去写你的正则了:  等价:等价是等同于的意思,表示同样的功能,用不同符号来书写。?,*,+,\d,\w 都是等价字符  ?等价于匹配长度{0,1}  *等价于匹配长度{0,}   +等价于匹配长度{1,}  \d等价于[0-9]\D等价于[^0-9]  \w等价于[A-Za-z_0-9]\W等价于[^A-Za-z_0-9]。常用运算符与表达式:  ^ 开始  () 域段  [] 包含,默认是一个字符长度  [^] 不包含,默认是一个字符长度  {n,m} 匹配长度   . 任何单个字符(\. 字符点)  | 或  \ 转义  $ 结尾  [A-Z] 26个大写字母  [a-z] 26个小写字母  [0-9] 0至9数字[A-Za-z0-9] 26个大写字母、26个小写字母和0至9数字  , 分割  分割语法:  [A,H,T,W] 包含A或H或T或W字母  [a,h,t,w] 包含a或h或t或w字母  [0,3,6,8] 包含0或3或6或8数字  语法与释义:  基础语法 "^([]{})([]{})([]{})$"  正则字符串 = "开始([包含内容]{长度})([包含内容]{长度})([包含内容]{长度})结束"     ?,*,+,\d,\w 这些都是简写的,完全可以用[]和{}代替,在(?:)(?=)(?!)(?<=)(?

代码中运用实例如下

// 定义一个正则表达式 , 4~23 位数字和字母的组合regex repPattern("[0-9a-zA-Z]{4,23}",regex_constants::extended);// 声明匹配结果变量match_results
rerResult;// 定义待匹配的字符串string strValue = "123abc";// 进行匹配bool bValid = regex_match(strValue, rerResult, repPattern);if (bValid){ // 匹配成功}

常用的正则表达式

检验数字的表达式
数字 : ^[0-9]*$n 位的数字 : ^\d{n}$至少 n 位的数字 : ^\d{n,}$m-n 位的数字 : ^\d{m,n}$零和非零开头的数字 : ^(0|[1-9][0-9]*)$非零开头的最多带两位小数的数字 : ^([1-9][0-9]*)+(.[0-9]{1,2})?$带 1~2 位小数的正数或负数 : ^(\-)?\d+(\.\d{1,2})?$正数 , 负数 , 和小数 : ^(\-|\+)?\d+(\.\d+)?$有两位小数的正实数 : ^[0-9]+(.[0-9]{2})?$有 1~3 位小数的正实数 : ^[0-9]+(.[0-9]{1,3})?$非零的正整数 : ^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$非零的负整数 : ^\-[1-9][]0-9″*$ 或 ^-[1-9]\d*$非负整数 : ^\d+$ 或 ^[1-9]\d*|0$非正整数 : ^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$非负浮点数 : ^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$非正浮点数 : ^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$正浮点数 : ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$负浮点数 : ^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$浮点数 : ^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
检验字符的表达式
汉字 : ^[\u4e00-\u9fa5]{0,}$英文和数字 : ^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$长度为 3~20 的所有字符 : ^.{3,20}$由 26 个英文字母组成的字符串 : ^[A-Za-z]+$由 26 个大写英文字母组成的字符串 : ^[A-Z]+$由 26 个小写英文字母组成的字符串 : ^[a-z]+$由数字和 26 个英文字母组成的字符串 : ^[A-Za-z0-9]+$由数字 , 26 个英文字母或者下划线组成的字符串 : ^\w+$ 或 ^\w{3,20}$中文 , 英文 , 数字包括下划线 : ^[\u4E00-\u9FA5A-Za-z0-9_]+$中文 , 英文 , 数字但不包括下划线等符号 : ^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$可以输入含有^%&',;=?$\"等字符 : [^%&',;=?$\x22]+禁止输入含有 ~ 的字符 : [^~\x22]+
特殊需求表达式
Email 地址 : ^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$域名 : [a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?InternetURL : [a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$手机号码 : ^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$电话号码("XXX-XXXXXXX" , "XXXX-XXXXXXXX" , "XXX-XXXXXXX" , "XXX-XXXXXXXX" , "XXXXXXX"和"XXXXXXXX) : ^($$\d{3,4}-)|\d{3.4}-)?\d{7,8}$国内电话号码 (0511-4405222 , 021-87888822) : \d{3}-\d{8}|\d{4}-\d{7}身份证号 (15 位 , 18 位数字) : ^\d{15}|\d{18}$短身份证号码 (数字 , 字母 x 结尾) : ^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$帐号是否合法(字母开头,允许 5~16 字节,允许字母数字下划线) : ^[a-zA-Z][a-zA-Z0-9_]{4,15}$密码 (以字母开头,长度在 6~18 之间,只能包含字母 , 数字和下划线) : ^[a-zA-Z]\w{5,17}$强密码 (必须包含大小写字母和数字的组合,不能使用特殊字符,长度在 8~10 之间) : ^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$日期格式 : ^\d{4}-\d{1,2}-\d{1,2}一年的 12 个月(01~09和1~12) : ^(0?[1-9]|1[0-2])$一个月的 31 天(01~09和1~31) : ^((0?[1-9])|((1|2)[0-9])|30|31)$

A.

#include
using namespace std;typedef long long ll;#define pp pair
const ll mod=998244353;const int maxn=1e6+50;const ll inf=0x3f3f3f3f3f3f3f3fLL;int gcd(int a,int b){while(b){int t=a%b;a=b;b=t;}return a;}int lcm(int a,int b){return a*b/gcd(a,b);}string s[250];int tot,n;string ans[maxn];int cnt[maxn];regex str("0|([1-9][0-9]*)");int main(){ std::ios::sync_with_stdio(false); std::cin.tie(0); std::cout.tie(0); n=0; while(getline(cin,s[n]))n++; tot=0; for(int i=n-1;i>=1;i--){ while(s[i].size()&&isdigit(s[i][0])&&isdigit(s[i-1].back())){ s[i-1].push_back(s[i][0]); s[i].erase(0,1); } } for(int i=0;i
>now){ if(regex_match(now,str))ans[tot++]=now,cnt[i]++; } } for(int i=0;i

转载于:https://www.cnblogs.com/luowentao/p/10332311.html

你可能感兴趣的文章
HTTP缓存和CDN缓存
查看>>
HDU-1171 Big Event in HDU(生成函数/背包dp)
查看>>
Babel 是干什么的
查看>>
cocos2dx-3.0(8)------Label、LabelTTF、LabelAtlas、LabelBMFont使用之法
查看>>
Mysql数据库乱码总结
查看>>
BZOJ.3160.万径人踪灭(FFT Manacher)
查看>>
CODE[VS] 1842 递归第一次
查看>>
20180418小测
查看>>
Spring Cloud是怎么运行的?
查看>>
12 联结表
查看>>
数字三角形
查看>>
NGUI 减少drawcall规则
查看>>
三元表达,匿名函数
查看>>
前端笔记-基础笔记
查看>>
【LeetCode & 剑指offer刷题】查找与排序题6:33. Search in Rotated Sorted Array(系列)
查看>>
GNU/Linux超级本ZaReason Ultralap 440体验
查看>>
将github上托管的代码 在我的域名下运行
查看>>
【Manthan, Codefest 18 (rated, Div. 1 + Div. 2) C】Equalize
查看>>
【codeforces 767A】Snacktower
查看>>
【MemSQL Start[c]UP 3.0 - Round 1 C】 Pie Rules
查看>>