c 正则表达式教程(c正则表达式语法大全)
Regex(正则表达式)是描述字符序列的强大工具。正则表达式存在于许多语言中,C++11也将正则表达式作为新标准的一部分。
C++regex正则表达式的规则与其他编程语言类似,如下:
1.校验字符的表示
1个汉字:^[\u4e00-\u9fa5]{0,}$
2英文和数字:^[A-Za-z0-9]+$或^[A-Za-z0-9]{4,40}$
3长度为3-20的所有字符:^.{3,20}$
4由26个英文字母组成的字符串:^[A-Za-z]+$
5由26个大写英文字母组成的字符串:^[A-Z]+$
626个小写英文字母组成的字符串:^[a-z]+$
7由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$
8由数字、26个英文字母或下划线组成的字符串:^\w+$或^\w{3,20}$
9中文、英文、数字包括下划线:^[\u4E00-\u9FA5A-Za-z0-9_]+$
10个中文、英文、数字但不包括下划线等符号:^[\u4E00-\u9FA5A-Za-z0-9]+$或^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
11可以输入包含^%,=?$\'的字符及其他字符:[^%,=?$\x22]+
12禁止输入含有~的字符:[^~\x22]+
2.校验位的表示
1.n位数字:^\d{n}$
2.数字:^[0-9]*$
3.m-n位数字:^\d{m,n}$
4.至少n位数字:^\d{n,}$
5.以零和非零开头的数字:^(0|[1-9][0-9]*)$
6.以非零开头且最多保留两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
7.保留1-2位小数的正数或负数:^(\-)?\d+(\.\d{1,2})?$
8.正数、负数和小数:^(\-|\+)?\d+(\.\d+)?$
9.保留两位小数的正实数:^[0-9]+(.[0-9]{2})?$
10.1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
11.非零正整数:^[1-9]\d*$或^([1-9][0-9]*){1,3}$或^\+?[1-9][0-9]*$
12.非零负整数:^\-[1-9][]0-9'*$或^-[1-9]\d*$
13.非负整数:^\d+$或^[1-9]\d*|0$
14.非正整数:^-[1-9]\d*|0$或^((-\d+)|(0+))$
15.非负浮点数:^\d+(\.\d+)?$或^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
16.非正浮点数:^((-\d+(\.\d+)?)|(0+(\.0+)?))$或^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
17.正浮点数:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$或^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
18.负浮点数:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$或^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
19.浮点数:^(-?\d+)(\.\d+)?$或^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
3.特殊需求的表达
1、域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.
2.电子邮件地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
3、手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
4.InternetURL:[a-zA-z]+://[^\s]*或([\w-]+\.)+[\w-]+(/[\w-./?%=]*)?$
5、国内电话(0511-、021-):\d{3}-\d{8}|\d{4}-\d{7}
6.电话号码('XXX-XXXXXXX'、'XXXX-XXXXXXX'、'XXX-XXXXXXX'、'XXX-XXXXXXX'、'XXXXXXX'和'XXXXXXXXX):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
7.短身份证号码(数字、x结尾的字母):^([0-9]){7,18}(x|X)?$或^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
8、身份证号码(15位、18位):^\d{15}|\d{18}$
9.账号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
10.密码(以字母开头,长度在6到18之间,只能包含字母、数字和下划线):^[a-zA-Z]\w{5,17}$
11、强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
12.日期格式:^\d{4}-\d{1,2}-\d{1,2}
13.一年中的12个月(01~09和1~12):^(0?[1-9]|1[0-2])$
14.一个月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
C++正则表达式函数共有三个:regex_match、regex_search、regex_replace
regex_match
regex_match是一个正则表达式匹配函数,如下示例所示。
输出如下:
regex_search
regex_match是另一个正则表达式匹配函数。以下是regex_search的示例。regex_search和regex_match之间的主要区别是:regex_match是全字匹配,而regex_search是搜索匹配字符串。
输出如下:
regex_replace
regex_replace是一个替换正则表达式匹配的内容的函数。以下是regex_replace的示例。
输出如下:
请注意,在C++中,反斜杠字符(\)将被转义
如果我们的正则表达式中有错误,标准库将在运行时抛出regex_error异常。它有一个名为code的成员,用于标记错误的类型。具体错误值及语义如下表所示:
结论
每天进步一点,每天消化一点。如果您有更好的想法,欢迎分享。如果您觉得文章写得不错,请点个赞吧。