这篇文章主要介绍了C#正则表达式使用源码分析的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇C#正则表达式使用源码分析文章都会有所收获,下面我们一起来看看吧。
文章导读
正则表达式的本质是使用一系列特殊字符模式,来表示某一类字符串。正则表达式无疑是处理文本最有力的工具,而.NET提供的Regex类实现了验证正则表达式的方法。Regex 类表示不可变(只读)的正则表达式。它还包含各种静态方法,允许在不显式创建其他类的实例的情况下使用其他正则表达式类。
说明:
由于在正则表达式中“ \ ”、“ ? ”、“ * ”、“ ^ ”、“ $ ”、“ + ”、“(”、“)”、“ | ”、“ { ”、“ [ ”等字符已经具有一定特殊意义,如果需要用它们的原始意义,则应该对它进行转义,例如 希 望在字符串中至少有一个“ \ ”,那么正则表达式应该这么写: \\+ 。
使用静态Match方法,可以得到源中第一个匹配模式的连续子串。
静态的Match方法有2个重载,分别是
Regex.Match(string input, string pattern); Regex.Match(string input, string pattern, RegexOptions options);
第一种重载的参数表示:输入、模式
第二种重载的参数表示:输入、模式、RegexOptions枚举的“按位或”组合。
RegexOptions枚举的有效值是:
Complied表示编译此模式
CultureInvariant表示不考虑文化背景
ECMAScript表示符合ECMAScript,这个值只能和IgnoreCase、Multiline、Complied连用
ExplicitCapture表示只保存显式命名的组
IgnoreCase表示不区分输入的大小写
IgnorePatternWhitespace表示去掉模式中的非转义空白,并启用由#标记的注释
Multiline表示多行模式,改变元字符^和$的含义,它们可以匹配行的开头和结尾
None表示无设置,此枚举项没有意义
RightToLeft表示从右向左扫描、匹配,这时,静态的Match方法返回从右向左的第一个匹配
Singleline表示单行模式,改变元字符.的意义,它可以匹配换行符
注意:Multiline在没有ECMAScript的情况下,可以和Singleline连用。Singleline和Multiline不互斥,但是和ECMAScript互斥。
这个方法的重载形式同静态的Match方法,返回一个MatchCollection,表示输入中,匹配模式的匹配的集合。
此方法返回一个bool,重载形式同静态的Matches,若输入中匹配模式,返回true,否则返回false。
可以理解为:IsMatch方法,返回Matches方法返回的集合是否为空。
//例如我想把如下格式记录中的NAME值修改为WANG string line = "ADDR=1234;NAME=ZHANG;PHONE=6789"; Regex reg = new Regex("NAME=(.+);"); string modified = reg.Replace(line, "NAME=WANG;"); //修改后的字符串为 ADDR=1234;NAME=WANG;PHONE=6789
string line = "ADDR=1234;NAME=ZHANG;PHONE=6789"; Regex reg = new Regex("NAME=(.+);"); //例如我想提取line中的NAME值 Match match = reg.Match(line); string value = match.Groups[1].Value; Console.WriteLine("value的值为:{0}", value);
//文本中含有"speed=30.3mph",需要提取该速度值,但是速度的单位可能是公制也可能是英制,mph,km/h,m/s都有可能;另外前后可能有空格。 string line = "lane=1;speed=30.3mph;acceleration=2.5mph/s"; Regex reg = new Regex(@"speed\s*=\s*([\d\.]+)\s*(mph|km/h|m/s)*"); Match match = reg.Match(line); //那么在返回的结果中match.Groups[1].Value将含有数值,而match.Groups[2].Value将含有单位。 var 值 = match.Groups[1].Value;//此处方便演示,在实际开发中请勿使用中文命名变量 var 单位 = match.Groups[2].Value; Console.WriteLine("speed的值为:{0} speed的单位是:{1}", 值,单位);
//就可以获得经度、纬度值,而以前需要几十行代码。 Regex reg = new Regex(@"^\$GPRMC,[\d\.]*,[A|V],(-?[0-9]*\.?[0-9]+),([NS]*),(-?[0-9]*\.?[0-9]+),([EW]*),.*");
string pattern1 = @"(?is)(?<=\[)(.*)(?=\])"; string result1 = new Regex(pattern1).Match("sadff[xxx]sdfdsf").Value;
string pattern2 = @"(?is)(?<=\()(.*)(?=\))"; string result2 = new Regex(pattern2).Match("sad(f)dsf").Value;
string pattern3 = @"(?is)(?<=\{)(.*)(?=\})"; string result3 = new Regex(pattern3).Match("sadff[{xxx]sdfd}sf").Value;
System.Text.RegularExpressions命名空间的说明
该名称空间包括8个类,1个枚举,1个委托。他们分别是:
Capture: 包含一次匹配的结果; CaptureCollection: Capture的序列; Group: 一次组记录的结果,由Capture继承而来; GroupCollection:表示捕获组的集合 Match: 一次表达式的匹配结果,由Group继承而来; MatchCollection: Match的一个序列; MatchEvaluator: 执行替换操作时使用的委托; RegexCompilationInfo:提供编译器用于将正则表达式编译为独立程序集的信息 RegexOptions 提供用于设置正则表达式的枚举值 Regex类中还包含一些静态的方法: Escape: 对字符串中的regex中的转义符进行转义; IsMatch: 如果表达式在字符串中匹配,该方法返回一个布尔值; Match: 返回Match的实例; Matches: 返回一系列的Match的方法; Replace: 用替换字符串替换匹配的表达式; Split: 返回一系列由表达式决定的字符串; Unescape:不对字符串中的转义字符转义。
//数字 Regex reg = new Regex(@"^[0-9]*$"); //n位的数字 Regex reg = new Regex(@"^\d{n}$"); //至少n位的数字 Regex reg = new Regex(@"^\d{n,}$"); //m-n位的数字 Regex reg = new Regex(@"^\d{m,n}$"); //零和非零开头的数字 Regex reg = new Regex(@"^(0|[1-9][0-9]*)$"); //非零开头的最多带两位小数的数字 Regex reg = new Regex(@"^([1-9][0-9]*)+(.[0-9]{1,2})?$"); //带1-2位小数的正数或负数 Regex reg = new Regex(@"^(\-)?\d+(\.\d{1,2})?$"); //正数、负数、和小数 Regex reg = new Regex(@"^(\-|\+)?\d+(\.\d+)?$"); //有两位小数的正实数 Regex reg = new Regex(@"^[0-9]+(.[0-9]{2})?$"); //有1~3位小数的正实数 Regex reg = new Regex(@"^[0-9]+(.[0-9]{1,3})?$"); //非零的正整数 Regex reg = new Regex(@"^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$"); //非零的负整数 Regex reg = new Regex(@"^\-[1-9][]0-9″*$ 或 ^-[1-9]\d*$"); //非负整数 Regex reg = new Regex(@"^\d+$ 或 ^[1-9]\d*|0$"); //非正整数 Regex reg = new Regex(@"^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$"); //非负浮点数 Regex reg = new Regex(@"^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$"); //非正浮点数 Regex reg = new Regex(@"^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$"); //正浮点数 Regex reg = new Regex(@"^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$"); //负浮点数 Regex reg = new Regex(@"^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$"); //浮点数 Regex reg = new Regex(@"^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$");
//汉字 Regex reg = new Regex(@"^[\u4e00-\u9fa5]{0,}$"); //英文和数字 Regex reg = new Regex(@"^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$"); //长度为3-20的所有字符 Regex reg = new Regex(@"^.{3,20}$"); //由26个英文字母组成的字符串 Regex reg = new Regex(@"^[A-Za-z]+$"); //由26个大写英文字母组成的字符串 Regex reg = new Regex(@"^[A-Z]+$"); //由26个小写英文字母组成的字符串 Regex reg = new Regex(@"^[a-z]+$"); //由数字和26个英文字母组成的字符串 Regex reg = new Regex(@"^[A-Za-z0-9]+$"); //由数字、26个英文字母或者下划线组成的字符串 Regex reg = new Regex(@"^\w+$ 或 ^\w{3,20}$"); //中文、英文、数字包括下划线 Regex reg = new Regex(@"^[\u4E00-\u9FA5A-Za-z0-9_]+$"); //中文、英文、数字但不包括下划线等符号 Regex reg = new Regex(@"^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$"); //可以输入含有^%&',;=?$\”等字符 Regex reg = new Regex(@"[^%&',;=?$\x22]+"); //禁止输入含有~的字符 Regex reg = new Regex(@"[^~\x22]+");
//Email地址 Regex reg = new Regex(@"^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$"); //域名 Regex reg = new Regex(@"[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?"); //InternetURL Regex reg = new Regex(@"[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$"); //手机号码 Regex reg = new Regex(@"^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$"); //电话号码(“XXX-XXXXXXX”、”XXXX-XXXXXXXX”、”XXX-XXXXXXX”、”XXX-XXXXXXXX”、”XXXXXXX”和”XXXXXXXX) Regex reg = new Regex(@"^($$\d{3,4}-)|\d{3.4}-)?\d{7,8}$"); //国内电话号码(0511-4405222、021-87888822) Regex reg = new Regex(@"\d{3}-\d{8}|\d{4}-\d{7}"); //身份证号(15位、18位数字) Regex reg = new Regex(@"^\d{15}|\d{18}$"); //短身份证号码(数字、字母x结尾) Regex reg = new Regex(@"^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$"); //帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线) Regex reg = new Regex(@"^[a-zA-Z][a-zA-Z0-9_]{4,15}$"); //密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线) Regex reg = new Regex(@"^[a-zA-Z]\w{5,17}$"); //强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间) Regex reg = new Regex(@"^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$"); //日期格式 Regex reg = new Regex(@"^\d{4}-\d{1,2}-\d{1,2}"); //一年的12个月(01~09和1~12) Regex reg = new Regex(@"^(0?[1-9]|1[0-2])$"); //一个月的31天(01~09和1~31) Regex reg = new Regex(@"^((0?[1-9])|((1|2)[0-9])|30|31)$"); //钱的输入格式: //有四种钱的表示形式我们可以接受:”10000.00″ 和 “10,000.00”, 和没有 “分” 的 “10000” 和 “10,000” Regex reg = new Regex(@"^[1-9][0-9]*$"); //这表示任意一个不以0开头的数字,但是,这也意味着一个字符”0″不通过,所以我们采用下面的形式 Regex reg = new Regex(@"^(0|[1-9][0-9]*)$"); //一个0或者一个不以0开头的数字.我们还可以允许开头有一个负号 Regex reg = new Regex(@"^(0|-?[1-9][0-9]*)$"); //这表示一个0或者一个可能为负的开头不为0的数字.让用户以0开头好了.把负号的也去掉,因为钱总不能是负的吧.下面我们要加的是说明可能的小数部分 Regex reg = new Regex(@"^[0-9]+(.[0-9]+)?$"); //必须说明的是,小数点后面至少应该有1位数,所以”10.”是不通过的,但是 “10” 和 “10.2” 是通过的 Regex reg = new Regex(@"^[0-9]+(.[0-9]{2})?$"); //这样我们规定小数点后面必须有两位,如果你认为太苛刻了,可以这样 Regex reg = new Regex(@"^[0-9]+(.[0-9]{1,2})?$"); //这样就允许用户只写一位小数。下面我们该考虑数字中的逗号了,我们可以这样 Regex reg = new Regex(@"^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$"); //1到3个数字,后面跟着任意个 逗号+3个数字,逗号成为可选,而不是必须 Regex reg = new Regex(@"^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$"); //备注:这就是最终结果了,别忘了”+”可以用”*”替代。如果你觉得空字符串也可以接受的话(奇怪,为什么?)最后,别忘了在用函数时去掉去掉那个反斜杠,一般的错误都在这里 //xml文件 Regex reg = new Regex(@"^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$"); //中文字符的正则表达式 Regex reg = new Regex(@"[\u4e00-\u9fa5]"); //双字节字符 Regex reg = new Regex(@"[^\x00-\xff] (包括汉字在内,可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1))"); //空白行的正则表达式,可用来删除空白行 Regex reg = new Regex(@"\n\s*\r"); //HTML标记的正则表达式 Regex reg = new Regex(@"<(\S*?)[^>]*>.*?</\1>|<.*? />");// (网上流传的版本太糟糕,上面这个也仅仅能部分,对于复杂的嵌套标记依旧无能为力) //首尾空白字符的正则表达式 Regex reg = new Regex(@"^\s*|\s*$或(^\s*)|(\s*$)");// (可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式) //腾讯QQ号 Regex reg = new Regex(@"[1-9][0-9]{4,}"); //(腾讯QQ号从10000开始) //中国邮政编码 Regex reg = new Regex(@"[1-9]\d{5}(?!\d)");// (中国邮政编码为6位数字) //IP地址 Regex reg = new Regex(@"\d+\.\d+\.\d+\.\d+");// (提取IP地址时有用) //IP地址 Regex reg = new Regex(@"((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))");
正则的使用可以分为验证方法和匹配方法两种
因上文对正则已经做了比较详细的讲解,故在此不多做赘述,直接贴出使用demo
public class Validator { #region 匹配方法 /// <summary> /// 验证字符串是否匹配正则表达式描述的规则 /// </summary> /// <param name="inputStr">待验证的字符串</param> /// <param name="patternStr">正则表达式字符串</param> /// <returns>是否匹配</returns> public static bool IsMatch(string inputStr, string patternStr) { return IsMatch(inputStr, patternStr, false, false); } /// <summary> /// 验证字符串是否匹配正则表达式描述的规则 /// </summary> /// <param name="inputStr">待验证的字符串</param> /// <param name="patternStr">正则表达式字符串</param> /// <param name="ifIgnoreCase">匹配时是否不区分大小写</param> /// <returns>是否匹配</returns> public static bool IsMatch(string inputStr, string patternStr, bool ifIgnoreCase) { return IsMatch(inputStr, patternStr, ifIgnoreCase, false); } /// <summary> /// 验证字符串是否匹配正则表达式描述的规则 /// </summary> /// <param name="inputStr">待验证的字符串</param> /// <param name="patternStr">正则表达式字符串</param> /// <param name="ifValidateWhiteSpace">是否验证空白字符串</param> /// <returns>是否匹配</returns> public static bool IsMatch(string inputStr, string patternStr, bool ifValidateWhiteSpace) { return IsMatch(inputStr, patternStr, false, ifValidateWhiteSpace); } /// <summary> /// 验证字符串是否匹配正则表达式描述的规则 /// </summary> /// <param name="inputStr">待验证的字符串</param> /// <param name="patternStr">正则表达式字符串</param> /// <param name="ifIgnoreCase">匹配时是否不区分大小写</param> /// <param name="ifValidateWhiteSpace">是否验证空白字符串</param> /// <returns>是否匹配</returns> public static bool IsMatch(string inputStr, string patternStr, bool ifIgnoreCase, bool ifValidateWhiteSpace) { if (!ifValidateWhiteSpace && string.IsNullOrWhiteSpace(inputStr))//.NET 4.0 新增IsNullOrWhiteSpace 方法,便于对用户做处理 return false;//如果不要求验证空白字符串而此时传入的待验证字符串为空白字符串,则不匹配 Regex regex = null; if (ifIgnoreCase) regex = new Regex(patternStr, RegexOptions.IgnoreCase);//指定不区分大小写的匹配 else regex = new Regex(patternStr); return regex.IsMatch(inputStr); } #endregion #region 验证方法 /// <summary> /// 验证数字(double类型) /// [可以包含负号和小数点] /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsNumber(string input) { //string pattern = @"^-?\d+$|^(-?\d+)(\.\d+)?$"; //return IsMatch(input, pattern); double d = 0; if (double.TryParse(input, out d)) return true; else return false; } /// <summary> /// 验证整数 /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsInteger(string input) { //string pattern = @"^-?\d+$"; //return IsMatch(input, pattern); int i = 0; if (int.TryParse(input, out i)) return true; else return false; } /// <summary> /// 验证非负整数 /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsIntegerNotNagtive(string input) { //string pattern = @"^\d+$"; //return IsMatch(input, pattern); int i = -1; if (int.TryParse(input, out i) && i >= 0) return true; else return false; } /// <summary> /// 验证正整数 /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsIntegerPositive(string input) { //string pattern = @"^[0-9]*[1-9][0-9]*$"; //return IsMatch(input, pattern); int i = 0; if (int.TryParse(input, out i) && i >= 1) return true; else return false; } /// <summary> /// 验证小数 /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsDecimal(string input) { string pattern = @"^([-+]?[1-9]\d*\.\d+|-?0\.\d*[1-9]\d*)$"; return IsMatch(input, pattern); } /// <summary> /// 验证只包含英文字母 /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsEnglishCharacter(string input) { string pattern = @"^[A-Za-z]+$"; return IsMatch(input, pattern); } /// <summary> /// 验证只包含数字和英文字母 /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsIntegerAndEnglishCharacter(string input) { string pattern = @"^[0-9A-Za-z]+$"; return IsMatch(input, pattern); } /// <summary> /// 验证只包含汉字 /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsChineseCharacter(string input) { string pattern = @"^[\u4e00-\u9fa5]+$"; return IsMatch(input, pattern); } /// <summary> /// 验证数字长度范围(数字前端的0计长度) /// [若要验证固定长度,可传入相同的两个长度数值] /// </summary> /// <param name="input">待验证的字符串</param> /// <param name="lengthBegin">长度范围起始值(含)</param> /// <param name="lengthEnd">长度范围结束值(含)</param> /// <returns>是否匹配</returns> public static bool IsIntegerLength(string input, int lengthBegin, int lengthEnd) { //string pattern = @"^\d{" + lengthBegin + "," + lengthEnd + "}$"; //return IsMatch(input, pattern); if (input.Length >= lengthBegin && input.Length <= lengthEnd) { int i; if (int.TryParse(input, out i)) return true; else return false; } else return false; } /// <summary> /// 验证字符串包含内容 /// </summary> /// <param name="input">待验证的字符串</param> /// <param name="withEnglishCharacter">是否包含英文字母</param> /// <param name="withNumber">是否包含数字</param> /// <param name="withChineseCharacter">是否包含汉字</param> /// <returns>是否匹配</returns> public static bool IsStringInclude(string input, bool withEnglishCharacter, bool withNumber, bool withChineseCharacter) { if (!withEnglishCharacter && !withNumber && !withChineseCharacter) return false;//如果英文字母、数字和汉字都没有,则返回false StringBuilder patternString = new StringBuilder(); patternString.Append("^["); if (withEnglishCharacter) patternString.Append("a-zA-Z"); if (withNumber) patternString.Append("0-9"); if (withChineseCharacter) patternString.Append(@"\u4E00-\u9FA5"); patternString.Append("]+$"); return IsMatch(input, patternString.ToString()); } /// <summary> /// 验证字符串长度范围 /// [若要验证固定长度,可传入相同的两个长度数值] /// </summary> /// <param name="input">待验证的字符串</param> /// <param name="lengthBegin">长度范围起始值(含)</param> /// <param name="lengthEnd">长度范围结束值(含)</param> /// <returns>是否匹配</returns> public static bool IsStringLength(string input, int lengthBegin, int lengthEnd) { //string pattern = @"^.{" + lengthBegin + "," + lengthEnd + "}$"; //return IsMatch(input, pattern); if (input.Length >= lengthBegin && input.Length <= lengthEnd) return true; else return false; } /// <summary> /// 验证字符串长度范围(字符串内只包含数字和/或英文字母) /// [若要验证固定长度,可传入相同的两个长度数值] /// </summary> /// <param name="input">待验证的字符串</param> /// <param name="lengthBegin">长度范围起始值(含)</param> /// <param name="lengthEnd">长度范围结束值(含)</param> /// <returns>是否匹配</returns> public static bool IsStringLengthOnlyNumberAndEnglishCharacter(string input, int lengthBegin, int lengthEnd) { string pattern = @"^[0-9a-zA-z]{" + lengthBegin + "," + lengthEnd + "}$"; return IsMatch(input, pattern); } /// <summary> /// 验证字符串长度范围 /// [若要验证固定长度,可传入相同的两个长度数值] /// </summary> /// <param name="input">待验证的字符串</param> /// <param name="withEnglishCharacter">是否包含英文字母</param> /// <param name="withNumber">是否包含数字</param> /// <param name="withChineseCharacter">是否包含汉字</param> /// <param name="lengthBegin">长度范围起始值(含)</param> /// <param name="lengthEnd">长度范围结束值(含)</param> /// <returns>是否匹配</returns> public static bool IsStringLengthByInclude(string input, bool withEnglishCharacter, bool withNumber, bool withChineseCharacter, int lengthBegin, int lengthEnd) { if (!withEnglishCharacter && !withNumber && !withChineseCharacter) return false;//如果英文字母、数字和汉字都没有,则返回false StringBuilder patternString = new StringBuilder(); patternString.Append("^["); if (withEnglishCharacter) patternString.Append("a-zA-Z"); if (withNumber) patternString.Append("0-9"); if (withChineseCharacter) patternString.Append(@"\u4E00-\u9FA5"); patternString.Append("]{" + lengthBegin + "," + lengthEnd + "}$"); return IsMatch(input, patternString.ToString()); } /// <summary> /// 验证字符串字节数长度范围 /// [若要验证固定长度,可传入相同的两个长度数值;每个汉字为两个字节长度] /// </summary> /// <param name="input">待验证的字符串</param> /// <param name="lengthBegin">长度范围起始值(含)</param> /// <param name="lengthEnd">长度范围结束值(含)</param> /// <returns></returns> public static bool IsStringByteLength(string input, int lengthBegin, int lengthEnd) { //int byteLength = Regex.Replace(input, @"[^\x00-\xff]", "ok").Length; //if (byteLength >= lengthBegin && byteLength <= lengthEnd) //{ // return true; //} //return false; int byteLength = Encoding.Default.GetByteCount(input); if (byteLength >= lengthBegin && byteLength <= lengthEnd) return true; else return false; } /// <summary> /// 验证日期 /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsDateTime(string input) { DateTime dt; if (DateTime.TryParse(input, out dt)) return true; else return false; } /// <summary> /// 验证固定电话号码 /// [3位或4位区号;区号可以用小括号括起来;区号可以省略;区号与本地号间可以用减号或空格隔开;可以有3位数的分机号,分机号前要加减号] /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsTelePhoneNumber(string input) { string pattern = @"^(((0\d2|0\d{2})[- ]?)?\d{8}|((0\d3|0\d{3})[- ]?)?\d{7})(-\d{3})?$"; return IsMatch(input, pattern); } /// <summary> /// 验证手机号码 /// [可匹配"(+86)013325656352",括号可以省略,+号可以省略,(+86)可以省略,11位手机号前的0可以省略;11位手机号第二位数可以是3、4、5、8中的任意一个] /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsMobilePhoneNumber(string input) { string pattern = @"^((\+)?86|((\+)?86)?)0?1[3458]\d{9}$"; return IsMatch(input, pattern); } /// <summary> /// 验证电话号码(可以是固定电话号码或手机号码) /// [固定电话:[3位或4位区号;区号可以用小括号括起来;区号可以省略;区号与本地号间可以用减号或空格隔开;可以有3位数的分机号,分机号前要加减号]] /// [手机号码:[可匹配"(+86)013325656352",括号可以省略,+号可以省略,(+86)可以省略,手机号前的0可以省略;手机号第二位数可以是3、4、5、8中的任意一个]] /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsPhoneNumber(string input) { string pattern = @"^((\+)?86|((\+)?86)?)0?1[3458]\d{9}$|^(((0\d2|0\d{2})[- ]?)?\d{8}|((0\d3|0\d{3})[- ]?)?\d{7})(-\d{3})?$"; return IsMatch(input, pattern); } /// <summary> /// 验证邮政编码 /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsZipCode(string input) { //string pattern = @"^\d{6}$"; //return IsMatch(input, pattern); if (input.Length != 6) return false; int i; if (int.TryParse(input, out i)) return true; else return false; } /// <summary> /// 验证电子邮箱 /// [@字符前可以包含字母、数字、下划线和点号;@字符后可以包含字母、数字、下划线和点号;@字符后至少包含一个点号且点号不能是最后一个字符;最后一个点号后只能是字母或数字] /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsEmail(string input) { ////邮箱名以数字或字母开头;邮箱名可由字母、数字、点号、减号、下划线组成;邮箱名(@前的字符)长度为3~18个字符;邮箱名不能以点号、减号或下划线结尾;不能出现连续两个或两个以上的点号、减号。 //string pattern = @"^[a-zA-Z0-9]((?<!(\.\.|--))[a-zA-Z0-9\._-]){1,16}[a-zA-Z0-9]@([0-9a-zA-Z][0-9a-zA-Z-]{0,62}\.)+([0-9a-zA-Z][0-9a-zA-Z-]{0,62})\.?|((25[0-5]|2[0-4]\d|[01]?\d\d?)\.){3}(25[0-5]|2[0-4]\d|[01]?\d\d?)$"; string pattern = @"^([\w-\.]+)@([\w-\.]+)(\.[a-zA-Z0-9]+)$"; return IsMatch(input, pattern); } /// <summary> /// 验证网址(可以匹配IPv4地址但没对IPv4地址进行格式验证;IPv6暂时没做匹配) /// [允许省略"://";可以添加端口号;允许层级;允许传参;域名中至少一个点号且此点号前要有内容] /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsURL(string input) { ////每级域名由字母、数字和减号构成(第一个字母不能是减号),不区分大小写,单个域长度不超过63,完整的域名全长不超过256个字符。在DNS系统中,全名是以一个点“.”来结束的,例如“www.nit.edu.cn.”。没有最后的那个点则表示一个相对地址。 ////没有例如"http://"的前缀,没有传参的匹配 //string pattern = @"^([0-9a-zA-Z][0-9a-zA-Z-]{0,62}\.)+([0-9a-zA-Z][0-9a-zA-Z-]{0,62})\.?$"; //string pattern = @"^(((file|gopher|news|nntp|telnet|http|ftp|https|ftps|sftp)://)|(www\.))+(([a-zA-Z0-9\._-]+\.[a-zA-Z]{2,6})|([0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}))(/[a-zA-Z0-9\&%_\./-~-]*)?$"; string pattern = @"^([a-zA-Z]+://)?([\w-\.]+)(\.[a-zA-Z0-9]+)(:\d{0,5})?/?([\w-/]*)\.?([a-zA-Z]*)\??(([\w-]*=[\w%]*&?)*)$"; return IsMatch(input, pattern); } /// <summary> /// 验证IPv4地址 /// [第一位和最后一位数字不能是0或255;允许用0补位] /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsIPv4(string input) { //string pattern = @"^(25[0-4]|2[0-4]\d]|[01]?\d{2}|[1-9])\.(25[0-5]|2[0-4]\d]|[01]?\d?\d)\.(25[0-5]|2[0-4]\d]|[01]?\d?\d)\.(25[0-4]|2[0-4]\d]|[01]?\d{2}|[1-9])$"; //return IsMatch(input, pattern); string[] IPs = input.Split('.'); if (IPs.Length != 4) return false; int n = -1; for (int i = 0; i < IPs.Length; i++) { if (i == 0 || i == 3) { if (int.TryParse(IPs[i], out n) && n > 0 && n < 255) continue; else return false; } else { if (int.TryParse(IPs[i], out n) && n >= 0 && n <= 255) continue; else return false; } } return true; } /// <summary> /// 验证IPv6地址 /// [可用于匹配任何一个合法的IPv6地址] /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsIPv6(string input) { string pattern = @"^\s*((([0-9A-Fa-f]{1,4}:){7}([0-9A-Fa-f]{1,4}|:))|(([0-9A-Fa-f]{1,4}:){6}(:[0-9A-Fa-f]{1,4}|((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|:))|(([0-9A-Fa-f]{1,4}:){5}(((:[0-9A-Fa-f]{1,4}){1,2})|:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|:))|(([0-9A-Fa-f]{1,4}:){4}(((:[0-9A-Fa-f]{1,4}){1,3})|((:[0-9A-Fa-f]{1,4})?:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){3}(((:[0-9A-Fa-f]{1,4}){1,4})|((:[0-9A-Fa-f]{1,4}){0,2}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){2}(((:[0-9A-Fa-f]{1,4}){1,5})|((:[0-9A-Fa-f]{1,4}){0,3}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){1}(((:[0-9A-Fa-f]{1,4}){1,6})|((:[0-9A-Fa-f]{1,4}){0,4}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(:(((:[0-9A-Fa-f]{1,4}){1,7})|((:[0-9A-Fa-f]{1,4}){0,5}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:)))(%.+)?\s*$"; return IsMatch(input, pattern); } /// <summary> /// 身份证上数字对应的地址 /// </summary> //enum IDAddress //{ // 北京 = 11, 天津 = 12, 河北 = 13, 山西 = 14, 内蒙古 = 15, 辽宁 = 21, 吉林 = 22, 黑龙江 = 23, 上海 = 31, 江苏 = 32, 浙江 = 33, // 安徽 = 34, 福建 = 35, 江西 = 36, 山东 = 37, 河南 = 41, 湖北 = 42, 湖南 = 43, 广东 = 44, 广西 = 45, 海南 = 46, 重庆 = 50, 四川 = 51, // 贵州 = 52, 云南 = 53, 西藏 = 54, 陕西 = 61, 甘肃 = 62, 青海 = 63, 宁夏 = 64, 新疆 = 65, 台湾 = 71, 香港 = 81, 澳门 = 82, 国外 = 91 //} /// <summary> /// 验证一代身份证号(15位数) /// [长度为15位的数字;匹配对应省份地址;生日能正确匹配] /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsIDCard15(string input) { //验证是否可以转换为15位整数 long l = 0; if (!long.TryParse(input, out l) || l.ToString().Length != 15) { return false; } //验证省份是否匹配 //1~6位为地区代码,其中1、2位数为各省级政府的代码,3、4位数为地、市级政府的代码,5、6位数为县、区级政府代码。 string address = "11,12,13,14,15,21,22,23,31,32,33,34,35,36,37,41,42,43,44,45,46,50,51,52,53,54,61,62,63,64,65,71,81,82,91,"; if (!address.Contains(input.Remove(2) + ",")) { return false; } //验证生日是否匹配 string birthdate = input.Substring(6, 6).Insert(4, "/").Insert(2, "/"); DateTime dt; if (!DateTime.TryParse(birthdate, out dt)) { return false; } return true; } /// <summary> /// 验证二代身份证号(18位数,GB11643-1999标准) /// [长度为18位;前17位为数字,最后一位(校验码)可以为大小写x;匹配对应省份地址;生日能正确匹配;校验码能正确匹配] /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsIDCard18(string input) { //验证是否可以转换为正确的整数 long l = 0; if (!long.TryParse(input.Remove(17), out l) || l.ToString().Length != 17 || !long.TryParse(input.Replace('x', '0').Replace('X', '0'), out l)) { return false; } //验证省份是否匹配 //1~6位为地区代码,其中1、2位数为各省级政府的代码,3、4位数为地、市级政府的代码,5、6位数为县、区级政府代码。 string address = "11,12,13,14,15,21,22,23,31,32,33,34,35,36,37,41,42,43,44,45,46,50,51,52,53,54,61,62,63,64,65,71,81,82,91,"; if (!address.Contains(input.Remove(2) + ",")) { return false; } //验证生日是否匹配 string birthdate = input.Substring(6, 8).Insert(6, "/").Insert(4, "/"); DateTime dt; if (!DateTime.TryParse(birthdate, out dt)) { return false; } //校验码验证 //校验码: //(1)十七位数字本体码加权求和公式 //S = Sum(Ai * Wi), i = 0, ... , 16 ,先对前17位数字的权求和 //Ai:表示第i位置上的身份证号码数字值 //Wi:表示第i位置上的加权因子 //Wi: 7 9 10 5 8 4 2 1 6 3 7 9 10 5 8 4 2 //(2)计算模 //Y = mod(S, 11) //(3)通过模得到对应的校验码 //Y: 0 1 2 3 4 5 6 7 8 9 10 //校验码: 1 0 X 9 8 7 6 5 4 3 2 string[] arrVarifyCode = ("1,0,x,9,8,7,6,5,4,3,2").Split(','); string[] Wi = ("7,9,10,5,8,4,2,1,6,3,7,9,10,5,8,4,2").Split(','); char[] Ai = input.Remove(17).ToCharArray(); int sum = 0; for (int i = 0; i < 17; i++) { sum += int.Parse(Wi[i]) * int.Parse(Ai[i].ToString()); } int y = -1; Math.DivRem(sum, 11, out y); if (arrVarifyCode[y] != input.Substring(17, 1).ToLower()) { return false; } return true; } /// <summary> /// 验证身份证号(不区分一二代身份证号) /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsIDCard(string input) { if (input.Length == 18) return IsIDCard18(input); else if (input.Length == 15) return IsIDCard15(input); else return false; } /// <summary> /// 验证经度 /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsLongitude(string input) { ////范围为-180~180,小数位数必须是1到5位 //string pattern = @"^[-\+]?((1[0-7]\d{1}|0?\d{1,2})\.\d{1,5}|180\.0{1,5})$"; //return IsMatch(input, pattern); float lon; if (float.TryParse(input, out lon) && lon >= -180 && lon <= 180) return true; else return false; } /// <summary> /// 验证纬度 /// </summary> /// <param name="input">待验证的字符串</param> /// <returns>是否匹配</returns> public static bool IsLatitude(string input) { ////范围为-90~90,小数位数必须是1到5位 //string pattern = @"^[-\+]?([0-8]?\d{1}\.\d{1,5}|90\.0{1,5})$"; //return IsMatch(input, pattern); float lat; if (float.TryParse(input, out lat) && lat >= -90 && lat <= 90) return true; else return false; } #endregion }
关于“C#正则表达式使用源码分析”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“C#正则表达式使用源码分析”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。