C#中的Regexpr获取值
-
28-09-2019 - |
题
我在C#中有任何文本,我需要使用正则表达式的“匹配”,并获得一个值(解析文本以获取值)。
文字:
var asunto1 =“ id p20101125_0003 -pendiente deautorización-”;
var asunto2 =“ id p20101125_0003任何文本任何文本”;
var asunto3 =“ id_p20101125_0003任何文本任何文本”;
我需要获得价值:
var peticion =“ p20101125_0003”;
我有这种正则表达,但对我来说失败了:
//ID P20101125_0003 -- Pendiente de autorización --
patternPeticionEV.Append(@"^");
patternPeticionEV.Append(@"ID P");
patternPeticionEV.Append(@"(20[0-9][0-9])"); // yyyy
patternPeticionEV.Append(@"(0[1-9]|1[012])"); // MM
patternPeticionEV.Append(@"(0[1-9]|[12][0-9]|3[01])"); // dd
patternPeticionEV.Append(@"(_)");
patternPeticionEV.Append(@"\d{4}");
//patternPeticionEV.Append(@"*");
patternPeticionEV.Append(@"$");
if (System.Text.RegularExpressions.Regex.IsMatch(asuntoPeticionEV, exprRegular, System.Text.RegularExpressions.RegexOptions.IgnoreCase))
{
var match = System.Text.RegularExpressions.Regex.Match(asuntoPeticionEV, exprRegular, System.Text.RegularExpressions.RegexOptions.IgnoreCase);
//...
}
解决方案
您的正则表达式以“ $”结尾,上面写着“线/文本必须在那里结束”。你不想要那个。只是摆脱这一行:
patternPeticionEV.Append(@"$");
它主要会立即起作用。然后,您只需要添加一个捕获组即可隔离所需的文本。
我也建议添加 using System.Text.RegularExpressions;
这样您就不必充分资格 Regex
每一次。你也可以打电话 Match
然后检查成功,以避免将其匹配两次。
示例代码:
using System.Text.RegularExpressions;
class Test
{
static void Main()
{
DisplayMatch("ID P20101125_0003 -- Pendiente de autorización --");
// No match due to _
DisplayMatch("ID_P20101125_0003 any text any text");
}
static readonly Regex Pattern = new Regex
("^" + // Start of string
"ID " +
"(" + // Start of capturing group
"P" +
"(20[0-9][0-9])" + // yyyy
"(0[1-9]|1[012])" + // MM
"(0[1-9]|[12][0-9]|3[01])" + // dd
@"_\d{4}" +
")" // End of capturing group
);
static void DisplayMatch(string input)
{
Match match = Pattern.Match(input);
if (match.Success)
{
Console.WriteLine("Matched: {0}", match.Groups[1]);
}
else
{
Console.WriteLine("No match");
}
}
}
其他提示
这可能只是我,但是对于将弦线解析为有意义的价值观,我更喜欢做更多的详细事物:
private bool TryParseContent(string text, out DateTime date, out int index)
{
date = DateTime.MinValue;
index = -1;
if (text.Length < 17)
return false;
string idPart = text.Substring(0, 4);
if (idPart != "ID_P" && idPart != "ID P")
return false;
string datePart = text.Substring(4, 8);
if (!DateTime.TryParseExact(datePart, "yyyyMMdd", System.Globalization.DateTimeFormatInfo.InvariantInfo, System.Globalization.DateTimeStyles.None, out date))
return false;
// TODO: do additional validation of the date
string indexPart = text.Substring(13, 4);
if (!int.TryParse(indexPart, out index))
return false;
return true;
}
为什么不使用以下类似的子字符串:
var asunto1 = "ID P20101125_0003 -- Pendiente de autorización --";
var asunto2 = "ID P20101125_0003 any text any text";
var asunto3 = "ID_P20101125_0003 any text any text";
var peticion = asunto1.Substring(3,14); //gets P20101125_0003
此正则将为您提供所需的字符串
^ID[_ ]P[0-9_]+?
不隶属于 StackOverflow