Regex - 在 C 中获取 html 标签之间的文本#-解网

问：

我正在尝试在 C# 中获取 2 个 html 标签之间的文本。providerKey 值会经常更改，并且可以有多个这样的标记。我正在尝试获得此值 - Barry Todd Smith，医学博士（129461）

<div class="headerLink">

<a href="/AffiliationLetters/VerificationLetter/Report?providerKey=_OG4no3ZLu0SfzRBHPwVs95CgOPx7T9VDVn8RVKS4_9JprRJP-OAjHe20&amp;reportKey=7ILaIBnEn9QuHG42XVvQmn_48-fachhNjhjPccErrPn5oEhDIgWjtHRy0&amp;filtered=True" target="blank">Barry Todd Smith, MD                                                       (129461)</a>

</div>

这是我为正则表达式准备的。第一个是 till - 第二个是 till 。target="blank">- </a>

<a href="\/AffiliationLetters\/VerificationLetter\/Report[\\?]providerKey[=](.*?)>

<a href="\/AffiliationLetters\/VerificationLetter\/Report[\?]providerKey[=](.*?)<\/a>

C# 正则表达式

string html = @"<div class=""headerLink"">    
<a href=""/AffiliationLetters/VerificationLetter/Report?providerKey=_OG4no3ZLu0SfzRBHPwVs95CgOPx7T9VDVn8RVKS4_9JprRJP-OAjHe20&amp;reportKey=7ILaIBnEn9QuHG42XVvQmn_48-fachhNjhjPccErrPn5oEhDIgWjtHRy0&amp;filtered=True"" target=""blank"">Barry Todd Smith, MD                                                       (129461)</a>
</div>";    
    
var match = Regex.Match(html, "<a [^<>]+>([^<>]*)");
var anchorValue = match.Result("$1"); // contains 'Barry Todd Smith ...'

如果 href-value 中有未转义的 < 或 > 个字符，它将失败。

Regex - 在 C 中获取 html 标签之间的文本#

Regex - Get text between html tags in C#

评论

评论