提问人:Max 提问时间:8/10/2023 最后编辑:Max 更新时间:8/10/2023 访问量:39
无法使用 Html Agility Pack 从 HTML 文档中提取所有段落标签
Unable to extract all paragraph tags from HTML document using Html Agility Pack
问:
我正在尝试使用 Html Agility Pack 从 HTML 文档中获取所有内容。
但是,当我在下面尝试时,所有节点都是空的。<p></p>
var doc = new HtmlDocument();
doc.Load(@"c:\Webs\test.html");
var nodes = doc.DocumentNode.SelectNodes("//p");
foreach ( var paragraph in nodes ) {
Console.WriteLine($"paragraph {paragraph.InnerText}");
}
Html
<!DOCTYPE html>
<html>
<head>
</head>
<body>
<p>I am a paragraph</p>
<p>I am a paragraph</p>
<h1>I am an H1</h1>
<p>I am a paragraph</p>
<p>I am a paragraph</p>
<p>I am a paragraph</p>
<h1>I am an H1</h1>
</body>
</html>
答: 暂无答案
评论
var nodes = doc.DocumentNode.Descendants("p");
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();