如何在htmlagalitypack中转义/n/t/t/t

How can I escape /n/t/t/t in htmlagalitypack

提问人: 提问时间:8/3/2020 更新时间:8/4/2020 访问量:36

问:

我想通过html-agility-pack从 cvedetails.com 解析受影响的版本表。我写了如下代码。我通过傀儡师获取表格的原始 HTML。via (VulnerabilityParser.GetAffectedVersionAsync () 函数)

string versionsTableRawHTML = await VulnerabilityParser.GetAffectedVersionAsync(AffectedVersionsSelector);

        var versionsTable = new HtmlDocument();
        versionsTable.LoadHtml(versionsTableRawHTML);

        foreach (HtmlNode table in versionsTable.DocumentNode.SelectNodes("//tr/td"))
        {
            var row= table.SelectSingleNode("//tr/td[5]").InnerText;           
        }

该结果如下,属于我的行变量。 “\n\t\t\t\t\t\t\t\t1\t\t\t\t”

我检查了目标站点。它不在其中。 这个结果的原因是什么?我应该如何解析它?

解析 dom html-parsing html-agility-pack

评论


答:

0赞 ad79h 8/4/2020 #1

要获取表格的行,您可以遵循以下方法

  HtmlWeb mWb = new HtmlWeb();

         HtmlDocument mDoc= mWb.Load("https://www.cvedetails.com/cve/CVE-2019-16223/");

        var rows = mDoc.DocumentNode.SelectNodes("//td[@class='num']");

        foreach (var row in rows)
        {
            //Each row number
            Console.WriteLine(row.InnerText);
        }

要获取其他列,您可以遵循相同的方法,并在长度为 700 的 for 循环中拆分所有行