提问人:dotnetdev 提问时间:6/26/2021 更新时间:6/27/2021 访问量:129
HtmlAgilityPack - 解析表并将行分配给自定义模型
HtmlAgilityPack - Parse table and assign rows to custom model
问:
所以我正在尝试抓取一些网站数据(特别是这里的第一个表)。我正在使用表 xpath,并尝试获取分配给我的模型的特定行数据。
public static async Task<List<SuspensionModel>> GetSuspensionData()
{
var htmlDocument = new HtmlDocument();
var httpResponseMessage = await _httpClient.GetAsync(_2020SuspUrl);
await EnsureSuccessStatusCode(httpResponseMessage);
var SuspStatsAsHtml = await httpResponseMessage.Content.ReadAsStringAsync();
htmlDocument.LoadHtml(SuspStatsAsHtml);
var suspData = ParseTable(htmlDocument, "/html/body/div[3]/div[3]/div[5]/div[1]/table[1]/tbody/tr");
//return ;
}
private static List<SuspensionModel> ParseTable(HtmlDocument htmlDocument, string xPath)
{
var returnData = new List<SuspensionModel>();
foreach (HtmlNode row in htmlDocument.DocumentNode.SelectNodes(xPath))
{
HtmlNodeCollection cells = row.SelectNodes("td");
var arr = new String[7];
for (int i = 0; i < cells.Count; ++i)
{
arr[i] = cells[i].InnerText;
}
var susp = new SuspensionModel
{
IncidentDate = DateTime.Parse(arr[0]),
OffenderName = arr[1],
OffenderTeam = arr[2],
OffenseDesc = arr[3],
ActionDate = DateTime.Parse(arr[4]),
OffenseLength = arr[5],
SalaryLoss = int.Parse(arr[6])
};
returnData.Add(susp);
}
return returnData;
}
在我的方法中,我在模型中分配值,如何访问给定行中的特定单元格数据?基本上,我想做这样的事情:.正如我现在所拥有的,我的变量总是返回 null,所以我假设我没有正确使用。ParseTable
foreach row, step through each cell and assign to the correct model value
cells
HtmlAgilityPack
在这里感谢任何帮助!
答:
0赞
dotnetdev
6/27/2021
#1
我最终解决了这个问题。我遗漏了两件事,事实证明它与 HtmlAgilityPack 无关。
- 我需要添加.跳过 (1) 到我的 foreach 行,以便它跳过表头行。
foreach (HtmlNode row in htmlDocument.DocumentNode.SelectNodes(xPath).Skip(1))
- 我需要修复我的 SalaryLoss 值。我将其指定为 int,但我需要将其更改为 double,因为它是货币值。
SalaryLoss = double.Parse(arr[6], System.Globalization.NumberStyles.Currency)
评论