如何使用CSS选择器或XPath抓取隐藏的Web链接地址

how to scrape hidden weblink addresses using css selector or xpath

提问人:Louie Sui 提问时间:6/23/2023 更新时间:6/23/2023 访问量:38

问:

我想删除订书钉类别下一页的链接地址,我正在努力这样做。有谁知道如何使用 css 选择器或 xpath 报废它?我正在使用 scrapy python 包。

在此处输入图像描述

我尝试使用图片中指向链接的一些标签,但无济于事。

python html 网页抓取 scapy web-inspector

评论

0赞 Alexander 6/23/2023
没有抓取链接...并不是说它是隐藏的,链接不存在
0赞 Community 6/23/2023
请提供足够的代码,以便其他人可以更好地理解或重现问题。

答:

0赞 Mark 6/23/2023 #1

没有必要抓取他们的网站 - 如果你在网络浏览器中查看事物的“网络”选项卡(右键单击>“检查>网络”选项卡),然后单击下一页,你会看到他们的数据被编码为 JSONInspect

它似乎没有在线记录,因此参数似乎是:

  • pn页码
  • categoryId不言自明
  • term搜索词

其他术语我不确定,(但我也不认为你不需要改变它们来诚实。

希望这有帮助!

免责声明:请务必在抓取之前检查机器人 .txt,看看该网站是否同意您抓取他们的网站。