提问人:Louie Sui 提问时间:6/23/2023 更新时间:6/23/2023 访问量:38
如何使用CSS选择器或XPath抓取隐藏的Web链接地址
how to scrape hidden weblink addresses using css selector or xpath
问:
我想删除订书钉类别下一页的链接地址,我正在努力这样做。有谁知道如何使用 css 选择器或 xpath 报废它?我正在使用 scrapy python 包。
我尝试使用图片中指向链接的一些标签,但无济于事。
答:
0赞
Mark
6/23/2023
#1
没有必要抓取他们的网站 - 如果你在网络浏览器中查看事物的“网络”选项卡(右键单击>“检查>网络”选项卡),然后单击下一页,你会看到他们的数据被编码为 JSON。Inspect
它似乎没有在线记录,因此参数似乎是:
pn
页码categoryId
不言自明term
搜索词
其他术语我不确定,(但我也不认为你不需要改变它们来诚实。
希望这有帮助!
免责声明:请务必在抓取之前检查机器人 .txt,看看该网站是否同意您抓取他们的网站。
评论