网页抓 问答列表

提取产品链接的正确选择器是什么?

作者:mohsen0965 提问时间:11/18/2023

我想抓取此网页中的产品链接 (href)。https://www.artfinder.com/editors-picks/theme/amazing-techniques/blurred-lines/...

使用 scrapy 抓取东西时的空响应 (python)

作者:Ignacio Perez vilaplana 提问时间:11/17/2023

我正在尝试使用 scrapy 及其 ,特别是此页面来废弃一个网站(“ellenmacarthurfoundation”):Selector.css 这是网站 这是我试图抓取的网络的 html 我正...

获取不为空的 asyncio 结果

作者:Roman Kazmin 提问时间:11/18/2023

我在使用 asyncio 进行网页抓取任务时遇到了一些问题。我想在 cian 网站上收集有关房地产经纪人的信息 - 我使用 asyncio,因为在这个网站上使用了分页。我遇到了两个问题。当我使用完全异...

从 h1 标签中提取文本时出现问题 美丽的汤

作者:DCUpro 提问时间:11/17/2023

我是解析网站的完全新手,但我有一个脚本,可以提取不同住房网站的数据,这些网站在过去一年中完美运行。但是,由于我无法弄清楚的原因,它不再适用于 daft.ie。我尝试过调试,但我尝试的似乎都不起作用。我...

检测是否存在含硒的元素

作者:MAHMUT CAN SARIBAL 提问时间:11/18/2023

我的问题如下;首先,我从页面中提取评论,当这些评论很长时,有一个“查看更多”按钮,我按下这个按钮。但是,问题从这里开始,并非页面的每个页面都有此按钮。如果找不到,程序就会停止,但如果我自己切换到另一页...

当page_source随着向下滚动而变化时,如何进行动态网络爬虫

作者:Ingyu Seo 提问时间:11/17/2023

我正在尝试从网站抓取数据。 问题是,当我向下滚动时,源代码正在发生变化。 例如 第一次,页面源代码就像...... <div role="presentation" style="transfo...

用硒增加抓取时间

作者:Muhammad Nabeel 提问时间:11/17/2023

我正在用 Selenium 进行抓取项目,我用 Selenium 做了很少的项目,我想知道,我如何减少抓取时间,我正在抓取一个网站,我的抓取器所做的是网页上有动态链接,它会抓取该页面,然后单击第一个链...

为什么在 Python 中编写新文件时会出现错误?

作者:archana 提问时间:11/17/2023

我正在尝试抓取网页并将数据写入txt.file中。 它抛出了一个错误。 UnicodeEncodeError Traceback (most recent call last) ~\AppData\...

Django/Python Web Scraping - 没有找到目标标签来提取我需要的信息

作者:ATSpiro 提问时间:11/16/2023

我正在开发一个用于体育卡的 Django Web 应用程序。每张卡都有自己的页面,在顶部显示卡名称,在它下面应该显示该卡的当前最低价格。最低价格值是从 https://cardboard.market...

使用 python 进行网页抓取的初学者:使用 BeautifulSoup 并通过类查找时,我要么得到错误的类,要么结果为“无”

作者:babytroopr 提问时间:11/17/2023

我想从以下网站获取UCI积分:https://www.procyclingstats.com/rider/tadej-pogacar 首先,我只想从最新一场比赛中抢到uci积分。 到目前为止,我的...


共174条 当前第7页