如何根据现有 URL 从 HTML 元素中抓取数据?
作者:T6VK 提问时间:10/28/2023
我有一个脚本可以将RSS数据保存到电子表格中,但它仍然有缺点和问题。 我收到了标题、时间、文章链接形式的数据。 https://i.stack.imgur.com/9YTAF.png 我希望脚本能...
抓取 问答列表
作者:T6VK 提问时间:10/28/2023
我有一个脚本可以将RSS数据保存到电子表格中,但它仍然有缺点和问题。 我收到了标题、时间、文章链接形式的数据。 https://i.stack.imgur.com/9YTAF.png 我希望脚本能...
作者:Peter Yun 提问时间:10/29/2023
我一直在尝试使用 WinHTTP 进行 Excel Web 抓取,并且尝试了各种元素搜索方法,例如 class、name 和 id,但它不起作用。抓取在其他网站上有效,但在此网站上效果不佳。我想抓取的...
作者:Рыбалка С Арсением Джумайсымба 提问时间:10/29/2023
def get_source_html(url): executable_path = "D:\python\Новая папка\chromedriver\chromedriver.exe" ...
作者:collatz 提问时间:10/28/2023
我在本地 Mac 上制作了一个 Selenium 机器人,它在那里完美运行。尝试通过 google cloud 在虚拟 Windows 10 计算机上运行它时,我收到以下错误: "Traceback...
作者:SparkyVBA 提问时间:10/30/2023
我希望有人可以帮助像我这样的初学者。 我正在尝试创建一个网络爬虫,该爬虫从 B 列中的 URL 中获取定价。 我想创建一个循环,以便将 HTML 中的价格从“B”列中的 URL 提取到“C”列。 由...
作者:Newbie 提问时间:11/16/2023
import requests from bs4 import BeautifulSoup import os import time # Define the URL of the webpage...
作者:Haiku 提问时间:11/16/2023
闭。此问题需要调试详细信息。它目前不接受答案。 编辑问题以包括所需的行为、特定问题或错误以及重现问题所需的最短代码。这将帮助其他人回答这个问题。 7天前关闭。 改进此问题 我根本无法通过网络抓...
作者:Michael Frank 提问时间:8/9/2012
我希望能够从移动应用程序中抓取数据,该应用程序会根据我的位置实时生成结果。例如,我希望能够实时提取离我最近的出租车的数据,并将其显示为其他移动应用程序的一部分。...
作者:Danny_webb 提问时间:11/16/2023
问题描述: 本网站上的每个产品 https://www.asos.com/us/women/dresses/cat/?cid=8799 都有几张图片。例如,这是一件黑色连衣裙 https://www...
作者:dewashya 提问时间:11/16/2023
我想从AMFI网站下载所有方案的每日NAV(资产净值),并将其全部存储在MongoDB中。但是使用我当前的代码,下载所有数据并将其推送到数据库中需要将近 5 天的时间太长,因为我正在尝试更改数据的结构...