网页抓取 问答列表

从抓取的数据创建数据帧时如何避免重复行?

作者:Joao Coelho 提问时间:11/13/2023

这只是提取美元报价和变化的简单代码。导出到 excel 时,我得到了一个具有相同值的附加行。 如何消除此双 excel 条目? import requests from bs4 import Be...

Puppeteer 中的导航超时超出抓取表

作者:Evan 提问时间:11/14/2023

我正在尝试从一个网站上抓取表格上的第一个名字,该网站展示了一支篮球队以及该球队的球员姓名和统计数据。当我这样做时,超出了导航超时,这意味着在给定的时间内没有抓取该值,并且在我的客户端上出现了“加载数据...

为什么我会断开连接:未连接到 Python Selenium ChromeDriver 的 DevTools 错误?

作者:Programmer0403 提问时间:11/14/2023

我正在使用硒来获取这个网站上每个人的名字:USTA网站 (我是那些初级网球运动员之一,所以这并不令人毛骨悚然) 获得名称后,我打开ChromeDriver并使用for循环将它们输入搜索栏,单击其行...

缺少登录此网站并抓取所需数据的代码

作者:CesarDev 提问时间:11/13/2023

我正在尝试从我的商品供应商网站上抓取数据,以便更轻松地填充和更新我的产品信息的某些字段。我实现了获取所有数据,除了 6 条文本,这些文本仅在我登录时可用。 我应该在我的代码中添加什么,以便它保持我的...

BeautifulSoup4 返回一个空列表

作者:Thales Souza 提问时间:11/14/2023

我正在尝试访问网站“https://veri.bet/simulator”,然后是“访问投注模拟器”按钮,然后下载体育线信息并以 JSON 格式显示它们。但是,我在控制台上看到一个空白列表。我做错了什...

如何从具有地质半径的 api 中抓取数据?

作者:Pa0x43 提问时间:11/14/2023

我有一个 API,我想从中将数据抓取到我的数据库中。API 始终返回包含 50 个条目的列表。作为 POST 请求,我必须指定带有半径的纬度和经度。 我现在如何查询整个德国? 我想在 X 轴和 Y...

如果 X 匹配 Y 网络抓取硒

作者:DerWildeFuchs 提问时间:11/13/2023

我正在抓取一个网站和 我想检查找到的内容是否与代码中给出的特定单词匹配。如果是这样,它应该做事情 1;如果没有,它应该做事情 2。browser.find_element() Check = bro...

带有 Flaresolver 的 C++ cURL 库结果为 403

作者:Silence 提问时间:11/15/2023

你好, 我目前正在使用 C++ 进行网络抓取项目。对于这个项目,我使用 Flaresolver 作为代理来绕过 Cloudflare 的反机器人措施。尽管阅读了多篇文章和资源,我发现自己陷入困境,无法...

在 Google 表格中使用 IMPORTXML 从 Google 支持页面中提取元素时遇到问题

作者:ali izadi 提问时间:11/15/2023

我正在尝试使用 Google 表格中的 IMPORTXML 函数从特定的 Google 支持页面中提取元素。该公式适用于其他 URL,但是当我在 Google 支持页面上使用它时,它会返回 Could...

同意在谷歌域REST请求上使用cookie?

作者:iSteeb 提问时间:11/15/2023

需要从谷歌地图(例如 https://www.google.com/maps/@/data=!3m1!4b1!4m2!11m1!2sVL_AlqDaR1ymbWlQfsT7Jw)中提取字符串/数组,最...


共171条 当前第15页