beautifulsoup 问答列表

如何从此产品URL中获取每张图片的URL?

作者:Danny_webb 提问时间:11/16/2023

问题描述: 本网站上的每个产品 https://www.asos.com/us/women/dresses/cat/?cid=8799 都有几张图片。例如,这是一件黑色连衣裙 https://www...

无法通过网络抓取访问 Yahoo Finances [已关闭]

作者:Haiku 提问时间:11/16/2023

闭。此问题需要调试详细信息。它目前不接受答案。 编辑问题以包括所需的行为、特定问题或错误以及重现问题所需的最短代码。这将帮助其他人回答这个问题。 7天前关闭。 改进此问题 我根本无法通过网络抓...

如何使用漂亮的汤进行网页抓取时解决服务器错误500?

作者:Newbie 提问时间:11/16/2023

import requests from bs4 import BeautifulSoup import os import time # Define the URL of the webpage...

无法使用 bs4 和 re 定位 html 标签

作者:Howard Zhu 提问时间:11/16/2023

我正在尝试使用 BS4 来取消收入发布的公开文件,有一个名为“reconciliation(s)”的关键字,所以我尝试使用 Regex 进行搜索。我发现所有的 reconciliation 关键字都应...

无法抓取使用 Algolia 组件的网站 [已关闭]

作者:Saurabh Jindal 提问时间:11/17/2023

已关闭。这个问题需要细节或澄清。它目前不接受答案。 想改进这个问题吗?通过编辑这篇文章添加详细信息并澄清问题。 5天前关闭。 改进此问题 这里的新手 - 并且一直在使用 BeautifulSo...

使用 python 进行网页抓取的初学者:使用 BeautifulSoup 并通过类查找时,我要么得到错误的类,要么结果为“无”

作者:babytroopr 提问时间:11/17/2023

我想从以下网站获取UCI积分:https://www.procyclingstats.com/rider/tadej-pogacar 首先,我只想从最新一场比赛中抢到uci积分。 到目前为止,我的...

驱动程序页面源未捕获新页面信息

作者:Paul Corcoran 提问时间:11/18/2023

我正在使用 selenium/Bs4 返回从此页面抓取的游戏,示例输出如下,列表格式如下。但是,我使用 selenium 单击并更改时间框架参数,从而导致出现不同的游戏。当我尝试使用 bs4 抓取更新...

使用 selenium/beatifulsoup 从地图上获取标记坐标 [已关闭]

作者:beridzeg45 提问时间:11/18/2023

已关闭。这个问题需要更加集中。它目前不接受答案。 想改进这个问题吗?更新问题,使其仅通过编辑这篇文章来关注一个问题。 昨天关闭。 改进此问题 我想从地图中检索标记坐标。 网站网址 : 'htt...

从 h1 标签中提取文本时出现问题 美丽的汤

作者:DCUpro 提问时间:11/17/2023

我是解析网站的完全新手,但我有一个脚本,可以提取不同住房网站的数据,这些网站在过去一年中完美运行。但是,由于我无法弄清楚的原因,它不再适用于 daft.ie。我尝试过调试,但我尝试的似乎都不起作用。我...


共109条 当前第11页