beautifulsoup 问答列表

为什么我的代码多次打印出相同的 html 链接?

作者:Vinh Nguyễn Thành 提问时间:7/27/2023

我正在 Python 上进行以下链接活动(这是关于 Python Web Access 数据 - Coursera 的作业)。问题来了: 在本作业中,您将编写一个扩展 http://www.py4e....

使用 python 从同名的 HTML div 框中提取信息

作者:BotheredNow 提问时间:7/22/2023

所以基本上我一直在试图弄清楚如何抓取 bigo.tv 聊天,我遇到的第一个问题是如何提取发送到聊天的每条消息,首先,由于发送的每条聊天消息都被赋予了相同的 div 容器 id,并且 div 框的类与发...

如何从美汤元素中迭代检索正确的信息?

作者:Nick 提问时间:7/18/2023

我尝试从 EZB 新闻稿中检索信息。为此,我使用 BeautifulSoup。由于新闻稿的结构 (HTML) 会随着时间的推移而变化,因此很难使用单个选择器检索新闻稿的日期。因此,我尝试使用“try ...

有没有更好的方法来使用 BeautifulSoup 解析以下 xml,该 xml 返回有组织的 panda 表中的所有内容?

作者:pyj 提问时间:7/14/2023

我正在使用 BeautifulSoup 来解析和 xml 文件。我已经能够成功解析文本列的所有级别。我的代码只返回 xml 中每个段落的最后一项,而不是返回其各自行中的所有项。 以下是我遇到问题的代...

BeautifulSoup 无法识别 <main class= 之后的子类

作者:ИНДУС Геймдев 提问时间:7/10/2023

我需要解析一个新闻网站,新闻的标题和链接位于 <main class='single-module__Main-sc-1qdjg1k-0 iMZnZU' 中。我尝试查询子类,但无法查询。soup.pr...

我使用带有 selenium 和漂亮汤的 python 解析器对 VK 站点的页面进行排序。一个难以理解的错误出现在一个随机的地方 [重复]

作者:Limaximy 提问时间:7/8/2023

这个问题在这里已经有答案了: 未知错误:会话因未知错误导致页面崩溃而删除:无法确定使用 ChromeDriver Selenium 崩溃的选项卡的加载状态 (9 个答案) selenium.commo...

使用Beautifulsoup find_all时如何跳过一行?

作者:Alberi 提问时间:7/5/2023

这是我的代码。它查找所有没有“https://”和域名的汽车链接。但是,其中一个是与“https://...”的完整链接。 如何编写一个代码,跳过这个结果,告诉他不介意带有“https://”或任何其...

Web scrapping Dermnet 图像

作者:sanchay vashist 提问时间:5/25/2023

尝试从文本中抓取图像,但无法使用 Beutiful soup 访问 div 块,有什么解决方案吗? 我也尝试过使用硒,但它仍然不起作用。该网站正在使用 sava 脚本动态加载图像,我认为这是一个问题...

如何使用 BeautifulSoup 从网页中抓取特定 URL?

作者:Outdoor_Cat 提问时间:5/19/2023

我正在编写一个 Python 脚本,用于解析 HTML(一个分类网站)并向我发送有关特定产品和价格点的电子邮件通知。除了“listing_url”捕获之外,一切都在这里工作,我希望在电子邮件中显示它,...

如何在python3中使用BeautifulSoup一次找到多个标签以及属性?

作者:David 提问时间:4/25/2023

我正在尝试使用 BeautifulSoup 的方法一次找到不同的标签。我找到了一种方法,将所有标签都包含在列表中以获取相应的标签。但是我正在尝试获取标签及其属性。我不确定如何获得它。find_all(...


共109条 当前第2页