Beautifulsoup 问答列表

使用 BeautifulSoup 从 python 中的 XML 中提取特定标签

作者:Jeff R 提问时间:9/20/2023

我有一个元数据文件,如下所示: <?xml version='1.0' encoding='utf-8'?> <package xmlns="http://www.idpf.org/2007/opf...

如何让 BeautifulSoup 在获取文本时忽略原始 HTML 中的任何缩进

作者:clel 提问时间:9/27/2023

我想,我基本上想要与函数的作用相反。prettify() 当一个人有HTML代码(摘录)时,如: <p> Test text with something in it Test text w...

beautifulsoup:find_all bs4.element.ResultSet 对象或列表?

作者:YJZ 提问时间:3/18/2016

我应用一个对象,并找到一些东西,这是一个对象或一个.find_allbeautifulsoupbs4.element.ResultSetlist 我想在那里进一步做,但它不允许在对象上。我可以遍历对...

使用 Selenium 分页和接受 Cookie

作者:tre-ananas 提问时间:11/10/2023

我正在尝试抓取存档以进行情绪分析,但我似乎无法接受 cookie 或单击“下一步”按钮。当我尝试接受 cookie 时,错误在“元素点击拦截:元素在点 (906, 934) 处不可点击”和“消息:将目...

抓取多个网站并将输出保存在不同的文本文件中

作者:Abuchi 提问时间:11/10/2023

我有一个包含两列( 和 )的 Excel 工作表。我遍历了Excel文件,并使用Beautifulsoup从各个网站获取文章标题和文章详细信息。Url_idUrl 现在我想创建一个以 作为文件名的文...

Python - Webscraping - 从网格和 flex 字段获取数据

作者:motylas 提问时间:11/13/2023

我正在使用 selenium,但我无法从标记为 flex 的 DIV 中获取数据 https://www.jpg.store/collection/hungrycowsbymuesliswap?tab...

从抓取的数据创建数据帧时如何避免重复行?

作者:Joao Coelho 提问时间:11/13/2023

这只是提取美元报价和变化的简单代码。导出到 excel 时,我得到了一个具有相同值的附加行。 如何消除此双 excel 条目? import requests from bs4 import Be...

BeautifulSoup4 返回一个空列表

作者:Thales Souza 提问时间:11/14/2023

我正在尝试访问网站“https://veri.bet/simulator”,然后是“访问投注模拟器”按钮,然后下载体育线信息并以 JSON 格式显示它们。但是,我在控制台上看到一个空白列表。我做错了什...

使用 BeautifulSoup 从 XML 中解析数据并写入 CSV 时是否有大小限制?[关闭]

作者:drossman 提问时间:11/14/2023

闭。此问题需要调试详细信息。它目前不接受答案。 编辑问题以包括所需的行为、特定问题或错误以及重现问题所需的最短代码。这将帮助其他人回答这个问题。 8天前关闭。 改进此问题 我正在尝试编写一个 ...

检索分页后面的元素屏幕截图

作者:Fariz Awi 提问时间:11/14/2023

请查看此网站。我的目标是检索给定 URL 的页面中所有 PDF 链接的屏幕截图。 首先,我尝试请求 URL 并解析 HTML 文本并找到所有 PDF 链接: from bs4 import Bea...


共109条 当前第10页