使用 BeautifulSoup 从 python 中的 XML 中提取特定标签
作者:Jeff R 提问时间:9/20/2023
我有一个元数据文件,如下所示: <?xml version='1.0' encoding='utf-8'?> <package xmlns="http://www.idpf.org/2007/opf...
Beautifulsoup 问答列表
作者:Jeff R 提问时间:9/20/2023
我有一个元数据文件,如下所示: <?xml version='1.0' encoding='utf-8'?> <package xmlns="http://www.idpf.org/2007/opf...
作者:clel 提问时间:9/27/2023
我想,我基本上想要与函数的作用相反。prettify() 当一个人有HTML代码(摘录)时,如: <p> Test text with something in it Test text w...
作者:YJZ 提问时间:3/18/2016
我应用一个对象,并找到一些东西,这是一个对象或一个.find_allbeautifulsoupbs4.element.ResultSetlist 我想在那里进一步做,但它不允许在对象上。我可以遍历对...
作者:tre-ananas 提问时间:11/10/2023
我正在尝试抓取存档以进行情绪分析,但我似乎无法接受 cookie 或单击“下一步”按钮。当我尝试接受 cookie 时,错误在“元素点击拦截:元素在点 (906, 934) 处不可点击”和“消息:将目...
作者:Abuchi 提问时间:11/10/2023
我有一个包含两列( 和 )的 Excel 工作表。我遍历了Excel文件,并使用Beautifulsoup从各个网站获取文章标题和文章详细信息。Url_idUrl 现在我想创建一个以 作为文件名的文...
作者:motylas 提问时间:11/13/2023
我正在使用 selenium,但我无法从标记为 flex 的 DIV 中获取数据 https://www.jpg.store/collection/hungrycowsbymuesliswap?tab...
作者:Joao Coelho 提问时间:11/13/2023
这只是提取美元报价和变化的简单代码。导出到 excel 时,我得到了一个具有相同值的附加行。 如何消除此双 excel 条目? import requests from bs4 import Be...
作者:Thales Souza 提问时间:11/14/2023
我正在尝试访问网站“https://veri.bet/simulator”,然后是“访问投注模拟器”按钮,然后下载体育线信息并以 JSON 格式显示它们。但是,我在控制台上看到一个空白列表。我做错了什...
作者:drossman 提问时间:11/14/2023
闭。此问题需要调试详细信息。它目前不接受答案。 编辑问题以包括所需的行为、特定问题或错误以及重现问题所需的最短代码。这将帮助其他人回答这个问题。 8天前关闭。 改进此问题 我正在尝试编写一个 ...
作者:Fariz Awi 提问时间:11/14/2023
请查看此网站。我的目标是检索给定 URL 的页面中所有 PDF 链接的屏幕截图。 首先,我尝试请求 URL 并解析 HTML 文本并找到所有 PDF 链接: from bs4 import Bea...