网页知识经验-第13页-解网

作者：Alex VIJU 提问时间：8/31/2023

我正在从事一个涉及从网站中提取一些数据的项目。具体来说，我有兴趣提取每个类别的名称及其描述。我曾考虑过在 Python 中使用像 BeautifulSoup 这样的网页抓取库，但我不确定如何浏览每...

作者：8hoursking 提问时间：9/7/2023

我想使用 JS 原生脚本创建 HTML 对象。我有一个函数，它绘制了一些文本，我想优化它。当我使用它时，它必须在 HTML 中使用循环中编写一些文本以进行几次不同的迭代，但我发现 new 循环不会...

作者：Eric Lehmann 提问时间：9/12/2023

我无法在要抓取的页面中获取特定元素。内容被包裹在一个奇怪的标签中，不确定它是否是 iframe。我也尝试过CSS_SELECTOR，但是在上述标签之后出现的任何内容都会引发错误。我要抓取的页面：h...

作者：PJB 提问时间：7/3/2023

我想从内部网站自动执行流程。我无法下载 selenium 或任何其他外部应用程序（github 被阻止）。我运行报告并审核从几个供应商输入的信息。我正在尝试自动单击 ric 网格中的三个编辑按...

作者：Mahdi Triki 提问时间：9/14/2023

我正在尝试使用 edge 创建用于网络抓取的驱动程序，因为新的 chrome 版本与 selenium 不兼容。但是，似乎每次我尝试加载指定的选项时，选项都会成功加载，但它总是返回错误。 from ...

作者：pigs never look back 提问时间：9/21/2023

网站需要特殊的证书，我需要为浏览器注册它们，我不能使用标准请求，因为我需要JS async def main(): browser = await launch(options={'ignoreH...

作者：Adam 提问时间：9/24/2023

我正在尝试抓取表格中的财务数据 https://www.barchart.com/stocks/quotes/IBM/income-statement/ 使用 inspect 元素我没有看到任何 X...

作者：K Max 提问时间：10/4/2023

我正在尝试抓取此网站以检索标题和正文内容（“描述”和“功能”）以及 PDF 链接。但是，当我尝试使用 XPath 提取文本时，我收到一个空列表。但是，正如您在以下屏幕截图中看到的那样，后面有一个文本块...

作者：이경민 提问时间：10/4/2023

import requests as rq from bs4 import BeautifulSoup url = 'https://kind.krx.co.kr/disclosure/todayd...

作者：提问时间：10/5/2023

对不起标题，我真的不知道效果叫什么。基本上，当标题出现在一个清晰的面板上时，你必须向下滚动才能显示页面的其余部分。我在这里链接它来说明我的请求：https://www.piariverola.com/...