网页 问答列表

如何提取每个 <a href> 标签中的内容?

作者:Alex VIJU 提问时间:8/31/2023

我正在从事一个涉及从网站中提取一些数据的项目。具体来说,我有兴趣提取每个类别的名称及其描述。 我曾考虑过在 Python 中使用像 BeautifulSoup 这样的网页抓取库,但我不确定如何浏览每...

在for循环中使用变量绘制对象时如何防止变量覆盖

作者:8hoursking 提问时间:9/7/2023

我想使用 JS 原生脚本创建 HTML 对象。我有一个函数,它绘制了一些文本,我想优化它。 当我使用它时,它必须在 HTML 中使用循环中编写一些文本以进行几次不同的迭代,但我发现 new 循环不会...

无法使用 Python Selenium 获取元素 find_element(By.CSS_SELECTOR)

作者:Eric Lehmann 提问时间:9/12/2023

我无法在要抓取的页面中获取特定元素。内容被包裹在一个奇怪的标签中,不确定它是否是 iframe。我也尝试过CSS_SELECTOR,但是在上述标签之后出现的任何内容都会引发错误。 我要抓取的页面:h...

Web 抓取 IE 中跨度标记名称中的多个编辑按钮

作者:PJB 提问时间:7/3/2023

我想从内部网站自动执行流程。我无法下载 selenium 或任何其他外部应用程序(github 被阻止)。 我运行报告并审核从几个供应商输入的信息。 我正在尝试自动单击 ric 网格中的三个编辑按...

Edge 驱动程序 加载指定选项时不断崩溃

作者:Mahdi Triki 提问时间:9/14/2023

我正在尝试使用 edge 创建用于网络抓取的驱动程序,因为新的 chrome 版本与 selenium 不兼容。但是,似乎每次我尝试加载指定的选项时,选项都会成功加载,但它总是返回错误。 from ...

有没有办法在 Puppeteer 中设置自定义证书?

作者:pigs never look back 提问时间:9/21/2023

网站需要特殊的证书,我需要为浏览器注册它们,我不能使用标准请求,因为我需要JS async def main(): browser = await launch(options={'ignoreH...

抓取 Barchart.com 财务数据

作者:Adam 提问时间:9/24/2023

我正在尝试抓取表格中的财务数据 https://www.barchart.com/stocks/quotes/IBM/income-statement/ 使用 inspect 元素我没有看到任何 X...

在 Python 中使用请求和 LXML 抓取网站

作者:K Max 提问时间:10/4/2023

我正在尝试抓取此网站以检索标题和正文内容(“描述”和“功能”)以及 PDF 链接。但是,当我尝试使用 XPath 提取文本时,我收到一个空列表。但是,正如您在以下屏幕截图中看到的那样,后面有一个文本块...

关于使用请求模块的get函数后用python解析

作者:이경민 提问时间:10/4/2023

import requests as rq from bs4 import BeautifulSoup url = 'https://kind.krx.co.kr/disclosure/todayd...

如何在我的 Squarespace 网站上添加向下滚动面板效果?

作者: 提问时间:10/5/2023

对不起标题,我真的不知道效果叫什么。基本上,当标题出现在一个清晰的面板上时,你必须向下滚动才能显示页面的其余部分。我在这里链接它来说明我的请求:https://www.piariverola.com/...


共212条 当前第13页