-解析 问答列表

在 Google 表格中使用 IMPORTXML 从 Google 支持页面中提取元素时遇到问题

作者:ali izadi 提问时间:11/15/2023

我正在尝试使用 Google 表格中的 IMPORTXML 函数从特定的 Google 支持页面中提取元素。该公式适用于其他网址,但是当我在 Google 支持页面上使用它时,它会返回无法提取网址错误...

Foreach 字符串参数 PHP

作者:Sergei 提问时间:11/9/2023

我像这样解析XML <offer internal-id="3"> <floor>2</floor> <name>Building 1</name> <image>picture.jpg</imag...

如何获取下载网页中 Html 元素的“innerHTML”?[已结束]

作者:unstuck 提问时间:10/7/2023

已关闭。这个问题需要细节或澄清。它目前不接受答案。 想改进这个问题吗?通过编辑这篇文章添加详细信息并澄清问题。 上个月关闭。 改进此问题 我正在尝试创建一个 Google Apps 脚本函数,...

如何使用 Python 的 HTMLParser 提取特定链接

作者:initWithStyle 提问时间:3/14/2012

我一直在使用 HTMLParser 类在 Python 中开发一个基本的网络爬虫。我使用修改后的handle_starttag方法获取我的链接,如下所示: def handle_starttag(s...

如何从 dictionary.cambridge.org 下载发音音频

作者:Dima 提问时间:6/11/2023

如何从 dictionary.cambridge.org 下载发音音频 帮我下载这个音频 ᅠᅠᅠᅠ ᅠᅠᅠᅠ ...

xpath 是否明确允许未定义的变量?

作者:android.weasel 提问时间:5/7/2023

我试图使用xmlstarlet从XML文件中提取一些数据,但是 xmlstarlet sel -t -v '//div[contains(@class,'addresses')]/a' 给我的比...

如何使PDFMiner Six在解析文档时检测项目符号(包括字母数字项目符号)?

作者:belacile 提问时间:6/2/2023

我目前正在使用 PDFMiner.six 为我解析文档,但希望它能够检测项目符号(包括字母数字项目符号,如“a.”、“i.”、“1.”)。目前,它只将它们视为字符,但我想知道我是否在 PDFMiner...

如何在Java中将CDT格式的时间戳转换为MM / DD?

作者:BugEater 提问时间:6/5/2023

我有一个cdt格式的时间戳,如下所示,我想将这个时间戳转换为Java格式。"2023-06-05T09:00:01CDT"MM/DD 我在下面尝试过: 预期输出为:6/5 但是出现解析错误。 Zo...

为什么 requests-html 会部分返回内容?

作者:GayLord 提问时间:7/2/2023

我知道,这是因为内容是由 JS 渲染的,但 requests-html 支持 JS,所以这很奇怪 代码本身: from requests_html import HTMLSession sess...

文档 AI 可对 pdf 文件中的大量数据进行自动研究

作者:prime 提问时间:7/13/2023

我需要为我的应用程序添加一个功能,允许我的客户从图像文本中提取文本,并将它们解析为可用数据(如 json 格式)并存储它们,以便能够执行更好的数据研究。 这些图像文本是大的pdf文件(~150-50...


共67条 当前第1页