提问人:unstuck 提问时间:10/7/2023 最后编辑:TheMasterunstuck 更新时间:10/7/2023 访问量:52
如何在下载的网页中获取 Html 元素的“innerHTML”?[关闭]
How to get the "innerHTML" of a Html element in a downloaded web page? [closed]
问:
我正在尝试创建一个 Google Apps 脚本函数,该函数返回网页的 ID 元素的内部 HTML。
使用 Web 浏览器的 JavaScript 控制台,可以执行以下操作:
document.getElementById("myID").innerHTML
在 Google Apps 脚本中:
function getValue(symbol) {
symbol= 'ABCD';
const url = `https://example.com/${symbol}`;
const options = {
headers: {'Content-Type':'application/xml'},
method: 'GET'
};
const res = UrlFetchApp.fetch(url, options);
const contentText = res.getContentText();
// ????
}
从上面的代码中,我设法提取了整个网页内容 - 但是如何获取 id 的内部 html?myID
答:
1赞
TheMaster
10/7/2023
#1
服务器端 JavaScript 与客户端 JavaScript(Browser) 不同。服务器端没有 API 或它的任何方法。要解析 html,您可以使用服务器端 html 解析器,例如 Cheerio。这里有一个 @tani/@3846masa 的 GAS 分支,它可能对你有用。服务器呈现 html/js 的方式与下载的 html 中可用的内容之间也存在差异。请参阅从使用 JavaScript 的网站抓取数据到 Google 表格window
document
如果你正在寻找xml解析器,有一个内置的解析器。
评论
1赞
unstuck
10/7/2023
我想 Cheerio 是我在这里需要的,我会看看。不知道他们为什么关闭了问题,降级了???无论如何,感谢您的帮助!
评论