html-parsing 问答列表

将 HTML 表格数据转换为转置的二维数组

作者:Sergey B. 提问时间:11/7/2018

我需要从 HTML 表格中抓取数据,并将列式数据定向为 2d 数组的行。 我的代码没有显示正确的结构。 HTML 表格: <html> <head> </head> <body> <table>...

在 Rails 中从 HTML 段落创建文本摘录

作者:sn3p 提问时间:3/7/2022

我正在尝试提取一篇文章的摘录(Markdown 解析为 HTML),其中仅包含段落中的纯文本。所有 HTML 都需要被剥离,换行符、制表符和连续空格需要替换为单个空格。 我的第一步是创建一个简单的测...

在 JavaScript 中如何解析 HTML 字符串以转换为表格数据(二维数组)

作者:Amitava Karan 提问时间:11/9/2023

我喜欢在客户端解析html字符串。我们使用 React 和 TypeScript 作为前端框架。在解析html时,我还喜欢获取与元素关联的样式。它可以是内联样式,继承自父元素,也可以是用 head 部...

将 HTML 表格数据转换为转置的二维数组

作者:Sergey B. 提问时间:11/7/2018

我需要从 HTML 表格中抓取数据,并将列式数据定向为 2d 数组的行。 我的代码没有显示正确的结构。 HTML 表格: <html> <head> </head> <body> <table>...

Next.js 的 React Quill 编辑器中的 HTML 解析和清理问题(使用 javascript 的页面路由器)

作者:loopstruct 提问时间:11/4/2023

我正在开发一个应用程序,该应用程序允许曲棍球俱乐部通过提供带有单个公告页面的俱乐部列表页面来相互联系。公告页面包含与 Next.js 应用程序中的 React Quill 编辑器集成的创建和更新表单。...

修改此正则表达式以以任意顺序匹配 img src、alt 和 title [duplicate]

作者:adrianTNT 提问时间:9/28/2023

这个问题在这里已经有答案了: 如何使用 php 从 html 中提取 img src、title 和 alt?[复制] (10 个答案) 正则表达式以任意顺序匹配包含两个名称的字符串 (9 个答案) ...

需要 Python 中正则表达式模式的帮助 – 解析复杂的 HTML 结构

作者:prabu naresh 提问时间:9/2/2023

我正在尝试使用 Python 的 re 模块解析复杂的 HTML 结构,但我的正则表达式模式遇到了障碍。这是我想做的: 我有包含嵌套元素的 HTML 文本,我想提取最内层标签的内容。但是,我似乎无法...

网站没有给我json文件

作者:user11225404 提问时间:8/30/2023

我的任务是为某些站点(csgofast,loot.run,upx)编写解析器。我需要从崩溃游戏(最终分数)中获取数据,但是浏览器的网络部分没有合适的json数据包。...

如何在DOMParser上触发点击事件?

作者:Morton 提问时间:3/20/2023

我想从 google play 网站获取 App 版本号。React Native 我试图弄清楚如何获取 div 标签值 <div class="reAt0">1.248.0.1</div> ...

从外部页面抓取 DIV 中的特定元素

作者:toscho 提问时间:9/7/2022

我需要删除这些 div 中的每一个中的以下元素(页面包含其中的几个),但实际上我不知道该怎么做......所以,我需要帮助不要拔掉我的头发。class="product-grid-item" 1 -...


共21条 当前第1页