HTML 解析 问答列表

转换 HTML 到 JSON 使用 rdd.map

作者:dja 提问时间:12/4/2022

我有html文件,我想在pySpark中解析。 例: <MainStruct Rank="1"> <Struct Name="A"> <Struct Name="AA"> <Struct N...

我需要在 itext 7 中使用 HTML 标记现有的 pdf,这怎么可能?显然来自版本 5 但不兼容的内容

作者:Aureo Dantas 提问时间:12/16/2022

我需要在现有的 pdf 中添加一个 html 文本,它将是文档中的一种图章,我正在使用 itext 的段落,以便能够在文档中的位置问题中格式化它和所有内容。问题是这里的所有内容都使用 html 内容创...

JSoup 解析网页读取 Table [duplicate] 的 thead 和 tbody

作者:iCoder 提问时间:12/29/2022

这个问题在这里已经有答案了: 页面内容加载了 JavaScript,而 Jsoup 看不到它 (8 个答案) Jsoup Java HTML 解析器:执行 Javascript 事件 (2 个答案) ...

尝试使用 pd.read_html 提取信息并将数据导出到 Pandas 数据帧

作者:edgestorm517 提问时间:12/31/2022

我正在尝试从此维基百科页面上的表格中提取信息以自动收集数据。 网页链接:https://en.wikipedia.org/wiki/List_of_members_of_the_17th_Lok_S...

yarn deploy [ gh-pages ] : 错误命令失败,退出代码为 1

作者:tan 提问时间:2/11/2023

我正在尝试构建我的项目,该项目运行良好,但是当我尝试使用时出现以下错误:gh-pagesyarn deploy yarn deploy yarn run v1.22.19 $ npm run bui...

如何使用 htmlparser2 解析网站中的 HTML 并使用 domhandle 包转换为 DOM 以使元素可点击?

作者:JediSZN 提问时间:2/4/2023

所以我正在用 Nike 网站创建一个订单检查器,而 Puppeteer 无法通过他们的反机器人,所以我想使用 chrome-launcher 包来解决这个问题,而不是使用 puppeteer 进行网络...

我如何将所有东西合二为一并获得.player_armour?

作者:hjjunz 提问时间:2/6/2023

当我尝试获取名称时,我需要从站点获取玩家的名字、他的 HP 和盔甲 - 一切都很好,但是当我在那里添加他的 HP 时 - 一切都会破裂 帮助! HTML 格式 - <div class="mark...

代码正在工作问题是card_elements中的循环不起作用

作者:Yeuhan Shen 提问时间:2/11/2023

url = "https://github.com/marketplace?category=project-management&type=actions" driver.get(url) 解析页...

如何在 Jsoup 中获取 h2 标签之间和之后的所有 p 标签

作者:Stɑrry Shivɑm 提问时间:2/14/2023

我有这样的HTML <h2 id="17273">bla bla bla 1</h2> <p>Text i need</p> <p>Text i need</p> <p>Text i need</p...

如何从文本区域解析花哨的文本

作者:Shoaib Fareed 提问时间:2/14/2023

在文本区域复制粘贴花哨的文本和表情符号时,我遇到了一些问题, 喜欢😋🅵🅰🅽🅲🆈 🆃🅴🆇🆃 🅶🅴🅽🅴🆁🅰🆃🅾🆁 我已使用以下代码删除了表情符号: e.cont...


共257条 当前第3页