html 解析 问答列表

使用 xpath 将无序列表 html 标记转换为多维数组

作者:Sophie 提问时间:10/26/2021

我正在尝试创建一个数组来重现以下代码: <div class="singlepost"> <ul class="linha_status" style=""> <li>Status: <b>Ob...

我正在使用 lxml.html 在 HTML 文件中添加新标签,然后对其进行操作,但它似乎不起作用

作者:Shubham Gupta 提问时间:10/27/2021

for y in row_data: say = html.fromstring( str(html.tostring(y)).lstrip("b'").replace('">', '"><spa...

如何使用 Nokogiri 获取没有任何文本内容的完整 HTML

作者:jayp 提问时间:10/26/2021

我正在尝试使用 Nokogiri 来获取页面的完整 HTML,但删除了所有文本。 我试过了这个: require 'nokogiri' x = "<html> <body> <div class=...

正则表达式匹配(替换)span 标记之间出现的所有双引号

作者:Pedellen 提问时间:11/2/2021

我正在尝试替换两个跨度标签之间出现的所有“ 。 我使用: (?<=<span>[a-zA-Z0-9_æøåÆØÅ_,.;:!#€%&\/()$§'])*(\")(?=[a-zA-Z0-9_æøåÆ...

Beautiful Soup 只提取一个标签,当可以在 html 代码中看到所有其他标签时

作者:Jake Wright 提问时间:11/21/2021

试图了解网页抓取的工作原理: import requests from bs4 import BeautifulSoup as soup url = "https://webscraper.io/t...

正则表达式用于在使用 &lt; 编码代码时匹配除 HTML 标记之外的任何内容和 &gt;

作者:raquelhortab 提问时间:11/25/2021

我正在尝试使用正则表达式来匹配除 HTML 标签以外的任何文本。我为“普通”HTML代码找到了这个解决方案: <[^>]*>(*SKIP)(*F)|[^<]+ 但是,我的代码是使用 and 而不...

从字符串块中获取元素数组

作者:inux 提问时间:11/26/2021

我有一个包含 HTML 元素的模板文字,我想通过一个函数运行它并获取所有元素及其字符串的数组。 const tmp = ` <div> <h1>Heading <span>inline</span...

在 Javascript 中动态修复/修复无效的 HTML

作者:Conor Reid 提问时间:11/27/2021

我目前正在编写一个与富文本编辑器非常相似的程序,我的 HTML 代码输出方式无效,类似于这样: <span>This is a <em class="test">test</span> title<...

如何抓取/抓取(使用 R)非表 EPA CompTox 仪表板?

作者:lawsq 提问时间:12/7/2021

EPA CompTox Chemical Dashboard 收到了更新,我的旧代码不再能够抓取化学品的沸点。有没有人能帮我刮掉实验平均沸点?我需要能够编写一个可以循环使用多种化学物质的 R 代码。 ...

Jsoup:将子元素附加到&lt;foorm&gt;&lt;input&gt;元素不会影响表单数据

作者:Vladimir 提问时间:12/11/2021

以下单元测试失败: @Test public void test() throws Exception { String html = "<html><form id=\"myform\"></f...


共257条 当前第14页