如何修复,使用简单 HTML DOM 解析 HTML 时导致意外行为的大括号

how to fix, Curly brackets causing unexpected behavior while parsing HTML using Simple HTML DOM

提问人: 提问时间:11/16/2017 更新时间:11/16/2017 访问量:113

问:

我正在尝试使用PHP Simple HTML DOM Parser

我在解析未关闭的页面时发现了问题。即curly brackets{

这是示例HTML

<html>
<body>
<span>a</span>
<span>{b</span>
<span>c}</span>
<span>d</span>
</body>
</html>

PHP代码

<?php
    $html = file_get_html('test.html');
    foreach ($html->find('span') as $v) {
    echo $v->innertext."\n";
}

预期:

A
{b
c}
d

结果是以下内容:

a
{b</span>  <span>c}
d

我该如何解决它?

看起来这是已知的错误,实际上提交于 2013-10-27 https://sourceforge.net/p/simplehtmldom/bugs/136/

simple-html-dom 项目死了吗?

php html 解析 simple-html-dom

评论

1赞 Kevin 11/16/2017
如果还没有解决方案,为什么不使用?加上其内置的DOMDocument
0赞 11/16/2017
我找不到太多关于它的文档,简单的 HTML Dom 在文档化方面也非常简单,谢谢
1赞 Kevin 11/16/2017
没有文档?php 在 SO 上已经有很多东西了,事实上并不缺乏。无论如何,很可能是库解析器的错,您可以尝试自己修复它,反正它是一个 php 文件

答: 暂无答案