提问人:pek 提问时间:8/26/2008 最后编辑:Charles Stewartpek 更新时间:1/3/2010 访问量:3962
您推荐的 Java HTML解析库 [已关闭]
What HTML parsing libraries do you recommend in Java [closed]
问:
就目前而言,这个问题并不适合我们的问答形式。我们希望答案得到事实、参考资料或专业知识的支持,但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您认为此问题可以改进并可能重新打开,请访问帮助中心获取指导。
11年前关闭。
我想解析一些 HTML 以查找某些属性/标签等的值。
您推荐哪些 HTML 解析器?有什么优点和缺点吗?
答:
7赞
pek
8/26/2008
#1
我尝试过非常简单的 HTML 解析器。
评论
0赞
Craig Angus
9/27/2008
我在一个项目上使用过 HTML 解析器,它完全按照预期工作
1赞
Lily
7/7/2009
但是可用的教程不多......
0赞
benjismith
3/17/2011
我注意到很多 javascript 片段(和元素属性)悄悄地进入了我所谓的“文本节点”提取。在某些情况下,格式错误的 HTML 会导致整个解析操作失败。因此,我希望用更好的东西替换我自己项目中的htmlparser库。
1赞
Herms
8/26/2008
#2
您需要对 HTML 进行完整解析吗?如果您只是在内容中查找特定值(特定标签/参数),那么一个简单的正则表达式可能就足够了,而且速度可能会更快。
12赞
jelovirt
8/26/2008
#3
NekoHTML、TagSoup 和 JTidy 将允许您解析 HTML,然后使用 XML 工具(如 XPath)进行处理。
评论
0赞
Sumit Ghosh
5/14/2010
XPath 是 HTML 解析的方式,它有助于在格式错误的 HTML 以及正则表达式失败的情况下。
下一个:我从哪里获得蚂蚁任务?
评论