正则表达式匹配从网页复制的行

Regex match a row copied from webpage

提问人:Eric 提问时间:9/30/2023 最后编辑:Gilles QuénotEric 更新时间:9/30/2023 访问量:79

问:

enter image description here

因此,如果我直接将表格复制到剪贴板,则会给出以下结果:

Dirty1057
SUPQB
1
Occupied
Checked Out
    
    
 (Unchecked) Priority
 (Unchecked) Linen Change
DEP
View
Select
Out of Order1060
SUPQV
1
Vacant
Checked Out
    
    
 (Unchecked) Priority
 (Unchecked) Linen Change

我正在尝试提取 3 到 4 位数字(房间号),如果仅当该行是“肮脏”房间并且包含“已占用”和“已退房”时。 我写了这个正则表达式

Dirty(\d{3,4})(.|\n)*?Vacant\nChecked Out

如您所见,它不应该与任何结果匹配,因为没有脏 + 空置 + 退房房间。是否可以编写正则表达式来匹配这些标准?

HTML 正则表达式

评论

0赞 Gilles Quénot 9/30/2023
最好添加您尝试抓取的链接或源 HTML。正则表达式不是单独解析 HTML 的工具。
0赞 Eric 9/30/2023
@GillesQuénot我不知道这个网页使用了什么技术,但网址是静态的,永远不会改变。此外,我不打算从 html 中提取,因为 id 是动态的,它会不断变化。这就是为什么我只能从剪贴板复制它
0赞 Gilles Quénot 9/30/2023
让我们来看看。共享 URL。这篇文章肯定会被关闭/删除,因为它不是一个可复制的问题。
0赞 Eric 9/30/2023
@GillesQuénot我真的做不到,不是我不想要。它需要登录
0赞 Gilles Quénot 9/30/2023
所以分享源HTML

答: 暂无答案