当一个标签不在另一个标签中时,Beatifulsoup find_all
作者:hit 提问时间:10/27/2022
html = """ <html> <h2>Top Single Name</h2> <table> <tr> <p>hello</p> </tr> </table> <div> <d...
html解析 问答列表
作者:hit 提问时间:10/27/2022
html = """ <html> <h2>Top Single Name</h2> <table> <tr> <p>hello</p> </tr> </table> <div> <d...
作者:Lexx Luxx 提问时间:8/8/2021
我在目录和子文件夹中有多个 html 文件。我想解析所有html文件(递归),并从代码中删除特定于div的div(包含所有内容),以及所有脚本和css。我想用 id=“wrapper”、“header...
作者:Michael Lin 提问时间:5/29/2017
闭。此问题需要调试详细信息。它目前不接受答案。 编辑问题以包括所需的行为、特定问题或错误以及重现问题所需的最短代码。这将有助于其他人回答这个问题。 6年前关闭。 改进此问题 我的任务是从目录中...
作者:Robur_131 提问时间:10/9/2020
我有一个XML文件,如下所示: <?xml version="1.0" encoding="utf-8"?> <posts> <row Id="1" PostTypeId="1" Accepted...
作者:Anatoly 提问时间:8/26/2020
尝试从 goodreads 网站提取报价并遇到不一致的行为。例如,转到此页面: https://www.goodreads.com/quotes?page=56 并在 Chrome 控制台中运行此选择...
作者:crmpicco 提问时间:2/4/2020
我正在用 .BeautifulSoup from bs4 import BeautifulSoup import requests import re page = requests.get("ht...
作者:Aklank Jain 提问时间:6/27/2019
我正在尝试找出可以匹配任何输入字符串的元素。 例如:- data = soup.find(text="something") 这工作得很好,但是当我必须搜索这样的东西时如何使用它:- dat...
作者:2manov 提问时间:2/5/2019
我不知道如何解析来自多个 html 的电话号码,因为它们在 span 类中具有不同的名称。我只有一个想法,那就是解析完整的html文本并使用正则表达式获取电话号码,但是我有大约1000个html,我认...
作者:topplethepat 提问时间:12/8/2018
我是第一次使用 bs4。如果我使用这个基本代码: from bs4 import BeautifulSoup with open ('test.txt','r') as f: soup = Bea...
作者:Vishaal Sudarsan 提问时间:11/14/2017
我想收集 2016 年印度特定城市每天的过去天气详细信息。以下网站包含此数据: "https://www.timeanddate.com/weather/india/kanpur/historic?...