html解析 问答列表

当一个标签不在另一个标签中时,Beatifulsoup find_all

作者:hit 提问时间:10/27/2022

html = """ <html> <h2>Top Single Name</h2> <table> <tr> <p>hello</p> </tr> </table> <div> <d...

解析目录中的html文件,并使用BeautifulSoup删除特定标签

作者:Lexx Luxx 提问时间:8/8/2021

我在目录和子文件夹中有多个 html 文件。我想解析所有html文件(递归),并从代码中删除特定于div的div(包含所有内容),以及所有脚本和css。我想用 id=“wrapper”、“header...

beautifulsoup 解析文件夹中的每个 HTML 文件 webscraping [已关闭]

作者:Michael Lin 提问时间:5/29/2017

闭。此问题需要调试详细信息。它目前不接受答案。 编辑问题以包括所需的行为、特定问题或错误以及重现问题所需的最短代码。这将有助于其他人回答这个问题。 6年前关闭。 改进此问题 我的任务是从目录中...

从 XML 文件的字段中删除标签

作者:Robur_131 提问时间:10/9/2020

我有一个XML文件,如下所示: <?xml version="1.0" encoding="utf-8"?> <posts> <row Id="1" PostTypeId="1" Accepted...

goodreads 站点上 jQuery 选择器的行为不一致

作者:Anatoly 提问时间:8/26/2020

尝试从 goodreads 网站提取报价并遇到不一致的行为。例如,转到此页面: https://www.goodreads.com/quotes?page=56 并在 Chrome 控制台中运行此选择...

使用 Python 2.7 从 HTML 字符串中提取文件名

作者:crmpicco 提问时间:2/4/2020

我正在用 .BeautifulSoup from bs4 import BeautifulSoup import requests import re page = requests.get("ht...

Beautiful Soup : 如何获取与任何给定字符串匹配的数据

作者:Aklank Jain 提问时间:6/27/2019

我正在尝试找出可以匹配任何输入字符串的元素。 例如:- data = soup.find(text="something") 这工作得很好,但是当我必须搜索这样的东西时如何使用它:- dat...

如何从多个html中解析电话号码?

作者:2manov 提问时间:2/5/2019

我不知道如何解析来自多个 html 的电话号码,因为它们在 span 类中具有不同的名称。我只有一个想法,那就是解析完整的html文本并使用正则表达式获取电话号码,但是我有大约1000个html,我认...

如何在文本文件中将输出复制到 BS4 中的终端

作者:topplethepat 提问时间:12/8/2018

我是第一次使用 bs4。如果我使用这个基本代码: from bs4 import BeautifulSoup with open ('test.txt','r') as f: soup = Bea...

从以下网站解析表

作者:Vishaal Sudarsan 提问时间:11/14/2017

我想收集 2016 年印度特定城市每天的过去天气详细信息。以下网站包含此数据: "https://www.timeanddate.com/weather/india/kanpur/historic?...


共22条 当前第2页