从 h1 标签中提取文本时出现问题美丽的汤-解网

问：

我是解析网站的完全新手，但我有一个脚本，可以提取不同住房网站的数据，这些网站在过去一年中完美运行。但是，由于我无法弄清楚的原因，它不再适用于 daft.ie。我尝试过调试，但我尝试的似乎都不起作用。我要么得到“列表索引超出范围”，要么得到“无”，我知道它表明数组是空的，但显然不是。下面是一些有问题的代码片段。

希望有比我更有知识的人看一看，因为我相信这将是显而易见的事情。

感谢该网站的所有帮助。

import sys
import requests
from bs4 import BeautifulSoup

def get_buy_numbers_dublin_city():
    page = requests.get("https://www.daft.ie/property-for-sale/dublin-city")
    soup = BeautifulSoup(page.content, 'html.parser')

    prop_num = str(soup.find_all(class_="styles__SearchH1-sc-1t5gb6v-3 guZHZl")[0])
    prop_num = prop_num.replace('<h1 class="styles__SearchH1-sc-1t5gb6v-3 guZHZl" data-testid="search-h1">', '')
    prop_num = prop_num.replace(' Properties for Sale in Dublin City</h1>', '')
    prop_num = prop_num.replace(',', '')
    return(prop_num)

def main(argv):

    print(get_buy_numbers_dublin_city())

if __name__ == "__main__":
    main(sys.argv[1:])

解析网页抓取 beautifulsoup python-requests

非常感谢。我怀疑请求被阻止了，但我不确定如何测试这个理论。我应该使用硒，但我甚至从未意识到这一点。不过，您的解决方案更适合我的用例，因此感谢您。小修改：我不得不将“html.parser”添加到BeautifulSoup构造函数中，以避免在Pycharm中出现错误。不过还是有效的。

上一个：未定义索引，_POST 美元 [重复]

下一个：我正在尝试在tradingview pine代码中解析过去的收益数据

从 h1 标签中提取文本时出现问题美丽的汤

Problem extracting text from h1 tag Beautiful Soup

评论

例

评论

从 h1 标签中提取文本时出现问题 美丽的汤

Problem extracting text from h1 tag Beautiful Soup

评论

例

评论

从 h1 标签中提取文本时出现问题美丽的汤