使用 bs4 检索 html 网站的文本输出

Retrieving the text output of a html website using bs4

提问人:Paul Corcoran 提问时间:9/23/2022 更新时间:9/23/2022 访问量:42

问:

我目前正在尝试提取我抓取的匹配名称的文本。

import pandas as pd
import requests
from bs4 import BeautifulSoup
import re

url = 'https://www.betexplorer.com/odds-movements/soccer/'

res = requests.get(url)
soup = BeautifulSoup(res.content, "lxml")
times = soup.select('span.table-main__time') #good
matches = soup.find_all("td",class_ ="table-main__tt")

Output

我已经找到了标签/类,似乎我要检索的值位于 a 标签中的 href 后面。我希望在这里实现的输出是“芹苴 - 隆安”

这是一个动态网页,因此可能无法进行相同的匹配输出,但我正在寻找有关如何仅提取文本而不是整个 html 的指针。

蟒蛇 美汤

评论

1赞 Matiiss 9/23/2022
print(matches[0].a.text)?

答: 暂无答案