提问人:Paul Corcoran 提问时间:9/23/2022 更新时间:9/23/2022 访问量:42
使用 bs4 检索 html 网站的文本输出
Retrieving the text output of a html website using bs4
问:
我目前正在尝试提取我抓取的匹配名称的文本。
import pandas as pd
import requests
from bs4 import BeautifulSoup
import re
url = 'https://www.betexplorer.com/odds-movements/soccer/'
res = requests.get(url)
soup = BeautifulSoup(res.content, "lxml")
times = soup.select('span.table-main__time') #good
matches = soup.find_all("td",class_ ="table-main__tt")
我已经找到了标签/类,似乎我要检索的值位于 a 标签中的 href 后面。我希望在这里实现的输出是“芹苴 - 隆安”
这是一个动态网页,因此可能无法进行相同的匹配输出,但我正在寻找有关如何仅提取文本而不是整个 html 的指针。
答: 暂无答案
评论
print(matches[0].a.text)
?