lxml 忽略部分 HTML 标记-解网

问：

好的，所以我有这样的 HTML 代码：

<span class="lista_td_calendar" rel="1617096300">finished</span>

我想使用 lxml 获取它，尽管这个类有很多跨度，并且每个跨度都有不同的属性，我写了这样的东西：rel

from lxml import html
import requests

page = requests.get(link)
tree = html.fromstring(page.content)

series = tree.xpath('//span[@class="lista_td_calendar"]/text()')
print(series)

虽然它没有获取任何东西，但有没有办法让它不依赖于争论？rel

python html 解析 lxml

from selenium.webdriver.chrome.options import Options
from selenium import webdriver


chrome_options = Options()
chrome_options.add_argument("--headless")

driver = webdriver.Chrome(options=chrome_options)
driver.get('https://blackclover.wbijam.pl/pierwsza_seria-170.html')

elements = driver.find_elements_by_class_name('lista_td_calendar')

上一个：为什么 lxml 在解析时关闭这个“ol”标签？

下一个：在 BeautifulSoup 中，使用带有 lxml 解析的过滤器的正确方法是什么？

lxml 忽略部分 HTML 标记

lxml ignore part of HTML tag

评论