提问人:Programmer0403 提问时间:10/25/2023 最后编辑:XMehdi01Programmer0403 更新时间:10/26/2023 访问量:56
是否可以下载页面的一部分 html 代码,以便以后使用 python 抓取它?
Is it possible to download a part of a page's html code so you can scrape it with python later?
问:
我正在创建一个 python 网页抓取项目,我从这个网站返回任何初级网球运动员的排名数据:网站
底部有一个选择器,您可以在其中选择每页看到多少人。如果您选择 100,将有 100 页的排名(10000 名玩家)有没有办法下载完整的排名表,以便我可以从中提取排名值?USTA每周三更新排名,所以我想我可以每周下载一次,这将加快这个过程,而不是使用我现在正在做的Selenium。
到目前为止,我已经用硒(片段)做到了这一点,对于32名玩家的锦标赛来说,这需要一段时间。
driver2 = webdriver.Chrome()
driver2.get('https://www.usta.com/en/home/play/rankings.html#tab=junior&junior-juniorListType=seeding&junior-rankListGender=M&junior-ageRestriction=Y14')
try:
driver2.maximize_window()
search = WebDriverWait(driver2, 35).until(
EC.presence_of_element_located((By.XPATH, "//*[@id='container-9a770322f5']/div/div/div/div/input"))
)
search.click()
search.send_keys(name_string)
finally:
pass
try:
national_ranking = WebDriverWait(driver2, 30).until(
EC.presence_of_element_located((By.XPATH, "//*[@id='container-c80bd54915']/div/div[1]/div/div[2]/div/span/p"))
)
ranking_string = str(national_ranking.text)
except:
ranking_string = 'Error'
finally:
pass
如果我无知,请原谅我,因为这是我在 SO 上的第一篇帖子
答: 暂无答案
评论