关于使用请求模块的get函数后用python解析-解网

首页
技术问答
关于使用请求模块的get函数后用python解析

问：

import requests as rq
from bs4 import BeautifulSoup

url = 'https://kind.krx.co.kr/disclosure/todaydisclosure.do?method=searchTodayDisclosureMain&marketType=0'
krx = rq.get(url)

krx_html = BeautifulSoup(krx.content, 'html.parser')

krx_title = krx_html.select('section.wrapper-contents > section.contents')

print(krx_title)

我执行了这段代码。请看下面的图片显然，“article”标签在html元素中有许多tail标签。

在此处输入图像描述

但是执行的代码的结果没有tail标签，只有下面的代码：

<article class="pcontents" id="main-contents">
</article>

为什么会出现这个问题？开发者阻止了它吗？

HTML 解析网页抓取网络爬虫

0赞 John Gordon 10/5/2023

requests无法处理 JavaScript。大多数现代网页都依赖于 javascript。

答： 暂无答案

上一个：带有 url 的 wrok 的 Python 解析器

下一个：如何让 BeautifulSoup 在获取文本时忽略原始 HTML 中的任何缩进

关于使用请求模块的get函数后用python解析

About in parsing with python after using get function of request module

评论