网页 问答列表

为什么在 Python 中编写新文件时会出现错误?

作者:archana 提问时间:11/17/2023

我正在尝试抓取网页并将数据写入txt.file中。 它抛出了一个错误。 UnicodeEncodeError Traceback (most recent call last) ~\AppData\...

网页打印效果不佳,政府门户网站上的 Angular [已关闭]

作者:Serge 提问时间:11/17/2023

闭。此问题不符合 Stack Overflow 准则。它目前不接受答案。 这个问题似乎与帮助中心定义的范围内的编程无关。 3天前关闭。 这篇文章在3天前被编辑并提交审核,未能重新打开帖子: 原...

使用 <video> HTML5 代码在 Google 云端硬盘中的网页上插入视频

作者:Andrea D'Ambrosio 提问时间:11/17/2023

我的网页在加载时遇到问题,因为标题中的视频对页面的美观很重要。页面加载速度非常快,但我的服务器在加载视频时的 TTFB 约为 4/5s。因此,我将视频上传到我的 Google Drive 广告中,我为...

当page_source随着向下滚动而变化时,如何进行动态网络爬虫

作者:Ingyu Seo 提问时间:11/17/2023

我正在尝试从网站抓取数据。 问题是,当我向下滚动时,源代码正在发生变化。 例如 第一次,页面源代码就像...... <div role="presentation" style="transfo...

Python 和 SQL Alchemy,无需将整个结果集加载到内存中

作者:Website360 提问时间:11/18/2023

如何使用 Python 和 SQL Alchemy 有效地对大型数据集进行分页,而无需将整个结果集加载到内存中? 使用 Python 和 SQLAlchemy 高效地对大型数据集进行分页,而无需将整...

使用 python 进行网页抓取的初学者:使用 BeautifulSoup 并通过类查找时,我要么得到错误的类,要么结果为“无”

作者:babytroopr 提问时间:11/17/2023

我想从以下网站获取UCI积分:https://www.procyclingstats.com/rider/tadej-pogacar 首先,我只想从最新一场比赛中抢到uci积分。 到目前为止,我的...

提取产品链接的正确选择器是什么?

作者:mohsen0965 提问时间:11/18/2023

我想抓取此网页中的产品链接 (href)。https://www.artfinder.com/editors-picks/theme/amazing-techniques/blurred-lines/...

检测是否存在含硒的元素

作者:MAHMUT CAN SARIBAL 提问时间:11/18/2023

我的问题如下;首先,我从页面中提取评论,当这些评论很长时,有一个“查看更多”按钮,我按下这个按钮。但是,问题从这里开始,并非页面的每个页面都有此按钮。如果找不到,程序就会停止,但如果我自己切换到另一页...

从 h1 标签中提取文本时出现问题 美丽的汤

作者:DCUpro 提问时间:11/17/2023

我是解析网站的完全新手,但我有一个脚本,可以提取不同住房网站的数据,这些网站在过去一年中完美运行。但是,由于我无法弄清楚的原因,它不再适用于 daft.ie。我尝试过调试,但我尝试的似乎都不起作用。我...

获取不为空的 asyncio 结果

作者:Roman Kazmin 提问时间:11/18/2023

我在使用 asyncio 进行网页抓取任务时遇到了一些问题。我想在 cian 网站上收集有关房地产经纪人的信息 - 我使用 asyncio,因为在这个网站上使用了分页。我遇到了两个问题。当我使用完全异...


共212条 当前第21页