问答列表

代理在刮痧蜘蛛中使用时返回“死”

作者:AxelotlZ 提问时间:4/1/2023

我正在使用scrapy框架从站点中抓取数据。因为我发送了大量的请求,所以我使用了 scrapy-rotating-proxies 和我从 razorproxy.com 购买的 100 个 dc 代理的...

Python Web Scraper 未使用任何抓取的数据填充 .txt 文件

作者:BlackHeart 提问时间:4/1/2023

我是python的新手,但我对正在发生的事情有一点了解。我正在尝试用 BeautifulSoup 编写一个网络爬虫。我正在抓取一个站点的一串数字,然后将该数字字符串写入 .txt 文件,以便我以后可以...

如何用请求和 BeautifulSoup 抓取《华尔街日报》的头条新闻?

作者:miraculous_guru 提问时间:4/1/2023

华尔街日报不想被解析 - 我有这个函数: def get_wsj_news(): global prev_news_wsj url = "https://www.wsj.com/news/wor...

如何在 powershell 2.0 中进行 Web 扫描

作者:Nezuko 提问时间:4/19/2023

我尝试了以下解决方案,基本上从url中检索表信息,或者只是从url中检索html内容,但它在Powershell 2.0中不起作用,因为我可以在powershell 5.0中运行相同的脚本,请帮我找到...

尝试使用 XML 从 URL 读取代码时出错,xmlParse

作者:Moh 提问时间:4/25/2023

我必须阅读下面的链接,并在代码 http://www.ggobi.org/book/data/australian-crabs.xml 后回答下面的问题 library(XML) crabs <-...

R 中的 stemCompletion 问题

作者:d4rkneo 提问时间:4/27/2023

尊敬的 stack overflow 社区: 尝试在 R 中使用 tm 包 (https://cran.r-project.org/web/packages/tm/tm.pdf) 中的函数 stem...

尝试从 python 中的 .split() 函数读取数组后列出索引超出范围错误 - 返回只有 1 个值的数组

作者:schnecktec 提问时间:5/3/2023

我有无法从其他程序编辑的 csv 文件。我想使用拆分功能通过符号“;”拆分文件。 1:我打开csv文件 2:我使用readlines() 3:我使用拆分(;) 4. 尝试读出拆分值时出错 da_sp...

如何使用 preg_match 或其他方法将数据从 html 提取到 PHP 数组

作者:Yogesh Saroya 提问时间:5/3/2023

我有来自旧网站的 html 页面,其中包含使用以下格式的一些地方的列表。 <p><b>Ado’s Kitchen &amp; Bar&nbsp; </b>1143 13th St., 720-465...

使用 sub() 提取多个列中的字符

作者:TheBoomerang 提问时间:8/8/2022

请考虑以下代码 x <- c('2','75% (3/4)','80% (4/5)','70% (7/10)','90% (9/10)') y <- c('1', '50% (1/2)', '25...

从字符串中的所有 &lt;a&gt; 标签中获取文本

作者:zuk1 提问时间:2/27/2009

由于我在正则表达式上完全没用,而且这在过去半个小时里一直困扰着我,我想我会在这里发布这个,因为它可能很简单。 <a href="/folder/files/hey/">hey.exe</a> <a ...


共489条 当前第22页