熊猫 问答列表

如何创建一个带有 dtype 的 pandas 系列,dtype 是 float 的子类?

作者:royk 提问时间:8/9/2023

我想创建一个派生自 float 类型的 pandas 系列。但是,pandas 会自动将其重铸为 float: import pandas as pd class PValue(float): ...

由于 pandas 上的夏令时,无法将时间戳 (%d/%m/%Y %H:%M) 转换为索引 (Python 3)

作者:Estraviz 提问时间:8/22/2023

我正在尝试使用 pandas 读取 CSV 文件中的信息,CSV 有两列,一个时间戳(例如:31/12/2022 21:30)和一个浮点值。该文件由测量每刻钟能量组合的仪器生成。这个设备有时会出现故障...

如何在 python 中横断面获取 Fama-Macbeth 回归

作者:Mostafa Bouzari 提问时间:9/2/2023

我对这个话题很陌生,我对理解它的回归和定量方面感到困惑,尽管我发现了惊人的帖子,例如 rationale-of-fama-macbeth-procedure、fama-macbeth-cross-se...

drop_duplicates期间和之后的内存使用情况()

作者:isalteverything 提问时间:10/10/2014

我正在处理一个数据帧,该数据帧占用大约 2 Gb 的内存(根据 htop),尺寸为 (6287475,19)。数据帧在数据类型上是异构的,这可能无关紧要。加载数据框后,我立即使用命令删除重复的行 d...

在 pandas 中从当地时间转换为 UTC

作者:Sheldon 提问时间:9/4/2023

我正在处理包含当地(智利)日期和时间的熊猫数据帧,例如: local_time 2/9/2023 23:33 2/9/2023 23:39 3/9/2023 1:00 3/9/2023 1:08 ...

modin 在 AWS Lambda 上有用吗

作者:bonney 提问时间:3/29/2021

AWS Lambda 附带 6 个 vCPU。Modin for Pandas 承诺使用内核来提高处理效率。 这是否真的在 AWS Lambda 上提供,否则它不支持多线程、多处理等? # imp...

Tabula 不提取 pdf 中的每一行数据

作者:Mark k 提问时间:9/19/2023

我目前有一个问题,我有点挣扎。我正在尝试使用表格库从 pdf 中提取每一行。我遇到的问题是,通常脚本可以正确提取数据,但由于某种原因,它没有提取每一行: Number of pages read: ...

_nanquantile_dispatcher() 有一个意外的关键字参数“method”

作者:Luis Valencia 提问时间:9/19/2023

我有一个大约有 6k 行的 pandaas 数据帧,有一个每小时的时间戳列和一个浮点数的值。 我正在使用 DARTS 进行预测和绘图 import pandas as pd from darts ...

如何创建一个新列,其中的值是根据现有列选择的?

作者:user7289 提问时间:11/12/2013

如何将列添加到以下数据帧中,以便 if 和 else?colorcolor='green'Set == 'Z'color='red' Type Set 1 A Z 2 B Z 3 B X 4 C...

dask.read_csv比 50k 列的 pandas.read_csv 慢得多

作者:Daniel Pinyol 提问时间:10/5/2023

我有一个包含 1k 行和 50k 列的 csv。 我花了 9 秒来计算所有带有 pandas 的列的最小值 panda_df = pd.read_csv(path, sep=",") # 8s m...


共260条 当前第17页