PANDAS 问答列表

在循环中更新数据帧时正在创建新的 DataFrame

作者:Prakhar Rathi 提问时间:3/6/2022

我正在尝试以这种方式对循环中的三个数据帧进行一些更改。 for sheet in [f1, f2, f3]: sheet = preprocess_df(sheet) 函数如下所示prepr...

如何根据列条件执行行求和并将类特定值添加为列?

作者:XYZ 提问时间:3/12/2022

Cluster Class Value 0 0 10 1 1 0 11 1 2 0 14 3 3 0 18 1 4 0 26 1 5 0 29 1 6 0 30 1 7 1 0 2 8 1 19 1 ...

将 numpy float64 NaN 转换为 Postgresql Null

作者:Md. Rezaul Karim 提问时间:3/15/2022

我有一个具有 float64 数据类型的数据帧,其中包含一些 NaN。我正在尝试将数据帧写入PGSQL数据库,但它失败并出现以下错误: invalid input syntax for type d...

使用布尔索引根据匹配的列值删除重复项

作者:Stijn 提问时间:3/29/2022

合并两个 DF 后,我有以下数据集: DB_ID x_val y_val x01系列 405 407 x01系列 405 405 x02系列 308 306 x02系列 308 308 x03系列 ...

Pandas json 转换扰乱浮点精度

作者:Titouan L 提问时间:4/8/2022

将 DataFrame 保存为 json 字符串后,当 json 被转换回 DataFrame 时,初始 DataFrame 和生成的 DataFrame 不相等。我知道使用 时存在转换问题,但是由于...

熊猫指数功率没有按应有的方式计算

作者:Paris Spinelli 提问时间:4/21/2022

我想我在 PANDA 中使用指数时发现了浮点精度的问题。我有一个数字列表,我正在通过 4 阶多项式运行,当我得到大于 2 的阶时,我注意到 Pandas 中预测的值不正确。代码如下: import ...

继续得到“ValueError:序列的真值是模棱两可的。使用 a.empty、a.bool()、a.item()、a.any() 或 a.all()。

作者:CRoss 提问时间:4/1/2022

data_df.loc[data_df['hotelID'] == sqlIDs[neededId] & to_integer(df.iloc[row, 6]) >= to_integer(MostR...

仅使用 numpy 根据年、月和游客到达人数对 csv 文件中的数据进行排序

作者:Nirajan 提问时间:4/26/2022

我正在尝试根据使用 numpy 的游客到达情况,以年、月和游客到达次数的格式对数据进行排序,从五个最差的月份开始。现在,我在这个线程中看到有人在熊猫的帮助下用熊猫对数据帧进行排序。我试图只用numpy...

pd.read_csv() 保留小数位数

作者:arkriger 提问时间:5/26/2022

我想读取 csv,但它剔除了小数点后的数量: fname = './sol/Pret-SB_A00DLR0_202205240635.pos' skiprow = 0 with open(fname...

使用幼稚和 tz 感知的日期时间实例测试相等性时出现意外行为

作者:user2246849 提问时间:4/30/2022

以下内容是在 Python 3.9.7 中生成的。 我很清楚 Python 中不允许在 tz 感知实例和幼稚实例之间进行比较,并引发 .但是,当测试相等性(使用 and 运算符)时,情况并非如此。事...


共852条 当前第23页