Pandas - 将区间指数合并为浮点数-解网

问：

我正在使用 qcut 获取预测值的 bin 并计算每个 bin 的标准误差。然后，我想通过将该数据帧的预测映射到我所做的 bin 的 SE，将这些标准误差应用于另一个 DataFrame 中的预测。

下面是我正在使用的代码，最后一行是弥补的。

df = pd.DataFrame(np.random.randint(0,100,size=(1000, 2)), columns=['Pred','Error'])
df2 = pd.DataFrame(np.random.randint(0,100,size=(1000, 2)), columns=['Pred'])
df['binned']=pd.qcut(df['Pred'], 10)    
binSEs=df.groupby(['binned'],observed=False)['Error'].std()  

**df2['binSE']=unknownintervaljoin(df['Pred'],binSEs)**

或者，如果我可以在 df2 中基于 binSE 创建一个“binned”列，我可以合并 binSEs 系列。

python-3.x pandas 合并间隔

import pandas as pd
import numpy as np

# Create the dataframes
df = pd.DataFrame(np.random.randint(0, 100, size=(1000, 2)), columns=['Pred', 'Error'])
df2 = pd.DataFrame(np.random.randint(0, 100, size=(1000, 1)), columns=['Pred'])

# Calculate the 'binned' column in df2
df2['binned'] = pd.qcut(df2['Pred'], 10, labels=False, duplicates='drop')

# Calculate binSEs
df['binned'] = pd.qcut(df['Pred'], 10)
binSEs = df.groupby(['binned'], observed=False)['Error'].std()

# Merge df2 with binSEs based on the 'binned' column
df2['binSE'] = df2['binned'].map(binSEs)

print(df2.head())

在此代码中，我们首先使用计算 'binned' 列。然后，我们根据“binned”列进行合并，确保正确执行映射。最后，我们将生成的数据帧中的“Error”列重命名为“binSE”。df2pd.qcutdf2binSEsdf2

这应该为您提供“binSE”列，其中包含基于 .df2df

上一个：合并两个没有公共元素但其中一个是单列几何列的 GeoDataFrame

下一个：使用 pandas 分别合并 2 个不同数据帧的 2 个部分

Pandas - 将区间指数合并为浮点数

Pandas - merging Interval Index to float

评论