如何用真值求解缺失值

How to solve missing values with true values

提问人:Centing 提问时间:11/9/2023 最后编辑:gbyCenting 更新时间:11/9/2023 访问量:35

问:

我想通过输入实际值来解决数据中的缺失值问题。我有一个 Suburb 列和一个 CouncilArea 列。Suburb 列中没有缺失值,而在 CouncilArea 列中,有许多缺失值。我想通过将缺失值与 Suburb 列中的值进行匹配,根据现有值在 CouncilArea 列中插入缺失值。

假设 Suburb 列中的某行的值为 Abbotsford,则 CouncilArea 列中的行值为 Yarra。我想通过在空行中插入 Yarra 的值来解决缺失值,其中 Suburb 列中的值是 Abbotsford。

图像

df['CouncilArea'] = df.groupby('Suburb')['CouncilArea'].transform(lambda x: x.fillna(x.mode().iloc[0] if not x.mode().empty else None))

以前,我使用上述语法,使用 groupby('Suburb')['CouncilArea'] 根据 'Suburb' 列中的唯一值对数据进行分组。然后,我将 transform 方法与 lambda 函数一起使用,使用每个“Suburb”组的模式填充“CouncilArea”列中的空值。如果该模式不可用,则空白值保持不变。但是发生错误。

我可以使用什么语法来解决我的问题?我希望有人能帮助我解决这个问题。

python 语法错误 缺失数据

评论


答: 暂无答案