我不理解带有分类数据的 Pandas 中的 groupby 行为

I don't understand groupby behavior in Pandas with categorical data

提问人:E.L 提问时间:7/11/2023 最后编辑:CorralienE.L 更新时间:7/11/2023 访问量:48

问:

案例 1 : groupby 将“A”和“B”的“缺失”组合相加?

情况 2 :结果与条目 DataFrame 的长度相同。

如果“A”和“B”表示整数,则在两种情况下我都会得到相同的结果。

entry data

categorical

integers

熊猫 分类

评论


答:

0赞 Corralien 7/11/2023 #1

当键为 dtype 时,输出包含所有组合的乘积,即使由于 groupby 方法的默认设置而缺少组也是如此。categoryobserved=False

observed: bool, default False
仅当任何分组器是 Categoricals 时才适用。如果为 True:仅显示分类分组鱼的观测值。如果为 False:显示分类分组器的所有值。

如果使用 ,则输出将相同,当 和 为整数时。sample.groupby(['A', 'B'], observed=True)['C'].count().reset_index()AB