如何创建一个循环，该循环将在新列中输出百分比-解网

问：

我有一个看起来像这样的数据帧：

COL1型	COL2型	COL3型	COL4型	COL5型	COL6型
S1系列	一个	苹果	通道 1	N	第2节
S1系列	一个	苹果	通道 2	Y	第2节
S1系列	一个	苹果	通道 1	Y	第2节
S2系列	一个	苹果	通道 1	N	第2节
S1系列	B	香蕉	通道 2	N	第2节
S1系列	B	香蕉	通道 1	N	第2节

我需要帮助编写一个循环来计算每个记录组合的出现百分比。我希望在此计算中忽略 COL1。关键标识符是 COL2 和 COL3，所以我认为我需要在 COL2 和 COL3 上使用 groupby，然后计算 COL4-COL6 的出现百分比以获得以下结果。我怎样才能做到这一点？

COL1型	COL2型	COL3型	COL4型	COL5型	COL6型	COL4_PCT	COL5_PCT	COL6_PCT
S1系列	一个	苹果	通道 1	N	第2节	.75	.50	1
S1系列	一个	苹果	通道 2	Y	第2节	.25	.50	1
S1系列	一个	苹果	通道 1	Y	第2节	.75	.50	1
S2系列	一个	苹果	通道 1	N	第2节	.75	.50	1
S1系列	B	香蕉	通道 2	N	第2节	.50	1	1
S1系列	B	香蕉	通道 1	N	第2节	.50	1	1

Pandas DataFrame 循环分组百分比

counter = df.groupby(["COL2","COL3"])["COL2"].transform("count")
for column in ["COL4", "COL5", "COL6"]:
    df[f"{column}_PCT"] = df.groupby(["COL2", "COL3", column])["COL2"].transform("count").div(counter)

>>> df
  COL1 COL2     COL3     COL4 COL5       COL6  COL4_PCT  COL5_PCT  COL6_PCT
0   S1    A   Apples  Aisle 1    N  Section 2      0.75       0.5       1.0
1   S1    A   Apples  Aisle 2    Y  Section 2      0.25       0.5       1.0
2   S1    A   Apples  Aisle 1    Y  Section 2      0.75       0.5       1.0
3   S2    A   Apples  Aisle 1    N  Section 2      0.75       0.5       1.0
4   S1    B  Bananas  Aisle 2    N  Section 2      0.50       1.0       1.0
5   S1    B  Bananas  Aisle 1    N  Section 2      0.50       1.0       1.0

如何创建一个循环，该循环将在新列中输出百分比

How to create a loop that will output percentage in a new column

评论

评论