将组中满足条件的行数追加到 Pandas 数据帧-解网

问：

我知道如何附加一列来计算组中的元素数，但我只需要为该组中满足特定条件的数字这样做。

例如，如果我有以下数据：

import numpy as np
import pandas as pd

columns=['group1', 'value1']

data = np.array([np.arange(5)]*2).T
mydf = pd.DataFrame(data, columns=columns)

mydf.group1 = [0,0,1,1,2]
mydf.value1 = ['P','F',100,10,0]

valueslist={'50','51','52','53','54','55','56','57','58','59','60','61','62','63','64','65','66','67','68','69','70','71','72','73','74','75','76','77','78','79','80','81','82','83','84','85','86','87','88','89','90','91','92','93','94','95','96','97','98','99','100','A','B','C','D','P','S'}

因此，我的数据帧如下所示：

mydf

   group1 value1
0       0      P
1       0      F
2       1    100
3       1     10
4       2      0

然后，我想计算每个值中的行数。group1value1valuelist

我想要的输出是：

   group1 value1 count
0       0      P     1
1       0      F     1
2       1    100     1
3       1     10     1
4       2      0     0

蟒蛇熊猫

@AntonvBR 因为 = 中只有 1 个值，所以中。你明白我的意思吗？我们在组内计算有多少行的值在 .为了给您提供上下文，这些是班级组的成绩。因此，100 的值通过，但 10 没有。由此可见选修课“1”组中的1门课已通过。同样的事情也适用于的组 0。一个有及格值（），一个不及格（），因此该组通过的总数为 1。value1group11valuelistgroup1value1valuelistvalue1countgroup1group1PF

答：

2赞 DSM 10/9/2017 #1

更改 value1 列的类型以匹配 valueslist 后（或相反），您可以使用获取 True/False 列，并使用将其转换为 1 和 0。然后我们可以应用一个普通的 groupby 变换：isinastype(int)

In [13]: mydf["value1"] = mydf["value1"].astype(str)

In [14]: mydf["count"] = (mydf["value1"].isin(valueslist).astype(int) 
                          .groupby(mydf["group1"]).transform(sum))

In [15]: mydf
Out[15]: 
   group1 value1  count
0       0      P      1
1       0      F      1
2       1    100      1
3       1     10      1
4       2      0      0

mydf.merge(mydf.groupby('group1').apply(lambda x: len(set(x['value1'].values).intersection(valueslist))).reset_index().rename(columns={0: 'count'}), how='inner', on='group1')


   group1 value1  count
0       0      P      1
1       0      F      1
2       1    100      1
3       1     10      1
4       2      0      0

上一个：在 Windows 上将 UTF-8 中文字符从 R 写入 CSV

下一个：Django：在由 {{variable}} 生成的文本字符串中间更改 HTML 模板的字体

将组中满足条件的行数追加到 Pandas 数据帧

Append count of rows meeting a condition within a group to Pandas dataframe

评论

评论