如何在 pandas 中计算每列中唯一项的出现次数？-解网

问：

假设我有一个如下所示：dataframe

指数	一	二	三
第一	一个	B	C
第二	C	一个	B
第三	B	一个	C

我想要的是跨列的计数。df.iloc[:,1:]:

项目	一	二	三
一个	1	2	0
B	1	1	1
C	1	0	2

对第二个表计数的解释在每个计数旁边的括号中。

项目	一	二	三
一个	1（第 1 栏中只有一个 A）	2（第 2 列中 A 的两次计数）	0（第 3 栏中没有 A）
B	1（第1栏中只有一个B）	1（第 2 栏中只有一个 B）	1（第3栏为1 B）
C	1（第 1 列中只有一个 C）	0（第 2 列中没有 C）	2（第 3 列中 C 的两次计数）

我尝试了以下不太有效的方法：

df3.iloc[:,1:].value_counts().to_frame('counts').reset_index()
df[df.columns[1:]].value_counts()

上面两个单行线很接近，但还不完全存在。

我能想到的 Macgyvered 解决方案是逐一遍历列并对每个列进行操作并尝试组织计数，但鉴于每个列的顺序有些不同，这有点混乱。.value_counts().value_count

我应该怎么做？

python-3.x 熊猫

from io import StringIO
import pandas as pd

s = """Index    one two three
First   A   B   C
Second  C   A   B
Third   B   A   C"""

df  = pd.read_csv(StringIO(s), sep='\t').set_index('Index')

df = (df.apply(pd.value_counts).fillna(0)
      .apply(pd.to_numeric,downcast='integer')
      .reset_index()
      .rename(columns={'index':'Item'})
     )

`>>> display(df)`

0赞 Golden Lion 9/15/2022 #3

在 Apply 中使用 value_counts for the DataFrame

data="""Index,one,two,three
First,A,B,C
Second,C,A,B
Third,B,A,C
"""
df = pd.read_csv(io.StringIO(data), sep=',')


df=df.apply(lambda x: x.value_counts()).fillna(0)
df=df.drop(labels=['First','Second','Third'],axis=0)

print(df)

上一个：有没有办法将熊猫细胞内两个不同的 n * n 个数据帧的相应单元格的内容连接起来？

下一个：如何让 IJulia 在 mamba 环境中工作？

如何在 pandas 中计算每列中唯一项的出现次数？

How can I count occurrences of unique items per column across columns in pandas?

评论

评论

`>>> display(df)`