将 .loc 与 DataFrame 的级别子集一起使用-解网

问：

给定一个具有 3 个多索引级别的数据帧：

import pandas as pd

df = pd.concat({'a': pd.Series([1,2,3,1]),
                'b': pd.Series([5,4,3,5]),
                'c': pd.Series(range(9,13)),
                'd': pd.Series(range(13,17))}, axis=1).set_index(['a', 'b', 'c'])
>>>         d
    a b c       
    1 5 9   13
    2 6 10  14
    3 7 11  15
    4 8 12  16

我想将 loc 与前 2 个级别的索引列表一起使用：

idx = pd.MultiIndex.from_arrays([[1, 2], [5, 4]], names=('a', 'b'))
>>> MultiIndex([(1, 5),
                (2, 6)],
               names=['a', 'b'])

我尝试将 .loc 与单个索引一起使用：

df.loc[idx[0]]
>>>      d
    c     
    9   13
    12  16

df.loc[idx[1]]
>>>      d
    c     
    10  14

我希望返回与df.loc[idx]

pd.concat([df.loc[i] for i in idx])
>>>     d
    c     
    9   13
    12  16
    10  14

但我回来了df.loc[idx]

ValueError: operands could not be broadcast together with shapes (2,2) (3,) (2,2)

还有什么比获得预期结果更干净的吗？pd.concat([df.loc[i] for i in idx])

Python Pandas 多索引

将 .loc 与 DataFrame 的级别子集一起使用

Using .loc with on subset of levels from a DataFrame with MultIndex

评论

评论