pandas MultiIndex 的多个切片器-解网

问：

我想从具有多个独立索引器的 MultiIndex 中选择多个列。例如

df = pd.DataFrame(
    np.zeros((2,4)),
    columns=pd.MultiIndex.from_product([('a','b'),(1,2)])
)

从此 DataFrame

    a       b   
    1   2   1   2
0   0   0   0   0
1   0   0   0   0

我想选择加号下的所有列，比如，但我不想明确指定下面列的所有级别。'a'('b', 1)df[[('a', 1), ('a', 2), ('b', 1)]]'a'

什么不起作用：

df[['a', ('b', 1)]]:KeyError: "[('b', 1)] not in index"
df.loc[:, ['a', ('b', 1)]]:KeyError: "[('b', 1)] not in index"
df[[('a', slice(None)), ('b', 1)]]:TypeError: unhashable type: 'slice'
df.loc[:, [pd.IndexSlice['a', :], ('b', 1)]]:TypeError: unhashable type: 'slice'

我希望能够做的另一件类似的事情是：加上('a', 1)pd.IndexSlice[:, 2]

Pandas Slice 多索引

def mimsc(col_specs):
    # usage: df.loc[msms(['A', ('B', 'X')])]
    def slicer(df):
        cols = []
        dfc = df.columns.to_frame()
        for cs in col_specs:
            cols.append(dfc.loc[cs])
        all_cols = pd.concat(cols, ignore_index=True)
        return pd.MultiIndex.from_frame(all_cols)
    return slicer

用法

df.loc[:, mimsc(['a', ('b', 1)])]
df.loc[:, mimsc([('b', 1), pd.IndexSlice[:, 2]])]

下面是一个更通用的版本，也适用于索引

def mims(col_specs, axis=1):
    def slicer(df):
        cols = []
        if axis==1:
            dfc = df.columns.to_frame()
        elif axis==0:
            dfc = df.index.to_frame()
        for cs in col_specs:
            col = dfc.loc[cs, :]
            if isinstance(col, pd.Series):
                col = dfc.loc[[cs], :]
            cols.append(col)
        all_cols = pd.concat(cols, ignore_index=True)
        return pd.MultiIndex.from_frame(all_cols)
    return slicer

例

df.T.loc[mims(['a', ('b', 1)], axis=0), :]
df.T.loc[mims([('b', 1), pd.IndexSlice[:, 2]], axis=0), :]

上一个：Pandas 使用列值对字符串进行切片

下一个：从另一个 DataFrame 更新 DataFrame 的切片，编码为项目编号、因子和周数

pandas MultiIndex 的多个切片器

pandas multiple slicers of MultiIndex

评论

评论

评论