数据帧字典中的最大值和最小日期

Max and min date in a dictionary of dataframes

提问人:edge-case 提问时间:5/29/2018 更新时间:5/29/2018 访问量:1227

问:

在每个数据帧的字典中查找最大和最小日期的最 pythonic 方法是什么?例如:

import pandas as pd
import datetime

df1 = pd.DataFrame(index =  [datetime.datetime(2016, 7, 2, 0, 0),
                    datetime.datetime(2016, 8, 6, 0, 0),
                    datetime.datetime(2016, 9, 13, 0, 0),
                    datetime.datetime(2016, 10, 26, 0, 0),
                    datetime.datetime(2016, 11, 2, 0, 0)],
                    data = {'bee' : [5, 3, 1, 0, 2],
                           'an' : [2,3,2,2,7]})

df2 = pd.DataFrame(index =  [datetime.datetime(2015, 7, 2, 0, 0),
                    datetime.datetime(2015, 8, 6, 0, 0),
                    datetime.datetime(2015, 9, 13, 0, 0),
                    datetime.datetime(2015, 10, 26, 0, 0),
                    datetime.datetime(2015, 11, 2, 0, 0)],
                    data = {'bee' : [15, 2, 5, 0, 2],
                           'an' : [1,1,2,7,7]})

df_dict = {'df1':df1, 'df2':df2}

df_dict['df1']

输出:

index       an  bee
2016-07-02  2   5
2016-08-06  3   3
2016-09-13  2   1
2016-10-26  2   0
2016-11-02  7   2

df_dict['df2']

输出

index       an  bee
2015-07-02  1   15
2015-08-06  1   2
2015-09-13  2   5
2015-10-26  7   0
2015-11-02  7   2

所以,我想找到 的最大日期 ,应该是 2016-11-02,最短日期是 ,应该是 2015-07-02。df_dictdf_dict

Python Pandas 词典

评论


答:

2赞 rafaelc 5/29/2018 #1

获取每个 's 和 每个 'smaxmaxminmin

max(max(v.index) for k,v in df_dict.items())
min(min(v.index) for k,v in df_dict.items())

2016-11-02 00:00:00
2015-07-02 00:00:00

添加@温建议,如果您不会同时使用 和 ,您可以这样做kv

max(max(v.index) for _,v in df_dict.items())

甚至

max(max(df_dict[k].index) for k in df_dict.keys())

评论

0赞 edge-case 5/29/2018
这有效,谢谢!我是 python 的新手,你能帮我理解为什么它需要两个参数,k 和 v 或 _ 和 v 吗?在哪里可以找到有关您使用的策略的更多信息,我应该在谷歌上搜索哪些关键术语?
0赞 edge-case 6/1/2018
啊,k 代表“键”,v 代表循环字典中的“值”。
2赞 BENY 5/29/2018 #2

通过使用pd.concat

pd.concat(df_dict).index.get_level_values(1).max()
Out[159]: Timestamp('2016-11-02 00:00:00')
pd.concat(df_dict).index.get_level_values(1).min()
Out[160]: Timestamp('2015-07-02 00:00:00')