在 pandas 中从无序日期创建 datetime 对象

Creating datetime object in pandas from out of order dates

提问人:thefrollickingnerd 提问时间:9/10/2018 最后编辑:thefrollickingnerd 更新时间:9/10/2018 访问量:93

问:

我在 pandas 中有一个数据帧,看起来像这样

Year Month Month_index Rainfall
1900 Jan   1            4.8
1901 Jan   1            5
.
.
.
1900 Feb   2            3.2
1901 Feb   2            4.3
.
.

要使用日期时间索引,我需要重新排列它以使其看起来像 -

Year Month Month_index Rainfall
1900 Jan   1            4.8
1900 Feb   2            3.2
.
.
1901 Jan   1            5
1901 Feb   2            4.3
.
.

当然,为了简洁起见,我展示了整整 12 个月。我对 python 相当陌生,所以我不知道是否有命令可以做到这一点。 先谢谢你!

编辑:这是我用来达到目前的代码 -

import csv
#import pyexcel-io as pi
import numpy as np
import pandas as pd
import dateutil
#Read data from csv file into dataframe
df =pd.read_csv('/Users/Gingeraffe/Documents/University/3rd_year/Bureau_Research/Notebooks/Data/rainfall_SW_WA.csv')

months = df.columns[1:]
#Melt is putting months down a column and the data down another column. 
Problem is ' jan jan jan... feb feb feb..' etc. instead of 'jan feb mar.. etc'
df = pd.melt(df, id_vars='Year', value_vars=months, var_name='Month')
df.insert(2,'Month_index',0)
M = {'Jan':1, 'Feb':2, 'Mar':3, 'Apr':4, 'May':5, 'June':6, 'July':7, 'Aug':8, 'Sep':9, 'Oct':10, 'Nov':11, 'Dec':12}
df.Month_index = df.Month.map(M) 
python-3.x 熊猫 日期时间

评论

0赞 CKE 9/10/2018
欢迎来到 SO。您能更详细地描述您的问题吗?例如,通过添加描述您的问题的代码、命令或屏幕截图。也请查看帮助中心,特别是对于询问最小示例。谢谢。

答:

2赞 user3483203 9/10/2018 #1

使用您的三列创建一个序列,然后我们可以使用它进行排序:datetime

s = pd.to_datetime(
        df[['Year', 'Month']].astype(str).sum(1), format='%Y%b'
)

最后,排序:

df.iloc[s.sort_values().index]

   Year Month Month_index Rainfall
0  1900   Jan           1      4.8
2  1900   Feb           2      3.2
1  1901   Jan           1      5.0
3  1901   Feb           2      4.3

评论

1赞 thefrollickingnerd 9/10/2018
谢谢!我所要添加的只是 df = df.iloc[etc] 以使其工作。
0赞 Vinuthna V 9/10/2018 #2
   import pandas as pd  
   d = {'Year' : [1900,1901,1900,1901], 'Month' : ['Jan','Jan','Feb','Feb'] , 'Month_index' : [1,1,2,2], 'Rainfall' : [4.8,5,3.2,4.3]}  
   df = pd.DataFrame(data=d)  
   df = df.sort(['Year','Month_index'])  
   #dataframe <df> should now contain the sorted dataframe