将未对齐的时间序列加载到 DataFrame 中，使用一个索引？-解网

问：

我开始学习这个很棒的工具，我被困在加载几个时间序列并将它们与“主”日期向量对齐的简单任务上。

例如：我有一个 csv 文件：Data.csv，其中第一行包含标题，其中 Date1 是 Rate1 的日期，Date2 是 Rate2 的日期。"Date1, Rate1, Date2, Rate2"

在本例中，Rate2 具有较多的观测值（开始日期与 Date1 相同，但结束日期比 Date1 中的结束日期相距更远，并且缺失值较少），并且应根据 Date2 对所有内容进行索引。

获取以下 DataFrame 的首选方法是什么？（或完成类似的事情）

index(Date2) Rate1 Rate2
11/12/06     1.5   1.8
12/12/06     NaN   1.9
13/12/06     1.6   1.9
etc
etc
11/10/06     NaN   1.2
12/10/06     NaN   1.1
13/10/06     NaN   1.3

我试图效仿官方熊猫.pdf和谷歌搜索中的例子，但无济于事。（我什至买了麦金尼先生的《熊猫》一书的预版，但关于熊猫的章节还没有准备好:(）

有没有很好的食谱？

谢谢

编辑：关于将系列一分为二的答案。CSV 文件：但是，如果我有很多时间序列，例如

日期1 速率1 日期2 速率2 ...日期N 率N

我所知道的是，日期应该几乎相同，但包含缺失值的序列（没有日期或利率条目）除外（顺便说一句，这将是一些金融经济学时间序列的一个例子）

加载此数据集的首选方法仍然是将每个系列拆分为单独的 .CSV？

EDIT2 archlight 是完全正确的，只是做“csv_read”会把事情搞砸。

从本质上讲，我的问题可以归结为：如何连接几个未对齐的时间序列，其中每个序列都有一个日期列，以及序列本身的列（.从 Excel 导出的 CSV 文件）

再次感谢

Python 熊猫

谢谢，但我在这里遇到了两个问题：1）序列未被识别为时间序列，有没有办法将索引解析为日期？2）序列（在本例中为 ts1，稍短的序列）索引包含 NaN 的 .由于它是从使用 excel 导出的 CSV 文件中读取的，因此当序列“结束”时，其余条目只是空值。我尝试了ts1.dropna（），但这不仅会删除索引处的NaN。（我需要在frame = DataFrame（{'rate1'： ts1， 'rate2'： ts2}）命令起作用之前删除所有NaN）我希望我把自己说清楚了。非常感谢您的帮助！

0赞 luffe 6/6/2012

我只是想快速记下我刚刚更新到最新的 Enthought 发行版。这并没有改变任何事情。如果快速浏览一下我的数据集将有助于澄清我的问题;这是我的系列外观的代表性样本的链接（54 KB） dl.dropbox.com/u/13846181/Data.csv 谢谢。

0赞 luffe 6/11/2012

任何人？我的数据表示有那么罕见吗？

上一个：如何转换pandas数据帧，使index是唯一的值集，data是每个值的计数？

下一个：获取pandas.read_csv以将空值读取为空字符串而不是 nan

将未对齐的时间序列加载到 DataFrame 中，使用一个索引？

Load un-aligned time series into a DataFrame, with one index?

评论

评论

评论