提问人:B_rett 提问时间:10/5/2023 更新时间:10/5/2023 访问量:10
如何根据列值从两个或多个 pandas 数据帧添加列并获取一个数据帧作为输出
How can I add columns from two or more pandas dataframes based on a column value and get one dataframe as the output
问:
大家好,提前感谢任何愿意提供帮助的人。
这是我试图完成的事情,我完全迷失了:
- 我有一个股票代码列表,我用它来读取相关的 csv 文件 (tickerList)。每个 csv 文件都有 3 列,分别标记为“ticker”、“company”、“weight”。我计划将这些 csv 文件读入 pandas 数据帧。
- 我有一个随每个股票代码附带的权重列表(tickerWeights)
tickerList = ['VYM','VUG']
tickerWeights = [.1,.2]
- 我想首先将每个 csv 文件/数据帧的“权重”列中的每一行乘以关联的 tickerWeight。例如,我想将“权重”列中“VYM.csv”中的所有行乘以 .1,“权重”列中“VUG.csv”中的所有行乘以 .2(如上面的列表中所述)。
- 然后,我想从所有 csv 文件/数据帧的“ticker”列中获取一个唯一的列表。
- 然后,我想从这个唯一列表的每一行中搜索每个股票代码的所有 csv 文件/数据帧,并按“权重”列求和
最终数据帧应该是唯一的代码列表,其中包含所有 csv 文件/数据帧中每个代码的总权重。例如:
股票 | 总和重量 |
---|---|
AAPL公司 | .12 |
TSLA公司 | .10 |
我对 python 相当陌生,所以如果我的问题/描述缺乏准确性或细节,请原谅我。
我希望我清楚地描述了这一点,但如果没有,请告诉我。
再次感谢
答: 暂无答案
评论