如何根据列值从两个或多个 pandas 数据帧添加列并获取一个数据帧作为输出

How can I add columns from two or more pandas dataframes based on a column value and get one dataframe as the output

提问人:B_rett 提问时间:10/5/2023 更新时间:10/5/2023 访问量:10

问:

大家好,提前感谢任何愿意提供帮助的人。

这是我试图完成的事情,我完全迷失了:

  1. 我有一个股票代码列表,我用它来读取相关的 csv 文件 (tickerList)。每个 csv 文件都有 3 列,分别标记为“ticker”、“company”、“weight”。我计划将这些 csv 文件读入 pandas 数据帧。
  2. 我有一个随每个股票代码附带的权重列表(tickerWeights)
tickerList = ['VYM','VUG']
tickerWeights = [.1,.2]
  1. 我想首先将每个 csv 文件/数据帧的“权重”列中的每一行乘以关联的 tickerWeight。例如,我想将“权重”列中“VYM.csv”中的所有行乘以 .1,“权重”列中“VUG.csv”中的所有行乘以 .2(如上面的列表中所述)。
  2. 然后,我想从所有 csv 文件/数据帧的“ticker”列中获取一个唯一的列表。
  3. 然后,我想从这个唯一列表的每一行中搜索每个股票代码的所有 csv 文件/数据帧,并按“权重”列求和

最终数据帧应该是唯一的代码列表,其中包含所有 csv 文件/数据帧中每个代码的总权重。例如:

股票 总和重量
AAPL公司 .12
TSLA公司 .10

我对 python 相当陌生,所以如果我的问题/描述缺乏准确性或细节,请原谅我。

我希望我清楚地描述了这一点,但如果没有,请告诉我。

再次感谢

数据操作 读取.csv

评论


答: 暂无答案