(蟒蛇)本地化变量

(Python)Localizing variable

提问人:Soon 提问时间:11/28/2021 更新时间:11/28/2021 访问量:85

问:

我的目标是使用 my_function 更改数据帧 df,然后将结果分配给 dataframe df。 但是当我使用函数时,函数外部的数据帧 df 发生了变化。 我怎样才能修改函数以不影响功能之外的 df 变量?

import pandas as pd
df = pd.DataFrame({'A': [10, 20, 30]}, index=['2021-11-24', '2021-11-25', '2021-11-26'])


def my_function(df_temp):
    df_temp['A'][0] = 100  # How could I modify not to affect df varable which is outside of funtion
    return df_temp         

   something = my_function(df)
   print(df)   # df is already altered although I didn't assign

# df = my_function(df)
# print(df)
Python 函数 pass-by-value

评论


答:

0赞 Daniel Afriyie 11/28/2021 #1

试试这些解决方案

  1. 使用 pandas.apply 函数
import pandas as pd
df = pd.DataFrame({'A': [10, 20, 30]}, index=['2021-11-24', '2021-11-25', '2021-11-26'])


def my_function(row):
    row[0] = 100       
    return row


something = df.apply(my_function)
print(something)
A
2021-11-24  100
2021-11-25  20
2021-11-26  30
print(df)

A
2021-11-24  10
2021-11-25  20
2021-11-26  30



2.使用pandas.copy功能

import pandas as pd
df = pd.DataFrame({'A': [10, 20, 30]}, index=['2021-11-24', '2021-11-25', '2021-11-26'])

def my_function(df):
    temp_df = df.copy()
    temp_df['A'][0] = 100
    return temp_df


something = my_function(df)
print(something)
A
2021-11-24  100
2021-11-25  20
2021-11-26  30
print(df)

A
2021-11-24  10
2021-11-25  20
2021-11-26  30
1赞 Kamil Górzyński 11/28/2021 #2

参数始终在 Python 中通过赋值传递,因此 DataFrame 在函数内部发生变异。处理参考文献是首选,因为它不会影响性能。

如果被迫保留原始对象,可以通过手动创建副本来执行该操作。

import pandas as pd
df = pd.DataFrame({'A': [10, 20, 30]}, index=['2021-11-24', '2021-11-25', '2021-11-26'])

def my_function(df_temp):
    df_temp['A'][0] = 99

dfc = df.copy()
my_function(dfc) # alter the copy

print(df) # unchanged
print(dfc) # altered

您可以在文档中阅读有关传递变量的更多信息:https://docs.python.org/3/faq/programming.html#how-do-i-write-a-function-with-output-parameters-call-by-reference