Python:将列表替换在引用位置,而不是创建新的引用/列表

Python: Replace a list in place from where it is referenced, not create a new reference/list

提问人:Alex 提问时间:1/22/2019 最后编辑:Alex 更新时间:1/26/2019 访问量:491

问:

我在 Python 中处理了相当多的值(内存占用量为 5GB)。

有时,我需要按键访问值,有时我需要循环值。出于性能原因,我在启动时将 Dict 转换为列表,因此我可以:

  • 在我想按键访问值的情况下使用 Dict
  • 在我想循环值的情况下使用 List
my_big_dict_of_values
my_big_values_list = list(my_big_dict_of_values.values())

为了清楚起见,下面是一个性能比较:

>some_dict = dict(zip(range(1000000), reversed(range(1000000))))
>some_list = list(some_dict.values())
>%timeit for t in some_dict.values(): t 
21.1 ms ± 483 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)
>%timeit for t in some_list: t 
16.1 ms ± 1.31 ms per loop (mean ± std. dev. of 7 runs, 100 loops each)

当我需要根据用户输入从字典中删除键时,我的问题就出现了。 首先,我从字典中删除以下条目:

for key in keys_to_remove:
    del(my_big_dict_of_values[key])

完成此操作后,我还想更新.我可以通过以下方式做到这一点:my_big_values_list

解决方案 A(慢速)

indexes_to_remove = list()
for idx, value in enumerate(my_big_values_list):
    if value.key in keys_to_remove:
        indexes_to_remove.append(idx)
for index in sorted(indexes_to_remove, reverse=True):
    del my_big_values_list[index]

但是,这确实很慢,也很麻烦。

理想情况下,我想再次从字典创建列表:

解决方案 B(快速参考问题)

my_big_values_list = list(my_big_dict_of_values.values())

这很快,但它似乎创造了一个新的参考。我需要替换传递给其他类/函数的所有引用,这看起来很奇怪,例如为了说明。my_big_values_list

my_big_dict_of_values
my_big_values_list = list(
    my_big_dict_of_values.values())

handle_process = handle_process_class(
    my_big_dict_of_values, my_big_values_list)

userinput = userinput(handle_process)

handle_process.calculate()

def userinput_class():
    def __init__(handle_process):
        self.handle_process = handle_process
    def user_del_key(key):
        del(self.handle_process.my_big_dict_of_values[key])
        # Update list here too:
        # Solution A works
        # Solution B throws error in
        # handle_process.calculate() because
        # handle_process still has old list

def handle_process_class():
    def __init__(my_big_dict_of_values, my_big_values_list):
        self.my_big_dict_of_values = my_big_dict_of_values
        self.my_big_values_list = my_big_values_list
    def calculate(self):
        return len(self.my_big_values_list)

有没有办法就地修改,但只需替换为新列表(例如 list(my_big_dict_of_values.values()))。my_big_values_list

我已经阅读了 Python 如何传递对值的引用,我想我理解了其中的大部分内容。这就是为什么我想出了解决方案A,但我不知道如何使用解决方案B来修改引用列表。也许有人可以解释这里发生了什么?

Python 性能 参考 值传递

评论

1赞 bruno desthuilliers 1/22/2019
确定你需要这个列表吗???循环使用值就像 or 一样简单 - 如果您使用的是 Python 2.7 并想要节省 RAM -for val in yourdict.values():for val in yourdict.iter_values():
0赞 Alex 1/22/2019
在大多数情况下,我同意,但是遍历列表比遍历 dict.values() 更快,这在我的 dict() 中的值量中很明显
0赞 Alex 1/22/2019
注意:我编辑了我的原始答案,并添加了性能比较
0赞 bruno desthuilliers 1/22/2019
它本身可能更快,但维护列表的开销也会增加一些开销,因此根据您的具体用例,净收益可能并不那么重要(真的不知道)。此外,这可能不是代码中的主要问题,因此,如果您想正确优化代码,您真的需要先对其进行分析。(注意:并不是说当前的优化是无用的或没有意义的 - 只是我们人类非常不善于猜测任何非平凡代码中真正的瓶颈在哪里)。
0赞 Alex 1/22/2019
完全同意:我可能需要对我的代码进行适当的性能测试。再介绍一下背景知识:my_big_dict_of_values是我程序的核心,我实际上在它的所有代码部分运行了数百万次迭代。

答:

4赞 mportes 1/22/2019 #1

若要就地修改列表,请分配给其切片:

my_big_values_list[:] = list(my_big_dict_of_values.values())

例:

>>> my_big_dict_of_values = {"a": 1, "b": 2, "c": 3}
>>> my_big_values_list = list(my_big_dict_of_values.values())
>>> another_list_reference = my_big_values_list

>>> print(my_big_values_list, another_list_reference)
[1, 2, 3] [1, 2, 3]

>>> del(my_big_dict_of_values["b"])
>>> my_big_values_list[:] = list(my_big_dict_of_values.values())

>>> print(my_big_values_list, another_list_reference)
[1, 3] [1, 3]

但是,在性能和内存使用方面,您应该考虑是否真的需要一个单独的大列表,因为您可以直接循环。dictionary.values()

评论

0赞 Alex 1/22/2019
哇,这么简单,解释得很好!非常感谢,这绝对有助于我的整个 Python 知识。