如何在不将字典加载到内存中的情况下写入 Python 字典？-解网

问：

我有一个大表，我想将其转换为 Python 字典，但我不想将所有数据加载到内存中。

是否可以在不先构建对象的情况下主动写入 pickle 转储？

例如：

import gzip
f_out = open("output.dict.pkl.gz", "wb")

with open("table.tsv", "r") as f_in:
    for line in f_in:
        line = line.strip()
        if line:
            fields = line.split("\t")
            k = fields[3]
            v = fields[1]

            # Pseudocode
            f_out[k] = v # I know this won't work but just so you can see my goal

# Close the pickle file
f_out.close()

python 字典 bigdata pickle 大数据

@PedroLobito：是的。但只要你在打开货架时不使用，它就不会被缓存在货架本身上;你使用的内存将取决于你访问的你保留的内容的数量（保存到变量或其他内存中的数据结构）。如果确实使用，则在缓存开始增长过大时，需要手动调用 to 来清除缓存。writeback=Truewriteback=True.sync()

0赞 O.rka 11/14/2023

有趣的是，这功能类似于泡菜对象，但被称为架子？

2赞 ShadowRanger 11/14/2023

@O.rka：它的作用类似于，但每次分配给键时，它都会腌制值，并将键和值存储到磁盘上的底层数据库中。因此，它是按值计算的泡菜，而不是一个大泡菜，这就是实现较低内存（但可能较高磁盘）消耗的方式。dict

上一个：如何在数据库中存储有关维基数据的32GB大小的json格式数据？ [已关闭]

下一个：我可以为我的静态博客网站制作多少个 Markdown 文件有限制吗？

如何在不将字典加载到内存中的情况下写入 Python 字典？

How to write to Python dictionary without loading the dictionary into memory?

评论

评论