提问人:lara_toff 提问时间:9/10/2020 最后编辑:Augustinlara_toff 更新时间:11/17/2022 访问量:486
Numpy Unique 在大型阵列上速度很慢...有什么方法可以加快速度吗?
Numpy Unique slow on a large array... is there any way to speed it up?
问:
我使用以下代码加载一个 numpy 数组,在第一列中查找唯一日期,然后根据日期从 numpy 数组中提取一个切片。它非常慢。有什么方法可以加快速度吗?也许如果我对第一列上的大数组进行排序?
db = np.load('/content/drive/My Drive/Share/Daily Data/Database/db_unranked.npy',
mmap_mode='r', allow_pickle=True)
dates = np.unique(db[:, 0])
data = db[db[:, 0] == dates[0]]
db_unranked.npy arary 为 21GB,约 800 万行和 345 列。np.unique 需要 10 多分钟,我已经等了 30 分钟,但它仍然没有完成。我正在使用 Google Colab。
答: 暂无答案
评论
data = db[db[:,0]==dates[0]]