在分解大型数据结构进行处理时,应该以什么大小为目标?具体筛段尺寸
作者:northerner 提问时间:12/10/2019
一些大型数据结构的引用局部性较低。这对缓存不利。我正在实施埃拉托色尼的筛子。它包含一长串数字。可以分段处理列表以提高缓存命中率。区段大小应该是多少?我听说 L1 指令集缓存应该效果最好。根据我的测试,...
cpu-cache 问答列表
作者:northerner 提问时间:12/10/2019
一些大型数据结构的引用局部性较低。这对缓存不利。我正在实施埃拉托色尼的筛子。它包含一长串数字。可以分段处理列表以提高缓存命中率。区段大小应该是多少?我听说 L1 指令集缓存应该效果最好。根据我的测试,...
作者:Matt 提问时间:6/19/2022
我的程序添加了浮点数组,并且在使用 MSVC 和 G++ 进行最大优化编译时展开了 4 倍。我不明白为什么两个编译器都选择展开 4x,所以我做了一些测试,发现只有偶尔在运行时进行 t 检验,用于手动展...
作者:G.C. 提问时间:9/7/2023
编辑 (07/11/2023) 在评论中的各种评论之后,我们理解了我们获得的各种结果之间的部分差异。GPU 或 CPU 上的计算结果可能有所不同这一事实在用户 ken 在其评论中提供的参考中得到了令...
作者:Frontier_Setter 提问时间:10/7/2023
我遇到了与此相同的问题。 L2 poison 是什么意思? 我使用的是 AMD CPU。...