微基准 问答列表

如何准确检查代码段的执行时间

作者:Jams.Liu 提问时间:10/23/2023

我正在 x86-64 平台上调试高性能数据路径。它的执行时间可能会抖动,但它的代码很短(可能是 20-100 个 cpu 周期),如何准确获取它的执行时间? 谢谢。...

为什么添加 vmovapd 指令可以使 simd 矢量化代码运行得更快?

作者:Rasmus 提问时间:10/24/2023

我正在对一些高性能数值代码进行矢量化,我注意到使用 Intel 的 SSE、AVX 和 AVX512 指令的 SIMD 矢量化性能与笔记本电脑上矢量寄存器的长度不成比例。我的笔记本电脑有 Tiger ...

为什么 FMA x86 MS C 编译器的 AVX2 速度会变慢?

作者:Martin Brown 提问时间:10/29/2023

这是求解开普勒方程的三个经典启动器,S3 提供了一个有趣的示例,即具有奇怪时序行为的看似短的代码片段。这个问题涉及在 Microsoft C 编译器 x86 模式下编译它们,其中观察到异常行为 - 即...

如何最好地确保指针已读入寄存器,以便进行基准测试?

作者:ajp 提问时间:11/8/2023

我有一些代码大致是这样的 unsafe fn foo(p: *const X) { let x = *p; let begin = Instant::now(); ... // potenti...

微基准测试 C 代码和缓存效果

作者:stefanobaghino 提问时间:11/3/2023

我在 macOS Sonoma 上使用 M1 Pro,编译时使用 15 () 而没有任何(显式)优化。(编辑:使用 -O3,我可以观察到各个版本之间没有有意义的差异。不过,与同一版本的先前运行相比,最...

提高自举功能的效率

作者:heikeehee 提问时间:11/16/2023

我有一个大数据帧,我想从中对每列进行随机抽样。我想多次采样并将结果的总和存储在新的数据帧中。 我的数据帧如下所示: library(microbenchmark) library(plyr) li...


共16条 当前第2页