微基准测试 问答列表

如何在 Java 中编写正确的微基准测试?

作者:John Nilsson 提问时间:2/3/2009

如何在 Java 中编写(和运行)正确的微基准测试? 我正在寻找一些代码示例和注释来说明需要考虑的各种事情。 示例:基准测试应该测量时间/迭代还是迭代/时间,为什么? 相关新闻: 秒表基准测试可...

组装功能中用于将缓冲区设置为零的不一致时钟周期测量

作者:Z123 提问时间:6/8/2023

我目前正在研究一个将缓冲区设置为零的汇编函数。我正在测量执行该函数所需的时钟周期。但是,我遇到了一个问题,即无论缓冲区大小如何增加,时钟周期数都保持不变,我无法解释此行为。 这是我正在使用的汇编函数...

如何在 Java 中编写正确的微基准测试?

作者:John Nilsson 提问时间:2/3/2009

如何在 Java 中编写(和运行)正确的微基准测试? 我正在寻找一些代码示例和注释来说明需要考虑的各种事情。 示例:基准测试应该测量时间/迭代还是迭代/时间,为什么? 相关新闻: 秒表基准测试可...

这是将 64b 值的缓冲区重新格式化为 16b 的最快方法吗?

作者:Douglas B 提问时间:6/29/2023

我有一个数据流,它将物理上的 64 位值输出到缓冲区。当缓冲区达到一定水平时,需要将其重新格式化为连续的 16 位值。实际值永远不会超过数据流生成的每个值的 64 位中的 24 位,因此这相当于将 2...

我可以通过 C++ 中的谷歌基准库计算吞吐量吗

作者:blonded04 提问时间:7/18/2023

我想测量每 N 秒将执行多少次 C++ 函数,有没有办法通过谷歌基准测试来做到这一点?也许使用一些 lambda 作为函数?ComputeStatistics 如果无法通过谷歌基准测试来做到这一点:...

如何防止一段无副作用的代码被优化掉?

作者:lei hu 提问时间:9/15/2023

考虑一个场景,我构造了一个表示大整数的类 T。此类 T 具有加法运算符函数。 class T { public: T operator+(const T &other) const } 为了测...

如何测试内部函数的延迟和吞吐量?

作者:Frontier_Setter 提问时间:9/26/2023

在英特尔的内部指南中,每个函数都有自己的延迟和吞吐量。例如:_mm256_loadu_ps Architecture, Latency, Throughput (CPI) Alderlake, 7,...

如何准确检查代码段的执行时间

作者:Jams.Liu 提问时间:10/23/2023

我正在 x86-64 平台上调试高性能数据路径。它的执行时间可能会抖动,但它的代码很短(可能是 20-100 个 cpu 周期),如何准确获取它的执行时间? 谢谢。...

为什么添加 vmovapd 指令可以使 simd 矢量化代码运行得更快?

作者:Rasmus 提问时间:10/24/2023

我正在对一些高性能数值代码进行矢量化,我注意到使用 Intel 的 SSE、AVX 和 AVX512 指令的 SIMD 矢量化性能与笔记本电脑上矢量寄存器的长度不成比例。我的笔记本电脑有 Tiger ...

为什么 FMA x86 MS C 编译器的 AVX2 速度会变慢?

作者:Martin Brown 提问时间:10/29/2023

这是求解开普勒方程的三个经典启动器,S3 提供了一个有趣的示例,即具有奇怪时序行为的看似短的代码片段。这个问题涉及在 Microsoft C 编译器 x86 模式下编译它们,其中观察到异常行为 - 即...


共13条 当前第1页