CPU 架构 问答列表

每个汇编指令需要多少个 CPU 周期?

作者:George2 提问时间:3/28/2009

我听说网上有一本英特尔的书,它描述了特定汇编指令所需的 CPU 周期,但我找不到它(经过努力)。谁能告诉我如何找到CPU周期? 下面是一个示例,在下面的代码中,mov/lock 是 1 个 CPU ...

MIPS 中是否存在执行存储数据风险?

作者:Nick 提问时间:6/4/2015

在具有流水线和转发功能的MIPS架构上: add $s0, $t1, $t2 sw $s0, 0($sp) 添加指令将在步骤 3(执行操作)准备好结果,但我假设 sw 指令希望在步骤 2(指令解...

有没有常见的计算机使用大端编码?

作者:Thomas Hedden 提问时间:1/23/2022

我了解大端和小端。然而,我能接触到的所有计算机——AMD、Intel、Broadcom——的所有处理器都是小端序。这让我想知道是否有任何使用大端序的常见计算机。谁能举例说明?...

Intel CPU 中的“Sub-NUMA Clustering”和“Hemisphere and Quadrant Modes”有什么区别?

作者:Frontier_Setter 提问时间:4/28/2023

在英特尔发布的技术概述中,“Sub-NUMA Clustering”和“Hemisphere and Quadrant Modes”分别进行了描述。但它们之间的主要区别尚不清楚。 在这个答案中,它说...

使用 dword 或 qword 参数的 fdiv 更快吗?

作者:pts 提问时间:5/16/2023

我可以在以下 80387 指令之间进行选择: fdiv dword ptr a 和 fdiv qword ptr b 数字 和 是等价的,它们都是 100% 准确的。ab 我应该选择版本...

存储/加载/移动后浮点数相等

作者:Kai Schmidt 提问时间:5/31/2023

我和一位同事在比较两个未经数学运算的浮点数时会发生什么存在分歧。也就是说,这些数字可能已经在内存和/或CPU寄存器周围移动,但没有对它们进行数学运算。也许它们已被放入列表中,然后被删除或其他各种操作。...

当发生 PMC 溢出时,会记录哪条指令?

作者:Frontier_Setter 提问时间:6/5/2023

当使用“pref record -p $pid & perf report”命令分析带有“cpu-cycle”事件的程序时,我认为底层硬件 PMC 会执行以下操作: 当周期到来时增加计数器 记录计数...

为什么使用非临时存储指令不能减少内存带宽使用?(写入似乎正在生成额外的读取)

作者:Frontier_Setter 提问时间:10/20/2023

我想使用非临时指令来减少 memcpy 过程中写入分配产生的读取带宽。优化后的预期读写带宽应相同,均等于实际数据处理带宽。 但我在实验中发现,内存读取带宽仍然是写入带宽的 1.7 倍。 我的代码是...

从多个插槽 (Xeon Scalable) 上的所有内核到共享缓存行的存储争用导致系统变得迟钝

作者:Vern 提问时间:11/1/2023

#include <glibmm/thread.h> #include <sys/sysinfo.h> #include <stdio.h> void threadLoop(int *PtrCoun...

如何设置线程亲和性到性能或高效内核?

作者:user2023370 提问时间:11/2/2023

我熟悉用于设置线程想要运行的 cpu。在下面的代码中,线程请求执行(设置为 13),方法是通过宏设置 affinity mask 来执行。pthread_attr_setaffinity_nptcpu...


共14条 当前第1页