组合函数转置矩阵中的指针问题
作者:szyjas 提问时间:10/28/2023
在我的代码中,我尝试使用在汇编中编写的函数转置动态矩阵 (IN64) 似乎我试图从矩阵外部读取,或者我在试图指出我的函数应该从哪里移动并保存字节时犯了一个错误。 请帮助我解决这个问题,因为正确理解我...
x86 问答列表
作者:szyjas 提问时间:10/28/2023
在我的代码中,我尝试使用在汇编中编写的函数转置动态矩阵 (IN64) 似乎我试图从矩阵外部读取,或者我在试图指出我的函数应该从哪里移动并保存字节时犯了一个错误。 请帮助我解决这个问题,因为正确理解我...
作者:Bastien Portigo 提问时间:11/3/2023
我不明白在我的虚拟软盘 img 上使用 Int 13H AH=00h。 我从命令行创建了一个 img 虚拟软盘: copy amorce.com/B+programme.com/B disk.im...
作者:user2052436 提问时间:11/3/2023
没有__m512填充位测试的内在函数(如)。_mm512_testz_si512 最好的方法是什么?...
作者:thequestioner 提问时间:10/31/2023
我是否可以将一个 2048 位数字加载到 8 个 AVX ymm 寄存器中,并在所有这些寄存器之间左右移动位? 我一次只需要移动 1 位。 我试图在 AVX 上找到准确的信息,但很多时候 xmm/...
作者:Gendai 提问时间:11/2/2023
我正在做一个项目,我第一次尝试使用矢量化来加快计算时间。 总体思路是给出一个足够大的数组,应用一些按位掩码,并计算具有位奇偶校验的uint16_t数。 以下代码是检查性能的测试用例,它生成给定大小的随...
作者:Frontier_Setter 提问时间:10/20/2023
我想使用非临时指令来减少 memcpy 过程中写入分配产生的读取带宽。优化后的预期读写带宽应相同,均等于实际数据处理带宽。 但我在实验中发现,内存读取带宽仍然是写入带宽的 1.7 倍。 我的代码是...
作者:Zayed Aldhaheri 提问时间:10/27/2023
我已经在 C 中获得了这段代码,我需要计算分配给函数算术堆栈帧的字节数。我到处寻找一种方法,但每个人都有不同的答案。 long arith(long x, long y, long z){ lon...
作者:aganm 提问时间:10/25/2023
我有我想除以的浮点数,其中一些可能是零。我怎样才能使除以零,当它们发生时,在x86-64上只返回零而不是NaN? 我尝试设置 MXCSR 的 FZ 和 DAZ 标志,但无济于事。我是不是误会了什么?...
作者:T-series 提问时间:10/3/2023
改写了问题 在迭代和显示堆栈值(为简单起见,2 次迭代)后,在最后一次 printf 之后立即出现分段错误。 只是尝试在循环中在堆栈上显示十六进制值。尝试将堆栈与步骤对齐(愚蠢的我),这意味着向堆栈...
作者:iegrm 提问时间:10/13/2023
我正在做一个项目,该项目涉及将 dll 加载到具有 64 位和 32 位版本的应用程序中。我无权访问此应用程序的源代码,我正在将指令注入代码洞穴以使用导入的 LoadLibrary,并且加载的 dll...