Windows 和 Linux 之间使用 SIMD 的代码速度差异
作者:Gendai 提问时间:11/2/2023
我正在做一个项目,我第一次尝试使用矢量化来加快计算时间。 总体思路是给出一个足够大的数组,应用一些按位掩码,并计算具有位奇偶校验的uint16_t数。 以下代码是检查性能的测试用例,它生成给定大小的随...
64 问答列表
作者:Gendai 提问时间:11/2/2023
我正在做一个项目,我第一次尝试使用矢量化来加快计算时间。 总体思路是给出一个足够大的数组,应用一些按位掩码,并计算具有位奇偶校验的uint16_t数。 以下代码是检查性能的测试用例,它生成给定大小的随...
作者:thequestioner 提问时间:10/31/2023
我是否可以将一个 2048 位数字加载到 8 个 AVX ymm 寄存器中,并在所有这些寄存器之间左右移动位? 我一次只需要移动 1 位。 我试图在 AVX 上找到准确的信息,但很多时候 xmm/...
作者:user2052436 提问时间:11/3/2023
没有__m512填充位测试的内在函数(如)。_mm512_testz_si512 最好的方法是什么?...
作者:YoungGun 提问时间:11/4/2023
这个问题在这里已经有答案了: 带枕头将PNG转换为JPG (2 个答案) 19天前关闭。 我需要在 python 中将 png 图像保存到 json 文件中。此外,json 文件的开头必须如下所示:...
作者:szyjas 提问时间:10/28/2023
在我的代码中,我尝试使用在汇编中编写的函数转置动态矩阵 (IN64) 似乎我试图从矩阵外部读取,或者我在试图指出我的函数应该从哪里移动并保存字节时犯了一个错误。 请帮助我解决这个问题,因为正确理解我...
作者:Zamyatin 提问时间:11/5/2023
使用:Windows 10 64 位,在 Git Bash 上MINGW64。 我一直在尝试在 MinGW (https://sourceforge.net/projects/mingw/) 中编译...
作者:James Hou 提问时间:11/5/2023
我是 C 和汇编的新手,我很难弄清楚为什么我的代码中会出现分段错误。在当前的任务中,我必须创建 4 个汇编程序,这些程序链接到我的主 c 程序。我只在处理第一个函数,即 sumOfPowers 函数,...
作者:Chris Copland 提问时间:11/5/2023
我在 WAMP64 的 virtualhost 目录中有一个表单填充器 .php 文件。文档的大小与 A4 页面的大小完全相同,并且看起来与模板文件完全相同,只是它具有占位符位于模板文件中的表单字段....
作者:Bartex pro 提问时间:11/6/2023
您好,我有一个 base64 加密的 python 代码。 看起来像这样import base64, lzma; exec(compile(lzma.decompress(base64.b64deco...
作者:interstellarfrog 提问时间:11/6/2023
我最近一直在做很多低级编码,并想尝试完全用机器代码编写一个程序来进一步了解我的知识(从 x64 汇编向下翻译,并将其添加到 PE 文件的正确部分) 我遇到的唯一问题是我在 Windows 上,我必须...