自动矢量化 问答列表

整数矢量化精度/整数除法精度是否取决于 CPU?

作者:György Kőszeg 提问时间:3/14/2023

我尝试对 16 位整数 ARGB 通道的 64 位颜色进行矢量化。 我很快意识到,由于缺乏加速整数除法支持,我需要将我的值转换为并显式使用一些 SSE2/SSE4.1 内部函数以获得最佳性能。尽管如...

使用 gcc -O3 优化时,为什么循环索引的类型会影响 gcc 的内部 GIMPLE 向量常量(但不会影响最终的 asm)?

作者:Daisy G 提问时间:11/1/2023

我创建了一个结构数组,这是我的源代码。 #include <stdio.h> #include <stdlib.h> #define N 256 typedef struct arc { i...


共2条 当前第1页