霓虹灯 问答列表

x86-64 SSE2 整数 SIMD GCC 内置函数是否有 ARM64 等效项?

作者:terdev 提问时间:3/19/2022

我正在尝试使用 AMM 算法(近似矩阵乘法;在 Apple 的 M1 上),它完全基于速度并使用下面列出的 x86 内置函数。由于将 VM 用于 x86 会减慢算法中的几个关键进程,我想知道是否有另一...

如何在 Go 的汇编程序中更高效地将全局数据加载到 NEON 寄存器?

作者:Emman Sun 提问时间:11/8/2023

arm64 asm 代码中有 p256one 全局数据作为示例: DATA p256one<>+0x00(SB)/8, $0x0000000000000001 DATA p256one<>+0x08...


共2条 当前第1页