矢量化 问答列表

如何在C#中抽象Vector256<T<的逻辑以支持不同的硬件配置?

作者:user22782688 提问时间:11/10/2023

C# 中的矢量化通过 Vector 类工作。有不同大小的向量,如 Vector64/Vector128/Vector256。但是我该如何使用它们呢?我已经用 编写了一个 for 循环,但如果设备不支持...

如何在matlab中优化嵌套循环的运行速度

作者:Alex 提问时间:11/10/2023

我需要在 matlab 中处理四维矩阵的元素。哪里是100左右。下面的程序计算起来非常耗时,不知道有没有合适的方法可以稍微简化一下?N for i1 = 1 : N for j1 = 1 : N...

在 RISC-V RVV 0.7.1 中屏蔽 CSR SpMV 的单个行

作者:Alex 提问时间:11/7/2023

编辑:我已经将我的问题重新表述为更有成效的东西,并将在下面提供答案。这个问题的旧版本仍然在下面。 我正在RVV 0.7.1中为CSR格式实现优化的SpMV内核。在 C 语言中,SpMV 可以这样实现...

使用 gcc -O3 优化时,为什么循环索引的类型会影响 gcc 的内部 GIMPLE 向量常量(但不会影响最终的 asm)?

作者:Daisy G 提问时间:11/1/2023

我创建了一个结构数组,这是我的源代码。 #include <stdio.h> #include <stdlib.h> #define N 256 typedef struct arc { i...

如何在“java.lang.Math”中打印为内部函数生成的汇编代码?

作者:serkan_ozal 提问时间:10/17/2023

我正在使用 Java Panama Vector API 试验向量相似性搜索算法。我正在尝试了解如何生成一些调用(例如)到不同平台上的汇编代码。我知道它们是JVM内部函数,但是当我启用打印汇编代码(和...

在带有 sapply 的函数中使用 str_split 和 union 的意外结果

作者:Hack-R 提问时间:2/26/2019

给定此 data.frame: library(dplyr) library(stringr) ml.mat2 <- structure(list(value = c("a", "b", "c"),...

关于gcc pragmas for vectorization的问题

作者:richard gostanian 提问时间:10/3/2023

James Reinders 有一个关于矢量化的非常翔实的 youtube 视频。 https://www.youtube.com/watch?v=hyZMssi_gZY 在其中,他提到了两个编译...

加速 pytorch 代码的困难:使用复杂的多对一非线性函数训练 MLP

作者:Steven Sagona 提问时间:9/1/2023

总之: 我的目标是弄清楚是否可以使用特定的复杂非线性函数来替换神经网络中的单个神经元。理想情况下,我想证明我可以训练MNIST的数字图片。我已经尝试过 pytorch,但它太慢了,主要是因为我无法弄...

如何有效地链接 avx2 内部函数以执行算术运算链?

作者:Stef1611 提问时间:9/7/2023

我写了一个大型程序来模拟分子系统。我在处理器是 Intel(R) Core(TM) i7-6700 CPU @ 3.40GHz 的台式计算机上运行它。大多数时间 (75%) 用于计算 4 个邻居的 L...

分组函数(tapply、by、aggregate)和 *apply 系列

作者:grautur 提问时间:8/18/2010

每当我想在 R 中做一些“map”py 时,我通常会尝试使用家族中的函数。apply 然而,我一直不太理解它们之间的区别——{、、等}如何将函数应用于输入/分组输入,输出会是什么样子,甚至输入可以是...


共27条 当前第2页