cuda

Идея моей простой программы, которую я пытался написать, состоит в том, чтобы взять входные данные от пользователя, чтобы увидеть, насколько велика матрица для умножения. dd@cuda-Linux:~/Desktop/multi$ ./program What is the rowSize of a? 33 What is the colSize of a? 33 What is the rowSize of b? 33 What is t...

У меня есть существующее приложение, которое использует класс C++, оболочку C++ и код FORTRAN для вычислительно интенсивных частей приложения. Я хотел бы реализовать части FORTRAN в CUDA, чтобы воспользоваться преимуществами распараллеливания, но я все равно хотел бы получить доступ к некоторым подпрограммам,...

Я следовал инструкциям , чтобы настроить Theo для использования GPU в Windows. Проблема в том, что я не могу точно следовать этим инструкциям, потому что у меня есть новая видеокарта GEForce GTX 980M, и она работает только с cuda 7.0. (Инструкции предлагают cuda 5.5). Все работает нормально, за исключением ...

Спасибо за @ hubs, при вызове cublasSgemv следует заметить, что CUBLAS_OP_T также является вектором транспонирования. /*Я изучаю cuda и cublas в течение месяца, и я хочу проверить производительность cublas для дальнейшего использования. Но в моем матрично-векторном умножении с использованием cublasSgemv ответ...

У меня есть простое приложение cuda со следующим кодом: #include <stdio.h> #include <sys/time.h> #include <stdint.h> __global__ void daxpy(int n, int a, int *x, int *y) { int i = blockIdx.x*blockDim.x + threadIdx.x; y[i] = x[i]; int j; for(j = 0; j < 1024*10000; ++j) { y[i]...

В программе CUDA я недавно переключился с тестирования на inifinity с помощью return x==INFINITY || x==-INFINITY; Где INFINITY - из математики.h, to return !isfinite(x); И был весьма удивлен, получив разные результаты. gnu.org предполагает, что они действительно должны вести себя подобным образом. Я ...

В руководстве CUDA C Best Practices Guide версии 5.0, раздел 6.1.2, написано, что: В отличие от cudaMemcpy (), асинхронная версия передачи требуется закрепленная память хоста (см. закрепленная память), и она содержит дополнительный аргумент-идентификатор потока. Это означает, что функция cudaMemcpy...

Я работаю над переводом приложения CUDA ( это, если вы должны знать) в OpenCL. Оригинальное приложение использует C-style CUDA API, с одним потоком только для того, чтобы избежать автоматического ожидания занятости при чтении результатов. Теперь я замечаю, что очереди команд OpenCL очень похожи на потоки CU...

На GPGPU, с cuda моей проблемой является : У меня есть вектор из 256 элементов, я хочу сделать программу, которая может извлекать позиции ненулевых значений и копировать их в другой вектор. Пожалуйста, мне нужна ваша помощь. Мой код не работает: Dev_Hist : - источник данных, начальный вектор; Dev_Xn: -...

просматривая ответы и комментарии на вопросы CUDA, а также в CUDA tag wiki, Я вижу, что часто предлагается, чтобы состояние возврата каждого вызова API проверялось на наличие ошибок. Документация API содержит такие функции, как cudaGetLastError,cudaPeekAtLastError и cudaGetErrorString, но каков наилучший спос...