МПИ отправить правильный способ, чтобы отправить матрицу

Я должен использовать MPI API для отправки/получения матриц в моих программах. Для отправки Матрицы я использовал следующий синтаксис: MPI_Send(matrix, ...) <- USE THIS MPI_Send(&matrix, ...) MPI_Send(&matrix[0][0], ...) Similar to t ...

Зонд для МПИ брошены или MPI отправить

У меня есть программа, в которой есть настройка master/slave, и у меня есть некоторые функции, реализованные для master, который отправляет различные виды данных в slave. Некоторые функции посылают отдельным подчиненным устройствам, но некоторые пере ...

Как добавить разреженный домен в Chapel

Я заполняю разреженный массив в Chapel циклом, который читает над CSV. Мне интересно, какая модель лучше. var dnsDom = {1..n_dims, 1..n_dims}; var spsDom: sparse subdomain(dnsDom); for line in file_reader.lines() { var i = line[1]:int; var ...

Настройка OpenMPI для работы на одной машине (Debian / Linux)

Я установил OpenMPI на моей машине Ubuntu 11.04. Мое понимание таково, что я печатаю mpirun и происходит магия. Чего я не понимаю, так это как настроить mpirun, чтобы это волшебство происходило только на двух ядрах моей машины. Как настроить OpenM ...

Использовать идентификатор задания slurm

Когда я запускаю вычисления в кластере, у меня обычно есть отдельная программа, выполняющая постобработку в конце: sbatch simulation sbatch --dependency=afterok:JOBIDHERE postprocessing Я хочу избежать опечаток и автоматически вставить идентифика ...

Десинхронизированные трассировки в COMPSs

Я генерирую следы моих казней с помощью COMPSs 1.4. Я заметил, что некоторые задачи с зависимостями данных среди них перекрываются в файле трассировки. Это не должно быть невозможно. Я также проверил график зависимостей, и они, кажется, правильны. Я ...

Какие все операции включает в себя флоп?

FLOPS означает операции с плавающей запятой в секунду, и у меня есть некоторое представление о том, что такое плавающая точка. Я хочу знать, что это за операции ? Являются ли +, -, *, / единственными операциями или операции, подобные логарифмировани ...

SGE / UGE / etc..стандартизированный способ отправки заданий OpenMP на несколько ядер?

Я ищу способ отправить задание OpenMP планировщику Grid Engine, указав при этом количество ядер, на которых оно должно выполняться. Что-то эквивалентное варианту LSF -n или варианту PBS -l узлов=[count]. Когда я ищу на этом, я вижу кучу ответов, о ...

Как машина с более высокой производительностью процессора (согласно gprof) имеет худшую производительность в реальном времени?

Фон У меня есть вычислительно интенсивная программа, которую я пытаюсь запустить на одном суперкомпьютерном узле. Вот характеристики одного из узлов суперкомпьютера: ОС: Redhat 6 Enterprise 64-bit Процессор: Intel 2x 6-core 2.8 GHz (12 ядер) -- ...

Интел МКЛ и математические библиотеки ядра АМД

Есть ли у кого-нибудь опыт программирования как для Intel Math Kernel Library, так и для AMD Math Core Library? Я создаю персональный компьютер для высокопроизводительных статистических вычислений и обсуждаю компоненты, которые нужно купить. Привле ...

Являются ли параметры модели Хокни функциями размера сообщения?

Используя модель Хокни, время переноса моделируется t (s) = α + βm, где α-задержка для каждого сообщения, а β-время передачи на байт (или обратная величина пропускной способности сети). Но в некоторых работах (, таких как эта статья), задержка и вре ...

MPI + GPU: как смешать эти два метода

Моя программа хорошо подходит для MPI. Каждый процессор выполняет свою собственную, специфическую (сложную) работу, производит один double, а затем я использую MPI_Reduce, чтобы умножить результат от каждого процессора. Но я повторяю это много-мног ...