Являются ли параметры модели Хокни функциями размера сообщения?


Используя модель Хокни, время переноса моделируется t (s) = α + βm, где α-задержка для каждого сообщения, а β-время передачи на байт (или обратная величина пропускной способности сети).

Но в некоторых работах (, таких как эта статья), задержка и время передачи являются функциями размера сообщения. При нескольких размерах сообщений они не являются ни постоянными, ни линейными!

Параметры модели Хокни

Если параметры модели Хокни являются функциями размера сообщения, как мы можем прогнозировать время коллективной коммуникации (например: для трансляции, разброса,...) с несколькими размерами сообщений?

Пример: если широковещательная операция выполняется алгоритмом плоского дерева, t(s)=(P-1) (α + βm). Поскольку α и β являются функциями размера сообщения, мы не можем построить его кривую линейной линией, и мы не можем предсказать время работы без параметров модели, которые соответствуют размеру сообщения. Например, мы не можем предсказать время работы для сообщения размером 30 байт, если у нас нет измеренные параметры модели, которые посылают и принимают 30 байтовые сообщения.

1 2

1 ответ:

В Хокни α и β-свойства сети, не зависящие от размера сообщения. Хотя в упомянутом документе ясно говорится:

Мы изменили модель Хокни таким образом, что α и β являются функциями размера сообщения.
Я согласен, что это сбивает с толку, что они всегда просто называют свою измененную модель Хокни. Диаграмма в статье также выглядит подозрительно, как будто "задержка" на самом деле является временем передачи сообщения. Вы можете назвать это задержкой , Как видно из применение . И "полоса пропускания" - это также полоса пропускания , Как видно из приложения. Рассмотрим 10^6 bytes / 65 MBytes/s = 1.5 * 10^4 us. Я не вижу никакого смысла в использовании этих значений, которые оба отражают общее время передачи сообщений в качестве аддитивных индивидуальных параметров сетидля Хокни. К сожалению, в статье не объясняется, как они на самом деле вывели параметры из своего двухточечного MPI-бенчмарка.

Также примечательно, что статья почти всегда просто использует полный термин для сообщения время переноса α(ms) + ms · β(ms), за исключением двух случаев, когда я подозреваю, что это может быть отсутствующая пара скобок. Тогда весь термин можно было бы просто заменить на p2p message time (message size).

Для модели я бы предпочел использовать либо чистый Хокни с константами α и β, либо модель, описывающую время сообщения p2p как функцию размера сообщения. В последнем случае ваш вопрос все еще актуален:

Например, мы не можем предсказать время работы для сообщения размером 30 байт, если у нас нет измеренные параметры модели, которые посылают и принимают 30 байтовые сообщения.

Либо вы должны измерить все возможные размеры, либо вы должны применить подходящую модель. Кстати - если вы используете линейную регрессию, вы снова получаете Хокни.