Векторный процессор

Векторный процессор — это процессор, в котором операндами некоторых команд могут выступать упорядоченные массивы данных — векторы. Отличается от скалярных процессоров, которые могут работать только с одним операндом в единицу времени. Абсолютное большинство процессоров является скалярным или близким к нему. Векторные процессоры были распространены в сфере научных вычислений, где они являлись основой большинства суперкомпьютеров начиная с 1980-х до 1990-х. Но резкое увеличение производительности и активная разработка новых процессоров привели к вытеснению векторных процессоров из сферы повседневных процессоров.

В большинстве современных микропроцессоров имеются векторные расширения (см. SSE). Кроме того, современные видеокарты и физические ускорители можно рассматривать как векторные сопроцессоры.

Иллюстрация работы

Для иллюстрации разницы в работе векторного и скалярного процессора рассмотрим простой пример попарного сложения двух наборов по 10 чисел. При «обычном» программировании используется цикл, который берёт пары чисел последовательно, и складывает их:

повторить цикл 10 раз
  прочитать следующую инструкцию и декодировать
  получить первое слагаемое
  получить второе слагаемое
  сложить
  сохранить результат
конец цикла

Для векторного процессора алгоритм будет значительно отличаться:

прочитать следующую инструкцию и декодировать
получить 10 первых слагаемых
получить 10 вторых слагаемых
сложить
сохранить результат

Реализация Cray расширила возможности вычислений, позволяя выполнять несколько различных операций сразу. Для примера рассмотрим код, складывающий 2 набора чисел и умножающий на третий, в Cray эти операции осуществились бы так:

прочитать следующую инструкцию и декодировать
получить 10 чисел
получить 10 чисел
получить 10 чисел
сложить и умножить их
сохранить результат

Таким образом, математические операции выполняются гораздо быстрее, основным ограничивающим фактором становится время, необходимое для извлечения данных из памяти.

Программирование под гетерогенные вычислительные архитектуры

Различные машины были спроектированы с применением и традиционных и векторных процессоров, например, Fujitsu AP1000 и AP3000. Программирование для таких гетерогенных машин может оказаться затруднительным, так как разработка программ, которые используют наилучшим образом характеристики разных процессоров, повышает нагрузку на программиста. Это увеличивает сложность кода и снижает его переносимость, так как участки кода, требуемые для каждого из процессоров, будут чередоваться на протяжении всей программы^[1]. Балансировка рабочей нагрузки приложений на процессорах может быть проблематичной, особенно если учесть, что они обычно имеют различные характеристики производительности. Существуют различные концептуальные модели для решения этой проблемы, например, использование языка координации и программных стандартных блоков (библиотек и/или функций высшего порядка). Каждый блок может иметь различные собственные реализации для каждого типа процессоров. Программист просто использует эту абстракцию, а интеллектуальный компилятор выбирает лучшую реализацию, основываясь на контексте^[2].

См. также

Примечания

↑ Kunzman, D. M.; Kale, L. V. (2011), "Programming Heterogeneous Systems", 2011 IEEE International Symposium on Parallel and Distributed Processing Workshops and Phd Forum, p. 2061, doi:10.1109/IPDPS.2011.377, ISBN 978-1-61284-425-1{{citation}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)
↑ John Darlinton, Moustafa Ghanem, Yike Guo, Hing Wing To (1996), "Guided Resource Organisation in Heterogeneous Parallel Computing", Journal of High Performance Computing, 4 (1): 13—23, Архивировано 8 июня 2013, Дата обращения: 16 декабря 2012{{citation}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка) Источник (неопр.). Дата обращения: 16 декабря 2012. Архивировано 8 июня 2013 года.

Ссылки

The History of the Development of Parallel Computing Архивная копия от 5 декабря 1996 на Wayback Machine (from 1955 to 1993)

[1] Kunzman, D. M.; Kale, L. V. (2011), "Programming Heterogeneous Systems", 2011 IEEE International Symposium on Parallel and Distributed Processing Workshops and Phd Forum, p. 2061, doi:10.1109/IPDPS.2011.377, ISBN 978-1-61284-425-1{{citation}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)

[2] John Darlinton, Moustafa Ghanem, Yike Guo, Hing Wing To (1996), "Guided Resource Organisation in Heterogeneous Parallel Computing", Journal of High Performance Computing, 4 (1): 13—23, Архивировано 8 июня 2013, Дата обращения: 16 декабря 2012{{citation}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка) Источник (неопр.). Дата обращения: 16 декабря 2012. Архивировано 8 июня 2013 года.

[1]

[2]

Параллельные вычисления
Общие положения	Высокопроизводительные вычисления Кластерные вычисления Распределённые вычисления Грид-вычисления Туманные вычисления
Уровни параллелизма	Биты Инструкции Данные Задачи Циклы
Поток выполнения	Суперпоточность Гиперпоточность
Теория	Закон Амдала Закон Густавсона — Барсиса Эффективность затрат Метрика Карпа — Флэтта Замедление Коэффициент ускорения
Элементы	Процесс Поток Файбер ПМПД Instruction window
Взаимодействие	Многопроцессорность Многозадачность (Вытесняющая многозадачность Кооперативная многозадачность) Многопоточность Когерентность памяти Когерентность кэша Недействительность кэша Барьер
Программирование	Модели (Скрытый параллелизм Явный параллелизм Параллелизм) Таксономия Флинна SISD SIMD MISD MIMD SPMD Поток Неблокирующая синхронизация
Компьютерная техника	Мультипроцессорность (Симметричная Асимметричная) Память (NUMA COMA Распределённая Разделяемая Распределённая разделяемая Транзакционная) Одновременная многопоточность MPP Суперскалярность Векторный процессор Матричный процессор Суперкомпьютер Beowulf
API	Ateji PX POSIX Threads OpenMP OpenHMPP PVM MPI UPC Intel Threading Building Blocks Boost Global Arrays Charm++ Cilk Co-array Fortran OpenCL CUDA FireStream Dryad DryadLINQ
Проблемы	Затруднительное распараллеливание Чрезвычайная параллельность Проблемы Великого Вызова Блокировка ПО Масштабируемость Состояние гонки Взаимная блокировка Активный тупик Детерминированный алгоритм Параллельное замедление