
Beowulf (Beowolf) — кластер, который состоит из широко распространённого аппаратного обеспечения, работающий под управлением операционной системы, распространяемой с исходными кодами.
Parallel Virtual Machine (PVM) (дословно виртуальная параллельная машина) — общедоступный программный пакет, позволяющий объединять разнородный набор компьютеров в общий вычислительный ресурс («виртуальную параллельную машину») и предоставляющий возможности управления процессами с помощью механизма передачи сообщений. Существуют реализации PVM для самых различных платформ: от лаптопов до суперкомпьютеров Cray. PVM имеет более расширенные возможности, чем её популярный аналог MPI, в плане контроля вычислений: присутствует специализированная консоль управления параллельной системой и её графический эквивалент XPVM, позволяющий наглядно продемонстрировать работу всей системы.

Грид-вычисления — это форма распределённых вычислений, в которой «виртуальный суперкомпьютер» представлен в виде кластеров, соединённых с помощью сети, слабосвязанных гетерогенных компьютеров, работающих вместе для выполнения огромного количества заданий. Эта технология применяется для решения научных, математических задач, требующих значительных вычислительных ресурсов. Грид-вычисления используются также в коммерческой инфраструктуре для решения таких трудоёмких задач, как экономическое прогнозирование, сейсмоанализ, разработка и изучение свойств новых лекарств.
AMPL — язык программирования высокого уровня, разработанный в Bell Laboratories в 1985 году для того, чтобы описывать и решать сложные задачи оптимизации и теории расписаний. AMPL не решает задачи непосредственно, а вызывает соответствующие внешние «решатели» для получения решения.

Векторный процессор — это процессор, в котором операндами некоторых команд могут выступать упорядоченные массивы данных — векторы. Отличается от скалярных процессоров, которые могут работать только с одним операндом в единицу времени. Абсолютное большинство процессоров является скалярным или близким к нему. Векторные процессоры были распространены в сфере научных вычислений, где они являлись основой большинства суперкомпьютеров начиная с 1980-х до 1990-х. Но резкое увеличение производительности и активная разработка новых процессоров привели к вытеснению векторных процессоров из сферы повседневных процессоров.
CUDA — программно-аппаратная архитектура параллельных вычислений, которая позволяет существенно увеличить вычислительную производительность благодаря использованию графических процессоров фирмы Nvidia.
Разделённое глоба́льное а́дресное простра́нство — одна из перспективных моделей параллельного программирования, в которой вся память параллельного вычислительного комплекса является адресуемой и разделена на логические разделы, каждый из которых локален для какого-то процесса или потока.
Performance Application Programming Interface — переносимый интерфейс, реализованный в виде библиотеки, для доступа к счетчикам аппаратной производительности на различных современных микропроцессорах. Он широко применяется для сбора низкоуровневых метрик производительности в компьютерных системах, работающих под операционными системами семейства UNIX или Linux. Библиотека PAPI доступна к использованию из программ на языках Си, C++, Fortran, Java, Matlab.

Ascalaph Designer — программа молекулярного моделирования общего назначения. Она предоставляет графическое окружение для консольных программ квантовой и классической механики Firefly, CP2K и MDynaMix, имеет возможности для конструирования молекулярных моделей, конформационной оптимизации и молекулярной динамики. Firefly/PC GAMESS предоставляет широкий ряд квантовохимических методов.
Таксономия (Классификация) Флинна — общая классификация архитектур ЭВМ по признакам наличия параллелизма в потоках команд и данных. Была предложена Майклом Флинном в 1966 году и расширена в 1972 году.

Julia — высокоуровневый свободный язык программирования с динамической типизацией, созданный для математических вычислений. Эффективен также и для написания программ общего назначения. Синтаксис языка схож с синтаксисом других математических языков, однако имеет некоторые существенные отличия. Julia написан на Си, C++ и Scheme. Имеет встроенную поддержку многопоточности и распределённых вычислений, реализованные в том числе в стандартных конструкциях.
Unified Parallel C (UPC) — расширение языка программирования Си, предназначенное для high-performance computing на масштабных параллельных компьютерах, в том числе на SMP/NUMA системах с общей памятью и с распределенной памятью. Программисту предоставляется доступ ко всему глобальному разделённому адресному пространству (PGAS), хранимые в нем переменные могут читаться и изменяться любым процессором. При этом каждое значение хранится в физической памяти одного из процессоров. UPC использует модель SPMD в которой степень параллелизма фиксируется при запуске программы, обычно на уровне один поток исполнения на ядро процессора.
Низкоуровневый программный интерфейс — интерфейс передачи данных для IBM Scalable Powerparallel (SP) суперкомпьютера Switch, разработанный в конце 1990-х годов. Он обеспечивает высокопроизводительную передачу между SP устройствами. LAPI обеспечивает эффективную одностороннюю передачу данных между задачами в системе IBM SP. LAPI быстрее передает сообщения, чем MPI при использовании маленьких или средних сообщений, однако пользователь вынужден писать много лишнего кода.
C++ Accelerated Massive Parallelism — библиотека, использующая DirectX 11, и открытая спецификация, созданные Microsoft для реализации параллельных программ для гибридных систем на языке C++. Система C++AMP позволяет переносить вычисления на GPU (видеоускорители) без внесения большого количества изменений в программы. Код, который не может запуститься на GPU, например, из-за своей сложности, будет автоматически запущен на центральном процессоре с применением SIMD (SSE) инструкций. Реализация системы от Microsoft включена в Visual Studio 2012 и включает в себя отладчик и профилировщик. Поддержку других платформ и оборудования могли бы реализовать компания Microsoft или другие в будущем.
Гетерогенные вычислительные системы — электронные системы, использующие различные типы вычислительных блоков. Вычислительными блоками такой системы могут быть процессор общего назначения (GPP), процессор специального назначения, сопроцессор, логика ускорения.
Cray MTA-2 многопроцессорный суперкомпьютер с разделяемой памятью (SM-MIMD), выпущенный компанией Cray в 2002 году. Его необычный дизайн основан на суперкомпьютере Tera одноимённой компании Tera Computer Company. Изначальный суперкомпьютер Tera оказался неудобным для массового производства из-за агрессивного подхода к упаковке логических элементов и выбранной технологии соединения процессоров. Модель MTA-2 являлась попыткой решить эти проблемы и сохранить при этом архитектуру процессора. Процессор был выполнен на одном кристалле кремния по технологии КМОП вместо 26 кристаллов на базе арсенида галлия в исходной модели MTA; также продвинутая топология 4-мерного тора была заменена на более масштабируемую топологию «граф Кэли». Название Cray к модели было добавлено после того, как компания Tera Computer Company в 2000 году выкупила подразделение Cray Research у компании Silicon Graphics, слилась с этим подразделением и сменила название на Cray Inc.
Данная таблица проводит сопоставление фреймворков, библиотек программ и отдельных программ для глубокого обучения.

BlackArch Linux или BlackArch — дистрибутив GNU/Linux, основанный на Arch Linux, для тестирования на проникновение и оценки безопасности, предоставляющий инструментарий для анализа сетей и информационных систем. Репозиторий содержит более 2800 утилит, которые можно установить по отдельности или группами. BlackArch Linux совместим с существующими установками Arch Linux. Официальным спонсором разработки является хакерская группа NullSecurity.
Тесты производительности LINPACK служат для измерения вычислительной производительности компьютеров при обработке чисел с плавающей запятой. Созданы Джеком Донгаррой в 1979, измеряют скорость решения компьютером плотной системы линейных уравнений (СЛАУ) Ax=b, где A является матрицей размера n на n. Подобная задача часто возникает в области машиностроения.
oneAPI — открытый стандарт унифицированного прикладного программного интерфейса, предназначенный для использования на различных вычислительных ускорительных архитектурах, включающих графические процессоры, нейронные процессоры и программируемые пользователем вентильные матрицы. Стандарт предназначен для устранения необходимости поддержания разработчиками отдельных кодовых баз, множества программных языков, и различных инструментов и рабочих процессов для каждой архитектуры.