OLAP — технология обработки данных, заключающаяся в подготовке суммарной (агрегированной) информации на основе больших массивов данных, структурированных по многомерному принципу. Реализации технологии OLAP являются компонентами программных решений класса Business Intelligence.

Схема «звезды», схема звёздного соединения, звездоподобная схема, звёздная схема — специальная организация реляционных таблиц, удобная для хранения многомерных показателей. Лежит в основе реляционного OLAP.

OLAP-куб — многомерный массив данных, как правило, разреженный и долговременно хранимый, используемый в OLAP. Может быть реализован на основе универсальных реляционных СУБД или специализированным программным обеспечением.

Храни́лище да́нных — предметно-ориентированная информационная база данных, специально разработанная и предназначенная для подготовки отчётов и бизнес-анализа с целью поддержки принятия решений в организации. Строится на базе систем управления базами данных и систем поддержки принятия решений. Данные, поступающие в хранилище данных, как правило, доступны только для чтения.
Суррога́тный ключ — понятие теории реляционных баз данных.
Таблица фактов — является основной таблицей хранилища данных. Как правило, она содержит сведения об объектах или событиях, совокупность которых будет в дальнейшем анализироваться. Обычно говорят о четырёх наиболее часто встречающихся типах фактов. К ним относятся:
- факты, связанные с транзакциями. Они основаны на отдельных событиях ;
- факты, связанные с «моментальными снимками». Основаны на состоянии объекта в определённые моменты времени, например на конец дня или месяца. Типичными примерами таких фактов являются объём продаж за день или дневная выручка;
- факты, связанные с элементами документа. Основаны на том или ином документе и содержат подробную информацию об элементах этого документа ;
- факты, связанные с событиями или состоянием объекта. Представляют возникновение события без подробностей о нём.

Отноше́ние — фундаментальное понятие реляционной модели данных, из-за которого модель и называется «реляционной», от англ. relation — «отношение».
Data mining — собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Термин введён Григорием Пятецким-Шапиро в 1989 году.
Блокировка в СУБД — отметка о захвате объекта транзакцией в ограниченный или исключительный доступ с целью предотвращения коллизий и поддержания целостности данных.
Microsoft Analysis Services — часть Microsoft SQL Server, системы управления базами данных (СУБД). Microsoft включила набор служб в SQL Server, связанных с бизнес-анализом и хранением данных. Эти службы включают в себя службы интеграции и службы анализа. Analysis Services, в свою очередь, включают в себя набор средств для работы с OLAP и интеллектуальным анализом данных.
NoSQL — обозначение широкого класса разнородных систем управления базами данных (СУБД), появившихся в конце 2000-х — начале 2010-х годов и существенно отличающихся от традиционных реляционных СУБД с доступом к данным средствами языка SQL. Применяется к системам, в которых делается попытка решить проблемы масштабируемости и доступности за счёт полного или частичного отказа от требований атомарности и согласованности данных.
Интеграция данных включает объединение данных, находящихся в различных источниках, и предоставление данных пользователям в унифицированном виде. Этот процесс становится существенным как в коммерческих задачах, так и в научных. Роль интеграции данных возрастает, когда увеличивается объём и необходимость совместного использования данных. Это стало фокусом обширной теоретической работы, а многочисленные проблемы остаются нерешёнными[прояснить].
Язык разметки для прогнозного моделирования является языком разметки на основе XML, разработанным Data Mining Group (DMG) и обеспечивающим приложениям способ определения моделей, относящихся к прогнозной аналитике и анализу данных, а также обмен такими моделями между PMML-совместимыми приложениями.
Сводная таблица — инструмент обработки данных, служащий для их обобщения.
Таблица — совокупность связанных данных, хранящихся в структурированном виде в базе данных. Она состоит из столбцов и строк.
В области информатики, неуверенные данные — это данные, содержащие шум, который заставляет данные отклоняться от правильных, предполагаемых или исходных значений. В эпоху больших данных неуверенность или достоверность — одна из определяющих характеристик данных. Данные постоянно растут в объёме, разнообразии, скорости и неуверенности (1/правдивость). Неуверенные данные в изобилии имеются сегодня в интернете, в сенсорных сетях, на предприятиях как в структурированных, так и в неструктурированных источниках. Например, это может быть неуверенность в адресе заказчика в базе данных компании или показания температуры, считанные специальным датчиком, из-за процесса старения датчика. В 2012 году компания IBM опубликовала информацию об «управлении неуверенными данными в масштабе» в своём докладе о глобальном технологическом прогнозе, который представляет собой комплексный анализ от трёх до десяти лет ближайшего будущего, направленный на выявление существенных, разрушительных технологий, которые изменят мир. Для того, чтобы принимать уверенные бизнес-решения на основе реальных данных, анализ должен обязательно учитывать целый ряд различных видов неуверенности, присутствующей в больших объёмах данных. Анализ на основе неуверенных данных будет влиять на качество последующих решений, поэтому степень и типы неточностей в конкретных неуверенных данных не могут быть проигнорированы.
Обучение ассоциативным правилам или поиск ассоциативных правил — это метод машинного обучения на базе правил обнаружения интересующих нас связей между переменными в большой базе данных. Метод предлагается для установления сильных правил, обнаруженных в базе данных с помощью некоторых мер интересности. Этот основанный на правилах подход генерирует также новые правила по мере анализа дополнительных данных. Конечной целью, исходя из достаточно большого набора данных, помочь машине имитировать выделение признаков и создать возможность нахождения абстрактных ассоциаций из новых неклассифицированных данных.
Извлечение знаний — создание знаний из структурированных и неструктурированных источников. Полученное знание должно иметь формат, позволяющий компьютерный ввод, и должно представлять знания так, чтобы облегчить логические выводы. Хотя по методике процесс подобен извлечению информации и процессу «Извлечения, Преобразования, Загрузки», главный критерий результата — создание структурированной информации или преобразование в реляционную схему. Это требует либо преобразования существующего формального знания, либо генерацией схемы, основанной на исходных данных.
Медленно меняющиеся измерения — механизм отслеживания изменений в данных измерения в терминах хранилища данных. Применяется в случае, если данные меняются не очень часто и не по расписанию. Примером могут служить географические данные, статус заказчика по программе лояльности или отдел компании, в котором работает её сотрудник.

Набор данных — коллекция данных. В случае с табличными данными, набор данных соответствует одной или нескольким таблицам баз данных, где каждый столбец таблицы соответствует отдельной переменной, и каждая строка соответствует записи в наборе данных. Наборы данных хранят значения для каждой переменной, например, высота и вес объекта для каждого члена набора данных. Наборы данных могут также состоять из коллекции документов или файлов.