MPEG-1 Audio Layer I

MPEG-1 Audio Layer 1
MPEG-1 Audio Layer 1
Расширение	.mp1 или .m1a
MIME-тип	audio/mpeg, audio/MPA
Разработчик	ISO, IEC
Тип формата	audio
Стандарт(ы)	ISO/IEC 11172-3, ; ISO/IEC 13818-3
Сайт	mpeg.chiariglione.org

MPEG-1 Audio Layer I (сокр. MP1) — один из трёх форматов (уровень 1) сжатия звука с потерями, определённых в стандарте MPEG-1^[5]. Хотя MPEG-1 Audio Layer I поддерживается большинством современных медиаплееров, этот формат считается устаревшим. Вместо него в основном используются форматы MP2 и MP3.

Для обозначения файлов, в которых содержится только аудиоинформация формата MP1, используется расширение .mp1 или, иногда, .m1a.

Технология сжатия MP1 использует сравнительно простую схему полосного кодирования с 32 поддиапазонами.

Layer I (слой 1) рекомендуется для применения в профессиональной области, в системах записи-перезаписи с высоким студийным качеством с достаточной ёмкостью памяти. Он характеризуется небольшой сложностью и невысокой степенью редукции аудиоданных.

MPEG-1 layer I также использовался в Digital Compact Cassette, как часть аудиокодека PASC (англ. Precision Adaptive Sub-band Coding — прецизионное адаптивное полосное кодирование). В связи с необходимостью передачи постоянного потока отдельных блоков данных (кадров) на ленточный носитель, в PASC использовался дополнительный бит в MPEG заголовке для определения начала кадра. Битрейт всегда 384 кбит/с^[6].

Основные параметры

MPEG-1 Layer I стандартизован ISO/IEC 11172-3, впервые опубликован в 1993.
- Число каналов: 1 или 2.
- Частоты дискретизации: 32, 44.1 и 48 кГц.
- Битрейт: 32, 64, 96, 128, 160, 192, 224, 256, 288, 320, 352, 384, 416 и 448 кбит/с^[7]
Расширение формата было представлено в MPEG-2 Audio Layer I и определено в стандарте ISO/IEC 13818-3 (MPEG-2 Part 3)^[8], первая редакция была опубликована в 1995^[4]
- дополнительные частоты дискретизации: 16, 22.05 и 24 кГц
- дополнительные битрейты: 48, 56, 80, 112, 144 и 176 кбит/с.

Кодирование и декодирование звуковых сигналов MPEG-1 Layer I

Метод кодирования

Входной цифровой звуковой сигнал разделяется на кадры (фреймы), каждый из которых кодируется и декодируется независимо от других кадров. Размер кадра для уровня Layer I составляет 384 отсчёта.

Полоса аудиосигнала с помощью цифровых полосовых фильтров разбивается на 32 поддиапазона. Все поддиапазоны имеют одинаковую ширину, которая зависит от частоты дискретизации входного сигнала. После разделения частота дискретизации уменьшается в 32 раза, так что число отсчётов в кадре в каждом поддиапазоне равно 12.

Затем выполняется квантование данных. Предварительно определяются масштабные множители, которые зависят от максимального значения сигнала. При этом масштабный множитель определяется для каждого поддиапазона в кадре, то есть для 12 отсчётов сигнала поддиапазона. Перед квантованием значения сигнала делятся на соответствующие масштабные множители.

Затем в блоке квантования и кодирования выполняется квантование данных. В основе сжатия звуковой информации на уровне Layer I лежит метод, называемый адаптивным распределением битов. Этот метод заключается в выполнении квантования с различным числом двоичных разрядов квантования для разных частотных поддиапазонов. При этом используется равномерное квантование. Полное число битов, выделяемых на все поддиапазоны в данном кадре, зависит от частоты дискретизации входного сигнала и от заданной выходной скорости передачи двоичных символов, то есть от требуемой степени сжатия звуковой информации. Распределение битов по поддиапазонам осуществляется блоком психоакустической модели.

Чтобы выполнить распределение битов в блоке психоакустической модели, анализируется спектр исходного звукового сигнала (не разложенного на поддиапазоны). Для этого производится быстрое преобразование Фурье участков этого сигнала по 512 отсчётов, после чего вычисляется спектр мощности звукового сигнала и величины звукового давления в каждом частотном поддиапазоне.

Затем анализируются тональные (синусоидальные) и нетональные составляющие звукового сигнала, определяются локальные и глобальные пороги маскировки и вычисляются отношения сигнал/маскирующий сигнал для всех поддиапазонов, на основании которых производится распределение битов по поддиапазонам.

В тех поддиапазонах, в которых искажения звука, вызываемые квантованием, менее заметны для слушателя или маскируются большим уровнем сигнала в других поддиапазонах, квантование делается более грубым, то есть для этих поддиапазонов выделяется меньше битов. Для полностью маскируемых поддиапазонов битов совсем не выделяется. Благодаря этому, удаётся существенно уменьшить количество передаваемой информации при сохранении достаточно высокого качества звука.

Декодирование

Данные, содержащиеся в кадре, декодируются в соответствии с порядком их следования и таблицами кодов, которые содержатся в программе работы декодера. Декодированные данные о распределении битов и о масштабных множителях используются для декодирования и деквантования звуковых данных. После деквантования отсчёты сигналов поддиапазонов умножаются на соответствующие масштабные множители.

После декодирования и деквантования отсчёты сигналов всех поддиапазонов объединяются в выходной цифровой звуковой сигнал.

Литература

Смирнов А. В. Основы цифрового телевидения: Учебное пособие.— М.: Горячая линия-Телеком, 2001.- 224 с.: ил.

Ссылки

Компрессия цифрового звука: психоакустические основы и алгоритмы. Юрий Ковалгин

См. также

MPEG-1
- MPEG-1 Audio Layer II
- MPEG-1 Layer III (MP3)
MPEG-2
- AAC (MPEG-2 Part 7) — в 1999 году обновлён и включён в MPEG-4 Part 3
MPEG-4
- AAC (MPEG-4 Part 3)

Примечания

↑ The audio/mpeg Media Type - RFC 3003 (неопр.). IETF (ноябрь 2000). Дата обращения: 15 марта 2011. Архивировано из оригинала 23 марта 2012 года.
↑ MIME Type Registration of RTP Payload Formats - RFC 3555 (неопр.). IETF (июль 2003). Дата обращения: 15 марта 2011. Архивировано из оригинала 23 марта 2012 года.
↑ ISO/IEC 11172-3:1993 - Information technology -- Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s -- Part 3: Audio (неопр.). ISO (1993). Дата обращения: 15 марта 2011. Архивировано из оригинала 23 марта 2012 года.
↑ ¹ ² ISO/IEC 13818-3:1995 - Information technology -- Generic coding of moving pictures and associated audio information -- Part 3: Audio (неопр.). ISO (1995). Дата обращения: 15 марта 2011. Архивировано из оригинала 23 марта 2012 года.
↑ Стандарт ISO/IEC 11172-3 «Coding of moving pictures and associated audio for digital storage media at up to about 1.5 mbit/s. Part 3 Audio»
↑ Digital Compact Cassette. Frequently Asked Questions
↑ MPEG Audio Frame Header Архивировано 8 февраля 2015 года.
↑ ISO/IEC 13818-3 (Second edition 1998-04-15) (неопр.). Дата обращения: 15 марта 2011. Архивировано 8 августа 2011 года.

[1] The audio/mpeg Media Type - RFC 3003 (неопр.). IETF (ноябрь 2000). Дата обращения: 15 марта 2011. Архивировано из оригинала 23 марта 2012 года.

[2] MIME Type Registration of RTP Payload Formats - RFC 3555 (неопр.). IETF (июль 2003). Дата обращения: 15 марта 2011. Архивировано из оригинала 23 марта 2012 года.

[11172-3-3] ISO/IEC 11172-3:1993 - Information technology -- Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s -- Part 3: Audio (неопр.). ISO (1993). Дата обращения: 15 марта 2011. Архивировано из оригинала 23 марта 2012 года.

[13818-3-4] ¹ ² ISO/IEC 13818-3:1995 - Information technology -- Generic coding of moving pictures and associated audio information -- Part 3: Audio (неопр.). ISO (1995). Дата обращения: 15 марта 2011. Архивировано из оригинала 23 марта 2012 года.

[ISO/IEC_11172-3-5] Стандарт ISO/IEC 11172-3 «Coding of moving pictures and associated audio for digital storage media at up to about 1.5 mbit/s. Part 3 Audio»

[6] Digital Compact Cassette. Frequently Asked Questions

[7] MPEG Audio Frame Header Архивировано 8 февраля 2015 года.

[8] ISO/IEC 13818-3 (Second edition 1998-04-15) (неопр.). Дата обращения: 15 марта 2011. Архивировано 8 августа 2011 года.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

MPEG (Moving Picture Experts Group)
Разделы MPEG-1	Part 3: Аудио (Layer I Layer II Layer III)
Разделы MPEG-2	Part 1: Системы (Транспортный поток Программный поток) Part 2: Видео (H.262) Part 3: Аудио (Layer I Layer II Layer III Многоканальный MPEG) Part 6: DSM CC Part 7: AAC
Разделы MPEG-4	Part 2: Видео Part 3: HE-AAC Part 6: DMIF Part 10: H.264 Part 11: Описание сцены Part 12: Формат медиафайлов ИСО Part 14: Формат файла MP4 Part 17: Потоковый текстовый формат Part 20: Облегченное приложение воспроизведения сцен (LASeR)
Разделы MPEG-7	Part 2: Язык описания определений (DDL)
Разделы MPEG-21	Parts 2, 3 и 9: Цифровой объект Part 5: Язык описания прав (REL)
Разделы MPEG-D	Part 1: Пространственный звук MPEG

Сжатие аудио
Кодеки	ATRAC Dolby Digital/AC3 DTS Musepack Opus TwinVQ (VQF) Vorbis WMA
Речь/голос	AMBE iLBC IMBE iSAC Nellymoser QCELP RTAudio SILK Siren Speex SVOPC Truespeech
Без потерь	Apple Lossless FLAC La Monkey’s Audio OptimFROG TAK True Audio/TTA WavPack WMA Lossless
Стандарты и форматы	AAC AMR G. 711 718 719 722 723 723.1 726 728 729 729.1 729A HE-AAC MLP MPEG-1 Audio Layer I Layer II Layer III MT9 RealMedia SHN Dolby E

Медиаконтейнеры
Видео/аудио	3GP ASF AVI Bink DMF^[англ.] DPX^[англ.] EVO FLV MP4 MPEG MPEG-PS^[англ.] MPEG-TS MXF Matroska (MKV) Ogg Media Ogg QuickTime RIFF RealMedia Smacker VOB WebM WMV сжатие сравнение
Аудио	AIFF APE AU^[англ.] DSD DXD FLAC MLP MP3 SHN^[англ.] WAV WMA сжатие сравнение
Музыка	MIDI (KAR) Трекерная музыка
Растровые	AVIF DNG FPX FLIF HEIF ICER ICO ILBM JBIG2 JBIG JPEG XR (HD Photo) JPEG XL JPEG/JP2/JPEG-LS MNG EXR PCX PNG PSD PNM Raw TIFF TGA WBMP WebP XCF PGF^[англ.] Анимационные: APNG, GIF Без потерь: BMP Включая сжатие с потерями: BPG
Векторные	SWF AI CDR EPS PS SVG VRML EMF WMF X3D XPS 3D: 3DS Анимационные: SVG
Комплексные	CGM DjVu PDF