Что есть что

Формат сжатия звука aacPlus

Как известно, в качестве формата записи звука для видео в MPEG-4 DVD-форум первоначально утвердил как основной AAC — Advanced Audio Coding, усовершенствованную версию AC-3, более известную как Dolby Digital, которая применяется для многоканальной записи звука на DVD. Формат AAC уже широко, хотя и не так как MP3, используется для сжатия музыкальных программ. Однако он не пригоден для существующих систем с низкой скоростью потока данных, таких как цифровое радиовещание, интернет-вещание (web radio) и мобильные мультимедийные приложения, поскольку имеет достаточно большой поток, которые указанные системы не в состоянии пропустить. Налагаемые ограничения являются системными. Так, в цифровом радиовещании (наземном или спутниковом) ограничивающим фактором выступает общая ширина полосы частот, выделенных для канала. Чтобы обеспечить слушателя достаточным набором привлекательных программ, для каждой из них приходится использовать канал с низким битрейтом. Сходная ситуация и в области мобильной связи. Для интернет-приложений теоретически можно было бы использовать записи с большими битрейтами, но количество абонентов с высокоскоростным доступом ограничено. Поэтому разработчики систем вынуждены использовать высокоэффективные (с точки зрения уменьшения скорости потока) аудиокодеки с малым потоком данных, в основе которых лежит перцептуальная модель слуха человека (такие как МР3 или ААС). Однако использование перцептуального кодирования с низким битрейтом не исключает потерь. Современные методы кодирования предполагают, что «CD-качество» достигается при битрейте 128 кбит/с и выше. Это приблизительно соответствует сжатию 12:1. При скорости ниже указанной использование большинства кодеков приводит к существенной деградации музыкальной программы. Чтобы справиться с поставленной задачей, кодеки или ограничивают полосу или уменьшают стереообраз, то есть частично объединяют информацию двух каналов и делают из них joint stereo. При потоке 64 кбит/с, например, МР3 или ограничивает полосу частотой 10 кГц, или привносит множество артефактов кодирования.

Рис. 1. Пример частотного ограничения типичного сигнала
Рис. 2. Результаты слуховых испытаний EBU для стереозвука 48 кбит/с
Рис. 3. Структура канала передачи сжатого сигнала с использованием SBR

Компания Coding Technjlogies разработала систему улучшения существующих кодеков, позволяющую значительно снизить скорость потока данных. Этот комплексный метод называется SRC (Spectral Band Replication, то есть восстановление спектральной полосы) и позволяет при перцептуальном кодировании с низким битрейтом увеличить полосу сигнала до принятых в аналоговом FM-вещании 15 кГц или даже выше.
   С технической точки зрения, в SRC используется метод, подобный реализованному при записи HDCD. Входной звуковой сигнал обрабатывается SRC-кодеком, который, с одной стороны, выделяет низкочастотную составляющую, а с другой — анализирует связь (корреляцию) между его низко- и высокочастотными составляющими, используя для ее описания очень малый объем данных. Затем низкочастотная составляющая кодируется обычным кодеком, и к этим сжатым низкочастотным данным добавляются полученные ранее SRC-данные, описывающие высокочастотную составляющую. Сходство с HDCD заключается в том, что SRC-данные размещаются в дополнительных полях данных НЧ-сигнала. Это позволяет использовать как традиционные декодеры (в этом случае будет восстановлена только низкочастотная составляющая), так и декодеры с SRC, на выходе которых получается практически исходный сигнал (рис. 3). Метод SRC может быть совместно использован с любым существующим кодеком. В результате его первого объединения с MP3 был реализован алгоритм MP3PRO, значительно улучшивший исходный. Однако наиболее существенного приближения к исходному несжатому сигналу удалось достичь при объединении SRC с ААС. Этот вариант и получил название aacPlus. Для случая передачи сжатой с помощью этого кодека аудиоинформации, например, при скорости 48 кбит/с, для передачи низкочастотной части используется 42 кбит/с, а на SRC-данные приходятся оставшиеся 6 кбит/с.
   Благодаря своей эффективности в передаче качественного звука формат сразу получил достаточно широкое признание: он обеспечивает качество близкое к компакт-диску при стереопотоке 48 кбит/с, высококачественное стерео при потоке 32 кбит/с и качественный моносигнал при 20 кбит/с. А при потоке 128 кбит/с aacPlus обеспечивает передачу многоканального звука формата 5.1. Благодаря своим исключительным характеристикам SRC был выбран еще в 2001 году в качестве эталонной модели для технологии расширения полосы внутри MPEG.
   При независимом тестировании качества восстановления сжатого сигнала, проведенным такими компетентными организациями как MPEG и Европейский союз радиовещателей (EBU), aacPlus превзошел все другие кодеки по такому показателю, как качество сигнала на бит. На графике приведены результаты слепого слухового тестирования различных кодеков интернет-звука специалистами европейского союза радиовещателей, проведенные в 2002 году. Эти испытания включали сравнение работы нескольких популярных кодеков с кодеком aacPlus при разных скоростях потока, в том числе 48 кбит/с, результаты для которого и приведены. Кроме того что aacPlus был признал явным победителем, специалисты EBU отметили, что SRC является в настоящее время единственным способом кардинального улучшения при компрессии звука.
   В 2003 году MPEG определил окончательные спецификации для MPEG-4 High-Efficiency AAC — таково теперь официальное название aacPlus. Кроме того, в интересах цифрового радио и телевещания, а также индустрии звукозаписи предполагается стандартизировать MPEG-2 AAC LC Plus SRC. Это позволит системным операторам вне зависимости от используемого стандарта (MPEG-2 или MPEG-4 AAC) уменьшить необходимую полосу пропускания канала практически вдвое.
   Новый кодек — не замена ААС, а расширяющее возможности его применения дополнение. Теперь уже MPEG-4 High-Efficiency AAC рассматривается в качестве основного звукового кодека для кодирования по стандарту MPEG-4. Его большим преимуществом является также двойная обратная совместимость: это возможность декодировать существующий контент, закодированный кодеком ААС, и уже отмеченная ранее совместимость с существующими ААС-декодерами. Это позволяет производителям аппаратуры и программного обеспечения сразу его использовать. Кроме того, библиотеки и исходный код для кодеров и декодеров MPEG-4 High-Efficiency AAC уже доступны в операционных системах Mac OS X, Win32, Linux, а также множестве DSP.
   Кроме полного декодера HE-AAC для профессиональной и стационарной аппаратуры, усилиями Coding Technjlogies, NEC и Panasonic был разработан и вариант так называемого «маломощного» декодера. В этом случае требуется процессор с производительностью на 40% меньше, но потоки HE-AAC декодируются лишь с незначительными потерями качества звука. Такое решение позволяет максимально широко использовать и HE-AAC в мобильных телефонах и других портативных устройствах для воспроизведения качественного звука.

Сетевое решение
   Распространение предоставления аудиовидеоинформации по сетям сдерживается тем, что для большей части территорий пиковая полоса пропускания этих сетей составляет не более 144 кбит/с, притом что каждый индивидуальный пользователь имеет подключение 40 кбит/с (обычно даже меньше — 28 кбит/с). Объединение экономичного High-efficiency AAC с видео в MPEG-4 позволяет снизить степень сжатия изображения, обеспечивая ему тем более высокое качество без потерь в звуке, и использовать их для передачи при малых скоростях потока.
   
   Coding Technоlogies
   Одна из ведущих компаний в области разработки алгоритмов сжатия звука для специальных применений в системах с ограниченной скоростью передачи данных: мобильных телефонов, цифрового радиовещания и интернета. Эта частная компания основана в 1997 году в Стокгольме, Швеция, и в настоящее время имеет, кроме этого, отделения в Германии и США (в «силиконовой» долине). Среди купивших технологии, предлагаемые Coding Technjlogies, такие известные компании как Thomson Multimedia, Texas Instruments, а также осуществляющая цифровое радиовещание в США XM Radio и интернет-компания MusicMatch.