Какие форматы файлов используют для хранения оцифрованного звука
Существуют различные понятия звукового формата.
Формат представления звуковых данных в цифровом виде зависит от способа квантования цифро-аналоговым преобразователем (ЦАП). В звукотехнике в настоящее время наиболее распространены два вида квантования : импульсно-кодовая модуляция и сигма-дельта-модуляция. Зачастую разрядность квантования и частоту дискретизации указывают для различных звуковых устройств записи и воспроизведения как формат представления цифрового звука (24 бита/192 кГц; 16 бит/48 кГц).
Формат файла определяет структуру и особенности представления звуковых данных при хранении на запоминающем устройстве ПК. Для устранения избыточности аудио данных используются аудиокодеки, при помощи которых производится сжатие аудиоданных. Выделяют три группы звуковых форматов файлов:
- аудиоформаты без сжатия, такие как WAV, AIFF
- аудиоформаты со сжатием без потерь (APE, FLAC)
- аудиоформаты, с применением сжатия с потерями (mp3, ogg)
Особняком стоят модульные музыкальные форматы файлов. Созданные синтетически или из сэмплов заранее записанных живых инструментов, они, в основном, служат для создания современной элетронной музыки (MOD). Также сюда можно отнести форматMIDI, который не является звукозаписью, но при этом с помощью секвенсора позволяет записывать и воспроизводить музыку, используя определенный набор команд в текстовом виде.
Форматы носителей цифрового звука применяют как для массового распространения звуковых записей (CD, SACD), так и в профессиональной звукозаписи (DAT, минидиск).
Для систем пространственного звучания также можно выделить форматы звука, в основном являющиеся звуковым многоканальным сопровождением к кинофильмам. Такие системы имеют целые семейства форматов от двух крупных конкурирующих компаний Digital Theater Systems Inc. - DTS и Dolby Laboratories Inc. - Dolby Digital.
Также форматом называют количество каналов в системах многоканального звука (5.1; 7.1). Изначально такая система была разработана для кинотеатров, но впоследствии была расширена для систем домашнего кинотеатра.
Как всегда, начну со старческого брюзжания. Вот лет двадцать назад… Собственно говоря, двадцать лет назад и выбора-то особо не было.
реклама
Потому что были компакт-диски, которые превращались в WAV-файлы, занимавшие пространство среднего «винчестера» – ну и на ОС немножко места оставалось. И на BBS. И на игры. И на архив файлов. И все. Потому что средний размер жесткого диска тогда составлял какие-то сказочные сегодня 850 мегабайт. Да, именно что 850 – и именно мегабайт. Толчок всему дало появление формата MP3 в 1997 году, и это был очень знаменательный год!
Я очень хорошо помню те времена. Тогда мы с другом «возрадовались до плеши» и принялись активно кодировать компакт-диски в самые популярные 128 кбит/с с joint stereo (это когда фактически пишется один канал, и к нему добавляется информация об отличиях второй дорожки – если они есть). Еще бы, теперь альбом занимал смешные 50-70 мегабайт, и компьютерные пластиковые колонки казались вершиной прогресса. Различные звуковые карты за 200,500 или 800 долларов в журналах казались чем-то страшным и далеким. Зачем? Ведь есть MP3 128 кбит/с, смотрите, какое крутое качество!
Шли месяцы и годы (скорее ближе к месяцам). Менялись колонки, развивался MP3, и мы тогда, юные падаваны старшего школьного и начального студенческого возраста, экспериментировали с битрейтами и появившимся тогда первым конкурентом MP3 – таинственным Vorbis OGG. Сколько часов на самой разной акустике (а мы тогда уже открыли, что даже советская «Вега» уделывала все эти пластиковые недоразумения за десять баксов) было отслушано – не сосчитать.
В итоге выводы выкристаллизовались такие: OGG круче MP3 на средних битрейтах, а на высших все равны. Но преимущество OGG было в том, что на средних битрейтах файл не только лучше звучал, но и занимал меньше места. Недостатком – то, что при всех этих достоинствах OGG питался большим количеством оперативной памяти и ресурсов процессора. А в те времена мощности были, как понимаете, совсем не те.
MSI RTX 3070 сливают дешевле любой другой, это за копейки Дешевая 3070 Gigabyte Gaming - успей пока не началосьПочему я так подробно пишу об отличиях OGG от MP3? Потому что уже начался рассказ про форматы, и все эти выводы справедливы и по сей день. Ну вот, теперь вы знаете почти все про OGG: а больше знать и не надо, поскольку его сегодня поддерживают не так уже много устройств.
И да, небольшой дисклеймер. Я не буду разводить воду про виды квантования и прочие страшные слова: если вам это интересно, то все прекрасно написано в Википедии. И форматов файлов на самом деле намного больше, чем будет перечислено далее. Вопрос в том, что они не только никому неизвестны, но и никем не поддерживаются. Почти.
И еще. Я не буду рассказывать о форматах многоканального звука. На сегодняшний день эта тема все еще в зачатке по причине своей дороговизны. И дисков выпускается мало, и также редко они перекодируются в звук. На коне по-прежнему старое доброе стерео. Очевидно, всем этого хватает. Ну или почти всем, но кто считает?
реклама
Сжатие с потерями и без
Для начала нужно определиться с тем, о чем мы будем говорить. Главное и основное: все форматы звуковых файлов сегодня делятся на:
- Форматы без сжатия (WAV, AIFF);
- Со сжатием без потерь – lossless в простонародье (FLAC, APE);
- Со сжатием с потерями – он же lossy (MP3, OGG).
Все, это была минутка Википедии.
И да, я раскрою вам правду на то, стоит ли тратить терабайты на lossless.
MP3: скорее отстреляться
Конечно, начать надо с MP3. И, перефразируя название фильма, – «и это все об MP3». Безусловно, все вы про него знаете, и быть Капитаном Очевидность здесь не вижу смысла. Все, что воспроизводит звук сегодня, поддерживает MP3, вплоть до максимума.
В чем его главные нарекания и минусы? В основном – в срезе верхних частот и «прореживании» всех остальных.
В этом и проявляется хваленая гибкость формата: можно сделать маленький файл и слушать покромсанную Верку Сердючку из динамика смартфона. А можно сделать большой файл, где сжатие с минимальными потерями и слушать… не на динамике смартфона как минимум.
У MP3 есть один, самый весомый и безусловный плюс, не считая хорошего качества звука и гибкости при кодировании – можно забить на качество и сделать тысячи MP3 128 кбит/с на одной флэшке. Или не забить на качество и сделать несколько сотен в 320 кбит/с.
Но плюс в том, что у него нет DRM и прочих видов защит от копирования, которые редиски-владельцы авторских прав могут ставить на свою музыку.
Отдельного абзаца заслуживает VBR. VBR – это сокращение от Variable BitRate, переменный битрейт. Основная идея VBR – то, что кодек автоматически выбирает нужный битрейт в зависимости от контента. Это происходит еще на этапе кодирования, и главное декларируемое преимущество технологии – меньший размер файла при вроде бы том же высоком качестве (разумеется, кодирование происходит все-таки «вокруг» заданной частоты).
В реальности же качество VBR заметно проигрывает своему оппоненту CBR (Constant BitRate – постоянный битрейт), плюс ко всему заметно нагружает процессор. Конечно, на современных многоядерных ЦП это не так что бы заметно, но – «как-то, доктор, неаккуратненько». В общем, смысл тут прост: VBR лучше не пользоваться, поскольку выигрыш в размерах минимален, microSD сегодня дешевы, HDD тоже не состояние стоят, а проблем от них больше. И, опять же, качество хромает.
Чем сегодня кодируют MP3? На заре формата было очень много разных декодеров, сегодня их тоже можно найти, если постараться, кто-то постоянно тоже изобретает велосипед, но безусловный авторитет уже долгие годы – LAME. Несмотря на стебный перевод названия (вольно – «хромуля»), кодек справляется со своей задачей блестяще.
Какой программой пользоваться для кодирования – тоже понятно, общепринятым авторитетом является грозный EAC (Exact Audio Copy, и он точно соответствует своему названию). И то, и другое распространяется совершенно бесплатно (более того – LAME в принципе встроен почти во все по умолчанию), так что можете попробовать свои силы в кодировании того, что и так уже сто раз кодировано.
реклама
WMA: все плохо, как всегда
Компания Microsoft разработала WMA как альтернативу MP3. Но, как и в случае с платформой Windows Phone, люди посмотрели на него, потыкали пальцем – и забросили на полку.
Потому как файл WMA изобилует мелкими неприятностями, которые сами по себе вроде бы и не так страшны (например, плохая устойчивость к ошибкам: чуть поврежденный файл про кодировании или передаче становится непригодным полностью), но в совокупности WMA становится несерьезным. К тому же, опять же декларировалось, что при меньшем битрейте WMA будет качественным. Серьезно?
Конечно, WMA сегодня поддерживает все, что поддерживает MP3. Конечно, декларируется, что поддерживается lossless-кодирование, начиная с версии 9.1. Ну поддерживается. А дальше-то что? Кто-то этим пользуется?
реклама
Плюс ко всему – в WMA можно зашивать DRM-защиту. От такого фактора потирают жадные лапки правообладатели, но говорят «фи» рядовые пользователи. Еще один гвоздь в крышку гроба WMA.
В общем, формат мутный и явно нежизнеспособный. Как и платформа Windows Phone. Как и Surface. У Microsoft хорошо получалось делать операционные системы, но вот сторонние проекты – слабовато.
Из истории. Говорят, что самые первые опыты по сохранению звука проводили еще древние греки. Они пытались сохранить звук в амфорах. Выглядело это примерно так: в амфору произносили слова и быстро её закупоривали. Увы, не одной такой записи не дошло до наших дней.
В двух словах объясню, откуда берется звук в цифровом формате. В процессе звукозаписи микрофон преобразует механические колебания (собственно звук) в аналоговый электрический сигнал. Аналоговый сигнал в самом общем случае похож на синусоиду, которая всем нам знакома со времен средней школы. В эру аналогового звука именно этот сигнал записывался на различные носители и затем воспроизводился.
С развитием микропроцессорной техники появилась возможность записывать и хранить аудиоинформацию в цифровых форматах. Получают эти форматы с помощью процесса аналого-цифрового преобразования (АЦП).
В ходе АЦП аналоговый сигнал (нашу синусоиду из средней школы) преобразуют в дискретный (проще говоря, разрезают на части). На следующем этапе дискретный сигнал квантуют, т.е. каждому получившемуся отрезку синусоиды сопоставляют цифровое значение. На третьем этапе квантованный сигнал оцифровывают, т.е. кодируют в виде последовательности 0 и 1. Применительно к цифровой звукозаписи оцифровке подвергаются сведения об амплитуде и частоте звука.
На сегодняшний день, для записи и хранения цифровой аудиоинформации, применяют цифровые аудиоформаты. Под аудиоформатом понимают набор требований к представлению звуковых данных в цифровом виде.
При рассуждении о качестве звучания цифровые форматы делят на 3 категории:
- Форматы без дополнительного сжатия (CDDA, DSD, WAV, AIFF и др.);
- Форматы, сжатые без потери качества (FLAC, WavPack, ADX и др.);
- Форматы, в которых применено сжатие с потерями (MP3, AAC, RealAudio и др.).
Звук высокого качества получается при воспроизведении музыки, сохраненной в форматах из первой и второй категорий. В форматах третьей категории, для уменьшения объема данных, намеренно исключают часть информации. Например, информацию о скрытых частотах.
Скрытыми называют частоты, лежащие за пределами диапазона восприятия среднестатистического человека: 20 Гц – 22 кГц. Для аудиофилов этот диапазон в силу индивидуальных психофизиологических особенностей бывает шире.
Для комплектации домашней аудиотеки следует выбирать записи, сохраненные в файлах с расширениями:
Последняя пятилетка дала большой толчок в развитие портативных и стационарных аудио систем, а с этим и поддержку разнообразных цифровых аудио форматов. Крошечные карманные гаджеты обзавелись огромной внутренней памятью, а стационарная аудио техника стала еще умнее и переборчивее. Именно по этому, теперь, мы можем не экономить место на плеере и загружать песни «весом» в 15-30 Мб каждая, а дома, слушать цифровую музыку в качестве, равном по звучанию аналогового винила.
Описание популярных цифровых аудио форматов
И тем не менее, аудио форматы, получившие наибольшее распространение, все еще имеют свои плюсы и минусы, и даже в таком актуальном вопросе, как цифровое аудио, еще не найдена «панацея». Классически цифровые аудио форматы делятся на «сжатый» и «несжатый» поток, а так же форматы типа «lossless», которые исключают потерю звучания.
Аудио формат wav
Waveform Audio File Format (WAVE, WAV, от англ. waveform - «в форме волны») - это формат файлов для хранения записи оцифрованного несжатого аудиопотока. По большому счету, это наиболее распространенный формат для работы в студийной сфере и радиовещании, т.к. позволяет получить самое честное качество звучания.
К примеру, стандартным форматом Audio-CD, является аудиопоток в формате LPCM, с параметрами: 2 канала (стерео), 44 100 Гц, 16 Бит.
Аудио формат mp3
MPEG-1/2 Audio Layer 3 - (MP3) – наиболее популярный цифоровой формат, для хранения сжатого аудио. В формате MP3 используется особый алгоритм, разработанный для значительного уменьшения размера исходного файла. Этот формат позволяет сохранить аудио, близкое к оригинальному звучанию, но благодаря множеству настроек, предельно малых размеров.
В сравнении со стандартным форматом Audio-CD, файл в фомате MP3 и битрейте 128кбит/с, по размеру будет примерно равен 1/11 исходного файла.
Аудио формат flac
FLAC (англ. Free Lossless Audio Codec) — популярный свободный кодек, предназначенный для сжатия аудиоданных без потерь. Что это значит? В отличие от аудиокодеков, обеспечивающих сжатие с потерями, например MP3 или OGG, аудиокодек FLAC не удаляет никакой информации из аудиопотока. Этот формат идеально подходит для аудиофилов, которые собирают собственные музыкальные коллекции и прослушивают музыку на высококачественной аппаратуре.
Аудио формат ogg
OGG – формат, который не получил массовую популярность, но тем не менее, используется достаточно большой аудиторией. Формат OGG, аналогично MP3, сжимает аудио с потерями качества, но принципиально отличается в практических пересчетах конвертации. Это дало возможность получить лучшее качество, при меньшем объеме файла и вывести данный кодек, как абсолютно независимый. Также как и подобные форматы, конвертирующие аудио с потерями, OGG имеет возможность тонкой настройки свойств контейнера.
Аудио формат aiff
Audio Interchange File Format (AIFF) – достаточно универсальный формат аудиофайлов, разработанный компание Apple, применяемый для хранения звуковых данных. Как и его аналог, формат WAV, это несжатое аудио и широко применяется в профессиональной сфере звукозаписи и музыкального продьюсинга.
Файлы с расширением .aiff и .aif, созданные Apple Loops, используются для музыкальных редакторов GarageBand и Logic Audio.
Аудио формат m4a
Apple Losseles (также известный как Apple Lossless Encoder, ALE, или Apple Lossless Audio Codec, ALAC) (m4a) – еще одна разработка от компании Apple. Этот аудиоформат относится к несжатому аудио, обеспечивающему проигрывание без потери качества. Это достаточно специфический формат, который поддерживается преимущественно продукцией от компании-создателя, и в некоторых случаях, как в системных звуках iPhone, где возможно использование исключительно формата m4a.
Читайте также: