Сколько памяти занимает аудиокнига
Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.
Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность "ступенек".
Частота дискретизации. Для записи аналогового звука и его преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т.е. частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее "лесенка" цифрового звукового сигнала повторяет кривую аналогового сигнала.
Частота дискретизации звука - это количество измерений громкости звука за одну секунду, измеряется в герцах (Гц). Обозначим частоту дискретизации буквой f.
Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду. Для кодировки выбирают одну из трех частот: 44,1 КГц, 22,05 КГц, 11,025 КГц.
Глубина кодирования звука. Каждой "ступеньке" присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации b , которое называется глубиной кодирования звука
Глубина кодирования звука - это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.
Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2 b . Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:
В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему - 1111111111111111.
Качество оцифрованного звука. Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим "моно"). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим "стерео").
Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.
1. Рассчитайте объём монофонического аудиофайла длительностью 10 с при 16-битном кодировании и частоте дискретизации 44,1 к Гц. (861 Кбайт)
2. Производится двухканальная (стерео) звукозапись с частотой дискретизации 48 кГц и 24-битным разрешением. Запись длится 1 минуту, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?
3. Производится одноканальная (моно) звукозапись с частотой дискретизации 11 кГц и глубиной кодирования 24 бита. Запись длится 7 минут, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?
4. Производится двухканальная (стерео) звукозапись с частотой дискретизации 11 кГц и глубиной кодирования 16 бит. Запись длится 6 минут, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?
5. При 16-битном кодировании, частоте дискретизации 32 кГц и объёме моноаудиофайла 700 Кбайт время звучания равно:
6. Одна минута записи цифрового аудиофайла занимает на диске 1,3 Мб, разрядность звуковой платы - 8. С какой частотой дискретизации записан звук?
7. Аналоговый звуковой сигнал был дискретизирован сначала с использованием 256 уровней интенсивности сигнала (качество звучания радиотрансляции), а затем 65 536 уровней (качество звучания аудио- CD ). Во сколько раз различаются информационные объёмы оцифрованного звука?
Установка первая. Не бывает идеального формата. Разные типы аудио требуют разных подходов.
Установка вторая. Из из плохого качества невозможно сделать хорошее.
Установка третья. Есть три подхода к сравнению качества – граница различения (тяжеловесы), граница комфортности (бытовое аудио) и граница разборчивости.
Битрейт – один из самых главных показателей измерения цифровых аудиозаписей. Измеряется в килобитах в секунду(для краткости: кбит/c, просто килобит, кбит, кбит в сек, kbps и т.п.).
На пальцах: он отвечает на вопрос “сколько памяти занимает одна секунда аудио”.
Тут уже идут всякие преобразования: в одном байте восемь бит, в одном килобите 1024 бит, в одной минуте 60 секунд, в одном часе 60 минут – и мы приходим к следующим эмпирическим данным:
- битрейт 1400 = 1 час занимает 615 мегабайт на диске
- битрейт 320 = 1 час занимает 141 мегабайт на диске
- битрейт 192 = 1 час занимает 84 мегабайт на диске
- битрейт 24 = 1 час занимает 11 мегабайт на диске
Естественно, все мы хотим экономно использовать место на диске. Вот именно отсюда и начинается война форматов. 11 Мб в шестьдесят раз экономнее 615 Мб. Мегабайты – это цена хранения аудио-записей.
Цену хранения можно выразить и в денежных знаках, разделив стоимость накопителя на его ёмкость. Для архива аудио-записей цена хранения далеко не так критична, как для архива видео-записей.
Также цену хранения можно условно выразить и в человеко-часах, если устройство воспроизведения обладает ёмкостью, гораздо меньшей вашего общего архива аудиозаписей. Требуется время на регулярную перезакачку новых треков в устройство.
Цену хранения можно выразить и в квадратных метрах рабочей площади. 500 аудиодисков займут огромное пространство и потребуют мебельных решений, но один небольшой внешний жёсткий диск поместится в карман.
Если есть разная цена, то возникает вопрос качества: тогда мы предполагаем, что меньший битрейт имеет меньшее качество. Вот мы и подходим к главному вопросу – где граница разумного, где идеальное соотношение “цена/качество”.
Самое грубое деление аудиоформатов в порядке убывания среднего битрейта:
- аудио без сжатия
- сжатие без потерь (losless)
- сжатие с потерями (lossy)
Аудио без сжатия – это чистый сигнал без преобразования, “как есть”, эквивалент WAV или Audio CD. Классические параметры: 1411 кбит/c, частота дискретизации 44100 кГц, 16-битный звук.
Для обычного человека требуется только проигрыватель, который умеет работать с этим форматом (то есть: имеет декодер). Сам “кодер” требуется только для “изготовления” таких файлов.
Сжатие без потерь – обычно используется для коллекционного аудио-материала. В целом считается, что такой формат в точности можно преобразовать обратно в Audio CD.
Чем лучше такое сжатие:
- Экономия места на диске примерно в два раза
- Формат файла предполагает хранение дополнительной информации (исполнитель, альбом, номер трека, наименование трека и т.д.)
Сами форматы такого сжатия отличаются:
- открытостью формата и алгоритмов сжатия
- поддержкой со стороны проигрывателей
- накладными расходами на кодирование, декодирование
- степенью сжатия
Накладные расходы – несущественны для обычного человека, а степень сжатия у кодеков отличается незначительно. Основные игроки: FLAC, APE, WAVPACK, ALAC.
Сжатие с потерями – даёт гораздо большую степень сжатия за счёт отбрасывания малосущественных деталей звука. Чем до меньшего размера файла мы пытаемся сжать, тем больше деталей надо отбросить. Кроме того что детали исчезают, так ещё появляются технические артефакты.
Основные игроки на рынке: MP3, OGG, AAC, WMA. Все они обладают градациями качества – чем выше битрейт, тем ближе качество к оригиналу. На одинаковых битрейтах разные кодеки в разных условиях могут давать разные результаты.
Объяснить на пальцах что такое сжатие с потерями можно на примере сжатия графических файлов в формате JPEG.
В начале – идеально и практически неотличимо (без увеличения).
В серединке – падение качества видно уже невооружённым глазом, но терпеть ещё можно.
В конце – уже деградация качества переходит границы терпения.
Фотография как бы одна и та же. Её размер в пикселях – такой же. Отличия – в качестве (от 100 до 10), ниже 10 – это уже реальный “трэш”.
Различия качества отражаются на в весе:
- оригинал BMP = 230 кб
- сжатие без потерь PNG = 165 кб
- сжатие с потерями JPG 100 = 95 кб
- сжатие с потерями JPG 90 = 36 кб
- сжатие с потерями JPG 80 = 25 кб
- сжатие с потерями JPG 60 = 16 кб
- сжатие с потерями JPG 40 = 12 кб
- сжатие с потерями JPG 10 = 5 кб
Сжатие с потерями – использовать для всего остального. Граница разумного определяется типом материала
Музыкальные записи – формат MP3 с битрейтом от 192 до 320.
Битрейт 192 от битрейта 320 отличить теоретически возможно, но средний битрейт 192 в подавляющем числе случаев находится в зоне комфортного восприятия. Классический низкий битрейт 128 уже уже легко может попадать за границу комфортности восприятия.
Я читал, что граница средняя различения находится в районе 220. Впрочем разный аудио-материал имеет разную границу различения. Чем шире полоса частот – тем больший битрейт требуется, чёткость границ также требует повышенного битрейта. Высокие частоты очень сильно режутся кодеком MP3 – чем ниже битрейт, тем более сильно отрезаются высокие частоты. Способны ли вы различать из наличие – вопрос спорный, так как эти негромкие высокие частоты прячутся за громкими звуками средних частот. Но зато по наличию высоких частот всегда можно отличить реальный материал, от восстановленного (называется “upconvert”).
Значительные искажения можно заметить только на низких и ультранизких битрейтах.
Диктофонные записи, радиозаписи, телевизионные записи – формат MP3 с битрейтом от 64 до 128. Подход следующий – для монофонического звука и голоса можно использовать более низкие битрейты.
Аудиокниги – здесь уже несколько сложнее.
Популярная альтернатива – AAC, он же M4B. У него есть два преимущества по сравнению с mp3. Во-первых, он качественнее передаёт звук на низких битрейтах (40-80). Во-вторых, он способен хранить оглавление внутри одного большого файла. Данный кодек имеет хорошую поддержку со стороны проигрывателей, продвигается больше Apple и iTunes.
Единственно верным способом оценки идеального или сравнимого качества является “слепое” тестирование, то есть сравнение двух образцов “без наклеек”. Именно такой метод позволяет отбросить психологические предубеждения против кодеков и битрейтов.
В плеере Foobar2000 кроме встроенных средств перекодирования из практически любых форматов в практически любые форматы есть и средство для “слепого” сравнения – “ABX Comparator”.
1) Берём два трека, полученного кодированием из одного оригинального файла, и загружаем в ABX.
2) Начинаем слушать, переключаясь между двумя парами треков (A+B=X+Y). А и B – два наших исходных разных трека, и X и Y – те же самые два наших трека, случайно перемешанные.
Цель – угадать, как именно они перемешаны.
3) Выбираем ответ: один из двух вариантов: (X=A, Y=B) или (X=B, Y = A)
4) Повторяем операцию как минимум раз пять, чтобы исключить случайное попадание.
Данный способ сравнения не подходит для сравнения разных весовых категорий – между высокими и низкими битрейтами можно наблюдать существенные различия. Однако такое средство может помочь в оценке границ комфорта.
Все преобразования битрейтов довольно трудоёмко прикидывать “в уме”.
Написал програмку, которая позволяет делать взаимообратные преобразования параметров: битрейт/скорость, объём, длительность.
Здравствуйте. Представляю Вашему вниманию немножко диванной аналитики.
Многие слушают музыку в машине или в общественном транспорте. И вот мне стало интересно, сколько музыки в хорошем качестве поместится на носителе информации белее-менее стандартного объема.
Отметим, что сейчас наибольшее распространение имеют два формата:
- Старый добрый mp3 - формат со сжатием и частичной потерей звуковой информации (той её части, которую обычный средний человек не должен слышать). Лучшее качество достигается с битрейтом 320кб/с
- Не такой старый, но от этого не менее добрый flac - формат сжатия без потери данных, но соответственно занимающий больший объем памяти. Битрейт может зашкаливать за 1000кб/с
В нем 24 песни, продолжительностью 77 минут.
- В формате Flac он занимает 505 Мегабайт, что в пересчёте на минуты составляет 6.5 Мегабайт в минуту или 21 Мегабайт на песню.
- В формате mp3 тот же материал весит 176 Мегабайт, что эквивалентно 2.3 Мегабайтам в минуту или 7.3 Мегабайтам на песню.
Посчитаем приблизительно сколько минут музыки или сколько песен поместится на флешке.
- Если аппаратура читает формат flac, то на 16-ти гиговую флешку поместится примерно 2500 минут (42часа) музыки или 780 песен (78 10-песенных альбома)
- Если использовать формат mp3, то получится ещё веселее - 7100 минут (118 часов) непрерывного звучания или 2200 песен (220 альбомов)
Если надо прикинуть объем звучания применительно к носимому устройству аналогичным образом посчитаем сколько аудилконтента поместится на 1 Гигабайте.
- В формате Flac : 157 минут (примерно 2.5 часа) или 48 песен (около 5 альбомов)
- В mp3 соответственно: 440 минут (около 7.5часов) или 140 песен (14 альбомов)
Итак, наши расчеты показывают, что при использовании mp3 формата 16-ти гиговую флешку с музыкой можно непрерывно слушать около 5 суток.
Качественный же аудиоконтент в формате flac будет воспроизводиться примерно 2.5 часа на каждый занятый гигабайт на устройстве.
А нужный именно Вам размер носителя под Ваш плейлист можно прикинуть в уме или на калькуляторе.
Нередко портативные устройства имеют большие емкости хранения, которые поддерживают десятки гигабайт доступного хранилища данных. Это пространство идеально подходит для того, чтобы взять с собой хороший выбор вашей цифровой музыкальной библиотеки вместе с другими типами мультимедийных файлов. Хотя эти устройства большей емкости устраняют большую часть ограничений аппаратного хранения , все равно полезно учитывать количество песен, которые вы можете добавить в оставшиеся свободные места на концертах.
Длина песен
Большинство современных популярных музыкальных часов имеют продолжительность от трех до пяти минут, поэтому большинство онлайн-оценщиков принимают файлы примерно такой же длительности. Однако в вашей коллекции могут быть и другие вещи, которые могут исказить ваши оценки, такие как ремиксы или оцифрованные 12-дюймовые виниловые синглы. Они могут быть значительно длиннее обычной длины песни, как и оркестровые произведения, оперы, подкасты и аналогичный контент.
Битрейт и метод кодирования
Битрейта используется для кодирования песня имеет большое влияние на размер файла. Например, песня, закодированная со скоростью 256 Кбит / с, дает больший размер файла, чем та же песня, закодированная со скоростью бит 128 Кбит / с. Метод кодирования также может влиять на то, сколько песен поместится на вашем портативном устройстве — файлы с переменным битрейтом создают файл меньшего размера по сравнению с файлами с постоянным битрейтом .
Аудио Формат
Выбор формата аудио для вашего конкретного портативного устройства также является важным фактором, который следует учитывать. Стандарт MP3 может быть наиболее широко поддерживаемым аудиоформатом, но ваше устройство может использовать альтернативный формат, который создает файлы меньшего размера. AAC, например, считается лучше, чем MP3. Обычно он производит звук более высокого качества и более эффективен при сжатии. Этот формат может дать вам больше песен на гигабайт, чем если бы вы использовали только MP3.
Другие форматы , такие как Windows Media Audio, Ogg Vorbis и Бесплатный аудиокодек без потерь, могут давать файлы меньшего размера с более богатыми акустическими свойствами, чем MP3, но стандарт MP3 — за исключением Apple, которая использует AAC — означает, что вы всегда можете воспроизводить MP3, но, возможно, не любого другого типа, в зависимости от используемого оборудования.
Выяснить это
Предполагая, что вы выбрали более универсальный формат MP3 для своей музыкальной библиотеки, есть очень простая формула, которую вы можете использовать, чтобы оценить, сколько песен поместится в 1 гигабайт. Это не точная наука, но она даст вам хорошую идею.
Возьмите длину песни в секундах. Затем умножьте его на битрейт файла. 128 Кбит / с — это стандарт для MP3, но вы также можете найти множество вариантов: 256 Кбит / с и 320 Кбит / с. Теперь возьмите результат и разделите его на результат 8, умноженный на 1024. Он преобразуется из килобит (кб) в мегабайт (МБ). Все вместе это выглядит так:
Это даст вам приблизительный размер для одной песни, но как насчет целой библиотеки. Ну, вы могли бы сидеть и индивидуально подсчитывать все свои песни, но кто бы на самом деле хотел это сделать? Вместо этого возьмите оценку. Предположим, что средняя продолжительность ваших песен составляет 3,5 минуты. Это довольно стандартно. Теперь примените формулу. Не забудьте умножить 3,5 на 60, чтобы получить количество секунд.
В результате получается приблизительная оценка в 3,28 мегабайта (МБ) на песню. Это кажется правильным для вашей библиотеки? Чтобы выяснить, сколько песен размером 3,28 МБ может уместиться в гигабайт (ГБ), разделите 1024 на 3,28, поскольку в одном гигабайте 1024 мегабайта.
Вот оно! Вы можете разместить примерно 312 песен на 1 ГБ памяти.
Если вам действительно не хочется заниматься всей математикой, вы можете помнить, что для MP3 с битрейтом 128 Кбит / с 1 минута звука равна примерно 1 МБ.
Примеры
Предположим, смартфон с 4 ГБ доступного хранилища данных. Если в вашей поп-музыкальной библиотеке в среднем 3,5 минуты на песню со скоростью 128 Кбит / с в формате MP3, у вас будет чуть более 70 часов музыки, что подходит почти для 1250 песен.
При таком же количестве места ваша коллекция симфоний со скоростью 7 минут на дорожку со скоростью 256 Кбит / с дает чуть более 36 часов музыки, в общей сложности 315 песен.
И наоборот, подкаст, воспроизводящий монофонический звук со скоростью 64 Кбит / с и работающий в течение 45 минут на каждый эпизод, дает вам 140 часов разговоров на 190 шоу.
Альтернативы для передачи файлов
Менее распространена загрузка аудиофайлов на портативные устройства, как это было, когда устройства, такие как iPod или Zune, лидировали на рынке, поскольку потоковые сервисы, такие как Spotify и Pandora, стали более распространенными на смартфонах. Если вы столкнулись с проблемой космического пространства, подумайте о том, чтобы отключить библиотеку файлов и сопоставить ваши MP3 с потоковым сервисом. Вы получите выгоду от своей музыки, не теряя места на своем смартфоне. Кроме того, вы часто можете загружать определенные списки воспроизведения, чтобы пройти через те времена, когда у вас нет сотовых или Wi-Fi сигналов.
Другие соображения
Формат MP3 поддерживает теги и обложки альбомов. Хотя эти ресурсы обычно невелики, они добавляют немного дополнительного отступа к разным размерам файлов.
В частности, с подкастами и другими звуковыми дорожками, файл, свернутый из стерео в моно, занимает меньше места, часто практически не влияя на качество прослушивания.
Несмотря на то, что производители звука должны выбрать правильный аудиоформат и битрейт для своей музыки, если вам нужно сократить несколько мегабайт из вашей коллекции MP3, воспользуйтесь программным обеспечением, которое динамически изменяет размеры MP3 или других аудиофайлов.
Читайте также: