Что такое компьютерная техника и технология звукозаписи
Каким был переход от аналогового звука в цифровой? Как инженеры энтузиасты создают искусственный интеллект, способный сочинять музыку и как научить петь «Терминатора»?
Со времён возникновения Пангеи все биологические виды на планете Земля стремятся воспроизводить звук, а с начала антропогенового периода создавать звуки начал и первый человек. Сейчас трудно представить, на что был похож первый звук изданный видом Homo, но одно совершенно ясно, он точно был. Более поздние археологические находки, например наскальные рисунки эпохи мезолита, говорят нам о возникновении первых духовых инструментов.
Долгие годы эволюции, войн, эпидемий не сломали человеческую веру в прекрасное и в культуре Шумеров появились первые письменные символы для написания музыки. А позже, спустя десятки веков, монах бенедиктинец Гвидо д’Ареццо сформулировал написание нот таким, какими они пришли в современную пятилинейную тактовую нотацию, которой мы пользуемся и по сей день.
За XX век человек изобрёл много всего (как ему казалось) интересного, включая газовые камеры, ядерную бомбу и интернет, и хотя музыка тоже претерпела многие изменения, в целом она осталась такой же, всё той же надеждой на лучшее, что не угасает в человеке на протяжении всего его существования.
XXI век и быстрый технологический скачок начали диктовать новые правила развития музыкальной индустрии. В дело вступил искусственный интеллект. Если быть точным, он стал применяться гораздо раньше во время перехода от аналоговой магнитной аудиозаписи к цифровой, одним из первых подобных проявлений аудио-инженерной мысли была цифровая звуковая рабочая станция Fairlight CMI, созданная в 1979 году талантливым австралийским инженером Питером Вогелем.
Она представляла собой полноценную рабочую станцию, симбиоз синтезатора, сэмплера и секвенсора с возможностью сохранения информации на дискеты. Она состояла из целого набора компонентов, системного блока с преобразователем цифрового сигнала в аналоговый и обратно (ADC/DAC) с впечатляющими даже по сей день частотными характеристиками и сэмплера с возможностью расширения памяти, светочувствительного монитора с пером для рисования линий, символьной клавиатуры и клавишных.
Синтез звука происходил методом аддиктивного синтеза (синтез Фурье), также можно было работать над нарезанными в цифровой форме сэмплами и рисовать синусоидальные волны специальным световым пером на мониторе. Считается что именно этот инструмент дал начало всем DAW — программно-аппаратным и компьютерным цифровым аудио комплексам для создания музыки. Так же можно вспомнить его легендарного американского брата Synclavier от компании New England Digital неоднократно менявшего форму и комплектацию на протяжении всей истории выпуска.
С помощью этого программно-аппаратного комплекса создавали свою музыку такие легендарные музыканты как Frank Zappa, Depeche Mode, Kraftwerk. В отличии от австралийского родственника, этот экземпляр приобрёл более широкую коммерческую известность и с успехом использовался на многих студиях мира.
В конце XX века неожиданную популяризацию получают настольные компьютеры. В числе первых моделей, имевших коммерческий успех были Apple Macintosh, Atari ST и Amiga. Разработчики компьютерного софта, чувствуя наступление новой эры музыкального продакшна, переходят к разработке аудио программ для редакции аудио сэмплов для сэмплеров E-mu Emulator II и Akai s900.
В 1989 компания Sonic Solutions запускает производство первой профессиональной нелинейной системы цифрового аудио редактирования, основанной на компьютере The Maс IIfx с интегрированным управлением цифрового аудио-редактора U-matic Player от компании Sony. Эта комбинация компьютера, аудиософта и аудио-цифрового железа была одним из ранних примеров коммерческого применения того, что сейчас принято называть Digital Audio Workstation или DAW, так, ещё до выпуска в серийное производство система была испытана в подразделении George Lucas’ Spocket Systems, занимавшимся саунд-дизайном фильмов.
К началу XXI века с развитием компьютерных технологий и операционных систем именно компьютерные аудио-цифровые рабочие станции (Softwar DAW) получили широкое распространение, не вытеснив программно-аппаратные комплексы (integrated DAW), но заняв свою прочную нишу в этом сегменте инструментов для создания музыки. Эту точку на бесконечной ленте времени можно смело считать периодом проявления искусственного интеллекта в музыке.
Первые DAW компьютерные
В 1991 году большинство студий в мире приобрели программное обеспечение Pro Tools от компании Digidesign, созданное по образцу традиционного метода и потока сигнала в большинстве аналоговых записывающих устройств. Большая часть DAW тех времён разрабатывалась на базе системы Apple Mac. В 1992 году начали появляться первые DAW для компьютеров с системой Windows от таких разработчиков как Soundscape Digital Technology, Echo Digital Audio, IQS Innovative Quality Softwar. Стоит отметить, что все DAW того времени использовали периферийные устройства для обработки звука DSP.
Что же такое технология DSP? Коротко, это процесс преобразования аналогового сигнала в цифровой формат — Digital Signal Processing, в котором ими можно математически манипулировать, прежде чем преобразовать обратно в аналоговый. Например, возьмём на гитаре низкую ноту Ми. Звуковая волна этой низкой ноты Ми имеет фундаментальную чистоту 80Гц. В DSP этот сигнал 80Гц преобразуется в цифровой форме и дискретизируется с частотой 96 кГц. Теперь представьте процесс сэмплинга, как 96 000 снимков высокого разрешения сигнала, которые выражены 96 000 различными числами, каждым из которых можно математически манипулировать.
Вычисления производятся DSP чипом, запрограммированным инженером. В аналоге, для достижения определённой эквализации звуковой волны может потребоваться очень сложная и трудоёмкая схема, DSP же этот процесс упрощает. По сути, DSP это автономный процесс, в котором мы можем принять сигнал и в течении заданного периода времени. Мы можем сделать всё, что захотим, математически, прежде чем преобразовать его в аналоговый. Предела преобразованиям нет.
В 1993 году немецкая компания Steinberg выпустила Cubase Audio для Atari Falcon 030. Эта версия внедрила встроенные DSP эффекты с 8 дорожечным рекордером и использовала только нативное оборудование. Первым программным продуктом на базе Windows был представлен Samplitude, разработанный ранее для Commodore Amiga.
В 1996 году Steinberg совершает прорыв в области кодировки и, внедряя новую технологию VST (Virtual Studio Technology), являет на свет Cubase VST c 32 дорожечным цифровым аудио рекордером на базе Apple Macintosh, без необходимости использования какого либо периферийного DSP. В Cubase был смоделирован весь интерфейс DLT-LTO рекордера для записи и редактирования, многоканальный микшерный пульт и рэковая стойка эффектов. Это продвинуло DAW на новый уровень и дало начало всем современным системам Software DAW, а главное это внедрение новой технологии VST plug-in, которая даёт возможность с помощью компьютерного алгоритма обрабатывать цифровой сигнал в реальном времени. В 1999 году Steinberg, используя совместные с компанией Propellerhead наработки, развивает технологию в VSTi plug-in, плагин, позволяющий программно моделировать музыкальные инструменты. Тогда же выходит первый стандартный инструмент для Steinberg Cubase – программный синтезатор Neon.
В 2004 году те же мастера кодировки в области обработки цифровых сигналов Steinberg совместно с компанией Yamaha внедряют софт Studio Connection, который создаёт связь между программой Cubase и музыкальными инструментами Yamaha. Таким образом была налажена связь между компьютерной программой и музыкальным инструментом.
Игры разума
В 2000 году при содействии корпорации Yamaha в Барселонском университете Помпеу Фабра были разработаны принципы обработки сигнала, благодаря которому стал возможен полный синтез речи по правилам. В последствии эти наработки были использованы при создании коммерческого продукта Yamaha Vocaloid, способного синтезировать голос поющего человека на основе введённых данных мелодии и текста. Синтез осуществляется путём моделирования речевого тракта с помощью артикулярного и формантного синтеза. 4 версия Vocaloid используется вокалистом Mega-Watts из известной кавер-группе Compressorhead, полностью состоящей из роботов.
Группа возникла в 2013 году и первоначально состояла из четырёхрукого ударника Stickboy, хай-хэта Junior и гитариста Fingers, использующих миди-интерфейс и подключенных к DAW, позже к ним присоединился бас-гитарист Bones, основанный на одноплатном Panda ES, а в 2017 группа пополнилась новыми участниками вокалистом Mega-Watts и ритм гитаристкой Hellga Tarr. Участники с большим успехом проводят туры по всему миру на различных фестивалях. Место менеджера PR и HR специалиста пока ещё остаётся за биологической единицей— человеком, но, учитывая какими темпами искусственный интеллект интегрируется в среду музыкальной индустрии, скоро он не понадобится.
В 2010 году команда специалистов доктор Аджэй Капур и Майкл Дарлинг из Калифорнийского института искусств представила проект под названием Karmetik Machine Orchestra, являющийся роботом, самообучающимся и исполняющим музыку на аналоговых инструментах.
Современный искусственный интеллект уже достиг того уровня, когда немного подучившись у своих создателей, способен сам сочинять и исполнять свои музыкальные композиции. Система обрабатывает огромное количество музыкальных композиций. Запоминает и упорядочивает параметры множества звуковых сигналов, скормленных ей и создаёт свою композицию.
В 2016 году искусственный интеллект на основе нейросетей от научно-исследовательского подразделения Sony Computers Science Laboratories совместно с французским композитором Бенуа Карре написал песню в стиле The Beatles. Искуственный интеллект (в дальнейшем ИИ) под названием Flow Mashines написал трэк Dady’s Car после изучения более 13 000 различных композиций. Программа сочиняла музыку, а Карре писал текст. Стоит заметить, что всё же здесь ещё оставался человеческий фактор, ведь ИИ писал пустую мелодию и без человека она не была бы подогнана под текст. В декабре 2016 Франсуа Паше, являющийся руководителем той же Sony SCL, представил алгоритм DeepBach, который уже без участия человека писал симфоническую музыку только лишь на основе прослушивания произведений известных классических композиторов.
Технологический гигант Google тоже решил не отставать от своих конкурентов и запустил проект Google Magenta, работающим на основе алгоритма генерации музыки Perfomance RNN. Этот ИИ полностью сам задаёт параметры для будущих композиций, но результаты пока оставляют желать лучшего, музыка получается смешанная, неритмичная и вообще написание полноценных композиций остаётся проблемой, так как ИИ не может научиться работать с аккордами.
В августе 2017 компания Amper представила свою версию одноименного ИИ, написавшего композицию Break Free для американской певицы Тарин Саутерн. Стартап изначально планировавшийся для использования в коммерческих целях для создания музыки к рекламным роликам и видео-блогинга получил весьма внушительные инвестиции и планирует развивать продукт дальше, выводя его на новый уровень. Алгоритм этого ИИ может мгновенно выдавать мелодии по заданным параметрам, правда композиционная и звуко-режиссёрская составляющая всё ещё остаётся за человеком, так как алгоритму пока вообще не известно понятие структуры песни.
В том же году Джон Эдс из легендарной студии Abbey Road, где когда-то записывали большинство своих альбомов группа The Beatles, представляет ИИ Abbey Road Red, а уже известный по работе в Sony SCL Франсуа Паше начинает сотрудничать с компанией Spotify, использующей в своих проектах алгоритмы распознавания и запоминания музыки.
Как мы видим, развитие ИИ в музыкальной индустрии идёт очень бурно. Одни технологии быстро сменяются другими и казалось уже ничто не может удержать технологический бум. Но за этим всем конечно же стоят человеческие амбиции и погоня за прибылью. Музыка перестаёт быть как таковой. Музыка, написанная ИИ, лишена смысла, в ней отсутствует та самая неразгаданная учёными творческая энергетика человека, так присущая всем легендарным композициям, которые будут звучать в проигрывателях даже через сотни лет и возможно именно их человек возьмёт с собой на последний корабль с погибающей Земли. Тут важно рассматривать конкретные причины создания композиций.
Для рекламного и презентационного использования данная технология открывает широкие возможности. Компании, рекламные агентства и прочие, продвигающие какой либо продукт, люди избавятся от необходимости воздействия с композитором-аранжировщиком и удешевят производственный процесс. Что касается написания популярной музыки, тут всё гораздо сложнее. Мы просто рискуем получить море штампованной безынициативной однообразной музыки. Хотя, если рассуждать философски, человек просто боится лишения природной монополии на творчество.
Послушав большинство современных поп-исполнителей, иногда даже хочется чтобы Искусственный Интеллект поскорее в полную силу вступил в творческий процесс, может хоть у него получится сделать что-то стоящее, а то человек, судя по стилистике и композиционной составляющей новых песен, явно зашёл в тупик…
До появления портативных источников воспроизведения звука, цифрового сигнала и музыки, какой мы ее представляем сегодня, звукозапись прошла долгую и увлекательную историю развития. Сегодня мы поговорим о том, как всего за 100 с небольшим лет человек перевернул понимание звукозаписи: от громоздких архаичных фонографов до современных ультракомпактных плееров.
Механическая запись мелодии.
Природа человека такова, что он попросту не представляет жизни без звуков, гармонии и музыкальных инструментов. На протяжение нескольких тысячелетий музыканты оттачивали свое мастерство в игре на лире, варгане, лютне или цистре. Но для того, чтобы усладить слух высокопоставленных господ всегда требовалось присутствие труппы музыкантов. Так возникла необходимость записать музыку с возможностью ее дальнейшего воспроизведения без участия человека.
Вплоть до XIX века именно изобретения братьев Бану Муса остается единственным доступным способом программируемой звукозаписи. Продемонстрированный в XIII веке механический карильон, использующий тот же принцип что орган Бану Муса, но с установленными колоколами, был очень скоро забыт.
Эра механической звукозаписи.
Записанный звук впервые можно было воспроизвести, используя то же устройство, на котором и производилась сама запись. Увы, механической энергии было недостаточно для получения номинального уровня громкости.
Фонограф Эдисона сумел перевернуть тогдашний мир с ног на голову: сотни изобретателей стали экспериментировать с использованием различных материалов для покрытия цилиндра-носителя, а в 1906 году состоялся первый публичный концерт-прослушивание. Фонографу Эдисона аплодировал переполненный зал. В 1912 году мир увидел дисковый фонограф, в котором вместо привычного воскового валика стал использоваться диск, значительно упростивший конструкцию.
Появление дискового фонографа хоть и имело интерес общественности, с точки зрения эволюции звукозаписи практического применения так и не нашло. С 1888 года Эмиль Берлинер начал активно развивать собственное видение звукозаписи с помощью собственного устройства – граммофона.
В качестве альтернативы восковому барабану Берлинер предпочел более прочный целлулоид. В 1887 году пластинки изготавливают из шпата, сажи и шеллака. Принцип записи оставался прежним: рупор, звук, колебания иглы и равномерное вращение диска-пластинки.
Эксперименты со скоростями вращения записываемого диска позволили увеличить время записи одной стороны пластинки до 2-2,5 минут при скорости вращения в 78 оборотов за минуту. Записанные диски-пластины помещались в картонные чехлы (реже кожаные) из-за чего в дальнейшем получили название альбомов – внешне они очень напоминали фотоальбомы с достопримечательностями городов, повсеместно реализуемых в Европе.
Заменой громоздкому граммофону стал усовершенствованное и доработанное в 1907 году Гильоном Кеммлером устройство – патефон.
Маленький встроенный в корпус рупор, возможность размещения всего устройства в одном компактном чемодане привели к быстрой популяризации патефона. В 40-х года выходит компактная версия устройства – мини-патефон, получивший особую популярность среди солдат.
Эра электромеханической записи.
Научно-технический прогресс не стоял на месте и с появлением электричества эволюция звукозаписи начала свое стремительное развитие. В 1925 году начинается эра звукозаписи с использованием микрофона, электродвигателя (взамен пружинному механизму) для вращения пластинки и, сначала пьезоэлектрический, а затем более совершенный магнитный звукосниматель.
Арсенал устройств, позволяющих осуществлять как звукозапись, так и ее дальнейшее воспроизведение пополняется модифицированной версией граммофона – электрофоном. Появление усилителя позволяет вывести звукозапись на новый уровень: электроакустические системы получают громкоговорители, а необходимость в форсации звука через рупор уходит в прошлое. Все физические усилия человека теперь выполняет электрическая энергия.
Вопрос длительности звукозаписи был впервые решен советским изобретателем Александром Шориным, который в 1930 году предложил в качестве оперативной записи использовать кинопленку, проходящую через пишущий электрический узел с постоянной скоростью. Устройство получило название шоринофона, но качество записи оставалось пригодным исключительно для дальнейшего воспроизведения голоса. Но на 20 метровой киноленте теперь можно было разместить 1 час записи.
Эра магнитной звукозаписи.
История развития магнитной звукозаписи практически все время шла параллельно механическим способам записи, но оставалась в тени вплоть до 1932 года. Еще в конце XIX века, вдохновленный изобретением Эдисона американский инженер Оберлин Смит занялся изучением вопроса звукозаписи. В 1888 году выходит статья, посвященная использованию явления магнетизма при звукозаписи. Датский инженер Вальдемар Поульсен, после десяти лет экспериментов в 1898 году получает патент на использование стальной проволоки в качестве звуконосителя.
Так появляется первое устройство звукозаписи, в основе которого лежал принцип магнетизма – телеграфон. В 1924 году изобретатель Курт Штилле совершенствует детище Поульсена и создает первый диктофон на основе магнитной ленты.
1928 год, немецкий инженер Фриц Пфлеймер получает патент на использование магнитного порошка с целью напыления на бумагу и дальнейшим использованием для магнитной записи. Увы, через 8 лет Национальный суд Германии признает патента Пфлеймера плагиатом на принципы звукозаписи, изложенные еще в 1898 году Вальдемаром Поульсеном. В дальнейшую эволюцию магнитной записи вмешивается компания AEG, выпустившая в середине 1932 года прибор Магнитофон-К1.
Применяя в качестве покрытия пленки оксид железа, компания BASF производит настоящую революцию в мире звукозаписи. Использование подмагничивание переменным током, инженеры получают совершенно новое качество звучания: сниженное до 60 дБ соотношение сигнала/шума и преодоление верхней планки звукочастотности в 10 кГц.
Начиная с 1930 и вплоть до 1970 года мировой рынок представлен катушечными магнитофонами самых различных форм-факторов и с самыми различными возможностями. Магнитная лента открывает творческие двери перед тысячами продюсеров, инженеров и композиторов, которые получили возможность экспериментировать со звукозаписью не в промышленных масштабах, а прямо в собственной квартире.
Еще больше поспособствовало таким экспериментам появление в середине 1950-х многодорожечных магнитофонов. На одну магнитную ленту стало возможным производить запись сразу нескольких источников звука. В 1963 году выходит 16-дорожечный магнитофон, в 74-м – 24-дорожечный, а через 8 лет компания Sony предлагает улучшенную схему цифровой записи DASH-формата на 24-дорожечный магнитофон.
Уже через год в Ганновере запускается серийное производство компактных кассет. В 1965 году компания Philips инициирует производство музыкальных кассет, а в сентябре 1966 года на территории США в продажу поступают первые отголоски двухгодичных промышленных экспериментов компании. Малонадежность конструкции и сложности, которые возникали с записью музыки, вынуждают производителей к дальнейшим поискам эталонного носителя информации. И поиски удачно окончились для компании Advent Corporation, представившей в 1971 году кассету на основе магнитной ленты, при производстве которой использовался оксид хрома.
Эра лазерной-оптической звукозаписи.
Идеи звукозаписи, заложенные еще в конце XIX века Томасом Эдисоном, во второй половине XX века привели к использованию лазерного луча. В основу оптической звукозаписи лег принцип образования на компакт-диске спиральных дорожек, состоящих из гладких участков и впадин-питов. Лазерная эра позволила представить звуковую волну в сложную комбинацию нулей (гладких участков) и единиц (питов).
В марте 1979 года компания Philips демонстрирует первый прототип компакт-диска, а уже через неделю нидерландский концерн заключает соглашение с японской фирмой Sony, утвердив новый стандарт аудиодисков. В 1982 году Philips презентует первый проигрыватель компакт-дисков, по качеству воспроизведения превзошедший все доселе представленные носители.
Параллельно с развитием CD-дисков уверенно развивалось и кустарное производство – копирование носителей. Звукозаписывающие компании впервые задумались о необходимости цифровой защиты данных с использованием шифрования и водяных знаков.
Эра магнитооптической записи
Несмотря на универсальность и удобство использования компакт-дисков, данный носитель имеет внушительный перечень недостатков. Одним из главных является их чрезмерная хрупкость и необходимость бережного обращения. Время записи CD-носителя также существенно ограничено и индустрия начала искать альтернативный вариант.
Появление на рынке магнитооптического минидиска так и осталось незамеченным рядовыми почитателями музыки. MiniDisk, разработанный компанией Sony еще в 1992 году, так и остался достоянием звукорежиссеров, исполнителей и людей, напрямую связанных со сценой.
При записи минидиска используется магнитооптическая головка и лазерный луч, прорезающий на высокой температуре участки с магнитооптическим слоем. Одновременно с этим изменяется при помощи электромагнитного импульса изменяется намагниченность слоя с проявлением тех же питов (пробоин), что и при записи CD-диска. Главным преимуществом минидиска перед традиционным CD является его улучшенная защищенность и более длительный срок эксплуатации.
В 1992 году компания Sony представила и первый плеер для формата носителей типа минидиск. Модель плеера (впрочем, как и сам формат) получила особую популярность в Японии, а вот за пределами страны как первенец – плеер Sony MZ1, так и его усовершенствованные потомки, принят не был.
Так или иначе, совместить занятия спортом и прослушивание компакт или минидиска скорее подходит исключительно для более стационарного использования. Даже с портативным CD-проигрывателем представить себе активное занятие спортом на природе не представляется возможным. И решением этой проблемы инженеры начали заниматься еще в начале 90-х годов прошлого века.
Эра цифровой звукозаписи.
В 1995 году в институте Фраунгофера был разработан революционный формат сжатия аудиоданных – MPEG 1 Audio Layer 3, который получил сокращенное имя mp3. Главной проблемой начала 90-х в сфере цифровых носителей оставалась недоступность достаточного размера дискового пространства для размещения цифровой композиции. Средний размер жесткого диска самого навороченного персонального компьютера на тот момент с трудом превышал несколько десятков мегабайт.
Несжатый формат WAV (WAVE).
WAV файлы достаточно большие, что делает этот формат неудобным для обмена по сети Интернет, и это сильно подрывает его популярность. Однако, этот формат – как правило, чаще всего используется для сохранения первозданного вида для файлов высокого качества в таких случаях, где размер свободного дискового пространства не является ограничением. Он также используется в программах для редактирования аудио, где экономят время на сжатии и распаковке данных.
Использование формата WAV является общепринятым, благодаря его простоте и простой структуре, которая в большой степени основана на формате файлов RIFF. Благодаря этому, формат WAV не испытывает притеснения среди различного программного обеспечения или аппаратных плееров, он поддерживает практически везде.
Назло огромному размеру данных несжатого WAV, этот формат иногда используется для радиовещания, особенно для адаптированных безкассетных систем. Радио BBC (BBC Radio) в Соединенном Королевстве использует 44.1 кГц, 16 бит, стерео аудио данные как стандарт в их системе VCS. Система ABC “D-Cart”, которая разработана Австралийским радиовещателем, использует 48 кГц, 16 бит, стерео аудио данные, что идентично цифровым аудио кассетам (DAT).
Спустя два года, за нарушение авторских прав со стороны музыкальной индустрии сервис был закрыт, но механизм был запущен и эра цифровой музыки продолжала развиваться уже бесконтрольно: сотни пиринговых сетей, регулировать работу которых стало настоящей головной болью для правительства.
В 1997 году на рынок выходит первый программный плеер Winamp, разработкой которого занималась компания Nullsoft.
Появление кодека mp3 и дальнейшая его поддержка со стороны производителей CD-плееров ведет к постепенному снижению продаж CD-дисков. Выбирая между качеством звучания (которое реально ощущал лишь небольшой процент потребителей) и максимально возможным количеством композиций, которые можно записать на одну CD-болванку (в среднем, разница составляет около 6-7 раз), слушатель выбирал последнее.
Первым mp3-проигрывателем стал миниатюрный MPMan, выпущенный южнокорейской компанией SaeHan в марте 1998 года. MPMan был представлен в двух версиях: с 32 и 64 мегабайтами встроенной памяти, ценник на модель стартовал от $400.
Формат loseless FLAC.
Разработка была начата в 2000-м году Джошем Колсоном. Формат битового потока был зафиксирован, когда FLAC вошел в бета стадию с версией 0.5, выпущенной 15 января 2001 года. Версия 1.0 была выпущена 20 июля 2001 года.
17 сентября 2007 года была выпущена версия 1.2.1, в которой была добавлена возможность сохранять AIFF и RIFF цепочки метаданных при помощи ключа --keep-foreign-metadata.
После прошествия еще полутора лет 25 ноября 2014 года вышел в свет релиз 1.3.1 с более серьезными изменениями. В этот раз была улучшена производительность кодирования при использовании SSE и AVX расширений. Также была улучшена производительность декодирования для всех разрядностей, но особенно для 24 бит в связке с архитектурой IA32.
Формат FLAC поддерживает только целочисленные сэмплы. Это позволяет избежать неточностей нецелочисленной арифметики, таким образом, это дает гарантию сжатия без потерь. На вход кодер может принимать от 4 до 32 бит на сэмпл, любую частоту дискретизации от 1 Гц до 655 350 Гц с шагом в 1 Гц, а также любое количество каналов в диапазоне от 1 до 8. Каналы могут быть сгруппированы в случае стерео или 5.1 звука для извлечения выгода от межканальных корреляций и, тем самым, увеличивая степень сжатия звука. FLAC проверяет контрольные суммы CRC для обнаружения испорченных фреймов в тех случаях, когда формат используется в потоковом протоколе. Помимо этого, в тэге с заголовком STREAMINFO хранится полный MD5 хэш необработанных PCM аудио данных. FLAC допускает диапазон Rice параметра от 0 до 16. FLAC поддерживает ReplayGain.
Портируется на многие системы и платформы
Исходный код открыт и легко лицензирован
Быстрое декодирование, высокая независимость от уровня сжатия
Аппаратная поддержка (PhatBox, Kenwood MusicKeg, Rio Karma и другие)
Испорченные файлы могут быть частично восстановлены
Менее эффективное сжатие, чем у некоторых других современных кодеков (APE (Monkey’s Audio), LPAC, OptimFROG)
Коэффициент производительность/сжатие приблизительно такой же как и у WavPack (однако, WavPack быстрее), и на 1%-2% хуже, чем у других современных кодеров, таких как APE (Monkey’s Audio) и OptimFROG.
Декодирование формата FLAC очень нетребовательно к ресурсам процессора, что делает этот формат идеальным для воспроизведения на различных портативных устройствах.
В 2003 году на рынок врывается компания Apple, предложившая распространение легальных цифровых копий композиций посредством магазина iTunes Store. Общая база композиций в онлайн-магазине на момент презентации составляла свыше 200 000 треков. Сегодня эта цифра перевелила за отметку в 20 млн. Подписав соглашения с такими лидерами звукозаписывающей индустрии, как: BMG, Sony Music Entertainment, Warner, Universal и EMI, компания Apple открыла совершенно новую страницу в истории звукозаписи, которую мы продолжаем создавать и сегодня.
Попробуйте в наше время приступить к записи альбома без компьютера. Кто-то сейчас сразу же скажет: «Ничего страшного, раньше же писали отличные альбомы без компьютеров и прочих гаджетов, так что и я смогу». Да, несомненно так оно и было, но стоит помнить, что и альтернатив раньше как таковых не было, а потому писали, как могли.
Отрицать важность технического прогресса как минимум бессмысленно. А ведь цифровые технологии уже в плотную подошли к качеству аналогово оборудования, нравится вам это или нет. Редакция нашего сайта решила устроить небольшой экскурс в историю и вспомнить, как же все начиналось более 60 лет назад.
1951 год. Первый компьютер для записи музыки
Верите вы или нет, но впервые компьютеры стали использоваться для записи музыки еще в далеком 1951 году. В Манчестерском университете были обнаружены самые первые записи, сделанные на компьютере Ferranti Mark 1. Ими стали «God Save The Queen», «Baa Baa Black Sheep» и урезанная версия «In The Mood». Революция началась!
1957 год. Макс Мэтьюз пишет музыку
Мэтьюза часто называют одним из величайших пионеров компьютерной музыки. Среди его первых достижений в этой области стало написание музыки с помощью программы. На тот момент он работал в Bell Labs в США, а результатом послужил 17-секундный аудиотрек, который был исполнен в Нью-Йорке на компьютере IBM 704.
1982 год. Commodore 64
С появлением Commodore 64 компьютерная музыка выходит на новый уровень. В компьютере был установлен звуковой чип SID (Sound Interface Device), который позволил пользователям создавать музыку. Следует отметить, что саунд, которого позволял добиться звуковой чип SID, популярен и по сей день – для Mac и PC доступны эмуляторы.
1983 год. Рождение MIDI
Создание MIDI (Musical Instrument Digital Interface) имеет неоценимое значение для всей музыкальной индустрии. Этот новый протокол позволял соединить компьютер с другим оборудованием. Если бы не MIDI, история развития компьютерных технологий в музыке была бы совершенно иной.
1985 год. Atari выпускает ST
В середине 1980-х каждый электронный музыкант хотел владеть Atari ST. Компьютер был оснащен MIDI-интерфейсом, что делало его идеальной платформой для всех, кто хотел подсоединить внешнее оборудование к своему компьютеру.
1989 год. Steinberg выпускает Cubase
Начало 1990-х годов. Появление аудиозаписи
Если раньше для написания музыки на компьютере мог использоваться только MIDI-интерфейс с подключенным внешним устройством, то теперь компьютер наконец стал полноценным аудиозаписывающим устройством. Steinberg выпускает Cubase Audio для Mac в 1991 году, а спустя 2 года улучшенную версию для Atari Falcon.
1991 год. Звуковая карта Sound Blaster Pro
В 1989 году Creative Labs (Creative Technology) выпускает первую чрезвычайно успешную звуковую карту Sound Blaster. Два года спустя выходит Pro-версия, в которой добавилась возможность стереозаписи с чистотой дискретизации 44.1 кГц. Теоретически это позволяло использовать домашний компьютер для записи файлов, качество которых было бы сопоставимо с качеством аудио CD.
1997 год. VST
С выпуском Cubase VST (Virtual Studio Technology) стало возможно не только записывать несколько звуковых дорожек на компьютер, но и обрабатывать их с помощью подключаемых эффектов. Вскоре и другие разработчики программного обеспечения начали оснащать свои продукты подобной функциональностью.
1999 год. Первые полноценные VST-плагины и VST-инструменты
Приверженность Steinberg к инновациям была продемонстрирована еще раз, когда был выпушен Cubase VST 3.7. Появилась возможность подключения программных инструментов напрямую в DAW (Digital Audio Workstation). А ведь сегодня мы уже привыкли принимать это как должное.
2000 год. Запуск первой версии Reason
Технологии современной звукозаписи за последние 30 лет существенно изменились. Еще в 90-х годах создание профессиональной студии обходилось в непомерную сумму и требовало покупки очень дорогого оборудования. Основная проблема была в том, что запись производилась на аналоговое оборудование, что приводило к потерям из-за невозможности точной настройки.
Особенности цифрового оборудования для студии
Цифровое оборудование дает возможность точнейшей подстройки с автоматическим удержанием параметров и копирования «один к одному». Стоимость современного оборудования для записи звука также существенно снизилась. Например,в московской студии «ЧЕМОДАНОВ ПРОДАКШН» песня на заказ в подарок стоит всего 4,5–15 тысяч рублей. В конце 1980-х и начале 1990-х подобная услуга обходилась в сумму многомесячного заработка хорошо оплачиваемого специалиста.
Несмотря на быстрое развитие технологий, большинству пользователей достаточно получения аудиофайлов со значениями звука в 16 бит и 44,1 КГц. Это стандартные показатели, основанные на способности человека воспринимать такой звук как единый во всем диапазоне частот.
Обработка звука повсеместно производится на компьютерах. Для организации вполне приличной домашней студии вполне достаточно затрат в диапазоне 1–2 тысячи долларов на компьютерное «железо» и 1,5–3 тысяч долларов на профессиональное программное обеспечение.
Аналоговая часть
Вся работа по обработке и сведению звука проводится на компьютере. Аналоговых устройств осталось не так много. Это микрофон, колонки, кабели, звукосниматель, предусилитель и микшер.
Звук – это изменение давления в виде волны, распространяющейся в воздухе. Чтобы осуществить запись, акустические колебания преобразуются в электрические сигналы. Для этого создается копия воздушной волны в виде колебания тока или напряжения. Делается это с помощью микрофона либо звукоснимателя.
Микрофон
Микрофон – это аналоговый акустико-электрический преобразователь. Он в режиме реального времени улавливает изменения давления воздуха и преобразует его в электрический сигнал.
Устройство записывает все звуки. Проблема в том, что человеческий мозг способен фильтровать нежелательный шум. Поэтому в домашних условиях сделать качественную запись крайне сложно. Она может содержать множество нежелательных звуков, которые не всегда можно устранить впоследствии. Чтобы снять это ограничение, профессиональная студия звукозаписи оборудуется помещением с мощной звукоизоляцией, непропускающей внешние шумы.
Микрофоны бывают разные по конструкции, предназначению, качеству. В настоящее время наиболее распространенный тип устройств – динамический и конденсаторный.
Конструкционно динамический микрофон состоит из подвижной электрической катушки, внутри которой находится стационарно закрепленный магнитный сердечник. Катушка прикреплена к звуковой мембране. При колебаниях воздуха она приходит в движение, перемещаясь относительно магнита. Электромагнитное поле меняется, и на ток, протекающий по катушке, накладывается сигнал.
В конденсаторном микрофоне мембрана выступает в качестве обкладки конденсатора. При ее колебании его электрическая емкость меняется, накладывая сигнал на электромагнитное поле. Сигнал получается очень слабым, зато конденсаторный микрофон очень чувствителен, улавливает малейшие колебания. Это приводит к тому, что любые дефекты речи становятся очень заметны на записи. Поэтому диктор для озвучки на студиях подбирается из базы профессионалов.
Конденсаторные микрофоны с большими диафрагмами используются на студиях звукозаписи. Это дорогие устройства, но они обладают повышенной чувствительностью.
Микрофоны бывают голосовые и инструментальные. Есть также модели, которые подходят для обеих целей. Многие звукорежиссеры предпочитают именно такие.
Другие аналоговые устройства
Сигнал от микрофона нужно поднять до линейного уровня. Для этого используются предусилители. Современные модели оснащены возможностями для динамической обработки сигнала и его коррекции по частоте. В некоторых устройствах предусмотрена возможность удаления звуковых артефактов.
Если источников звука несколько, то применяются микшеры – устройства для смешивания сигналов. Это стандартное студийное оборудование. Сейчас все чаще аналоговые микшеры заменяют цифровыми.
Большое значение имеют кабели и разъемы. Чем они качественнее, тем меньше потерь сигнала, ниже вносимые искажения. В хороших студиях проводники могут быть выполнены из серебра и даже золота.
Цифровая обработка сигнала
При выборе оборудования нужно учесть ряд требований. Оно должно быть:
- достаточно современным;
- распространенным;
- многоканальным.
Учтите, что лучше брать популярные устройства. Дело в том, что профессиональное оборудование выпускается в небольшом количестве. Если что-то плохо покупается, то с большой вероятностью производитель прекратит его производство и сервисную поддержку. Кроме того, важно, чтобы производитель выпускал обновления драйверов для новых ОС.
Также от аппаратной части требуется, чтобы она могла:
- поддерживать частоту дискретизации 96 КГц и разрешение 32 бит;
- работать с актуальными протоколами синхронизации и с драйверами ASIO.
Компьютерные звуковые карты могут иметь встроенный предусилитель для микрофона. Но работают они хуже внешних моделей. Желательно приобрести такую. Можно обратить внимание на марки TL Audio, Focusrite, dbx.
Программы
Качественного звукового ПО сейчас довольно много. Есть бесплатное для любителей и платное для профессионалов. Подобрать качественные программы можно, руководствуясь рейтингами в профильных изданиях.
Главное – это чтобы возможности компьютера позволяли работать с софтом. Поэтому, прежде чем приобрести ПО, внимательно изучите его требования. Если они велики, то или ищите что-то менее требовательное, или проведите апгрейд своего компьютера.
Акустическая часть
Для получения качественного звука потребуются активные мониторы. При выборе обращайте внимание на величину частотного диапазона (должен быть как можно шире) и параметры линейности АЧХ. Качественные мониторы имеют возможность изменения АЧХ. Это важно, так как колонки нужно настраивать в зависимости от конфигурации и величины комнаты, где они установлены.
Сейчас сравнительно недорого можно найти активные акустические системы стандартов: от 4.0 до 7.1. Для профессиональных целей они недостаточны, но для любителей вполне пригодны. По маркам обратите внимание на модели от Yamaha, JBL, M-Audio, Behringer, Genelec.
Наушники
Требования к наушникам такие же, как к колонкам. Они бывают закрытые и открытые. Для качественного сведения потребуются оба типа. Звук в наушниках более яркий, чем при прослушивании колонок. Поэтому судить о результате композиции только по ним нельзя, нужно прослушать звучание акустической системы.
Вопросы безопасности
Не перегружайте уши. Работать с мониторами желательно не свыше 6 часов в день, делая перерывы на 15 минут через каждый час. В наушниках время работы – 4 часа, (перерывы – 20 минут в час).
Чрезмерная нагрузка сажает слух, из-за нее ухудшается настроение, появляется раздражительность. Может начать болеть голова. В этих случаях нужно дать ушам длительный отдых – на день или на два.
Человеческое ухо воспринимает звук как небольшие колебания давления воздуха — звуковую волну. Интенсивность звука меняется непрерывно, и эти изменения могут быть сколь угодно малыми. Это означает, что звук — аналоговое явление. В то же время компьютер способен работать исключительно с цифровыми данными, т. е. последовательностями нулей и единиц. Для того чтобы сделать звукозапись пригодной для компьютерной обработки, ее оцифровывают: много раз в секунду делают «моментальный снимок» интенсивности звука, таким образом, в цифровой звукозаписи сигналы — моментальные снимки звуковой волны, которые следуют друг за другом. Количество таких снимков, сделанных в течение одной секунды, называют частотой дискретизации [54]. Полученное таким образом значение интенсивности сигнала округляется и представляется целым числом. Допустимое число двоичных разрядов в этом числе определяет битовую разрядность записи, при этом чем выше разрядность, тем выше качество звучания. Так, например, понятие «качество компакт-диска» подразумевает конкретные параметры оцифровки: частота дискретизации в 44100 Гц, 16-битовое представление и стереозапись (оцифровка производится отдельно по правому и левому каналам). Эти значения были выбраны с учетом свойств органов слуха, они обеспечивают передачу звуков, которые способен услышать человек [1]. Уменьшение данных параметров приводит к ухудшению качества звукозаписи.
Современные платы синтеза звука способны синтезировать звучание одновременно 20 и более музыкальных инструментов, создавая при этом множество специальных звуковых эффектов: плавное изменение громкости каждого инструмента, вибрацию звуков, их модуляцию по частоте и т. д. Появилась возможность записи звуковых сигналов на магнитные носители ПК в виде файлов и их обработки: наложение сигналов, фильтрации шумов и т. д. Сейчас HiFi-звучание неразрывно связано с лазерными аудиодисками (или компакт-дисками CD), использующими цифровые методы кодирования звуковых сигналов [17]. На поверхности диска имеются микроскопические углубления, созданные записывающим устройством (точнее говоря, технологическим процессом тиражирования дисков с некоторого оригинала). Они покрыты слоем прозрачного лака, предохраняющим поверхность диска от повреждений. Рабочей является только одна поверхность, вторая, при необходимости, используется для маркировки. После преобразования звукового сигнала в цифровую форму он уже не подвержен деградации при хранении и копировании, как обычная аналоговая запись.
При использовании компьютера звукозаписи, как и любые другие данные, должны храниться в виде файлов. На сегодняшний день существует много разных форматов файлов, применяемых для хранения звукозаписей. Часть из них уже устарела и представляет лишь исторический интерес, а другие используются активно. Однако какой бы формат ни использовался, работа со звуком в цифровом представлении связана с главной проблемой — большим объемом звукозаписей. Так, например, при записи информации на компакт-диск в виде файлов можно поместить данные, которые будут звучать около часа.
Для экономии места применялась упаковка файлов, но структура цифровой звукозаписи препятствует ее эффективному сжатию традиционными методами (обратимое сжатие), так как достигалась экономия не более 10—20 % места. Только после решения данной проблемы возникла возможность активного использования компьютеров в обработке музыкальных записей [20].
В конце 80-х годов группа исследователей MPEG (Motion Picture Expert Group) разработала способ десятикратного сжатия звуковых данных, практически без потери качества. Соответствующий формат получил обозначение MP3 (MPEG Layer 3). С 1999 года этот формат получил широкое распространение.
Алгоритмы необратимого сжатия звуковых данных, предложенные в рамках стандарта на формат представления упакованной видеоинформации МРЕG [60], используют совершенно иной, так называемый психоакустический подход. Этот подход основан на том, что в сложных составных звуках (например, в звуке оркестра) не все компоненты (в зависимости от громкости и частоты) воспринимаются на слух. Сжатие основано на фильтрации и удалении неслышимых компонентов. Сжатый звук может представлять собой звуковую дорожку видеозаписи или сохраняться автономно. Соотношение между плотностью упаковки и качеством звукозаписи в этом формате практически оптимально. Для представления звукозаписи формат МРЕG предлагает три варианта («уровня»). Каждый следующий уровень основывается на предыдущем и обеспечивает более высокую степень сжатия. Последний, третий, уровень, дающий наиболее высокую степень сжатия, так и называется: МРЕG уровень III, или просто МР3. Файлы, использующие данный формат, занимают в 10—12 раз меньше места на жестком диске, чем аналогичные неупакованные файлы при хорошем качестве звука. Примерные коэффициенты сжатия при использовании разных уровней в формате МРЕG приведены в табл. 2 [60].
Сжатые форматы обычно применяют как окончательную форму звукозаписи, в которой она хранится и воспроизводится. В то же время обработку файлов (их редактирование) удобно производить, когда они хранятся в неупакованном формате. В качестве стандартного формата хранения неупакованных цифровых записей сегодня выступает формат звуковых файлов WINDOWS (WAV-файлы).
Некоторые форматы записи звука со сжатием появлялись и раньше формата МРЗ, но они стремились максимально точно описать форму звуковой волны.
Современные средства мультимедиа дают качество стереозвука, удовлетворяющее требованиям HiFi (High Fidelity — высокая точность/ верность воспроизведения). Для считывания информации с CD-ROM используется полупроводниковый диод с фокусирующей и следящей оптической системой. Область диска под лаком с микроуглублениями находится в фокусе, и отраженный от нее сигнал воспринимается фотодиодом, расположенным рядом с лазерным излучателем. Диск вращается с переменной скоростью, что дает постоянную линейную скорость считывания данных. Диаметр светового пятна от лазера, создающего сходящийся конус света, около 1 мм. Умеренные загрязнения нерабочей поверхности и даже небольшие царапины практически не влияют на воспроизведение. Тем более что специальная электронная система коррекции ошибок устраняет их проникновение в данные [17].
Сигнал фотодиода имеет форму импульсов. Для работы проигрывателя важно лишь наличие или отсутствие импульса, т. е. логический 0 или 1. Оптический диск идеально подходит для создания ПЗУ (ROM) компьютера с огромной емкостью. Но исторически сложилось так, что такой диск был вначале задуман как средство цифровой записи звука для обычных целей HiFi-звуковоспроизведения. И лишь в начале 90-х гг. он стал использоваться для записи компьютерных данных и программ в связи с практической реализацией идей мультимедиа.
Общая схема [42] формирования звука посредством ПК представлена на рис. 1.37.
Цифровой аудиопоток с какого-либо носителя (CD, DVD), жесткого диска или через локальную сеть попадает в компьютер. Точнее, в его системную (материнскую) плату, на которой установлены центральный процессор, оперативная память, чипсеты, контроллеры и прочее. Благодаря взаимодействию звуковой подсистемы и программного обеспечения с основной частью компьютера, звуковой поток проходит обработку или же подается как есть в звуковую подсистему, где преобразуется в аналоговую форму и выводится на активные колонки, наушники или иное оборудование [63].
Читайте также: