Как пользоваться программой шазам на телефоне
В целом, процесс использования одинаковый на всех платформах, однако имеются некоторые отличия. Например, разнятся способы установки и удаления софта, а также некоторые тонкости в процессе работы.
В данной статье вы узнаете, как пользоваться программой Shazam на всех известных устройствах (смартфонах и персональных компьютерах).
Как пользоваться Шазамом на Андроид?
Теперь вы знаете, как начать пользоваться приложением Shazam на Андроид.
Как пользоваться приложением Шазам на Айфоне?
Процесс установки и использования программы для устройств Apple примерно схож с Андроидом:
- Заходим в магазин приложений App Store;
- В поисковой строке вводим название программы и жмем ОК;
- Заходим на страницу утилиты и нажимаем кнопку «Установить».
Далее весь процесс работы похож на Андроид. Дожидаемся конца настройки и приступаем к работе:
- Подтвердите свой адрес электронной почты;
- Чтобы просканировать музыкальную запись на главном экране предусмотрена кнопка «Shazamнуть»;
- Также программа запоминает все распознанные вами песни за весь период использования софта. Теперь вы знаете, как пользоваться Shazam на iPhone.
Как пользоваться Шазамом на компьютере?
Рассмотрим процесс использования утилиты на ПК:
- Первый вариант – вы скачиваете официальную версию приложения через магазин Windows Store, как показано на скриншоте;
- Второй и более сложный вариант – установка через эмулятор Android. Этот способ уместен для пользователей более старых версии Windows XP/7, в которых еще не было сервиса с приложениями.
Особенности программы
Главная фишка Шазам в том, что вам не придется разбираться в ее интерфейсе и функциях. Уже с первого запуска понятно, куда нажать для сканирования музыки. Вы также можете просматривать хит-парады музыки по всему миру. Таким образом Shazam образовывает целую социальную сеть пользователей, которые делятся найденной музыкой друг с другом.
Шазам – полезное приложение, с помощью которого можно легко узнать воспроизводимую песню. Этот софт весьма популярен среди пользователей, которые не только любят слушать музыку, но и всегда хотят знать имя исполнителя и название трека. Владея этой информацией, можно легко найти и скачать или купить понравившуюся песню.
Пользуемся Шазам на смартфоне
Shazam способен буквально за несколько секунд определить, что за песня звучит на радио, в фильме, рекламном ролике или с любого другого источника, когда отсутствует прямая возможность просмотра основных сведений. Это главная, но далеко не единственная функция приложения, и ниже речь пойдет о его мобильной версии, предназначенной для ОС Android.
Шаг 1: Установка
Как и любой сторонний софт для Андроид, найти и установить Шазам можно из Play Маркета – фирменного магазина Google. Делается это довольно легко.
- Запустите Плей Маркет и тапните по поисковой строке.
Шаг 2: Авторизация и настройка
Прежде чем приступить к использованию Shazam, рекомендуем выполнить несколько простых манипуляций. В дальнейшем это позволит ощутимо облегчить и автоматизировать работу.
- Запустив приложение, нажмите по иконке «Мой Shazam», расположенной в левом верхнем углу главного окна.
Закончив с авторизацией, можно смело приступать к использованию приложения и «зашазамить» свой первый трек.
Шаг 3: Распознавание музыки
Самое время воспользоваться основной функцией Shazam – распознаванию музыки. Необходимая для этих целей кнопка занимает большую часть главного окна, поэтому ошибиться здесь вряд ли получиться. Итак, запускаем воспроизведение песни, которую требуется распознать, и приступаем.
-
Нажмите по круглой кнопке «Шазамить», выполненной в виде логотипа рассматриваемого сервиса. Если вы делаете это первый раз, потребуется разрешить Shazam использовать микрофон – для этого во всплывающем окне нажмите по соответствующей кнопке.
Непосредственно из главного окна приложения можно прослушать музыкальную композицию (ее фрагмент). Дополнительно имеется возможность открыть и купить ее в Google Music. Если на вашем устройстве установлено Apple Music, то прослушать распознанный трек можно и через него.
По нажатию соответствующей кнопки будет открыта страница альбома, включающего эту песню.
Непосредственно после распознавания трека в Shazam, его главный экран будет раздел на пять вкладок. В них представлены дополнительные сведения об исполнителе и песне, ее текст, похожие треки, клип или видеоролик, есть список похожих артистов. Для переключения между этими разделами можно использовать горизонтальные свайпы по экрану или же просто тапать по нужному пункту в верхней области экрана. Рассмотрим содержимое каждой из вкладок подробнее.
-
В главном окне, непосредственно под названием распознанного трека, есть небольшая кнопка (вертикальное троеточие внутри круга), нажатие на которую позволяет удалить только что зашазамленный трек из общего списка шазамов. В редких случаях такая возможность может оказаться весьма полезной. Например, если вы не хотите «портить» потенциальные рекомендации.
Вот, собственно, и все дополнительные возможности приложения. Если умело их использовать, можно не только знать, что за музыка где-то играет в данный момент, но и быстро находить похожие треки, слушать их, читать текст и смотреть клипы.
Далее расскажем о том, как можно сделать использование Shazam более быстрым, и удобным, упростив доступ к возможности распознавания музыки.
Шаг 4: Автоматизация основной функции
Запуск приложения, нажатие кнопки «Шазамить» и последующее ожидание занимают некоторое время. Да, в идеальных условиях это считанные секунды, но ведь на то, чтобы разблокировать устройство, найти Shazam на одном из экранов или в основном меню тоже требуется время. Добавим к этому и очевидный факт того, что смартфоны на Android не всегда работают стабильно и быстро. Вот и получается, что при наихудшем исходе можно попросту не успеть «зашазамить» понравившийся трек. Благо, сообразительные разработчики приложения придумали, как все ускорить.
Шазам можно настроить на автоматическое распознавание музыки непосредственно после запуска, то есть без необходимости нажатия кнопки «Шазамить». Делается это следующим образом:
-
Сначала необходимо нажать на кнопку «Мой Shazam», расположенную в левом верхнем углу главного экрана.
После выполнения этих простых действий распознавание музыки будет начинаться сразу после запуска Shazam, что позволит вам сэкономить драгоценные секунды.
Если же этой небольшой экономии времени вам недостаточно, можно заставить Шазам работать постоянно, распознавая всю воспроизводимую музыку. Правда, стоит понимать, что это не только ощутимо повысит расход батареи, но и затронет вашего внутреннего параноика (если таковой имеется) – приложение всегда будет слушать не только музыку, но и вас. Итак, для включения «Автошазама» выполните следующее.
- Проделайте шаги 1-2 из описанной выше инструкции, чтобы перейти к разделу «Настроек» Shazam.
- Найдите там пункт «Автошазам» и активируйте расположенный напротив него переключатель. Возможно, дополнительно потребуется подтвердить свои действия, нажав по кнопке «Включить» во всплывающем окне.
К слову, совсем не обязательно позволять Шазаму работать непрерывно. Вы можете сами определять, когда это необходимо, и включать «Автошазам» только во время прослушивания музыки. Тем более что для этого даже не потребуется запускать приложение. Кнопку активации/деактивации рассматриваемой нами функции можно добавить в панель уведомлений (шторку) для быстрого доступа и включать ее точно так же, как вы включаете интернет или Bluetooth.
-
Свайпом сверху вниз вдоль экрана полностью разверните панель уведомлений. Найдите и нажмите небольшой значок карандаша, расположенный справа от иконки профиля.
На этом перечень основных возможностей Шазам заканчивается. Но, как и было сказано в самом начале статьи, приложение умеет не только распознавать музыку. Ниже кратко рассмотрим то, что еще можно делать с его помощью.
Шаг 5: Использование плеера и рекомендации
Далеко не все знают о том, что Shazam умеет не только распознавать музыку, но и воспроизводить ее. Его вполне можно использоваться в качестве «умного» плеера, работающего примерно по тому же принципу, что и популярные стриминговые сервисы, правда, с некоторыми ограничениями. Помимо этого, Шазам может и просто проигрывать ранее распознанные треки, но обо всем по порядку.
Примечание: В связи с законом об авторском праве, Shazam позволяет прослушивать только 30-секундные фрагменты песен. Если вы пользуетесь Google Play Музыкой, то сможете прямо из приложения перейти к полной версии трека и прослушать его. Кроме того, понравившуюся композицию всегда можно купить.
-
Итак, чтобы обучить плеер Shazam и заставить его играть вашу любимую музыку, для начала из главного экрана перейдите в раздел «Микс». Соответствующая кнопка выполнена в виде компаса и расположена в правом верхнем углу.
Вот так просто можно превратить Шазам в плеер, предлагающий к прослушиванию музыку тех исполнителей и жанров, которые вам действительно нравятся. Помимо этого, в автоматически сгенерированных списках воспроизведения, вероятнее всего, будут и неизвестные треки, которые наверняка должны вам понравится.
Примечание: Ограничение в 30 секунд воспроизведения не распространяется на клипы, так как приложение берет их из свободного доступа на YouTube.
Если же вы довольно активно «шазамите» треки или просто хотите послушать то, что распознавали с помощью Shazam, достаточно выполнить два простых действия:
-
Запустите приложение и перейдите к разделу «Мой Shazam», тапнув по одноименной кнопке в левом верхнем углу экрана.
В противном случае просто нажмите «Не сейчас», после чего сразу же запустится воспроизведение ранее распознанных вами песен.
Встроенный в Shazam плеер прост и удобен в использовании, содержит необходимый минимум элементов управления. Кроме того, в нем можно оценивать музыкальные композиции, нажимая «Нравится» (палец вверх) или «Не нравится» (палец вниз) – это улучшит будущие рекомендации.
Конечно, далеко не всех устроит то, что песни проигрываются всего по 30 секунд, но для ознакомления и оценки этого достаточно. Для полноценного же скачивания и прослушивания музыки лучше использовать специализированные приложения.
Заключение
На этом можно смело закончить рассмотрение всех возможностей Шазам и того, как их использовать в полной мере. Казалось бы, простое приложение для распознавания песен, на самом деле представляет собой нечто значительно большее – это и умный, пусть и немного ограниченный, плеер с рекомендациями, и источник информации об артисте и его произведениях, а также эффективное средство поиска новой музыки. Надеемся, эта статья оказалась полезной и интересной для вас.
Отблагодарите автора, поделитесь статьей в социальных сетях.
Приложение Шазам позволяет определять песню по отрывку. Достаточно установить его на компьютер или телефон. Затем поднести микрофон к источнику звука — и запустить функцию определения. Через пару секунд вы получите все данные о песне и исполнителе. Ниже будет подробно разобран процесс работы с приложением.
Если у вас еще не установлен Shazam, воспользуйтесь разделом «Установочные файлы», чтобы подобрать дистрибутив для своего устройства.
Как работает Шазам на телефоне
Запустите приложение. Вы увидите стартовый экран, с большой синей кнопкой посередине. Чтобы определить песню, вам нужно поднести телефон к источнику звука, и нажать на нее.
Будет запущен процесс. Теперь Шазам быстро запишет отрывок, и отправит его на сервер. Там будет проведен анализ и сравнение с данными , которые есть в базе. Если совпадение будет найдено, вам в ответ сообщат песню и ее исполнителя.
В дополнение, можно посмотреть текст песни, данные об исполнителе. Если хотите — поделитесь находкой в социальных сетях. Все эти инструменты доступны в верхнем меню.
Для Вашего удобства, мы записали подробный видео обзор, где пошагово разобран процесс установки Шазам на телефон, и процесс поиска песни .
Как пользоваться Шазам на компьютере
Принцип тот же. Но предварительно нужно приложение установить. Поскольку у Шазам нет полноценной версии для компьютера, приходится использовать эмулятор операционной системы Андроид. И уже на него устанавливать приложение. Мы воспользуемся BlueStacks — это самый популярный эмулятор для Windows. Скачайте и установите его. Дистрибутив доступен ниже.
Также скачайте установочный файл Shazam.
Инструкцию по установке и настройке, вы найдете в этой статье. Дальше действуем по аналогии. Запускаем Шазам. Подносим микрофон, подключенный к компьютеру, поближе к источнику звука. И нажимаем на кнопку «Шазамить» .
В результате мы получим всю необходимую информацию.
Этот процесс разобран в видео.
Режим Автошазам
В версии для телефонов, есть очень интересная функция. Называется авто шазам. Она позволяет без вашего участия, в фоновом режиме определять музыку, которая играет. Можете ехать по своим делам, а приложение будет собирать коллекцию музыки из треков, которые играют по радио.
Включается очень просто. Нажмите и держите кнопку «Шазамить» . Появится дополнительно окно, с предложением включить Автошазам. Нажимаем кнопку «Включить» — функция активирована.
Через некоторое время откройте приложение — у вас уже будет определено несколько песен .
Определите с помощью Shazam музыкальную композицию, которая звучит по радио, ТВ, в магазине, на вашем устройстве или где-либо еще. Затем перейдите в библиотеку Shazam, чтобы просмотреть распознанные композиции и на их основе найти новую музыку.
Shazam определяет композиции, создавая уникальные цифровые отпечатки для сопоставления того, что вы слышите, с одной из миллионов композиций в базе данных Shazam.
Определение музыки с помощью Shazam
С помощью Shazam можно определить музыку, которая звучит вокруг вас. Кроме того, Shazam определяет музыку, которая звучит в другом приложении, даже если вы в наушниках.
- Коснитесь и удерживайте значок Shazam на панели приложений, затем нажмите «Шазамить».
- Откройте приложение Shazam на своем устройстве, затем нажмите кнопку Shazam (Шазамнуть) .
Когда Shazam распознает композицию, она сохраняется в библиотеке Shazam.
После определения композиции можно подключиться к Apple Music и другим музыкальным службам для прослушивания композиции Shazam.
Если подключение к Интернету отсутствует, программа все равно создает уникальный цифровой отпечаток для сопоставления с базой данных Shazam при следующем подключении вашего устройства к Интернету. Если определить композицию не удается, она будет убрана из списка ожидания Shazam.
Использование режима «Автошазам»
Чтобы приложение Shazam автоматически определяло музыку, которая звучит вокруг, включите режим «Автошазам».
- Коснитесь и удерживайте значок Shazam на панели приложений, затем нажмите «Автошазам».
- Откройте приложение Shazam на своем устройстве, затем нажмите и удерживайте кнопку Shazam (Шазамнуть) .
Когда режим «Автошазам» включен, приложение Shazam сопоставляет звучащую музыку с композициями в базе данных Shazam даже при переключении на другое приложение. Shazam никогда не сохраняет и не хранит музыку.
Композиции, определенные программой Shazam в режиме «Автошазам», затем можно найти сгруппированными по дате в библиотеке.
Чтобы выключить режим «Автошазам», нажмите кнопку Shazam (Шазамнуть).
Использование панели уведомлений вместе с жестами смахивания и нажатия для определения музыки
При использовании другого приложения можно получить доступ к Shazam на панели уведомлений, чтобы определить звучащую музыку.
- Смахните вниз, чтобы увидеть Shazam на панели уведомлений.
- Нажмите Shazam (Шазамнуть), чтобы начать определять музыку.
- Чтобы закрыть панель уведомлений, перейдите в библиотеку Shazam, нажмите кнопку «Настройки» , затем выключите параметр «Шазамить из панели уведомлений».
Использование функции Pop-Up Shazam (Всплывающий Shazam) для определения музыки
- Откройте приложение Shazam, смахните вниз, чтобы перейти в библиотеку, затем нажмите кнопку «Настройки» .
- Включите «Всплывающий Shazam», выберите «Открыть настройки», затем включите параметр Allow display over other apps (Разрешить отображение поверх других приложений).
- При использовании другого приложения нажмите кнопку «Всплывающий Shazam» , чтобы определить музыку, которая звучит в этом приложении.
- Чтобы удалить всплывающую кнопку, перетащите ее к значку X внизу экрана.
Чтобы вернуть всплывающую кнопку, смахните вниз от верхней части экрана и нажмите на уведомление. Если параметр «Шазамить из панели уведомлений» не включен, откройте приложение Shazam и начните определять композицию. Пока Shazam определяет композицию, перейдите в фоновый режим. На экране появится всплывающая кнопка.
Последний альбом группы Queen с участием легендарного Фредди Меркьюри был записан уже после смерти вокалиста. И в этом альбоме есть одна интереcная песня, собранная буквально по кусочкам из обрывков записей Меркьюри, сделанных незадолго до смерти.
И что же делать в подобных ситуациях?
Раньше, услышав красивую песню где-нибудь в кафе или на улице, вы могли достать смартфон, запустить приложение Shazam или SoundHound и тут же получить всю подробную информацию. Но сегодня бурный рост технологий позволил нечто большее!
После прочтения этой статьи вы поймете, как именно бездушный процессор смартфона стал еще на один шаг ближе к человеческому разуму. Или, по крайней мере, научился еще лучше его имитировать.
Часть 1. Природа звука
Бессмысленно говорить о том, как работает Shazam или распознавание музыки в целом, если не понимать, что такое музыка и звуки вообще. Поэтому вначале я уделю немного внимания этому вопросу.
Итак, звук возникает у нас в голове, когда воздух стучит по барабанной перепонке в наших ушах. Очень подробно этот процесс я описывал в статье о шумоподавлении или вреде громкой музыки. Так что здесь не будем повторяться.
Сам по себе воздух не может ни ударить по барабанной перепонке, ни сдвинуть с места даже пылинку. Это делают миллиарды молекул, хаотично летающих в пространстве.
Мы даже можем отобразить это движение динамика на графике в виде волны:
Вот только если это будет делать динамик, вместо приятного звука мы услышим не очень приятный монотонный гул:
А теперь посмотрите в замедленном движении, что происходит со струной в реальности (на примере скрипки):
Такое движение скорее можно схематически изобразить вот так:
И это еще очень упрощенный пример. На самом деле, движение струны гораздо сложнее! Струна вибрирует вся целиком (как показано на первой анимации) и создает звук на частоте 440 Гц (монотонная нота ля). Но также вибрирует и каждая половинка струны, создавая звуки на частотах 880 Гц (половинка в два раза короче целой струны, а значит и вибрирует в 2 раза быстрее, т.е. 880 раз в секунду).
А теперь добавьте к этому еще и вибрацию корпуса инструмента, например, скрипки. Ведь струна жестко закреплена на корпусе и ее вибрация также приводит к вибрации всего инструмента. Эти вибрации в свою очередь зависят от породы дерева, толщины корпуса и его формы.
Каждая такая вибрация добавляет к нашему ансамблю звуков еще и свои монотонные писки на разных частотах.
Именно эти дополнительные частоты/ноты/звуки, вызванные особенностями колебания струны/корпуса и создают уникальный тембр каждого музыкального инструмента.
Мы можем даже самостоятельно создать звук похожий на пианино или гитару, просто взяв монотонный гул, который я приводил выше, и добавить к нему еще различные монотонные пищалки, только на более высоких частотах и с разной громкостью.
От того, насколько громко (и как долго) будет звучать каждая дополнительная частота и зависит тембр инструмента.
Реальная звуковая волна
Вы наверняка не раз видели звуковую волну какого-то реального звука и она совершенно не похожа на все эти красивые графики волн, которые встречаются в статьях, например, такую:
Ответ на этот вопрос уже дан чуть выше. Ни один инструмент не создает только одну звуковую волну на одной частоте. В этом случае мы бы слышали монотонный гул. Но так как на основной тон накладывается еще десяток-другой частот, график полностью искажается.
Вот, к примеру, у нас есть основная частота 440 Гц (нота ля):
Струна будет создавать другие частоты, первой из которых станет 880 Гц (это вторая гармоника или 440*2). Такая частота будет получаться, когда две половинки струны будут вибрировать отдельно. И выглядеть вторая волна (880 Гц) будет уже так:
То есть, мы видим, что количество волн увеличилось вдвое (440 Гц и 880 Гц). Но две волны не будут путешествовать по воздуху отдельно, они сольются в одну. И какой же она будет?
Какие-то пики одной волны совпадут с впадинами другой и немного погасятся, в каком-то месте пики двух волн наложатся и она станет еще выше (громче). В общем, вместо двух волн разной частоты мы получим одну волну такого вида:
Глядя на эту волну, мы даже можем легко себе представить, как именно будет двигаться динамик, чтобы воспроизвести этот звук.
На этом мы, пожалуй, и остановимся. Этих знаний должно хватить для понимания основной темы.
Часть 2. Как работает Shazam и любая другая технология распознавания музыки
Если я попрошу вас напеть какую-то музыкальную композицию, что именно вы споете? Будете ли вы учитывать басовую партию или партию ударных инструментов? А если речь идет об оркестровой музыке, в которой одновременно могут звучать десятки музыкальных инструментов?
Конечно же, вы просто напоете основную мелодию, игнорируя всё остальное. И что самое удивительное, я без проблем пойму, о чем идет речь. Даже если до вашего исполнения слушал эту композицию только на хорошей акустике в высоком качестве.
То есть, мы интуитивно можем сократить очень сложную и красивую музыку до нескольких простых нот. Точно так же работает и технология распознавания музыки. Вот только у смартфона нет интуиции и в этом его проблема.
Для бездушной железки даже самая прекрасная мелодия ничем не отличается от рёва мотора или простого шума ветра. Поэтому мы должны создать алгоритм, который бы привил смартфону чувство прекрасного. Этим и займемся!
Шаг 1. Анализируем частоты
Наш смартфон должен увидеть, какие конкретно частоты звучат в каждый момент времени. Другими словами, он должен получить музыку в том виде, в котором она была до того, как все частоты смешались в один поток и направились к звукозаписывающей аппаратуре на студии.
К примеру, вместо сложной волны от нажатия клавиши фортепиано, в которой смешались монотонные звуки на частотах 440 Гц, 880 Гц и 1320 Гц, нам нужно получить эти частоты отдельно и узнать громкость каждой из них:
Это как если бы я показал вам цветное пятно и сказал, чтобы вы назвали, какие основные цвета и в какой пропорции я смешивал, чтобы получить этот уникальный цвет.
К счастью, нам не нужно ломать голову над этой задачей, так как ее успешно решил французский математик еще в 1807 году! Так появилась функция под названием преобразование Фурье.
При помощи этого математического метода мы получаем из сложной волны набор всех частот, из которых она состоит, а также амплитуду (громкость) каждой из них.
К примеру, на спектрограмме выше мы видим, как где-то на 9-й секунде (по оси X) очень громко заиграли все инструменты или все частоты (красная вертикальная линия). А где-то на 31-й секунде частоты свыше 1500 Гц вообще пропали, то есть, в этот момент они не звучат в нашей композиции:
Согласитесь, в таком виде работать с музыкой гораздо проще и понятнее, чем смотреть на бессмысленный график ломаной линии. Здесь мы можем, к примеру, убрать какой-то дефект на частоте 10 000 Гц (какой-то лишний звонкий писк). Ведь мы увидим яркую полоску сверху, которую можно удалить, а затем снова сложить все частоты в один звук, но уже без удаленной частоты.
Теперь давайте подытожим. На первом шаге смартфон переводит записанный фрагмент мелодии в спектрограмму. Но пользоваться ею не получится. Ведь помимо мелодии, здесь присутствуют и посторонние звуки (шум улицы, кафе или разговоров, низкое качество микрофона и пр.).
Кроме того, в этой спектрограмме очень много информации. Смартфону она не нужна, как и нам не нужно знать все партии каждого инструмента, чтобы напеть фрагмент мелодии. И это приводит нас ко второму шагу.
Шаг 2. Создаем карту созвездий
Естественно, качество звука сильно упало, так как мы слышим частоты до 15-20 тысяч герц (в зависимости от возраста) и эта информация есть в каждом музыкальном произведении. Но для распознавания музыки эти частоты совершенно не нужны. Основная мелодия находится гораздо ниже (в пределах 100-2000 Гц):
На этой картинке мы видим, что основной диапазон голосов и музыкальных инструментов (насыщенная темная часть каждой полоски) легко помещается до 1000 Гц, а уже гармоники уходят до предела слышимости.
А теперь начинается самое интересное! Алгоритм начинает анализировать полученную спектрограмму и искать на ней самые яркие области в каждый момент времени. Другими словами, он определяет, какие частоты (можем для простоты называть их нотами) звучат наиболее громко в конкретный момент времени.
Эта карта созвездий буквально показывает следующее:
Помимо того, что мы колоссально сократили размер композиции, этот процесс естественным образом удалил все лишние звуки, так как на записи именно основная мелодия будет наиболее ярко выражена. Также мы удалили все гармоники, так как они практически всегда звучат тише основного тона.
Такую карту приложение создает на смартфоне еще до отправки данных на сервер Shazam. То есть, смартфон не передает звук.
На данном этапе мы столкнулись с довольно серьезной проблемой. Предположим, вот это карта созвездий полноценной композиции на сервере Shazam:
Но человек даже теоретически не сможет каждый раз начинать записывать фрагмент интересующей его музыки с самого начала. Он может записать маленький кусочек где-то в середине композиции или за несколько секунд до конца песни.
В итоге, на смартфоне появится вот такая карта:
Получается, смартфон передает серверу, что он услышал композицию, у которой на 5-й секунде ярко выражены 3 частоты: 510 Гц, 800 Гц и 1600 Гц (на графике по оси Y указаны только несколько частот, поэтому я называю частоты примерно).
Если сервер начнет искать у себя в базе данных композицию, у которой на 5-й секунде встречаются такие же основные частоты, то он может выдать любой результат, но только не правильный. Так как в оригинале эти частоты встречаются примерно на 22-й секунде.
А если не искать частоты с привязкой ко времени, то среди нескольких миллионов композиций может найтись сотня таких, в которых просто где-то встречаются 3 указанные частоты.
Нужно избавиться от привязки ко времени, сохранив при этом привязку ко времени! Хотя это и кажется нелогичным на первый взгляд, решение получилось весьма элегантным.
Вместо списка частот (нот) с привязкой к конкретной секунде, мы берем одну любую точку на карте и связываем ее с несколькими другими точками. Например:
Вот и всё! То есть, вместо конкретных частот с привязкой к определенному времени, мы храним информацию о том, как связаны конкретные частоты между собой. Например, сохраняем информацию о том, что в определенной композиции звук на частоте 1600 Гц начинается спустя 3 секунды после звука на частоте 515 Гц.
Теперь мы можем передать эту информацию на сервер и он поищет, есть ли у него в базе такая мелодия, в которой прозвучала частота 515 Гц, а затем ровно через 3 секунды был звук на частоте 1600 Гц.
Размышления вместо выводов
Только что мы рассмотрели базовый принцип работы любого сервиса по распознаванию музыки. Конечно, у вас могло остаться множество вопросов, так как я хотел раскрыть тему в общих чертах, чтобы она была понятной самому широкому кругу читателей.
Например, не совсем понятно, по какому принципу алгоритм выбирает опорные точки, от которых затем строит связи с другими частотами.
Ответа на этот вопрос у меня нет, так как Shazam не раскрывает свои алгоритмы в таких деталях. Возможно, компания выбирает для каждого момента времени первую по счету точку (счет ведется снизу вверх слева направо) и связывает ее с несколькими рядом стоящими точками.
Кроме того, я не рассказал о том, как именно передаются и хранятся такие записи. Для этого используются хеши. Но само понятие хеш-функции настолько интересное и важное, что мне не хотелось использовать его без подробного и понятного объяснения. А это бы заняло еще больше места в статье и усложнило восприятие информации.
Также мы коснулись только алгоритмов, без упоминания нейросетей. А именно последние используются Google Ассистентом для определения мелодии, когда человек просто напевает или насвистывает мотив песни.
Затем нейросеть обучили находить оригинал по плохому неточному отпечатку, полученному с напетой человеком мелодии. Когда нейросеть прошла обучение на тысячах примеров, теперь она способна самостоятельно сопоставлять отпечаток напетой мелодии с отпечатком оригинала на серверах Google.
Более подробно о том, как работают нейросети и что такое обучение нейросетей, мы рассказывали в отдельной статье.
Алексей, глав. ред. Deep-Review
P.S. Не забудьте подписаться в Telegram на первый научно-популярный сайт о мобильных технологиях — Deep-Review, чтобы не пропустить очень интересные материалы, которые мы сейчас готовим!
Как бы вы оценили эту статью?
Нажмите на звездочку для оценки
Внизу страницы есть комментарии.
Если Вы хотите только поставить оценку, укажите, что именно не так?
Камера смартфона для «чайников» №3. Погружаемся в матрицу!
ЭКГ на смарт-часах для «чайников». Как на самом деле работает эта функция?
Что такое энергия? Или таинственная материя, которую создают гаджеты
Камеры смартфонов с матрицами Sony и Samsung. Что такое Tetracell и Quad Bayer?
Гаджеты и приложения для учета выпитой воды: 2 литра мифов в день!
Спасибо, очень интересно! А упоминанием хеш-функций вы меня заинтриговали 🙂 Буду с нетерпением ждать статьи по ним!
Что касается длительности звучания частоты, такая информация не используется, так как она буквально уничтожит весь алгоритм. Мы используем именно дискретные точки без длительности.
Что касается связи между точками, мы скорее не связь выстраиваем, а записываем координаты точек, только не относительно привязки ко времени, а относительно других точек (опорных).
Вот смотрите. Возьмем точку A из нашего примера. У нее такие координаты A[515;1600;3]. Они означают буквально следующее: частота 1600 Гц появляется на карте спустя 3 секунды после частоты 515 Гц. Это жесткая привязка к координатам. Именно эту точку мы закодируем в виде строки и отправим на сервер. Shazam будет искать композицию в которой просто есть частота 1600 Гц, появившаяся спустя 3 секунды после частоты 515 Гц. Не важно, сколько звучала частота 515 Гц или 1600 Гц. Важно только совпадение координаты точки A.
Благодарю за ответ!
Тем не менее, мне решительно не понятно, почему информация о длительности частоты должна рушить алгоритм. Определенная частота вполне может быть выражена определенный промежуток времени, например, когда исполнитель тянет ноту. Это не значит, что больше нет жесткой привязки, просто она теперь относится к началу звучания, так что длительность звучания никак не ломает алгоритм, а наоборот, дополняет.
Однако в чисто алгоритмическом определении (без нейросетей), длительность звучания частоты не используется. Приведу еще такие аргументы для наглядности:
1. Начиная запись мелодии в кафе в любой момент времени, мы нарушаем совпадение по длительности звучания многих частот. Например, в оригинале есть звучание частоты 440 Гц в течение 5 секунд, а мы начали запись на 4-й секунде звучания этой частоты, получается, она будет звучать у нас всего 1 секунду вместо 5-ти секунд, как в оригинале. То же касается и окончания записи по среди песни (обрывается длительность всех частот). Когда же мы напеваем что-то, то всегда начинаем с логического начала основной мелодии.
Читайте также: