Какой временной интервал речевого сигнала выбран в стандарте gsm для цифрового преобразования
Обработка речи в стандарте GSM осуществляется в рамках принятого режима прерывистой передачи (DTX - Discontinuous Transmission), которая обеспечивает включение передатчика только во время самого разговора. Система DTX управляется детектором активности речи (VAD - Voice Activity Detection), который обеспечивает обнаружение и выделение интервалов речи с шумом и шум без речи даже в тех случаях, когда уровень шума соизмерим с уровнем сигнала речи. В состав системы DTX также входит устройство формирования комфортного шума, который включается в паузах речи. В системе DTX происходит также экстраполяция фрагментов речи, утерянных из-за помех в канале. Структурная схема обработки речи в стандарте GSM приведена на рис. 2.
Основным устройством в данной схеме является речевой кодек. В соответствии со стандартом GSM каждый радиоканал используется для организации 8 цифровых каналов с временным разделением. Следовательно, если бы это были стандартные ИКМ каналы, то потребовалась бы скорость передачи 64 х 8 = 512 кбит/с. Такую скорость передачи пользовательской информации по одному частотному радиоканалу обеспечить практически невозможно. В качестве выхода из положения используются методы уплотнения передаваемой информации и применение сложных методов кодирования, уменьшающих избыточность, а значит и требующих меньшие скорости передачи. При этом, как правило, используются методы фазовой модуляции (манипуляции). В системе GSM используется гауссовская фазовая манипуляции несущей частоты радиосигнала с минимальным сдвигом (GMSK - Gaussian Minimum Shift Keying) с индексом манипуляции, равным 0,3.
Рис. 2. Структурная схема процесса обработки речи в стандарте GSM
VAD Voice Activity Detection - детектор активности речи;
DTX (Discontinuous Transmission) - система прерывистой передачи речи
Снижение требуемой скорости передачи цифрового потока приводит к ухудшению качества передаваемой речи. Наиболее низкая скорость передачи информации (1 - 3 кбит/с) требуется при использовании вокодеров. Однако при этом очень низкое качество речи. Звук приобретает «синтетический» характер.
Высокое качество речи при допустимом снижении требований к скорости передачи можно получить при использовании различных модификаций ИКМ, за счет усложнения аппаратуры. Для того, чтобы иметь высокое качество речи при передаче с относительно низкими скоростями, в GSM используется способ кодирования, объединяющий вокодеры и дифференциальную ИКМ. Такой способ получил название дифференциального кодирования.
Вокодерное преобразование основано на использовании особенностей человеческого голосового тракта. Голосовые связки генерируют некоторую частоту, которая модулируется горлом и ртом, как фильтром. Зная в каждый момент частоту и параметры фильтра можно восстановить (создать) требуемый звуковой сигнал.
В фиксированные промежутки времени голосовые органы человека не остаются в фиксированном положении, и возбуждения носят более комплексный характер, чем передаваемые характер возбуждения и период основного тона. Это приводит к значительному ухудшению качества.
Дифференциальная ИКМ учитывает корреляцию дискретных отсчетов АИМ-сигнала. При этом кодируются не сами дискретные отсчеты, а разность амплитуд поступившего и предыдущего дискретных отсчетов. Поскольку диапазон изменения амплитуд разности дискретных отсчетов меньше диапазона изменения амплитуд самих дискретных отсчетов, для их кодирования требуется меньшее число разрядов. Таким образом, дифференциальное кодирование подразумевает деление речевого сигнала на отрезки в 20 мс с предыдущим кодированием.
В стандарте GSM используется метод RPE-LTP (линейное предсказание с возбуждением регулярной последовательностью импульсов и долговременным предсказанием). Упрощенная блок-схема кодека представлена на рис. 3.
Рис. 3. Упрощенная блок-схема кодека речи в стандарте GSM
Работа кодера заключается в следующем.
Блок предварительной обработки осуществляет: предыскажение входного сигнала при помощи цифрового фильтра, подчеркивающего верхние частоты; разбиение сигнала на сегменты по 160 выборок (20 мс); взвешивание каждого из сегментов окном Хэмминга.
Далее для каждого 20-мс сегмента оцениваются параметры фильтра кратковременного ЛП - 8 коэффициентов частичной корреляции ki i=1-8 (порядок предсказания М=8), которые для передачи по каналу связи преобразуются в логарифмические отношения площадей ri, причем для функции логарифма используется кусочно-линейная аппроксимация.
Сигнал с выхода блока предварительной обработки фильтруется решетчатым фильтром-анализатором кратковременного ЛП, и по его выходному сигналу (остатку предсказания еn) оцениваются параметры длительного предсказания: коэффициент предсказания g и задержка d. При этом 160-выборочный сегмент остатка кратковременного предсказания еn разделяется на 4 подсегмента, по 40 выборок в каждом, и параметры g,d оцениваются для каждого из подсегментов в отдельности, причем для оценки задержки d для текущего подсегмента используется скользящий подсегмент из 40 выборок, перемещающийся в пределах предшествующих 128 выборок сигнала остатка предсказания еn . Сигнал еn фильтруется фильтром-анализатором ДП, а выходной сигнал последнего (остаток предсказания fn) фильтруется сглаживающим фильтром, и по нему формируются параметры сигнала возбуждения в отдельности для каждого из 40-выборочных подсегментов.
Сигнал возбуждения одного подсегмента состоит из 13 импульсов, следующих через равные промежутки времени (втрое большие, чем интервал дискретизации исходного сигнала), и имеющих различные амплитуды. Для формирования сигнала возбуждения 40 импульсов подсегмента сглаженного остатка fn обрабатываются следующим образом. Последний (40-ой) импульс отбрасывается, а первые 39 импульсов разбиваются на три последовательности: в первой - импульсы 1,4. 37, во второй - импульсы 2,5. 38, в третьей - импульсы 3,6. 39. В качестве сигнала возбуждения выбирается та из последовательностей, энергия которой больше. Амплитуды импульсов нормируются по отношению к импульсу с наибольшей амплитудой, и нормированные амплитуды кодируются тремя битами каждая при линейной шкале квантования. Абсолютное значение наибольшей амплитуды кодируется шестью битами в логарифмическом масштабе. Положение начального импульса 13-элементной последовательности кодируется двумя битами, т.е. номер последовательности, выбранной в качестве сигнала возбуждения для данного подсегмента.
Таким образом, выходная информация кодера речи для одного 20-миллисекундного сегмента речи включает параметры: фильтра кратковременного ЛП 8 коэффициентов логарифмического отношения площадей ri, i=1-8 - один набор на весь сегмент; фильтра ДП - коэффициент предсказания g и задержка d - для каждого из четырех подсегментов; сигнала возбуждения - номер последовательности n, максимальная амплитуда v, нормированные амплитуды bi, i=1-13, импульсов последовательности - для каждого из четырех подсегментов.
Всего для одного 20-мс сегмента речи передается 260 бит информации, т.е. кодер речи осуществляет сжатие информации почти в 5 раз (1280:260=4,92). Перед выдачей в канал связи выходная информация кодера речи также подвергается дополнительно канальному кодированию.
Декодер выполняет следующие операции. Блок формирования сигнала возбуждения, используя принятые параметры сигнала возбуждения, восстанавливает 13-импульсную последовательность сигнала возбуждения для каждого из подсегментов сигнала речи, включая амплитуды импульсов и их расположение во времени. Сформированный таким образом сигнал возбуждения фильтруется фильтром-синтезатором длительного предсказания. На его выходе получается восстановленный остаток предсказания фильтра-анализатора кратковременного ЛП, который фильтруется решетчатым фильтром-синтезатором кратковременного ЛП. Причем параметры фильтра предварительно преобразуются из логарифмических отношений площадей ri , в коэффициенты частичной корреляции ki. Выходной сигнал фильтра-синтезатора кратковременного ЛП фильтруется (в блоке пост-фильтрации) цифровым фильтром, восстанавливающим амплитудные соотношения частотных составляющих сигнала речи, т.е. компенсирующим предискажение, внесеннон входным фильтром блока предварительной обработки кодера. Сигнал на выходе пост-фильтра является восстановленным цифровым сигналом речи.
Оценка качества кодирования речи. При оценке качества кодирования и сопоставлении различных кодеков оцениваются разборчивость речи и качество синтеза (качество звучания) речи. Для оценки разборчивости речи используется метод DRT (диагностический рифмованный текст). В этом методе подбираются пары близких по звучанию слов, отличающихся отдельными согласными, которые многократно произносятся рядом дикторов, и по результатам испытаний оценивается доля искажений. Метод позволяет получить как оценку разборчивости отдельных согласных, так и общую оценку разборчивости речи.
Для оценки качества звучания используется критерий DAM (диагностическая мера приемлемости). Испытания заключаются в чтении несколькими дикторами (мужщинами и женщинами) ряда фраз, которые прослушиваются на выходе тракта связи рядом экспертов-слушателей, выставляющих щценки по 5-балльной шкале. Результатом является средняя субъективная оценка, или средняя оценка мнений (MOS). Хотя этот метод является субъективным, его результаты по сопоставлению различных типов кодеков при проведении испытаний одними и теми же группами дикторов и экспертов-слушателей являются достаточно объективными, и на них основываются выводы и решения.
В табл. 1 приведены результаты оценки четырех типов кодеков. Близкие к шкале MOS результаты дает объективный метод оценки качества с использованием понятия кепстрального расстояния (Cepstrum Distance - CD).
Существует множество вариантов кодеков речи, из которых приходится выбирать кодек для ССС. Например, при разработке стандарта GSM были исследованы шесть типов кодеков, после чего выбор был остановлен на кодеке RPE-LTP. Работа по выбору типа кодека для стандарта GSMбыла завершена в 1988 г., а в 1089 г. был предложен метод VSEPL, принятый затем в стандарте D-AMPS. Работы по совершенствованию кодеков речи продолжаются и в настоящее время. Обоими стандартами (D-AMPS и GSM) предусмотрено введение полускоростного кодирования, которое сможет увеличить пропускную способность канала связи в два раза. В числе исследуемых вариантов для стандарта D-AMPS рассматривается возможность введения векторного квантователя параметров линейных спектральных пар с расщеплением и межкадровым предсказанием, а для стандарта GSM - использование метода кодирования CELP.
Таблица 1. Оценка кодеков речи по шкале MOS
Темп передачи информации, кбит/с
RPE-LTP (стандарт GSM
CELP (стандарт CDMA)
QCELP (стандарт CDMA)
Задачи и методы канального кодирования. Основная задача кодера канала - помехоустойчивое кодирование (ПУК) сигнала речи, т.е. такое кодирование, которое позволяет обнаруживать и исправлять ошибки, возникающие при распространении сигнала по радиоканалу. ПУК осуществляется за счет введения в состав передаваемого сигнала избыточной (контрольной) иеформации. В сотовой связи ПУК реализуется в виде трех процедур - блочного кодирования (block coding), сверточного кодирования (convolutional coding) и перемежения (interleaving). Кроме того, кодер канала выполняет еще ряд функций: добавляет управляющую информацию, (которая также подвергается ПУК); упаковывает подготовленную к передаче информацию и сжимает ее во времени; осуществляет шифрование передаваемой информации, если это предусмотрено режимом работы аппаратуры.
Последовательность выполнения этих задач показана на блок-схеме.
При блочном кодировании входная информация разделяется на блоки, содержащие по к символов каждый, которые по определенному закону преобразуются кодером в n-символьные блоки, причем n>k. Отношение R = k/n называется скоростью кодирования и является мерой избыточности, вносимой кодером. При рационально построенном кодере меньшая скорость кодирования (т,е. большая избыточность) соответствует более высокой помехоустойчивости.
Повышению помехоустойчивости способствует также увеличине длины блока. Блочный кодер с параметрами n, k обозначается (n,k). Если символы входной и выходной последовательностей являются двоичными ( т.е. состоят из одного бита каждый), то кодер называется двоичным. Именно двоичные кодеры используются в сотовой связи.
При сверточном кодировании K последовательных символов входной информациионной последовательности, по k бит в каждом символе, участвуют в образовании n-битовых символов выходной последовательности, n>k, причем на каждый символ входной последовательности приходится по одному символу выходной. Каждый бит выходной последовательности получается в результате суммирования по модулю 2 нескольких бит (от двух до Kk бит) K входных символов, для чего используются n сумматоров по модудю 2. Сверточный кодер с параметрами n,k,K обозначается (n, k, K). Отношение R=k/n, как и в блочном кодере, называется скоростью кодирования. Параметр K называется длиной ограничения; он определяет длину сдвигового регистра (в символах), содержимое которого участвует в формировании одного выходного символа.
Перемежение представляет собой такое изменение порядка следования символов информационной последовательности (т.е. перестановку), при которой стоявшие рядом символыы оказываются разделенными несколькими другими символами. Такая процедура предпринимается с целью преобразования групповых ошибок (пакетов ошибок) в одиночные ошибки, с которыми легче бороться с помощью блочного и сверточного кодирования.
Использование перемежения - одна из особенностей сотовой связи. Это является следствием неизбежных глубоких замираний сигнала в условиях многолучевого распространения. При этом группа следующих один за другим символов, попадающих на интервал замирания (провалв) сигнала, с большей вероятностью оказывается ошибочной. Если перед выдачей информационной последовательности в радиоканал она подвергается процедуре перемежения, а на приемном конце восстанавливается прежний порядок следования символов, то пакеты ошибок с большей вероятностью разбиваются на одиночные ошибки. Известно несколько различных схем перемежения и их модификаций - диагональная, блочная, сверточная и др. В основе схем, применяемых в сотовой связи,лежат первые две из них.
При диагональном перемежениии входная информация делится на блоки, а блоки - на субблоки, и в выходной последовательности субблоки, например, второй половины предыдущего блока чередуются с субблоками первой половины следуюего блока. При блочном перемежении входная информация также делится на блоки, по n субблоков (или символов) в каждом, и в выходной последовательности чередуются субблоки k последовательных блоков. Общим недостатком обеих рассмотренных схем является жесткая периодичность следования переставленных символов в пределах интервала перемежения. Этот недостаток может быть устранен, но за счет сложной схемы перемежения.
Канальное кодирование в стандарте GSM. В стандарте GSM 260 бит информации, кодирующих параметры 20-мс сегмента речи разделяются на два класса: класс 1 - 182 бита, защищаемые помехоустойчивым кодированием, и класс 2 - оставшиеся 78 бит, которы передаются без помехоустойчивого кодирвания. Из 182 бит класса 1 выделяются 50 наиболее существенных бит, составляющих подкласс 1a, которые подвергаются более мощному кодированию, а остальные 132 бита класса 1 составляют подкласс 1b и кодируются слабее. К подклассу 1a относятся параметры фильтра кратковременного ЛП и часть информации о параметрах фильтра ДП, к подклассу 1b - часть информации о параметрах сигнала возбуждения и оставшаяся информация о параметрах фильтра ДП. К классу 2 относится оставшаяся информация о параметрах сигнала возбуждения.
Информация подкласса 1a кодируется блочным кодом, обнаруживающим ошибки , - укороченным систематическим циклическим кодом (53, 50), дающим 3-битовый код четности. Затем вся информация класса 1 переупаковывается, располагаясь в следующей последовательности: биты с четными индексами, код четности подкласса 1a, биты с нечетными индексами в обратной последовательности, четыре добавочных нулевых бита - всего 189 бит. Эти 189 бит подаются на сверточный кодер (2, 1, 5) со скоростью кодирования R=1/2 и длиной ограничения K= В результате 378 бит с выхода сверточного кодера вместе с 78 битами класса 2 составляют 456 бит, т.е. поток информации речи на выходе кодера равен 456 бит/20 мс, или 22,8 кбит/c. Структурная схема канального кодирования изображена на рис. 4.
При декодировании информации речи также сначала выполняется сверточное декодирование информации класса 1, и при этом исправляются ошибки в пределах возможностей кода свертки. Затем по коду четности проверяется наличие остаточных ошибок в информации подкласса 1a, и, если такие ошибки обнаруживаются, информация данного сегмента не идет в последующую обработку, а заменяется интерполированной информацией смежных сегментов.
Перед выдачей в канал связи закодированная информация речи также подвергается перемежению. В стандарте GSM используется сложная схема блочно-диагонального перемежения. 456 бит информации одного 20-миллисекундного сегмента речи разбиваются на 8 подсегментов, и 57 бит одного подсегмента распределяются между смежными восемью подсегментами таким образом, что после перемежения смежными с каждым конкретным битом оказываются соответствующие ему по положению биты, отстовшие от него до перестановки на 4 сегмента, причем на четные и нечетные (после перестановки) битовые позиции подсегмента ставятся биты из смежных сегментов.
Рис. 4. Структурная схема канального кодирования
Алгоритм перемежения обладает свойствами квазислучайности, так что смежные биты исходной последовательности оказываются разделенными непостоянным числом бит, что является преимуществом в борьбе с периодическими битовыми ошибками.
После перемежения 456 бит информации одного сегмента распределяются по одноименным слотам четырех последовательных кадров канала трафика - два поля по 57 бит в слоте (рис. 2.37), и каждое 57-битовое поле снабжается дополнительным скрытым флажком, помечающим информацию речи (в отличие от информации управления канала FACCH, который кодируется иначе).
Информация KУ подвергается блочному и сверточному кодированию в полном объеме. Для кодирования информации каналов SACCH, FACCH, FCCH, PCH, AGCH, SDCCH используется блочный кодер (224, 184), сверточный кодер (2, 1, 5), и та же схема перемежения, что и для КТ. В каналах RACH, SCH используются другие схемы блочного кодирования, а также сверточные кодеры (2, 1, 5), отличающиеся от сверточных кодеров перечисленных ранее КУ. При ПД используются более сложные схемы сверточного кодирования и перемежения, обеспечивающие более высокое качество передачи информации.
Длительность слота КТ, с учетом добавления вспомогательной и служебной информации (рис. 2.37), составляет 156,25 бит, и , так как информация одного 20-мс сегмента речи занимает по одному слоту в четырех последовательных кадрах, результирующий поток информации составляет 625 бит/20 мс, или 31,25 кбит/с. Эта информация сжимается во времени в 8 раз, так что на протяжении одного кадра длительностью 4,615 мс передается информация восьми временных слотов (рис. 2.36), в результате чего частота битовой последовательности возрастает до 250 кбит/с. На каждые 12 кадров КТ, несущих информацию речи добавляется по одному кадру с информацией управления канала SACCH (кадры 13 и 26 мультикадра). Таким образом, частота информационной битовой последовательности на выходе кодера канала составляет 270,833 кбит/с.
В первой части цикла статей мы рассмотрели преобразование человеческого голоса в электрический сигнал. Теперь, казалось бы, самое время передать этот сигнал до местонахождения собеседника и начать разговор! Именно так первоначально и поступали. Однако чем более востребованной становилась услуга и чем на большие расстояния было необходимо передавать сигнал, тем понятнее становилось, что аналоговый сигнал для этого не годится.
Для того чтобы обеспечить передачу информации на любое расстояние без потери качества, нам потребуется произвести второе преобразование из Аналогового сигнала в Цифровой.
Эта картинка дает самое наглядное представление о том, что происходит при Аналого Цифровом Преобразовании (АЦП) а далее мы рассмотрим зачем это нужно, как происходило развитие технологии, и какие требования накладываются на такое преобразование в мобильных сетях.
Те, кто пропустил или подзабыл, о чем шла речь в первой части, могут вспомнить Как мы получили из звуковых колебаний электрический сигнал, а мы продолжим описание преобразований, перемещаясь по картинке, на которой обозначена новая область, интересующая нас в данный момент:
Сначала давайте поймем, зачем вообще нужно преобразовывать аналоговый сигнал, в какие-то последовательности нолей и единичек, которые без специальных знаний и математических преобразований и услышать невозможно.
После микрофона у нас есть аналоговый электрический сигнал, который можно с помощью динамика легко «озвучить», что, собственно, и производилось в первых опытах с телефонами: обратное преобразование «электрический сигнал – звуковая волна» выполняли в том же помещении или на минимальном расстоянии.
Только для чего нужен такой телефон? В соседнее помещение можно донести звуковую информацию без всяких преобразований – просто повысив голос. Поэтому появляется задача – услышать собеседника на максимальном расстоянии от инициатора разговора.
И вот тут в силу вступают неумолимые законы природы: чем больше расстояния, тем сильнее электрический сигнал в проводах затухает, и через какое-то количество метров/километров восстановить из него звук будет невозможно.
Те, кто застал городские проводные телефоны, работающие с декадно-шаговыми АТС (аналоговыми телефонными станциями), прекрасно помнят, какое качество голоса порой предоставлялось с помощью этих аппаратов. А кто-то может вспомнить и такие всеми забытые экзотические включения «через блокиратор» / «параллельный телефон», когда два телефона в одном доме включались на одну телефонную линию, при этом, когда один абонент занимал линию, второй был вынужден ждать окончания его разговора. Поверьте – это было нелегко!
То есть для увеличения количества одновременных вызовов между двумя точками, с использованием аналоговых линий нам требуется прокладывать все больше и больше проводов. К чему это может привести, можно оценить по городским пейзажам начала прошлого века:
Поэтому сразу после изобретения телефона, лучшие инженеры взялись за решение задачи: как передать голос на большие расстояния с максимальным сохранением качества и минимальными затратами на оборудование.
Что же нам необходимо для того, чтобы непрерывный аналоговый электрический сигнал превратился в дискретный, закодированный последовательностями нолей и единиц, и при этом передавал информацию максимально приближенную к оригиналу?
Чтобы преобразовать любой аналоговый сигнал в цифровой, необходимо через определенные промежутки времени (шаг дискретизации на картинке ниже) зафиксировать амплитуду сигнала с определенной точностью (шагом квантования).
После оцифровки получится ступенчатый график, показанный на рисунке. Для максимального приближения оцифрованного сигнала к аналоговому необходимо шаг дискретизации и шаг квантования выбирать как можно меньше, при бесконечных значениях мы получим идеально оцифрованную запись.
На практике бесконечная точность оцифровки не требуется, и нужно выбрать, какая точность может считать достаточной для передачи голоса с требуемым качеством?
Здесь нам на помощь придут знания о чувствительности человеческих органов слуха: принято считать, что человек может различать звуки с частотой от 20Гц до 22.000Гц. Это граничные значения для дискретизации, которые позволят передать любой звук, воспринимаемый человеком. Если перевести Гц в более привычные секунды – получим 0,000045 секунды, то есть измерения необходимо производить каждые 4,5 сто-тысячных секунды! Более того – и этого оказывается недостаточно. О причинах и требуемых значениях частоты дискретизации расскажем чуть ниже.
Теперь определимся с шагом квантования: шаг квантования позволяет присвоить в каждый момент времени определенное значение амплитуды измеряемому сигналу.
В первом приближении можно просто проверять наличие или отсутствие сигнала, для описания такого количества вариантов нам будет достаточно всего двух значений: 0 и 1. В информатике это соответствует количеству информации: 1 бит и битность записи будет равна 1. Если оцифровать любой звук с такой битностью, на выходе мы получим прерывистую запись, состоящую из пауз и звука одного тона, вряд ли это можно назвать записью голоса.
Поэтому придется увеличить количество измеряемых вариантов амплитуды, например, до 4 (то есть до 2 бит – 2 в степени 2): 0 — 0,25мА – 0,5мА – 0,75мА.
С такими значениями уже можно будет различить некоторые изменения звука после оцифровки, а не только его наличие или отсутствие. Иллюстрация прекрасно показывающая, что дает нам увеличение битности (квантования) при оцифровке звука, приведена на этом рисунке:
Теперь, увидев в свойствах музыкального файла цифры 44 кГц/16 бит, вы можете сразу понять, что Аналого-Цифровое Преобразование производилось с дискретизацией 1/44кГц = 0,000023 секунды и с глубиной квантования 2 в 16 степени – 65.536 вариантов значений.
Первые схемотехнические решения для выполнения АЦП-ЦАП преобразований были как всегда большими и медленными:
Сейчас эти задачи выполняются в основном процессоре мобильного телефона, который одновременно справляется с огромным количеством других задач:
Если провести оцифровку без дополнительной оптимизации полученной цифровой модели, объем полученных данных будет очень велик, достаточно вспомнить, сколько места на вашем диске может занять звуковой файл в несжатом виде. Стандартный CD, для примера, это 780 мегабайт информации и всего 74 минуты звука!
После обработки такого файла с применением алгоритмов оптимизации и сжатия с потерями данных (например, mp3) объем файла можно снизить в 10 и более раз.
Для наших целей объем получаемых данных имеет принципиальное значение, поскольку их еще необходимо передать до вашего собеседника, и ресурс транспортного канала очень ограничен.
Вновь задача для инженеров – максимальная оптимизация объема передаваемых данных с сохранением требуемого качества.
В разговорной речи, которая звучит во время телефонного диалога, спектр частот существенно ниже доступного для восприятия, поэтому для передачи телефонного разговора можно ограничиться более узким спектром: например 50..7000Гц. Про это мы достаточно подробно писали в материале о голосовых кодеках в мобильных сетях.
Теперь у нас есть исходные данные для начала преобразования – электрический аналоговый сигнал, в спектре 50-7000Гц, и нам необходимо провести преобразование А-ЦП, таким образом, чтобы искажение сигнала при преобразовании (те самые ступеньки на графике выше) не повлияло на качество записи. Для этого нужно выбрать значения шага дискретизации и шага квантования, достаточные для полного описания имеющегося аналогового сигнала.
Здесь нам на помощь придет одна из основополагающих теорем в области цифровой обработки сигналов — Теорема Котельникова.
В ней наш соотечественник математически обосновал, с какой частотой необходимо проводить измерения значений функции для её точного числового представления. Для нас важнейшее следствие данной теоремы заключается в следующем – измерения нужно проводить в два раза чаще самой высокой частоты, которую нам необходимо перевести в цифровой вид.
Поэтому шаг дискретизации для оцифровки разговора, будет достаточно взять на уровне 14 кГц, а для качественной оцифровки музыки — 2 х 22кГц, здесь мы и получаем стандартные 44кГц, с которыми сейчас, как правило, создаются музыкальные файлы.
Существует большое количество самых разнообразных голосовых кодеков, которые могут применяться в проводных и беспроводных сетях, причем кодеки для проводных сетей, в общем случае, кодируют голос с лучшим качеством, а кодеки для беспроводных сетей (сетей мобильных операторов) — с немного худшим качеством.
Зато эти кодеки генерируют дополнительные данные, для восстановления получаемого сигнала в случае неуспешной доставки из-за сложных радиоусловий. Эта особенность называется помехозащищенностью, и развитие кодеков для мобильных сетей происходит в направлении улучшения качества передаваемого сигнала с одновременным увеличением его помехозащищенности.
В мобильных сетях используются целые классы голосовых кодеков, которые включают в себя набор динамически выбираемых скоростей кодирования, в зависимости от текущего положения абонента и качества радиопокрытия в этой точке:
Кодек | Стандарт | Год создания | Диапазон сжимаемых частот | Создаваемый битрейт |
---|---|---|---|---|
Full Rate — FR | GSM 06.10 | 1990 | 200-3400 Hz | FR 13 kbit/s |
Half Rate — HR | GSM 06.20 | 1990 | 200-3400 Hz | HR 5.6 kbit/s |
Enhanced Full Rate — EFR | GSM 06.60 | 1995 | 200-3400 Hz | FR 12.2 kbit/s |
Adaptive Multi Rate — AMR | 3GPP TS 26.071 | 1999 | 200-3400 Hz | FR 12,20 |
Adaptive Multi Rate — AMR | 3GPP TS 26.071 | 1999 | 200-3400 Hz | FR 10,20 |
Adaptive Multi Rate — AMR | 3GPP TS 26.071 | 1999 | 200-3400 Hz | FR/HR 7,95 |
Adaptive Multi Rate — AMR | 3GPP TS 26.071 | 1999 | 200-3400 Hz | FR/HR 7,40 |
Adaptive Multi Rate — AMR | 3GPP TS 26.071 | 1999 | 200-3400 Hz | FR/HR 6,70 |
Adaptive Multi Rate — AMR | 3GPP TS 26.071 | 1999 | 200-3400 Hz | FR/HR 5,90 |
Adaptive Multi Rate — AMR | 3GPP TS 26.071 | 1999 | 200-3400 Hz | FR/HR 5,15 |
Adaptive Multi Rate — AMR | 3GPP TS 26.071 | 1999 | 200-3400 Hz | FR/HR 4.75 |
Adaptive Multi Rate — WideBand, AMR-WB | 3GPP TS 26.190 | 2001 | 50-7000 Hz | FR 23.85 |
Adaptive Multi Rate — WideBand, AMR-WB | 3GPP TS 26.190 | 2001 | 50-7000 Hz | FR 23.05 |
Adaptive Multi Rate — WideBand, AMR-WB | 3GPP TS 26.190 | 2001 | 50-7000 Hz | FR 19.85 |
Adaptive Multi Rate — WideBand, AMR-WB | 3GPP TS 26.190 | 2001 | 50-7000 Hz | FR 18.25 |
Adaptive Multi Rate — WideBand, AMR-WB | 3GPP TS 26.190 | 2001 | 50-7000 Hz | FR 15.85 |
Adaptive Multi Rate — WideBand, AMR-WB | 3GPP TS 26.190 | 2001 | 50-7000 Hz | FR 14.25 |
Adaptive Multi Rate — WideBand, AMR-WB | 3GPP TS 26.190 | 2001 | 50-7000 Hz | FR 12.65 |
Adaptive Multi Rate — WideBand, AMR-WB | 3GPP TS 26.190 | 2001 | 50-7000 Hz | FR 8.85 |
Adaptive Multi Rate — WideBand, AMR-WB | 3GPP TS 26.190 | 2001 | 50-7000 Hz | FR 6.60 |
Adaptive Multi Rate-WideBand+, AMR-WB+ | 3GPP TS 26.290 | 2004 | 50-7000 Hz | 6 — 36 kbit/s (mono) |
Adaptive Multi Rate-WideBand+, AMR-WB+ | 3GPP TS 26.290 | 2004 | 50-7000 Hz | 7 — 48 kbit/s (stereo) |
В таблице перечислены все кодеки, используемые в современных мобильных сетях, из них кодеки с динамическим битрейтом (в которых меняется соотношение полезных данных и избыточных для восстановления данных) имеют название AMR – Adaptive Multi Rate. Кодеки FR/HR/EFR используются только в сетях GSM.
Чтобы наглядно представить насколько больше данных кодируется в высокоскоростных кодеках, взгляните на следующую картинку:
Переход от кодеков класса AMR к AMR-WB почти удваивает количество данных, а AMR-WB+ требует еще на 40-50% больше ширины транспортного канала!
Именно поэтому в мобильных сетях широкополосные кодеки в мобильных сетях еще не нашли широкого применения, но в будущем возможен переход на Super Wide Band (AMR-WB+) и даже на Full Band полосу, к примеру для онлайн трансляций концертов.
Итак – после выполнения второй стадии преобразования голоса, мы вместо звуковых колебаний получаем поток цифровых данных, готовых к передаче через транспортную сеть.
До момента обратного преобразования цифр в аналоговый сигнал эти данные сохраняются почти без изменений (иногда в процессе доставки голоса может происходить перекодировка из одного кодека в другой), и дальнейшие преобразования происходящие с нашим голосом, будут касаться физической среды через которую передается вызов.
В следующем материале мы рассмотрим, что происходит между телефоном и базовой станцией и каким чудесным образом сформированный нами поток данных без проводов доставляется до оборудования оператора.
Аналоговый стандарт скандинавской мобильной телефонии (NMT-450 - Nordic Mobile Telephone) использует диапазон частот 453 - 468 МГц. В этом случае предоставляется значительно большая по сравнению с другими стандартами площадь обслуживания одной базовой станции и соответственно меньшие затраты, а также малое затухание сигнала на открытом пространстве. Возможность пользоваться связью на расстоянии в несколько десятков километров от базовой станции при благоприятных погодных условиях даже за пределами гарантированной зоны покрытия, если абонент может подключить высокоэффективные направленные антенны и усилители очень выгодно для обширных территорий с низкой плотностью населения. Обратной стороной медали является слабая помехоустойчивость, поскольку в этом частотном диапазоне уровень различного рода помех и их влияние выше, чем в диапазонах 800, 900 и 1800 МГц (особенно ощутимо в больших городах, где развита промышленная сеть), и меньшая, чем в цифровых стандартах системы связи (DCS - Digital Communication System), возможность предоставления широкого спектра сервисных услуг. Кроме всего прочего этот стандарт абсолютно не защищен от прослушивания, поскольку его полоса частот типична для приема приемника ультракоротких волн соответствующего диапазона. В довершение ко всему стоит отметить, что аналоговые стандарты планируется заменить цифровыми - например, NMT-450 на GSM-400.
Аналоговый стандарт AMPS (Advanced Mobile Phone Service) с рабочим диапазоном частот 825 - 890 МГц характеризуется более высокой, чем у NMT-450, емкостью сетей и более надежной связью в помещениях, низкой восприимчивостью к индустриальным и атмосферным помехам. Однако меньшая зона устойчивой связи для одной базовой станции вынуждает операторов ставить их ближе друг к другу. Учитывая данные недостатки, был разработан цифровой улучшенный стандарт DAMPS.
Цифровой стандарт DAMPS (Digital Advanced Mobile Phone Service) с рабочим диапазон частот 825 - 890 МГц обладает емкостью сетей значительно выше, чем у NMT-450 и AMPS. Возможность эксплуатации мобильных аппаратов как в цифровом, так и в аналоговом режимах, широкий спектр сервисных услуг, а так же емкость сетей сотовой связи, работающих в этом стандарте, ниже, чем в полностью цифровых системах, но все же значительно выше, чем в аналоговых. Если при роуминге абонент из аналоговой сети AMPS попадает в цифровую - DAMPS, для работы ему выделяются аналоговые каналы, однако в этом случае преимущества цифровой связи недоступны.
Но главная особенность цифровой техники - программное управление многими процессами, включая формирование логических каналов, переключение подвижного абонента между сотами, организация современных протоколов связи на основе эталонной модели взаимосвязи открытых систем (MOSC - Open System Communication Model) международной организации по стандартизации (ISO - International Standards Organization), а также управление с помощью интеллектуальной сети. Эти преимущества определили дальнейшее развитие сотовых систем в 90-х годах на основе цифровой техники.
Существует несколько стандартов цифровых систем связи: европейский GSM (Global System for Mobile communications), американский ADS (American Digital System), традиционно использующийся в США PCS (Personal Communications Service), английский (DCS - Digital Cellular System) DCS-1800, являющийся прямым аналогом GSM-1800, и японский JDS (Japan Digital System). В странах СНГ более широко применяется стандарт GSM. Это стандарт, определяющий работу в радиотелефонных сетях общего пользования, получил распространение в Европе, однако в США принят стандарт PCS-1900, что говорит о его несовместимости с европейским вследствие различных радиочастот, применяемых для связи. В частности, европейский институт стандартизации телекоммуникаций (ETSI - the European Telecommunications Standards Institute) стандартизировал и определил основные положения действующих в настоящее время в Европе стандартов мобильной связи.
Для работы сотовых систем общего пользования в большинстве стран СНГ были выделены частотные диапазоны: 450МГц - для аналоговой системы NMT-450i и диапазон 900МГц - для систем GSM. Эти две системы стандартов NMT-450i и GSM-900 получили статус федеральных. Дальнейшее развитие сотовых систем связано как с освоением для системы GSM диапазона 1800МГц, так и с переходом к третьему поколению сотовых систем, которые позволяют более гибко решать задачи предоставления каналов подвижным абонентам (в том числе с разными скоростями передачи) за счет широкополосных систем передачи и множественного кодового разделения каналов (СDМА - Code Division Multiple Access).
Современный мобильный радиотелефон - очень сложный и совершенный прибор, в котором реализованы новейшие научно-технические достижения. Ниже в качестве примера рассматривается стандарт GSM, основанный на комбинации FDMA и TDMA, который получил в настоящее время в странах СНГ наибольшее распространение, отличаясь высоким совершенством и ориентированием на перспективу создания универсальной системы персональной связи.
КОНЦЕПЦИИ ЦИФРОВЫХ СИСТЕМ СВЯЗИ
На основании этих данных формируется представление системы о мобильном пользователе (его местоположение, статус в сети и т. д.) и происходит соединение. Если мобильный пользователь во время разговора перемещается из зоны действия одного ретранслятора в зону действия другого, или даже между зонами действия разных контроллеров, связь не обрывается и не ухудшается, поскольку система автоматически выбирает ту базовую станцию, с которой связь лучше. В зависимости от загруженности каналов телефон выбирает между сетью 900 и 1800 МГц, причем переключение возможно даже во время разговора абсолютно незаметно для говорящего.
Звонок из обычной телефонной сети мобильному пользователю осуществляется в обратной последовательности: сначала определяются местоположение и статус абонента на основании постоянно обновляющихся данных в регистрах, а затем происходят соединение и поддержание связи.
Указание мощности в децибелах более удобно для расчета бюджета радиолинии, когда значения усиления и затухания в различных звеньях тракта передачи просто суммируются с соответствующими знаками. Как и финансовый бюджет, бюджет радиолинии определяет достаточность выделяемых средств для решения поставленной задачи - в данном случае для получения требуемого качества связи. При анализе такого бюджета необходимо учитывать как факторы, добавляющие децибелы (например, мощность передатчика, коэффициент усиления антенны), так и факторы, уменьшающие децибелы (например, замирания). Обычно приемник требует определенного уровня сигнала в децибелах плюс некоторый запас на замирания, обеспечивающий гарантированное качество связи. В отличие от аналоговых систем, в которых качество связи характеризуется влиянием внутренних и внешних помех, при рассмотрении цифровых каналов все виды помех сводятся к единственному их проявлению - появлению ошибок в отдельных передаваемых символах. Поэтому качество цифровых каналов передачи характеризуется просто частотой ошибок.
Однако, из этого не следует, что и у передатчиков сотовой связи мощность повышается с увеличением частоты. Наоборот, в версии системы GSM, работающей в диапазоне 1800МГц, мощности передачи на порядок ниже, чем в системе GSM-900. Если взять за основу приведенную ранее таблицу, то мощность абонентского аппарата системы GSM-1800 находится в пределах от 1Вт (вместо 8Вт в GSM-900, класс 2) до 0.25Вт (класс 5), а мощность базовой станции от 20Вт (класс 1) до 2Вт (класс 4), что объясняется размером сот. Однако на текущий момент для подвижных аппаратов системы GSM-900 мощность составляет максимум до 1Вт, реально же еще меньше. Поэтому цифры, приводимые в таблице ранее, на данный момент уже не актуальны, но приводятся для наглядности характеристики зависимости мощностей аппарата и базовой станции. Система GSM-900 рассчитана на соты радиусом в несколько десятков километров (приблизительно до 35км), а система GSM-1800 - на соты радиусом в несколько километров. Таким образом, при уменьшении мощности на порядок охватываемая площадь соты уменьшается на два порядка.
Важнейшими причинами повышенного затухания сигналов являются теневые зоны, создаваемые зданиями или естественными возвышенностями на местности. Исследования условий применения подвижной радиосвязи в городах показали, что даже на очень близких расстояниях теневые зоны дают затухание до 20дБ. Другой важной причиной затухания является листва деревьев. Например, на частоте 836МГц в летнее время, когда деревья покрыты листвой, уровень принимаемого сигнала оказывается приблизительно на 10дБ ниже, чем в том же месте зимой, при отсутствии листьев. Замирания сигналов от теневых зон иногда называют медленными с точки зрения условий их приема в движении при пересечении такой зоны.
Важное явление, которое приходится учитывать при создании сотовых систем подвижной радиосвязи - отражение радиоволн, и, как следствие, их многолучевое распространение. С одной стороны, это явление полезно, так как оно позволяет радиоволнам огибать препятствия и распространяться за зданиями, в подземных гаражах и тоннелях. Но с другой стороны, многолучевое распространение порождает такие трудные для радиосвязи проблемы, как растягивание задержки сигнала, релеевские замирания и усугубление эффекта Доплера.
Растягивание задержки сигнала получается из-за того, что сигнал, проходящий по нескольким независимым путям разной протяженности, принимается несколько раз. Поэтому повторяющийся импульс может выйти за пределы отведенного для него интервала времени и исказить следующий символ. Искажения, возникающие за счет растянутой задержки, называются межсимвольной интерференцией. При небольших расстояниях растянутая задержка не опасна, но если соту окружают горы, задержка может растянуться на многие микросекунды (иногда 50-100 мкс).
Эффект Доплера проявляется при движении приемника относительно передатчика и состоит в изменении частоты принимаемого колебания. Подобно тому, как тон шума движущегося поезда или автомобиля кажется неподвижному наблюдателю несколько выше при приближении транспортного средства и несколько ниже при его удалении, частота радиопередачи смещается при движении приемопередатчика. Более того, при многолучевом распространении сигнала отдельные лучи могут давать смещение частоты в ту или другую сторону одновременно. В результате, за счет эффекта Доплера получается случайная частотная модуляция передаваемого сигнала подобно тому, как за счет релеевских замираний происходит случайная амплитудная модуляция. Таким образом, в целом многолучевое распространение создает большие трудности в организации сотовой связи, в особенности для подвижных абонентов, что связано с медленными и быстрыми замираниями амплитуды сигнала в движущемся приемнике. Преодолеть эти трудности удалось с помощью цифровой техники, которая позволила создать новые методы кодирования, модуляции и выравнивания характеристик каналов.
Передача данных осуществляется по радиоканалам. Сеть GSM работает в диапазонах частот 900 или 1800 МГц. Более конкретно, например, в случае рассмотрения диапазона 900МГц подвижной абонентский аппарат передает на одной из частот, лежащих в диапазоне 890-915 МГц, а принимает на частоте, лежащей в диапазоне 935-960 МГц. Для других частот принцип тот же, изменяются только численные характеристики.
По аналогии со спутниковыми каналами направление передачи от абонентского аппарата к базовой станции называется восходящим (Rise), а направление от базовой станции к абонентскому аппарату - нисходящим (Fall). В дуплексном канале, состоящем из восходящего и нисходящего направлений передачи, для каждого из названных направлений применяются частоты, различающиеся точно на 45МГц. В каждом из указанных выше частотных диапазонов создаются по 124 радиоканала (124 для приема и 124 для передачи данных, разнесенных на 45МГц) шириной по 200кГц каждый. Этим каналам присваиваются номера (N) от 0 до 123. Тогда частоты восходящего (F R ) и нисходящего (F F ) направлений каждого из каналов можно вычислить по формулам: F R (N) = 890+0.2N (МГц), F F (N) = F R (N) + 45 (МГц).
В распоряжение каждой базовой станции может быть предоставлено от одной до 16 частот, причем число частот и мощность передачи определяются в зависимости от местных условий и нагрузки.
В каждом из частотных каналов, которому присвоен номер (N) и который занимает полосу 200кГц, организуются восемь каналов с временным разделением (временные каналы с номерами от 0 до 7), или восемь канальных интервалов.
Система с разделением частот (FDMA) позволяет получить 8 каналов по 25кГц, которые, в свою очередь, разделяются по принципу системы с разделением времени (TDMA) еще на 8 каналов. В GSM используется GMSK-модуляция, а несущая частота изменяется 217 раз в секунду для того, чтобы компенсировать возможное ухудшение качества.
Когда абонент получает канал, ему выделяется не только частотный канал, но и один из конкретных канальных интервалов, и он должен вести передачу в строго отведенном временном интервале, не выходя за его пределы - иначе будут создаваться помехи в других каналах. В соответствии с вышеизложенным работа передатчика происходит в виде отдельных импульсов, которые происходят в строго отведенном канальном интервале: продолжительность канального интервала составляет 577мкс, а всего цикла - 4616мкс. Выделение абоненту только одного из восьми канальных интервалов позволяет разделить во времени процесс передачи и приема путем сдвига канальных интервалов, выделяемых передатчикам подвижного аппарата и базовой станции. Базовая станция (BS) всегда передает на три канальных интервала раньше подвижного аппарата (HS).
Требования к характеристикам стандартного импульса описываются в виде нормативного шаблона изменения мощности излучения во времени. Процессы включения и выключения импульса, которые сопровождаются изменением мощности на 70дБ, должны укладываться в промежуток времени длительностью всего 28мкс, а рабочее время, в течение которого передаются 147 двоичных разрядов, составляет 542.8мкс. Значения мощности передачи, указанные в таблице ранее, относятся именно к мощности импульса. Средняя же мощность передатчика оказывается в восемь раз меньше, так как 7/8 времени передатчик не излучает.
Последовательность импульсов образует физический канал передачи, который характеризуется номером частоты и номером временного канального интервала. На основе этой последовательности импульсов организуется целая серия логических каналов, которые различаются своими функциями. Кроме каналов, передающих полезную информацию, существует еще ряд каналов, передающих сигналы управления. Реализация таких каналов и их работа требуют четкого управления, которое реализуется программными средствами.
GSM И КОМПЬЮТЕР
Поскольку эта тема выходит за рамки настоящей статьи, однако очень интересна и актуальна, то в нескольких словах на самом простейшем уровне, думается, стоит ее коснуться.
Читайте также: