Tonmind Dynamic Sound использует кодек Speex для обеспечения высококачественного звука. Speex - это открытый формат сжатия звука и бесплатное ПО, разработанное специально для передачи речи. Он является частью проекта GNU и доступен по пересмотренной лицензии BSD.
Этот формат аудиокодирования призван предоставить бесплатную альтернативу дорогим проприетарным речевым кодекам, снизить барьер входа для голосовых приложений и обеспечить эффективное использование в интернет-приложениях.
Speex был разработан для передачи голоса по IP (VoIP) и сжатия файлов. Было необходимо создать кодек, который обеспечивает высокое качество речи при низкой скорости передачи данных. Для достижения этой цели Speex использует несколько битовых скоростей и поддерживает различные режимы. Кодек способен обрабатывать потерянные пакеты, но менее эффективен при работе с поврежденными пакетами. Для кодирования звука Speex использует метод линейного предсказания с возбуждением кода (CELP).
Технические особенности:
Частота дискретизации:
Speex поддерживает три различные частоты дискретизации:
- узкополосная 8 кГц (аналогичная частота у передачи телефонных звонков)
- широкополосная 16 кГц и
- сверхширокополосная 32 кГц.
Качество:
Кодирование в Speex контролируется параметром качества, который может варьироваться от 0 до 10. При использовании постоянной скорости передачи (CBR) параметр качества задается целым числом, а при использовании переменной скорости передачи (VBR) - числом с плавающей точкой.
Сложность (переменная):
В Speex можно настраивать сложность кодировщика. Это осуществляется путем установки значения от 1 до 10, аналогично опциям сжатия gzip. При обычном использовании уровень шума при сложности 1 - на 1-2 дБ выше, чем при сложности 10, но требования к процессору для сложности 10 примерно в пять раз выше, чем для сложности 1.
Как правило, оптимальный компромисс - сложность 2 или 4, но более высокие значения могут быть полезны при кодировании неречевых звуков, таких как тоновые сигналы DTMF, или если кодирование не выполняется в режиме реального времени.
Переменный битрейт (VBR):
При использовании переменного битрейта (VBR) кодек может динамически изменять скорость передачи данных в зависимости от сложности звука, который кодируется.
Например, гласные и высокоэнергетические переходные процессы требуют более высокого битрейта для достижения хорошего качества, в то время как фрикативные звуки (например, звуки "s" и "f") могут быть адекватно закодированы с меньшим количеством битов. VBR позволяет достичь меньшей скорости передачи данных при сохранении качества звука или лучшего качества при определенной скорости передачи данных.
Однако VBR имеет и некоторые особенности: при указании только параметра качества, нельзя гарантировать конечный средний битрейт. Для некоторых real-time приложений (передача голоса по IP (VoIP), важен максимальный битрейт, при этом достаточно низким для канала связи. И, наконец, шифрование VBR-кодированной речи может не обеспечить полной
конфиденциальности: фразы все еще могут быть идентифицированы, по крайней мере, в контролируемых условиях с небольшим словарем фраз, путем анализа модели изменения скорости передачи данных.
Средний битрейт (ABR):
Средний битрейт (ABR) представляет собой решение для одной из проблем VBR, связанной с настройкой качества для достижения определенного среднего битрейта. Поскольку качество/битрейт настраивается в реальном времени (без обратной связи), общее качество может немного снизиться по сравнению с VBR при точной настройке для достижения целевого среднего битрейта.
Обнаружение голосовой активности (VAD):
При включении функции обнаружения голосовой активности (VAD) кодек определяет, является ли звук, который кодируется, речью или тишиной/фоновым шумом. VAD автоматически активируется при кодировании в режиме VBR, поэтому эта опция полезна только при отсутствии VBR. В этом случае Speex обнаруживает периоды без речи и кодирует их с достаточным количеством битов для воспроизведения фонового шума. Этот процесс называется "генерацией комфортного шума" (CNG). Обратите внимание, что начиная с версии 1.2, VAD был заменен простым обнаружением любой активности, и последняя версия, в которой VAD работал нормально, - 1.1.12.
Прерывистая передача (DTX):
Прерывистая передача (DTX) является дополнением к функциям VAD/VBR и позволяет полностью прекратить передачу данных, когда фоновый шум является неподвижным. В этом случае на каждый пропущенный кадр используется всего 5 бит (что соответствует скорости передачи 250 бит/с).
Улучшение восприятия:
Улучшение восприятия - это часть декодера, которая пытается уменьшить шум, создаваемый процессом кодирования/декодирования. В большинстве случаев перцептивное улучшение делает звук более отдаленным от оригинала с точки зрения соотношения сигнал/шум, но в результате звучит субъективно лучше.
Алгоритмическая задержка:
Каждый кодек вносит задержку в передачу звука. Для Speex эта задержка составляет размер кадра плюс некоторое количество предварительного ожидания, необходимого для обработки каждого кадра. В узкополосном режиме (8 кГц) задержка составляет 30 мс, а в широкополосном режиме (16 кГц) - 34 мс. Указанные значения не включают время, требуемое для кодирования или декодирования кадров с использованием процессора.
Итак, это основные характеристики и функции кодека Speex, который используется в динамике Tonmind для обеспечения качественного звука.
Speex предлагает гибкость и оптимизацию для различных режимов передачи, позволяет настраивать качество и сложность кодирования, а также имеет функции обнаружения голосовой активности и прерывистой передачи для повышения эффективности передачи данных.
Купить IP-громкоговорители для систем оповещения Tonmind можно у наших менеджеров по телефону +7 495 118 3237 или электронной почте info@c-sb.ru