Как функционирует голосовая телефонная служба?

Технически аудиотекс состоит из голосового сервера, как правило, интерактивного, соединенного с сетями телекоммуникаций. Голосовой сервер способен передавать звуковые послания либо предварительно записанные, либо созданные в процессе голосового синтеза, в индивидуальной манере и большому количеству потребителей одновременно. Компьютер может управляться с помощью клавиатуры телефона или даже голосом.

В широком смысле, в понятие аудиотекс можно включать и иные способы использования телефонных технологий, имеющих связь с сервером: автоматическую передачу вызова, службы факса и т.д. И это не будет преувеличением: голосовой сервер может встраиваться в систему телекоммуникаций предприятий для того, чтобы, например, принимать сообщения пользователей и передавать вызов конкретному оператору, принимать персональные сообщения и т.д. Голосовой сервер — это разумная машина, состоящая либо из компьютера, способного принимать голосовые сообщения, которые поступают по линиям связи; распознавать голос или воспринимать сигналы от кнопок телефона, соответственно голосом отвечать, либо из усовершенствованного автокоммуникатора, имеющего программу, позволяющую выполнять команды, и жесткий диск, предназначенный для цифровой записи звуковых сообщений.

Запись и возвращение звука. Голосовой синтез, который имеет ввиду превращение в искусственный голос письменных текстов, на сегодня еще очень мало используется в аудиотексе и не предназначается для массового потребителя: несмотря на большой прогресс в этой области, ответ получается не всегда точным, понятным, не считая того, что еще практически невозможно синтезировать красивый женский или мужской голос. Для ответа потребителям звук предварительно записывается, как правило, в цифровой форме и затем преобразуется в аналоговый сигнал. Запись может осуществляться в обычных условиях, даже по телефону. Но запись в студии, осуществленная профессиональными дикторами, остается предпочтительной, особенно если нужно гарантировать естественность и использовать в максимальной мере человеческий характер аудиотекса.

При необходимости ответ потребителю может быть прямым. При этом используются либо полностью записанные стандартные ответы, либо они составляются по определенной программе, но компьютер ведет диалог с помощью отдельных частей (фраз), предварительно записанных. Эти программы могут использоваться для сообщения цифр (например, состояние банковского счета), дат или времени (говорящие часы) и т.д. Соединение отдельных частей должно быть осуществлено с предельной точностью и быстротой, чтобы гарантировать естественный ответ, несмотря на операцию соединения, проводимую компьютером.

Факт записи и передачи звуковых сообщений по технологии аудиотекса остается более дорогим, чем его аналог по видеотексу. Одна секунда звука представляет собой объем записи и передачи в 32000 бит/с, тогда как видеотекс начинал работать со скоростью 1200 бит/с, в 24 раза медленней. И если говорить об эквивалентном числе одновременных пользователей, то возможность обрабатывать сигнал у сервера аудиотекса должна быть намного выше, чем у сервера видеотекса.

В 1993 году средняя плата видеотекса в компьютере позволяла вести диалог одновременно с 64 пользователями, а средняя звуковая карта не более, чем с 8. Однако с развитием компьютерных технологий эта разница быстро стиралась. Сегодня, когда компьютерные сети используются для передачи не только текстов, но и звука, изображений и видео, т.е. стали мультимедийными, возможности аудиотекса и видеотекса взаимодополняются.