Компания НордСофт информирует о запуске сервиса распознавания речи - поддержке нового механизма платформы "1С:Предприятие 8", начиная с версии 8.3.23 27.12.2022 13:11
Компания НордСофт информирует о запуске сервиса распознавания речи - поддержке нового механизма платформы "1С:Предприятие 8", начиная с версии 8.3.23.
Автоматическое преобразование речи в текст помогает усовершенствовать бизнес-процессы в различных сценариях использования:
- Распознавание речи позволит быстрее и проще надиктовать длинные тексты вместо их набора с клавиатуры. Электронные письма, текстовые блоки в документах, содержание задач и комментариев удобнее вводить голосом, особенно, если у пользователя заняты руки, а также при работе на мобильных устройствах.
- Можно распознавать записи телефонных звонков или совещаний при хорошем качестве аудиозаписи. Для получения лучшего результата рекомендуется записывать отдельные звуковые каналы для каждого собеседника.
- Можно разработать на 1С голосовое управление интерфейсом приложений: по команде голосом открывать нужные формы, строить отчеты, выполнять поиск, заполнять реквизиты.
Можно применять в голосовых системах самообслуживания, для речевой аналитики работы с клиентами, а также при создании интерфейсов для людей с ограниченными возможностями.
- Использовать работу с дополнительной грамматикой при потоковом распознавании речи: при начале распознавания вы можете передать какие-то специфичные термины (фамилии сотрудников, названия номенклатуры или компаний-контрагентов), и сервис будет их уверенно распознавать.
В рамках сервиса доступны следующие услуги:
1. Потоковое распознавание - пользователь отправляет аудиоданные в режиме реального времени, в ответ периодически получает распознанный текст. Это удобно для того, чтобы надиктовать письма, или реализовать управление интерфейсом программы.
Длительность одного сеанса при потоковом распознавании речи с помощью сервиса имеет ограничение в 2 часа. Потоковое распознавание при локальном распознавании речи по длительности сеанса не ограничено.
2. Файловое распознавание - пользователь отправляет в сервис файл с аудио, в ответ получает идентификатор задачи, по которому в дальнейшем сможет получить результат распознавания. В данном случае, пользователь может отправить готовый аудио-файл, например, запись совещания. Распознанный текст будет предоставлен пользователю с задержкой, которая зависит от длительности аудиофайла и загрузки сервиса.
Файловое распознавание может обрабатывать многоканальные аудиозаписи, в этом случае каждый канал будет распознаваться независимо. Для распознавания принимаются форматы аудио: WAV signed 16 bit little-endian и Opus в контейнере ogg. Частота дискретизации аудио: от 8 кГц до 48кГц. Максимальный размер аудиофайла – 1 Гб длительностью до 4 часов. Результаты распознавания доступны для скачивания из сервиса в течение 7 суток после выполнения задания.
Компания НордСофт информирует о запуске сервиса распознавания речи - поддержке нового механизма платформы "1С:Предприятие 8", начиная с версии 8.3.23.
Автоматическое преобразование речи в текст помогает усовершенствовать бизнес-процессы в различных сценариях использования:
- Распознавание речи позволит быстрее и проще надиктовать длинные тексты вместо их набора с клавиатуры. Электронные письма, текстовые блоки в документах, содержание задач и комментариев удобнее вводить голосом, особенно, если у пользователя заняты руки, а также при работе на мобильных устройствах.
- Можно распознавать записи телефонных звонков или совещаний при хорошем качестве аудиозаписи. Для получения лучшего результата рекомендуется записывать отдельные звуковые каналы для каждого собеседника.
- Можно разработать на 1С голосовое управление интерфейсом приложений: по команде голосом открывать нужные формы, строить отчеты, выполнять поиск, заполнять реквизиты.
Можно применять в голосовых системах самообслуживания, для речевой аналитики работы с клиентами, а также при создании интерфейсов для людей с ограниченными возможностями.
- Использовать работу с дополнительной грамматикой при потоковом распознавании речи: при начале распознавания вы можете передать какие-то специфичные термины (фамилии сотрудников, названия номенклатуры или компаний-контрагентов), и сервис будет их уверенно распознавать.
В рамках сервиса доступны следующие услуги:
1. Потоковое распознавание - пользователь отправляет аудиоданные в режиме реального времени, в ответ периодически получает распознанный текст. Это удобно для того, чтобы надиктовать письма, или реализовать управление интерфейсом программы.
Длительность одного сеанса при потоковом распознавании речи с помощью сервиса имеет ограничение в 2 часа. Потоковое распознавание при локальном распознавании речи по длительности сеанса не ограничено.
2. Файловое распознавание - пользователь отправляет в сервис файл с аудио, в ответ получает идентификатор задачи, по которому в дальнейшем сможет получить результат распознавания. В данном случае, пользователь может отправить готовый аудио-файл, например, запись совещания. Распознанный текст будет предоставлен пользователю с задержкой, которая зависит от длительности аудиофайла и загрузки сервиса.
Файловое распознавание может обрабатывать многоканальные аудиозаписи, в этом случае каждый канал будет распознаваться независимо. Для распознавания принимаются форматы аудио: WAV signed 16 bit little-endian и Opus в контейнере ogg. Частота дискретизации аудио: от 8 кГц до 48кГц. Максимальный размер аудиофайла – 1 Гб длительностью до 4 часов. Результаты распознавания доступны для скачивания из сервиса в течение 7 суток после выполнения задания.