Использование вами функций Riva для распознавания речи и преобразования текста в речь регулируется нашими Условиями использования. Ваши данные будут использоваться для улучшения продуктов и услуг NVIDIA.
Элементы ИИ для обработки речи — автоматическое распознавание речи (ASR) и преобразование текста в речь (TTS) — меняют процесс взаимодействия предприятий со своими клиентами и поддержки своих клиентов во всех отраслях. NVIDIA® Riva является частью платформы NVIDIA ИИ и предоставляет современные рабочие процессы, оптимизированные под GPU, для создания и развертывания полностью настраиваемых конвейеров искусственного интеллекта в реальном времени. Они используются для таких приложений, как помощники операторов контакт-центра, виртуальные помощники, цифровые аватары, голоса брендов и расшифровка записей видеоконференций. Riva позволяет адаптировать приложения для своего варианта использования и развертывать их во всех облаках, в дата-центрах, на периферийных или на встраиваемых устройствах.
В этой демонстрации система распознавания речи Riva генерирует высокоточные расшифровки в реальном времени.
Запишите голос на микрофон или загрузите готовый файл в формате .wav с вашего устройства.
Ограничение продолжительности записи — 30 секунд.
Если вы хотите добавить голосовые функции своему интерактивному виртуальному помощнику, современному домашнему устройству или помощнику для чтения для слабовидящих или людей, испытывающих затруднения при чтении, попробуйте встроенный английский женский или мужской голос в Riva.
Оцените аналогичные человеческим, выразительные голоса, созданные с помощью современных нейронных моделей для синтеза речи Riva.
Использование вами функций Riva для распознавания речи и преобразования текста в речь регулируется нашими Условиями использования. Ваши данные будут использоваться для улучшения продуктов и услуг NVIDIA.
Riva предлагает:
Предварительно обученные модели ИИ для обработки речи SOTA: модели ASR и TTS полностью настраиваются для наборов данных и ускоряют разработку предметно-ориентированных моделей в 10 раз.
Высокопроизводительный инференс: инференс основан на оптимизациях NVIDIA TensorRT™ и обеспечивается с помощью сервера для инференса NVIDIA Triton™ — обоих компонентов платформы искусственного интеллекта NVIDIA.
Сервисы Riva: доступны в виде микросервисов на основе gRPC для потоковой передачи с малой задержкой и использования в автономном режиме с высокой пропускной способностью.
Обучите и разверните комплексный конвейер ИИ для обработки речи с помощью NVIDIA Riva.
Современные модели, предварительно обученные на тысячах часов аудио на суперкомпьютерах NVIDIA.
Гото��ые модели и гибкие конвейеры, точно настраиваемые для вашего варианта использования, отрасли и области.
Поддерживает масштабирование до сотен тысяч одновременных пользователей в облаке, дата-центре и на периферийных устройствах.
Производительность в реальном времени намного ниже порогового значения 300 миллисекунд благодаря мощным оптимизациям ИИ NVIDIA с NVIDIA TensorRT™.
Обеспечивает работу сервисов ИИ для обработки речи с минимальным временем простоя и максимальной загрузкой системы.
Вы можете получить поддержку Riva через программное обеспечение NVIDIA AI Enterprise или бесплатно загрузить контейнеры и предварительно обученные модели.
Программное обеспечение NVIDIA AI Enterprise обеспечит корпоративную поддержку NVIDIA для крупномасштабных развертываний Riva.
Что включено:
Набор инструментов NVIDIA Riva доступен в виде набора контейнеров и предварительно обученных моделей на сайте NVIDIA NGC™ бесплатно для участников программы NVIDIA Developer.
Что включено:
Технология распознавания речи обеспечивает голосовой поиск в Интернете, работу в режиме громкой связи, голосовые команды для устройств умного дома и автомобильных помощников, ведение медицинских записей, круглосуточные виртуальные помощники в контакт-центре, а также расшифровку телефонных звонков и видеоконференций для выявления закономерностей и тенденций. Автоматическое распознавание речи (ASR) NVIDIA Riva обеспечивает первоклассные точные расшифровки на основе оптимизированных на GPU моделей, полностью настраиваемых для любой предметной области или платформы развертывания.
Преобразование текста в речь создает голоса, которые озвучивают электронные книги и документы, общаются с людьми в качестве умных помощников или цифровых аватаров и являются частью почти всех цифровых устройств, включая смартфоны, планшеты и ноутбуки. Преобразование текста в речь (TTS) NVIDIA Riva обеспечивает похожие на человеческие синтетические голоса на основе современных моделей генерации спектрограмм и вокодера. Конвейеры TTS оптимизированы на GPU и настраиваются для эффективной работы в режиме реального времени.
Получите немедленный доступ к NVIDIA Riva на бесплатном курсе практических заданий. Получите доступ к пошаговым практическим курсам по ИИ для обработки речи, включающим готовое программное обеспечение, примеры данных и приложения.
Riva на встраиваемых устройствах обеспечивает надежную и лучшую в своем классе точную расшифровку речи в режиме реального времени и выразительные, похожие на человеческие голоса для разговорных приложений на таких устройствах, как роботы-доставщики, интеллектуальные бесконтактные киоски, торговые автоматы и виртуальные помощники для фабрик, магазинов, медицинских учреждений и устройств умного дома.
NCS использовала NVIDIA Riva TTS для настройки голоса сингапурца с местным произношением, тоном и акцентом для десятков тысяч активных пользователей Breeze (приложения компаньона водителя), тысячи из которых обращаются к приложению одновременно.
T-Mobile использует NVIDIA Riva ASR в своем колл-центре для точной расшифровки разговоров с клиентами и мгновенного предоставления операторам рекомендаций для быстрого решения запросов клиентов.
В Data Monsters добавили речевой конвейер для приложения Plabook с помощью NVIDIA Riva, чтобы помочь учащимся читать, оценивать точность на уровне фонемы и предоставлять индивидуальную обратную связь.
Благодаря NVIDIA Riva компания RingCentral добилась непревзойденной точности транскрибирования в реальном времени для видеоконференций, обслуживая миллионы пользователей с разными акцентами и профессиональным жаргоном.
Компания Tarteel использует NVIDIA Riva и NVIDIA NeMo, чтобы в режиме реального времени предоставлять отзывы о рецитации Корана, помогая мусульманам, преподавателям, авторам контента и исследователям.
Floatbot использует NVIDIA Riva и NVIDIA TAO для своих настраиваемых приложений речевого ИИ на сингапурском английском, автоматизируя колл-центры для страховых компаний и финансовых клиентов по всему миру.
Получите доступ к курсу практических занятий по NVIDIA Riva для тестирования и создания прототипов решений на основе речи.
Разверните NVIDIA Riva из NVIDIA NGC.
Свяжитесь с экспертами, чтобы узнать о передовых методах создания и развертывания приложений ИИ для обработки речи.
Узнайте об основных возможностях Riva, которые помогут вам создавать сервисы ИИ для обработки речи.
Получите все необходимое, чтобы приступить к созданию конвейеров ИИ для обработки речи с помощью NVIDIA Riva, включая обучающие материалы, записные книжки Jupyter и документацию.
Узнайте, как ИИ NVIDIA помогает создавать и запускать передовые приложения ИИ для обработки речи в рамках тысяч трансляций в режиме реального времени.
Узнайте, как приступить к интеграции и развертыванию моделе�� Riva ASR и TTS в производственной среде с высокопроизводительным инференсом и минимальными усилиями.
Подпишитесь, чтобы получать свежие новости от NVIDIA по ИИ для обработки речи.
Быстро реализуйте свои проекты ИИ для обработки речи с помощью Riva на Launchpad.