IA de Voz y Traducción

NVIDIA Riva

Cree e implemente IA de voz y traducción multilingüe totalmente personalizable para su grande modelo de lenguaje y aplicaciones basadas en generación de recuperación aumentada.

¿Qué Es NVIDIA Riva?

NVIDIA® Riva es un conjunto de microservicios de traducción y voz multilingües acelerados por GPU para crear pipelines de IA conversacional en tiempo real y totalmente personalizables. Riva incluye reconocimiento automático de voz (ASR), texto a voz (TTS) y traducción automática neuronal (NMT) y se puede implementar en todas las nubes, en data centers, en el edge o en dispositivos integrados. Con Riva, las organizaciones pueden agregar interfaces de voz y traducción con grandes modelos de lenguaje (LLM) y generación de recuperación aumentada (RAG) para transformar los chatbots en asistentes y avatares multilingües atractivos y expresivos .

Presentamos la Magia de la IA de Voz y Traducción de Extremo a Extremo

Ofrezca chatbots de IA con transcripción, traducción y voces multilingües de última generación.

Vea a Riva en Acción

Pruebe el Reconocimiento Automático de Voz de NVIDIA Riva

Seleccione el idioma y compruebe cómo Riva ASR ofrece una transcripción altamente precisa en tiempo real proporcionando una entrada a través de su micrófono o cargando un archivo .wav desde su dispositivo.

Nota: La duración de cada muestra está limitada a 30 segundos.

Try saying something

Pruebe la Conversión de Texto a Voz de NVIDIA Riva

Seleccione una voz y escriba una oración de prueba para escuchar la voz masculina o femenina en inglés innovadora de Riva.

Nota: El texto ingresado está limitado a 400 caracteres.

El uso de las habilidades de Riva está sujeto a los términos de uso de NVIDIA Riva. Sus datos se utilizarán para mejorar los productos y servicios de NVIDIA.

Beneficios de NVIDIA Riva

Voces Multilingües Altamente Precisas y Expresivas

Logre una alta precisión de transcripción para traducciones bilingües y multilingües e implemente voces femeninas y masculinas profesionales expresivas y listas para usar con modelos de última generación previamente entrenados con miles de horas de audio en supercomputadoras NVIDIA.

Totalmente Personalizable

Personalice los pipelines ASR para diferentes idiomas, acentos, dominios, vocabulario y contexto para obtener la mayor precisión posible para su caso de uso y los pipelines TTS para la voz y la entonación que desee.

Implementaciones Flexibles

Proporcione experiencias consistentes a sus clientes para cientos de miles de flujos de entrada con mayor rendimiento de inferencia en comparación con la tecnología existente y en la implementación de su elección: en data centers, en las instalaciones, en la nube, en el edge o en dispositivos integrados.

Casos de Uso de Riva

Asistentes de Preguntas y Respuestas

Las empresas están implementando asistentes de preguntas y respuestas para abordar automáticamente las consultas de millones de clientes y empleados las 24 horas del día. Con los microservicios de inteligencia artificial de voz y traducción de Riva, estos asistentes brindan respuestas útiles y naturales en cada paso de la conversación a pesar del ruido de fondo, la mala calidad del sonido y los diversos dialectos y acentos de los hablantes.

Q&A assistants to automatically address the queries of millions of customers and employees around the clock.

Asistencia del Agente del Centro de Contacto

Los consumidores esperan que los agentes del centro de contacto resuelvan sus problemas de forma rápida y eficiente. Para ayudar a los agentes a ofrecer las mejores experiencias posibles, empresas de todos los sectores están implementando tecnología de asistencia a los agentes basada en la IA de voz y traducción de Riva, que puede proporcionar datos y sugerencias en tiempo real.

Agent assist technology based on Riva speech and translation AI

Avatares Digitales y Embajadores de Marca

Para mejorar las experiencias de servicio al cliente y construir relaciones con sus clientes, las empresas están creando avatares con voces de marca reconocibles. Con Riva, pueden crear una voz única, personalizada y de alta calidad con sólo tres segundos de datos de voz.

Learn more about digital avatars

Transcripción de Videoconferencia

Con cientos de millones de reuniones en línea realizadas diariamente, las videoconferencias se han convertido en una herramienta indispensable para las empresas. A través de la transcripción en tiempo real de Riva, las aplicaciones de videoconferencia logran una precisión impresionante en subtítulos en vivo y resúmenes de reuniones, acomodando a usuarios con acentos internacionales y diversos vocabularios específicos de dominio.    

Learn more about Riva's real-time transcription, video conferencing applications

Traducción

En la economía global, las empresas operan en todos los países y atienden a clientes con diversos orígenes lingüísticos y culturales. Esta diversidad de idiomas globales plantea un desafío único, ya que contratar hablantes nativos y capacitar a empleados en varios idiomas no es escalable, rentable ni eficiente. La traducción de Riva potencia las aplicaciones de comunicación precisas y efectivas, facilitando interacciones globales fluidas.

Riva translation empowers accurate and effective communication applications, facilitating smooth global interactions.

Robots de Servicio

Los robots de servicio se encuentran cada vez más en hospitales, aeropuertos y tiendas minoristas de todo el mundo. Ayudan a los trabajadores de primera línea a realizar tareas repetitivas diarias en restaurantes e instalaciones de manufactura, ayudan a los clientes a localizar artículos en las tiendas y apoyan a los médicos y enfermeras en la atención al paciente. Con Riva, es fácil agregar inteligencia artificial de voz y traducción a los robots de servicio.

Service robots in retail stores

Opciones de Inicio

Comience con NVIDIA Riva

Utilice las herramientas adecuadas para crear e implementar aplicaciones de IA de traducción y voz multilingües y totalmente personalizables.

Experimente API y Demostraciones Interactivas

Para las personas que buscan experimentar Riva, el catálogo de API ofrece un playground basado en UI y acceso gratuito a puntos finales de API administrados por NVIDIA como un excelente punto de partida.

Pruebe Antes de Comprar

Para las empresas que quieran probar Riva antes de comprar NVIDIA AI Enterprise para producción, existen dos opciones para comenzar de forma gratuita:

Sin Infraestructura:
Para aquellos que no cuentan con una infraestructura existente, NVIDIA ofrece laboratorios prácticos gratuitos a través de NVIDIA LaunchPad .

Con Infraestructura:
Para aquellos con infraestructura existente, NVIDIA ofrece una licencia de evaluación gratuita para probar NVIDIA AI Enterprise durante 90 días.

Estudios de Caso

Adoptadores Líderes en Todas las Industrias

Recursos

Uso de IA del Habla para Transcripción, Traducción y Voz

Cree aplicaciones de IA del habla de clase mundial y totalmente personalizables, como asistentes virtuales inteligentes, servicios de transcripción de audio, avatares digitales y más.

Reinvente las Experiencias del Centro de Contacto con la Transcripción de NVIDIA Riva

Al generar una transcripción precisa de las interacciones con los clientes en tiempo real, Riva permite que la IA proporcione información contextual, mida el sentimiento y recomiende la siguiente mejor acción a un agente, garantizando una excelente experiencia personalizada.

Perro Robot Busca Bocadillos por la Ciudad

Observe cómo Spot utiliza IA y un GPS súper preciso para pedir y recoger bocadillos.

Pruebe Riva en NVIDIA LaunchPad

¿Tiene un proyecto de IA del habla existente? Postúlate para obtener experiencia práctica probando y creando prototipos de tus soluciones basadas en conversaciones con habilidades de habla en la pila de software Riva de alto rendimiento que se puede implementar hoy.

Comience con ASR Personalizado de Alta Precisión para la IA del Habla

Aprenda a crear, entrenar, ajustar e implementar un servicio de reconocimiento automático de voz (ASR) acelerado por GPU con Riva que incluye funciones personalizadas.

Hable Con Sus Datos en Su Idioma Nativo

Únase a los expertos en IA para aprender cómo crear, ajustar e implementar IA de voz y traducción multilingüe lista para producción además de aplicaciones basadas en LLM para activar sus chatbots, permitirles hablar en el idioma de su elección y brindar mejores servicios.

NVIDIA Parlays Gana en el Desafío de Voz

Lea cómo un equipo de NVIDIAN ganó el desafío LIMMITS ’24, que pedía a los concursantes recrear en tiempo real la voz de un orador en inglés o en cualquiera de los seis idiomas que se hablan en la India con el acento apropiado.

Una Introducción a NVIDIA Riva

Conozca la arquitectura, las funciones clave y los componentes de Riva para crear servicios de inteligencia artificial de voz y traducción.

Creación de Aplicaciones de IA del Habla

Explore cómo comenzar a integrar e implementar modelos Riva ASR y TTS en producción con inferencia de alto rendimiento y mínimo esfuerzo.

Sesiones de GTC

Sumérjase en el contenido más reciente y vea cómo las empresas están haciendo posibles tecnologías poderosas como asistentes virtuales, transcripciones en tiempo real, búsquedas por voz y sistemas de respuesta a preguntas.

Speech AI Day

Speech AI Day le ofrece la oportunidad de escuchar a reconocidos líderes y expertos en IA del habla y la traducción mientras comparten sus investigaciones innovadoras, exploran aplicaciones del mundo real y discuten contribuciones de código abierto.

Webinars

Explore cómo iniciar su viaje con la IA de voz y traducción de última generación de Riva y personalícela completamente para lograr la solución de asistencia al agente de mayor precisión. Se incluyen demostraciones realizadas por expertos en IA conversacional de Infosys, Quantiphi y NVIDIA.

T-Mobile

IA del Habla para Una Atención Al Cliente Galardonada

T-Mobile utiliza Riva ASR en su centro de llamadas para transcribir con precisión las conversaciones de los clientes y brindar recomendaciones en tiempo real para ayudar a los agentes a resolver rápidamente las consultas de los clientes.

NCS

Personalización de IA de Voz Fácil para la Voz Local de Singapur

NCS utilizó Riva TTS para personalizar una voz de Singapur con pronunciación, tono y acento locales para miles de usuarios activos mensuales de Breeze, una aplicación complementaria para el conductor.

Tarteel

Automatización del Reconocimiento de Voz Árabe en Tiempo Real

Tarteel utiliza Riva y NVIDIA NeMo™ para proporcionar comentarios en tiempo real sobre la recitación del Corán a escala, lo que permite a musulmanes, instructores, creadores de contenido e investigadores interactuar con el Corán.

Foro de Usuarios de Riva

Explore la comunidad en línea de Riva, donde puede buscar preguntas prácticas, aprender las mejores prácticas, interactuar con otros desarrolladores e informar errores.

Pograma de Desarrolladores de NVIDIA

Conéctese con millones de desarrolladores con ideas afines y acceda a cientos de contenedores, modelos y SDK acelerados por GPU (todas las herramientas necesarias para crear aplicaciones con éxito con tecnología NVIDIA) a través del Programa para Desarrolladores de NVIDIA.

Acelera su Startup

NVIDIA Inception es un programa gratuito para startups de vanguardia que ofrece acceso fundamental a soporte de comercialización, experiencia técnica, capacitación y oportunidades de financiación.

Escuche a los Expertos

IA del Habla para Centros de Contacto Impactantes

Explore cómo AT&T, Kore.ai, Deloitte y Sutherland se benefician del uso de ASR, traducción y TTS en varios idiomas para brindar un autoservicio al cliente más rápido y preciso, mejorar la productividad de los agentes en vivo e impulsar la eficiencia operativa de las empresas.

El Futuro del Servicio al Cliente con AT&T

Aprenda de la mano de un experto en ciencia de datos y tecnología de IA sobre las soluciones de IA de voz y traducción de NVIDIA Riva que están revolucionando la industria, desde asistentes virtuales y avatares digitales para mejorar el alcance, la gestión de reclamos, los pedidos y el aprovisionamiento hasta sistemas de detección de fraude para mitigar riesgos.

Cree un Asistente Virtual Habilitado por Voz con IA

Mire este seminario web on demand para aprender cómo crear asistentes virtuales inteligentes en forma de agentes digitales habilitados por voz. Mostraremos cómo implementar soluciones flexibles y totalmente personalizables para mejorar la satisfacción del cliente.

Presentamos la Magia de la IA de Voz y Traducción de Extremo a Extremo

Vea cómo Motorola y SoftServe ofrecen la transcripción, traducción y voces más precisas a la velocidad y escala que exigen las experiencias conversacionales de IA.

Transform Your Business With Speech AI

Watch this on-demand webinar to learn how speech AI is revolutionizing customer experiences in finance, broadcasting, and retail by removing barriers across languages and dialects, driving operational efficiency, and helping businesses stay ahead by improving accuracy and enhancing performance.

Telcos Transform Customer Experiences With Conversational AI

Watch Infosys, Quantiphi, Talkmap, and NVIDIA on-demand to learn how telecommunications companies are using AI to improve operational efficiency and enhance customer engagement.

Enabling Contact Center Agents Through Speech AI

Learn best practices from Infosys and Quantiphi for seamlessly integrating speech and translation AI into agent-assist solutions, ensuring smooth and effective customer-agent communication.

Speech-to-Text at Scale With T-Mobile

Watch T-Mobile as they walk through their model development with NVIDIA NeMo, cloud deployment with NVIDIA Riva, their efforts to identify and remove bias in their models, and the future of speech-to-text at T-Mobile.

Más Recursos

Obtenga una Introducción

Comprenda las funciones clave de Riva que le ayudarán a crear servicios de IA de voz y traducción.

Explore los Recursos de Introducción

Obtenga todo lo que necesita para comenzar a construir sus procesos de IA de voz y traducción con NVIDIA Riva, incluidos tutoriales, Notebooks Jupyter y documentación.

Explorar Blogs Técnicos

Lea un tutorial técnico sobre cómo crear e implementar aplicaciones de IA de voz y traducción utilizando Riva.

Consulte un eBook

Explore cómo comenzar a integrar e implementar modelos Riva ASR y TTS en producción con inferencia de alto rendimiento y mínimo esfuerzo.

AI2Labs

En 2021, AI2Labs se separó de Yoozoo Games como una startup tecnológica local en Singapur. AI2Labs innova, experimenta y desarrolla productos y aplicaciones de IA, permitiendo procesos eficientes y mejorando la sostenibilidad y los resultados comerciales.

AI2Labs integró Riva en su API de reconocimiento de voz Speakr (IA de voz de dominio específico) para adaptarse a las complejidades de los dominios comerciales y de voz asiáticos y logró una precisión de traducción en inglés de última generación.

Avaya

Avaya se especializa en comunicaciones en la nube y soluciones de colaboración en workflow, brindando comunicaciones unificadas, centro de contacto, plataforma de comunicaciones como servicio (CPaaS) y servicios con su plataforma OneCloud.

Avaya integró el motor de voz a texto NVIDIA Riva para subtítulos en tiempo real a escala. Riva permite una mejor calidad de transcripción, una menor tasa de errores de palabras y una entrega económica.

C-DAC

Durante más de 10 años, el Applied AI Group de C-DAC en Pune, India, se ha centrado en la investigación y el desarrollo de tecnología del habla. Han creado con éxito un sistema de voz a texto (STT) de vanguardia para idiomas índicos como el hindi y el marathi. El grupo continúa avanzando en su trabajo explorando frameworks, bibliotecas y herramientas de deep learning de código abierto y habilitados para IA para crear aplicaciones STT y habilitadas para voz para otros idiomas índicos y de bajos recursos. Se realizaron experimentos utilizando varias arquitecturas y topologías de redes neuronales del framework NeMo de código abierto de NVIDIA, y las topologías de redes Citrinet y Conformer-CTC demostraron ser efectivas en la construcción y entrenamiento de modelos acústicos neuronales para el reconocimiento de voz. Estos modelos se entrenaron en sistemas de IA Param Siddhi de uno y varios nodos, optimizando el tiempo y el rendimiento del entrenamiento. Finalmente, los modelos se implementaron para inferencia en tiempo real y en modo por lotes utilizando el proceso de producción acelerado por GPU de Riva.

NCS

NCS, una subsidiaria de Singtel Group, es una firma líder de servicios tecnológicos con presencia en Asia Pacífico y se asocia con gobiernos y empresas para hacer avanzar a las comunidades a través de la tecnología. Combinando la experiencia y los conocimientos de su equipo de 12.000 personas en 61 especializaciones, NCS ofrece servicios de tecnología diferenciados y de extremo a extremo a los clientes con sus capacidades NEXT en digital, datos, nube y plataformas, así como ofertas principales en aplicaciones e infraestructura , ingeniería y ciberseguridad. NCS también cree en la construcción de un ecosistema de socios sólido con actores tecnológicos líderes, instituciones de investigación y empresas emergentes para apoyar la innovación abierta y la cocreación.

NCS utiliza NVIDIA Riva TTS en Breeze, la aplicación complementaria del conductor, para navegación guiada por voz, actualizaciones de tráfico y condiciones de la carretera en vivo, tarifas de estacionamiento en tiempo real y tarifas y horarios de operación electrónicos para ayudar a los conductores de Singapur a experimentar viajes de conducción sin problemas.

Más Información.

breeze.com.sg/

www.ncs.co

Historia del Cliente

RingCentral

RingCentral, un proveedor líder de soluciones globales de centros de contacto, colaboración y comunicaciones en la nube empresarial, presta servicios a millones de usuarios. La plataforma RingCentral permite la colaboración desde cualquier ubicación y dispositivo, mejorando la eficiencia empresarial y la satisfacción del cliente.

RingCentral utiliza NVIDIA Riva para la transcripción de videoconferencias para 200.000 usuarios simultáneos en su plataforma.

Más Información.

www.ringcentral.com

Historia del Cliente

Sesión GTC

Snap

Snap es una empresa de cámaras y redes sociales que permite la creación de mensajes multimedia con filtros y efectos. Para crear experiencias más interactivas, los usuarios de Snapchat juegan con Lenses, una función que agrega efectos en tiempo real a las instantáneas, más de 6 mil millones de veces al día.

El servicio de IA del habla optimizado para ruido y jerga de NVIDIA Riva está integrado en Snap AR Lens Studio, lo que permite a los creadores (artistas y desarrolladores) crear apasionantes experiencias de realidad aumentada (AR).

T-Mobile

T-Mobile, un Un-carrier supercargado, ofrece una red 4G LTE avanzada y una red 5G transformadora para la mejor experiencia del cliente. Para empoderar a los agentes del centro de contacto, T-Mobile implementa Expert Assist. Este software basado en IA utiliza NVIDIA Riva para transcribir conversaciones de clientes en tiempo real que alimentan a los recomendadores y ayudan a miles de agentes.

Con Riva, T-Mobile afina los modelos de reconocimiento automático de voz en conjuntos de datos personalizados e interpreta con precisión la jerga de los clientes en entornos ruidosos.

Más Información.

www.t-mobile.com

Historia del Cliente

Sesión GTC

Póngase en Contacto con un Representante de Ventas de NVIDIA AI Enterprise

Responderemos a sus preguntas y ayudaremos con las necesidades de su organización.

Contáctenos