Sprach-KI

NVIDIA Riva

Erstellen und Bereitstellen einer vollständig anpassbaren mehrsprachigen Sprach-und Übersetzungs-KI für Ihr großes Sprachmodell und Retrieval-Augmented Generation(RAG)-basierte Anwendungen.

Was ist NVIDIA Riva?

NVIDIA® Riva ist eine Reihe von GPU-beschleunigten, mehrsprachigen Sprach- und Übersetzungs-Microservices, mit denen Sie vollständig anpassbare Echtzeit-Gesprächs-KI-Pipelines erstellen können. Riva umfasst die automatische Spracherkennung (Automatic Speech Recognition, ASR), Text-zu-Sprache (Text-to-Speech, TTS) und die neuronale maschinelle Übersetzung (Neural Machine Translation, NMT) und kann in allen Clouds, in Rechenzentren, in der Peripherie oder in eingebetteten Geräten eingesetzt werden. Mit Riva können Unternehmen Sprach- und Übersetzungsfunktionen mit großen Sprachmodellen (Large Language Models, LLMs) und Retrieval-Augmented Generation (RAG) hinzufügen, um Chatbots in leistungsstarke mehrsprachige Assistenten und Avatare zu verwandeln.

End-to-End-Sprach-KI und magische Übersetzungs-KI im Fokus

Bereitstellen von KI-Chatbots mit modernster mehrsprachiger Transkription, Übersetzung und Spracheingabe.

Riva in Aktion erleben

Automatische Spracherkennung von NVIDIA Riva testen

Wählen Sie die Sprache aus und sehen Sie sich an, wie Riva ASR eine hochpräzise Transkription in Echtzeit ermöglicht, indem Sie eine Eingabe über Ihr Mikrofon vornehmen oder eine .wav-Datei von Ihrem Gerät hochladen.

Hinweis: Die Dauer jedes Samples ist auf 30 Sekunden begrenzt.

Try saying something

Text-zu-Sprache von NVIDIA Riva testen

Wählen Sie eine Stimme aus und geben Sie einen Testsatz ein, um Rivas vordefinierte englische Frauen- oder Männerstimme zu hören.

Hinweis: Der Eingabetext ist auf 400 Zeichen begrenzt.

Die Verwendung der Riva-Fähigkeiten unterliegt den Nutzungsbedingungen für NVIDIA Riva. Ihre Daten werden zur Verbesserung der Produkte und Dienste von NVIDIA verwendet.

Vorteile von NVIDIA Riva

Hochpräzise und ausdrucksstarke mehrsprachige Stimmen

Erzielen Sie eine hohe Genauigkeit bei der Transkription zwei- und mehrsprachiger Übersetzungen und stellen Sie vordefinierte, ausdrucksstarke professionelle Frauen- und Männerstimmen mit hochmodernen Modellen bereit, die auf NVIDIA-Supercomputern anhand von Tausenden von Stunden Audiomaterial vortrainiert wurden.

Vollständig anpassbar

Passen Sie ASR-Pipelines für verschiedene Sprachen, Akzente und Domänen, Vokabulare und Kontexte an, um die bestmögliche Genauigkeit für Ihren Anwendungsfall zu erzielen, und passen Sie TTS-Pipelines für die gewünschte Stimme und Intonation an.

Flexible Bereitstellungen

Bieten Sie Ihren Kunden konsistente Erfahrungen für Hunderttausende von Eingangsdatenströmen mit höherer Inferenzleistung im Vergleich zu bestehender Technologie und bei der Bereitstellung Ihrer Wahl – in Rechenzentren, lokal, in der Cloud, am Edge oder in eingebetteten Geräten. 

Startoptionen

Erste Schritte mit NVIDIA Riva

Erstellen und Bereitstellen von vollständig anpassbaren, mehrsprachigen Sprach- und Übersetzungs-KI-Anwendungen für Sprache und Übersetzung mit den richtigen Tools.

APIs und interaktive Demos erleben

Für Einzelpersonen, die Riva kennenlernen möchten, bietet der API-Katalog eine UI-basierte Spielwiese und kostenlosen Zugang zu den von NVIDIA verwalteten API-Endpunkten, die einen idealen Einstiegspunkt bilden. 

Erst testen, dann kaufen

Für Unternehmen, die Riva testen möchten, bevor sie NVIDIA AI Enterprise für die Produktion kaufen, gibt es zwei kostenlose Einstiegsoptionen:

Ohne Infrastruktur:
Für diejenigen, die über keine vorhandene Infrastruktur verfügen, bietet NVIDIA über das NVIDIA LaunchPad kostenlose Praxisübungen an.

Mit Infrastruktur:
Für diejenigen mit vorhandener Infrastruktur bietet NVIDIA eine kostenlose Testlizenz an, um NVIDIA AI Enterprise 90 Tage lang zu testen.

Fallstudien

Führende Anwender in allen Branchen

Das sagen Experten

Sprach-KI für wirkungsvolle Contact Center

Erfahren Sie, wie AT&T, Kore.ai, Deloitte und Sutherland von der Verwendung von mehrsprachiger ASR, Übersetzung und TTS profitieren, um Kunden einen schnelleren und präziseren Selfservice zu bieten sowie die Produktivität von Live-Agenten und die betriebliche Effizienz von Unternehmen zu steigern. 

Die Zukunft des Kundendienstes mit AT&T

Erfahren Sie von Experten für Datenwissenschaft und KI-Technologie mehr über die innovativen Sprach- und Übersetzungs-KI-Lösungen von NVIDIA Riva, die die Branche revolutionieren – von virtuellen Assistenten und digitalen Avataren für eine verbesserte Reichweite, Schadensverwaltung, Bestellung und Bereitstellung bis hin zu Betrugserkennungssystemen für die Risikominderung.

Entwicklung eines sprachgesteuerten virtuellen KI-Assistenten

In diesem On-Demand-Webinar erfahren Sie, wie Sie intelligente virtuelle Assistenten in Form von sprachgesteuerten digitalen Agenten entwickeln können. Wir zeigen Ihnen, wie Sie flexible, vollständig anpassbare Lösungen zur Steigerung der Kundenzufriedenheit einsetzen können.

End-to-End-Sprach-KI und magische Übersetzungs-KI im Fokus

Sehen Sie sich an, wie Motorola und SoftServe hochpräzise Transkription, Übersetzung und ansprechende Stimmen in der Geschwindigkeit und dem Umfang liefern, die KI-Erfahrungen erfordern.

Transform Your Business With Speech AI

Watch this on-demand webinar to learn how speech AI is revolutionizing customer experiences in finance, broadcasting, and retail by removing barriers across languages and dialects, driving operational efficiency, and helping businesses stay ahead by improving accuracy and enhancing performance.

Telcos Transform Customer Experiences With Conversational AI

Watch Infosys, Quantiphi, Talkmap, and NVIDIA on-demand to learn how telecommunications companies are using AI to improve operational efficiency and enhance customer engagement.

Enabling Contact Center Agents Through Speech AI

Learn best practices from Infosys and Quantiphi for seamlessly integrating speech and translation AI into agent-assist solutions, ensuring smooth and effective customer-agent communication.

Speech-to-Text at Scale With T-Mobile

Watch T-Mobile as they walk through their model development with NVIDIA NeMo, cloud deployment with NVIDIA Riva, their efforts to identify and remove bias in their models, and the future of speech-to-text at T-Mobile.

Transform Your Business With Speech AI

Watch this on-demand webinar to learn how speech AI is revolutionizing customer experiences in finance, broadcasting, and retail by removing barriers across languages and dialects, driving operational efficiency, and helping businesses stay ahead by improving accuracy and enhancing performance.

Unveiling End-to-End Speech and Translation AI Magic

Join Motorola and Softserve to learn how to deliver the most accurate transcription, translation, and engaging voices at the speed and scale conversational AI experiences demand.

Telcos Transform Customer Experiences With Conversational AI

Watch Infosys, Quantiphi, Talkmap, and NVIDIA on-demand to learn how telecommunications companies are using AI to improve operational efficiency and enhance customer engagement.

Enabling Contact Center Agents Through Speech AI

Learn best practices from Infosys and Quantiphi for seamlessly integrating speech and translation AI into agent-assist solutions, ensuring smooth and effective customer-agent communication.

Weitere Ressourcen

Einführung ansehen

Lernen Sie die wichtigsten Funktionen in Riva kennen, die Sie beim Erstellen von Sprach- und Übersetzungs-KI-Diensten unterstützen.

Ressourcen für die ersten Schritte entdecken

Erhalten Sie alles, was Sie benötigen, um Ihre Sprach- und Übersetzungs-KI-Pipelines mit NVIDIA Riva zu erstellen, einschließlich Tutorials, Jupyter Notebooks und Dokumentation.

Technische Blogs entdecken

Lesen Sie eine technische Anleitung, wie Sie Sprach- und Übersetzungs-KI-Anwendungen mit Riva erstellen und bereitstellen können.  

E-Book ansehen

Erfahren Sie, wie Sie mit der Integration und Bereitstellung von Riva ASR- und TTS-Modellen in der Produktion mit High-Performance-Inferenz und minimalem Aufwand beginnen können.

AI2Labs

AI2Labs wurde 2021 in Singapur von Yoozoo Games als lokales Tech-Start-up gegründet. AI2Labs innoviert, experimentiert und entwickelt KI-Produkte und KI-Anwendungen, die effiziente Prozesse ermöglichen und so die Nachhaltigkeit und Geschäftsergebnisse verbessern.

AI2Labs hat Riva in seine Spracherkennungs-API Speakr integriert – eine bereichsspezifische Sprach-KI –, um die Feinheiten asiatischer Sprach- und Geschäftsbereiche abzubilden, und hat damit eine hochmoderne Genauigkeit der Singlisch-Übersetzung erzielt.

Avaya

Avaya ist auf Lösungen für Cloud-Kommunikation und Workstream Collaboration spezialisiert und bietet mit seiner OneCloud-Plattform Unified Communications, Contact Center, Communications Platform as a Service (CPaaS) und Services.

Avaya hat die NVIDIA Riva Speech-to-Text-Engine für die Echtzeituntertitelung im großen Maßstab integriert. Riva ermöglicht eine bessere Transkriptionsqualität, eine geringere Wortfehlerrate und eine wirtschaftliche Bereitstellung.

C-DAC

For over 10 years, the Applied AI Group at C-DAC in Pune, India, has focused on research and development of speech technology. They’ve successfully created a cutting-edge speech-to-text (STT) system for Indic languages such as Hindiand Marathi. The group continues to advance their work by exploring AI-enabled, open-source deep learning frameworks, libraries, and tools for creating STT and speech-enabled applications for other Indic and low-resource languages. Experiments were conducted using various neural network architectures and topologies from NVIDIA’s open-source NeMo framework, with Citrinet and Conformer-CTC network topologies proving to be effective in building and training neural acoustic models for speech recognition. These models were trained on single- and multi-node Param Siddhi AI systems, optimizing training time and performance. Finally, the models were deployed for real-time and batch-mode inference using the Riva GPU-accelerated production pipeline.

NCS

NCS ist eine Tochtergesellschaft der Singtel Group und ein führender Technologiedienstleister im asiatisch-pazifischen Raum. Das Unternehmen arbeitet mit Regierungen und Unternehmen zusammen, um Kommunen durch Technologie voranzubringen. Durch die Kombination der Erfahrung und des Fachwissens seines 12.000 Mitarbeiter umfassenden Teams mit 61 Spezialisierungen bietet NCS seinen Kunden differenzierte und umfassende Technologiedienste mit seinen NEXT-Fähigkeiten in den Bereichen Digital, Daten, Cloud und Plattformen sowie zentrale Angebote in den Bereichen Anwendung und Infrastruktur, Technik und Cybersicherheit. NCS setzt außerdem auf ein starkes Partnerökosystem mit führenden Technologieakteuren, Forschungseinrichtungen und Start-ups, um offene Innovationen und Co-Creation zu unterstützen. 

NCS nutzt NVIDIA Riva TTS in Breeze – der Begleit-App für den Fahrer – für die sprachgeführte Navigation, Live-Updates zu Verkehr und Straßenzustand, Parktarife in Echtzeit sowie elektronische Straßenbenutzungsgebühren und Betriebszeiten, um Fahrern in Singapur eine störungsfreie Fahrt zu ermöglichen.

Weitere Informationen.

breeze.com.sg/

www.ncs.co

Customer Story

RingCentral

RingCentral ist ein führender Anbieter globaler Unternehmenslösungen für Cloud-Kommunikation, Zusammenarbeit und Contact Center, der Millionen von Benutzern betreut. Die RingCentral-Plattform ermöglicht die Zusammenarbeit von jedem Ort aus und mit jedem Gerät und verbessert die geschäftliche Effizienz und die Zufriedenheit der Kunden.

RingCentral nutzt NVIDIA Riva für die Transkription von Videokonferenzen für 200.000 gleichzeitige Benutzer seiner Plattform.

Weitere Informationen.

www.ringcentral.com

Customer Story

GTC Session

Snap

Snap ist ein Kamera- und Social-Media-Unternehmen, das die Erstellung von Multimedia-Nachrichten mit Filtern und Effekten ermöglicht. Um interaktivere Erlebnisse zu erschaffen, spielen Snapchat-Benutzer täglich über 6 Milliarden mal mit Lenses – einer Funktion, die Echtzeiteffekte zu Schnappschüssen hinzufügt. 

Der für Geräusche und Sprache optimierte Sprach-KI-Dienst Riva von NVIDIA ist in Snap AR Lens Studio integriert, mit dem Ersteller – Künstler und Entwickler – packende AR-Erlebnisse (Augmented Reality) erschaffen können.

T-Mobile

T-Mobile ist Anbieter von superschnellem Mobilfunk und bietet ein fortschrittliches 4G LTE- sowie ein transformatives 5G-Netz für ein bestmögliches Kundenerlebnis. T-Mobile implementiert Expert Assist, um Contact-Center-Mitarbeitern die Arbeit zu erleichtern. Diese KI-basierte Software nutzt NVIDIA Riva, um Kundengespräche in Echtzeit zu transkribieren, die in Empfehlungssysteme eingespeist werden und tausende von Agenten unterstützen.

Mit Riva hat T-Mobile eine Feinabstimmung automatischer Spracherkennungsmodelle mit benutzerdefinierten Datensätzen durchgeführt und kann auch in lauten Umgebungen die Sprache der Kunden exakt interpretieren.

Weitere Informationen.

www.t-mobile.com

Customer Story

GTC Session

Kontaktieren Sie einen NVIDIA AI Enterprise Vertriebsmitarbeiter

Wir beantworten Ihre Fragen und helfen Ihnen bei der Erfüllung der Anforderungen Ihrer Organisation.

Kontakt