Diese Woche hat Google seine Spracherkennungs- bzw. Sprachsynthese-API "Cloud Speech API" in einer "Limited Preview" für Entwickler, gewissermaßen einer Alpha-Phase, gestartet: cloud.google.com.

Gesprochener Text bzw. Audiodaten können über die API in geschriebenen Text konvertiert werden. Unterstützt werden hierbei über 80 Sprachen bzw. Sprachvarianten.

Werbung

Werbeblocker aktiv?

Vermutlich aufgrund eines Werbeblockers kann an dieser Stelle leider keine Werbung angezeigt werden. Als Blog ist diese Website jedoch darauf angewiesen, um diverse Kosten abdecken zu können. Vielleicht möchtest du Servaholics ja in deinem Werbeblocker als Ausnahme hinzufügen und so unterstützen? 🙂

Die API filtert Störungen wie Hintergrundgeräusche sowie optional anstößige Inhalte automatisch heraus und bietet das Ergebnis der Erkennung direkt als Stream.

Interessierte Entwickler können sich unter services.google.com für die Testphase bewerben. Im Rahmen dieser ist die Nutzung kostenlos.

Quelle: heise.de

Deine Meinung zu diesem Artikel?