Google Gemini: Docs liest sich jetzt selbst vor – mit anpassbaren KI-Stimmen
Google Docs wird die Art und Weise, wie Nutzer mit ihren Dokumenten interagieren, grundlegend verändern, dank der kürzlich integrierten KI-gestützten Audioerzeugungsfunktion. Mithilfe von Googles fortschrittlicher Gemini KI können Nutzer nun geschriebene Inhalte in gesprochene Worte umwandeln, was eine neue Dimension der Zugänglichkeit und Bequemlichkeit bietet. Diese Funktion ermöglicht die Erstellung einer Audioversion jedes Dokuments, komplett mit anpassbaren Sprachoptionen und einstellbaren Wiedergabegeschwindigkeiten, wodurch ein personalisiertes Hörerlebnis für den Nutzer bereitsteht.
Der Nutzen dieser neuen Funktion geht über den ursprünglichen Ersteller des Dokuments hinaus. Leser von freigegebenen Dokumenten können das KI-generierte Audio mühelos direkt aus Google Docs abrufen. Dies geschieht, indem man zum Dropdown-Menü „Tools“ navigiert, dann „Audio“ und schließlich „Diesen Tab anhören“ auswählt. Für Autoren, die die Audiooption noch prominenter gestalten möchten, kann ein anpassbarer Audio-Button direkt über das Menü „Einfügen“ in das Dokument eingebettet werden, sodass Leser die Wiedergabe mit einem einzigen Klick starten können.
Während Google bereits im April auf die Möglichkeit hingewiesen hatte, Dokumente in „KI-Podcasts“ umzuwandeln, scheint diese jüngste Einführung eine direktere und unmittelbarere Lösung für das On-Demand-Hören zu sein. Sie erfüllt das einfache Bedürfnis, geschriebene Inhalte vorgelesen zu bekommen, sei es zum Korrekturlesen, Multitasking oder einfach zum Aufnehmen von Informationen in einem anderen Format.
Anfangs unterstützt die Funktion nur englischsprachige Dokumente und ist ausschließlich auf Desktop-Geräten verfügbar. Google rollt diese Funktionalität schrittweise an eine spezifische Untergruppe seiner Nutzerbasis aus. Dazu gehören Google Workspace-Abonnenten mit Business-, Enterprise- und Education-Plänen sowie Personen, die AI Pro- oder Ultra-Stufen abonniert haben. Diese gezielte Veröffentlichung deutet auf einen strategischen Ansatz hin, der wahrscheinlich darauf abzielt, Feedback von Vielnutzern zu sammeln, bevor eine breitere Bereitstellung erfolgt.
Die Einführung von KI-gestütztem Audio in Google Docs markiert einen weiteren wichtigen Schritt in der fortlaufenden Integration künstlicher Intelligenz in alltägliche Produktivitätstools. Sie unterstreicht einen breiteren Branchentrend, digitale Inhalte vielseitiger und zugänglicher zu machen, um unterschiedlichen Lernstilen und situativen Bedürfnissen gerecht zu werden. Für Fachleute, Studenten und allgemeine Nutzer gleichermaßen kann die Möglichkeit, Dokumente anzuhören, die Produktivität steigern, indem sie den Informationskonsum während des Pendelns, des Trainings oder anderer Aktivitäten ermöglicht, bei denen das Lesen vom Bildschirm unpraktisch ist. Sie birgt auch ein erhebliches Potenzial zur Verbesserung von Dokumentenprüfungsprozessen und zur Unterstützung von Menschen mit Sehbehinderungen oder Lernschwierigkeiten. Da die KI-Fähigkeiten weiter voranschreiten, werden solche Funktionen voraussichtlich zum Standard werden und die Art und Weise, wie wir in der digitalen Ära mit Informationen interagieren, neu gestalten.