Google spouští Gemini 3.1 Flash TTS Preview pro text-to-speech 2026
Google vydal nový AI model pro převod textu na řeč s podporou 70+ jazyků, nízkým zpožděním a expresivními audio tagy pro kontrolu narace.

Google spouští Gemini 3.1 Flash TTS Preview pro převod textu na řeč
Co se stalo
Google oficiálně vydal nový Gemini 3.1 Flash TTS Preview model určený pro převod textu na řeč (text-to-speech). Nový AI model nabízí vylepšenou kvalitu řeči, nízké zpoždění při generování audio a podporuje více než 70 jazyků včetně češtiny. Model také obsahuje expresivní audio tagy, které umožňují uživatelům kontrolovat způsob narace a emocionální zabarvení hlasu.
Proč je to důležité
Gemini 3.1 Flash TTS Preview představuje významný pokrok v oblasti AI hlasových technologií, zejména díky kombinaci rychlosti a kvality. Nízké zpoždění činí model vhodným pro real-time aplikace jako jsou chatboty, asistenti nebo živé překladače. Expresivní audio tagy umožňují vývojářům jemně doladit emocionální zabarvení hlasu podle kontextu, což může dramaticky zlepšit uživatelský zážitek v aplikacích využívających umělou inteligenci.
Co to znamená pro české uživatele
Čeští vývojáři a firmy nyní získávají přístup k pokročilé TTS technologii s plnou podporou češtiny přímo od Googlu. Model je dostupný prostřednictvím Gemini API, což znamená relativně snadnou integraci do existujících aplikací. Pro běžné uživatele to znamená lepší kvalitu hlasového výstupu v českých aplikacích využívajících Google AI služby.
Používáš AI nástroje? Řekni nám jak →
Zúčastnit se průzkumuCena a podmínky Preview verze zatím nejsou zveřejněny, ale očekává se, že Google bude postupně rozšiřovat dostupnost modelu. České firmy pracující s hlasovými technologiemi tak získávají silného konkurenta pro stávající TTS řešení od Microsoftu nebo Amazon.
Model je momentálně v preview režimu, což znamená, že může docházet k častějším aktualizacím a změnám funkcionalit.