Bei den modernsten Systemen wie z.B. "Eleven Labs" klingen deutsche Stimmen heute schon nahezu perfekt wenn man nur Texte eingibt, durch das kurze Training anhand von Tonaufzeichnungen werden Intonation, Aussprache, Betonung und Sprachmelodie automatisch "mitgeklont". Dazu braucht es keine Sprecher mehr, die die Originalanmutung ohnehin nur verfälschen würden. Hin und wieder sind da und dort vielleicht Korrekturen nötig, die aber in die Routine einfließen und daher nur ein mal ausgebessert werden müssen.
Mit dem Programm "heygen" kann man die Stimmen in Videos vollautomatisch lippensynchron austauschen und/oder übersetzen, bei hoher Rechenleistung sogar "on the flow", also de facto live. Endanwender bekommen das dank großen Wettbewerbs diverser Anbieter im Internet mittlerweile genauso gut oder sogar besser hin wie die Profis im Studio.