Lors de sa conférence Google I/O 2025, Google a dévoilé une avancée majeure pour son service de visioconférence : la traduction vocale en temps réel sur Google Meet. Cette fonctionnalité vise à supprimer la barrière de la langue entre les participants, en utilisant l’intelligence artificielle pour interpréter et restituer les conversations dans la langue de l’utilisateur, presque instantanément.
Contrairement aux sous-titres traditionnels déjà disponibles sur Meet, cette nouvelle technologie remplace la voix d’origine par une voix synthétique traduite, générée par l’IA. Le modèle à l’origine de cette prouesse est AudioLM, développé par DeepMind, capable de produire des voix réalistes à partir de courts extraits audio, tout en conservant le ton, l’intonation et les émotions du locuteur.
Lorsque la fonction est activée, l’utilisateur entend d’abord brièvement la voix originale en sourdine, suivie par la traduction dans la langue choisie, entraînant une légère latence. Ce procédé permet à l’IA de capter le contexte et les nuances de la conversation avant de restituer une réponse fluide et cohérente. Google souligne que cette technologie permet une expérience de communication plus naturelle, même entre personnes ne partageant pas la même langue.
Pour le moment, cette innovation est réservée aux clients des offres premium Google AI Pro et Google Ultra, récemment lancées aux États-Unis à partir de 250 dollars par mois. Seules deux langues sont initialement disponibles : l’anglais et l’espagnol, avec l’italien, l’allemand et le portugais prévus dans les prochaines semaines. Google prévoit par la suite d’élargir cette fonctionnalité à l’ensemble des utilisateurs professionnels de Google Workspace.
En intégrant cette fonctionnalité dans Google Meet, Google souhaite réduire les barrières linguistiques, aussi bien dans le monde professionnel que personnel. Dans un contexte globalisé, où les réunions internationales sont devenues monnaie courante, cette avancée pourrait révolutionner les échanges entre équipes multilingues, tout en apportant un avantage concurrentiel décisif à Google dans le secteur des visioconférences.
Contrairement aux sous-titres traditionnels déjà disponibles sur Meet, cette nouvelle technologie remplace la voix d’origine par une voix synthétique traduite, générée par l’IA. Le modèle à l’origine de cette prouesse est AudioLM, développé par DeepMind, capable de produire des voix réalistes à partir de courts extraits audio, tout en conservant le ton, l’intonation et les émotions du locuteur.
Lorsque la fonction est activée, l’utilisateur entend d’abord brièvement la voix originale en sourdine, suivie par la traduction dans la langue choisie, entraînant une légère latence. Ce procédé permet à l’IA de capter le contexte et les nuances de la conversation avant de restituer une réponse fluide et cohérente. Google souligne que cette technologie permet une expérience de communication plus naturelle, même entre personnes ne partageant pas la même langue.
Pour le moment, cette innovation est réservée aux clients des offres premium Google AI Pro et Google Ultra, récemment lancées aux États-Unis à partir de 250 dollars par mois. Seules deux langues sont initialement disponibles : l’anglais et l’espagnol, avec l’italien, l’allemand et le portugais prévus dans les prochaines semaines. Google prévoit par la suite d’élargir cette fonctionnalité à l’ensemble des utilisateurs professionnels de Google Workspace.
En intégrant cette fonctionnalité dans Google Meet, Google souhaite réduire les barrières linguistiques, aussi bien dans le monde professionnel que personnel. Dans un contexte globalisé, où les réunions internationales sont devenues monnaie courante, cette avancée pourrait révolutionner les échanges entre équipes multilingues, tout en apportant un avantage concurrentiel décisif à Google dans le secteur des visioconférences.