FONCTIONNALITÉS

Tout ce que fait VoxisLive, en détail.

VoxisLive est une application Windows qui transforme n'importe quel audio système en une voix naturelle dans votre langue, environ deux secondes derrière l'orateur. Voici chaque capacité majeure, expliquée.

Capture de l'audio système sans pilote

VoxisLive lit directement le mixage audio de votre Windows via WASAPI process-loopback — la même API Windows Audio Session de bas niveau que les enregistreurs d'écran utilisent pour capturer ce qui est en cours de lecture. Il n'y a pas de VB-CABLE, pas de périphérique audio virtuel, et rien à router. Installez l'application et elle entend ce que vous entendez, immédiatement, sous Windows 10 et 11.

La capture exclut également la propre sortie de VoxisLive, si bien que l'application ne traduit jamais sa propre voix — même dans une conversation bidirectionnelle.

79 langues, interchangeables en cours de session

Choisissez ce que vous entendez et ce que vous parlez parmi 79 langues, et permutez la paire en un clic sans arrêter la session. La détection automatique de la langue source gère l'audio multilingue.

Mode réunion bidirectionnel

Le mode réunion exécute deux sessions en direct à la fois : votre interlocuteur est traduit dans votre langue via vos haut-parleurs, et votre propre parole est traduite dans la sienne et injectée via un microphone virtuel. Fonctionne aux côtés de Teams, Zoom, Meet, Webex et Discord — et aucun bot n'apparaît jamais dans la liste des participants.

Le mode réunion de VoxisLive traduisant dans les deux sens avec le thème clair

Un interprète simultané natif, pas un pipeline

La parole est transmise à un modèle temps réel multimodal qui reconnaît, traduit et redit en une seule passe à faible latence — à la manière d'un interprète humain en cabine. Il commence à traduire pendant que l'orateur parle encore et reste environ deux secondes derrière ; les interprètes simultanés professionnels travaillent généralement deux à quatre secondes derrière.

Ducking psychoacoustique

Pendant que la voix traduite parle, l'audio d'origine est automatiquement baissé — à l'image de l'interprétation simultanée professionnelle — puis rétabli à la fin de la réplique. Vous savez toujours qui parle.

Transcription bilingue en direct & export

Chaque session produit une transcription à deux colonnes consultable — la réplique d'origine et votre langue, côte à côte. Exportez-la en TXT, SRT ou VTT à la fin de la session.

Des sous-titres à l'écran, si vous le souhaitez

Une surimpression de sous-titres facultative, toujours au premier plan, flotte au-dessus de n'importe quelle application ou jeu avec un sous-titre à deux niveaux : la réplique source et la vôtre. La voix parlée est le cœur du produit ; les sous-titres sont là quand vous avez besoin d'une trace.

VoxisLive traduisant une vidéo avec une transcription bilingue en direct

Confidentiel par conception

VoxisLive ne rejoint jamais votre appel en tant que participant et n'est pas un bot de navigateur. La détection d'activité vocale sur l'appareil signifie que le silence et l'audio non vocal ne quittent jamais votre machine ; seuls les segments de parole détectés sont transmis au modèle de traduction, et aucun audio n'est conservé après la session. La version open source BYOK envoie l'audio directement à Google sous votre propre clé — les serveurs de VoxisLive ne sont jamais impliqués.

Open-core

Le moteur de bureau est open source sur GitHub. Exécutez-le gratuitement avec votre propre clé API Gemini, auditez l'intégralité du pipeline audio, ou installez l'application gérée depuis le Microsoft Store avec des minutes prépayées et zéro configuration.

FAQ

Questions fréquentes

01VoxisLive a-t-il besoin d'un câble audio virtuel ?

Non. VoxisLive utilise le WASAPI process-loopback sans pilote intégré à Windows 10 et 11 — il n'y a aucun VB-CABLE, pilote audio virtuel ni utilitaire de routage à installer, et votre configuration audio reste inchangée.

02La traduction est-elle parlée ou sous-titrée ?

Elle est parlée. VoxisLive offre une traduction parole-à-parole en temps réel dans une voix naturelle. Une transcription bilingue en direct et une surimpression de sous-titres facultative à l'écran sont également disponibles, exportables en TXT, SRT ou VTT.

03Quel est le décalage de la traduction par rapport à l'orateur ?

Environ deux secondes, selon la longueur des énoncés et la latence réseau. Le modèle commence à traduire pendant que l'orateur parle encore, au lieu d'attendre la fin de la phrase.

04Avec quelles applications fonctionne-t-il ?

Tout ce qui diffuse de l'audio sous Windows : navigateurs, lecteurs de bureau, jeux et applications de visioconférence comme Teams, Zoom, Meet, Webex ou Discord. La capture se produit au niveau de la couche audio du système d'exploitation, si bien que l'application source n'a aucune importance.

Essai gratuit · 10 minutes offertes

Entendez toutes les langues, en temps réel.

Fonctionne sous Windows 10 et 11 — pas de pilotes, pas de rituel de configuration, pas de bot dans votre appel.

Obtenir sur le Microsoft Store Open source sur GitHub