Con tecnología Gemini Live · habla a habla en tiempo real

Una traducción que te habla.
En tiempo real.

La mayoría de los traductores en vivo solo muestran subtítulos. Voxis te habla en tu idioma en cada vídeo, juego y reunión, tal como ocurre. Sin controladores. Sin leer.

También en Microsoft Store También disponible como extensión de Chrome
Loopback de Hardware Directo

Cero controladores.
Captura de audio directa.

Sin VB-CABLE, sin tarjetas de sonido virtuales. Voxis captura la mezcla del sistema directamente en la capa WASAPI y reduce el volumen de otros procesos en origen, evitando bucles de retroalimentación.

Soberanía de Código Abierto

Dos caminos.
Tus claves, o nuestra nube.

Voxis se ofrece como un motor autoalojado en GitHub y como una versión SaaS gestionada. Usa tus propias claves localmente para total privacidad, o deja que nuestro backend Go de alta velocidad gestione la traducción al instante.

Desplázate para explorar
Arquitectura

Elige tu nivel de ejecución

Voxis es un verdadero framework de código abierto. Ejecuta localmente con tu propia clave y detección de voz en el dispositivo, o usa nuestra nube gestionada de alta velocidad con un sencillo inicio de sesión.

Código Abierto

GitHub / BYOK

Toma el control total de tu configuración de traducción. Aporta tu propia clave API de Gemini, ejecuta el motor localmente e inspecciona directamente el código del pipeline en GitHub.

  • Tu clave de Gemini se cifra en el dispositivo
  • Cero costes de infraestructura (paga directamente al proveedor LLM)
  • Motor de código abierto completamente auditable
Licencia de código abierto gratuita Ver repositorio
SaaS Gestionado

Versión oficial

La experiencia gestionada premium. Obtén la aplicación oficial de Microsoft Store con captura WASAPI ultrarrápida. Autentícate al instante a través de nuestro backend Go auth-core de alto rendimiento, con seguimiento de sesiones y cuotas de minutos gestionadas en PocketBase.

Backend Go Auth-Core

Firma de tokens JWT, control de frecuencia de sesiones y cifrado de confianza cero.

Cuotas de minutos en la nube

Almacén en la nube PocketBase de alta velocidad que rastrea cuotas en tiempo real.

v1.0.15 (Aplicación oficial de Microsoft Store) Obtener en Microsoft Store

Un motor. Cada conversación.

English Türkçe 日本語 Español Deutsch Français 中文 한국어 Português Italiano Русский العربية English Türkçe 日本語 Español Deutsch Français 中文 한국어 Português Italiano Русский العربية English Türkçe 日本語 Español Deutsch Français 中文 한국어 Português Italiano Русский العربية
La barrera

Las mejores ideas están
atrapadas tras el idioma.

Una conferencia innovadora en japonés. Un compañero en Berlín. Un streamer en São Paulo. Hoy pausas, copias, pegas en un traductor, pierdes el momento — y lees en lugar de escuchar.

Los subtítulos interrumpen el flujo

Leer texto mientras ves algo significa que pierdes las caras, el ritmo, el ambiente. La traducción debe llegar a tus oídos, no robar tus ojos.

Los momentos en vivo no esperan

Las reuniones y las transmisiones avanzan en tiempo real. Las herramientas de copiar y pegar están hechas para documentos, no para una conversación que ya lleva tres frases de ventaja.

La configuración se interpone

Cables virtuales, reglas de enrutamiento, cadenas de audio frágiles. La mayoría de las herramientas te piden que te conviertas en ingeniero de audio antes de escuchar una sola palabra.

El recorrido

De la onda de sonido a la comprensión

Voxis se sienta silenciosamente junto al audio del sistema y lo convierte en una voz traducida — cuatro pasos, todos ejecutándose en vivo sobre la transmisión.

1 Captura

Audio del sistema, sin controladores

El loopback WASAPI sin proceso propio capta exactamente la mezcla que escuchas — y excluye al propio Voxis, para que nunca traduzca su propia voz.

2 Detectar

Solo el habla real

El Silero VAD en el dispositivo aísla el habla del ruido y la música, mientras el audio original se reduce suavemente para que la traducción tome la delantera.

3 Traducir

Gemini Live, en streaming

Una sesión de voz a voz en vivo traduce a medida que llegan las palabras — sin esperar frases completas, sin idas y venidas de copiar y pegar.

4 Hablar

Voz natural, sincronizada

Una voz de 24 kHz se reproduce en tus auriculares — o en un micrófono virtual para reuniones — sincronizada con la sala para que nunca parezca tardía.

Dos formas de escuchar

Una app, diseñada para ver
y para hablar.

JA → ES
この戦略は完璧に機能している。
Esta estrategia está funcionando perfectamente.
TR → ES
Lütfen devam edin.
Por favor, continúe.
Captura por loopback WASAPI
Audio entrante

Vídeo y Juegos

Traducción unidireccional de todo lo que se reproduce — streams, películas, clases, gameplay en vivo. El original se reduce, la traducción lidera.

  • Captura el audio del sistema sin enrutamiento
  • El atenuado inteligente mantiene la música de fondo
  • Subtítulos en pantalla y transcripción en vivo opcionales
Profundidad de atenuación 98%
Sincronización de reproducción Alineado por RTT
Bajo el capó

Diseñado para el momento

Cada detalle ajustado para que la traducción se sienta parte del audio — no una capa añadida encima.

Sin controladores por diseño

Sin VB-CABLE, sin tarjeta de sonido virtual, sin diagramas de enrutamiento. Voxis captura la mezcla del sistema directamente y reduce otras apps en origen. Instala, inicia sesión, escucha — esa es toda la configuración.

Atenuado de calidad de estudio

Un atenuador psicoacústico crea espacio para la voz traducida mientras preserva la música y el ambiente del original.

La voz que eliges

Selecciona una voz natural de Gemini para el audio traducido.

Transcripción en vivo

Cada traducción se transmite a una transcripción y un overlay opcional — guárdala en un archivo cuando termines.

Consciencia de latencia

Un estimador RTT mantiene la voz traducida alineada con el original para que el diálogo nunca pierda sincronía.

Presets de calidad y perfiles

Cambia entre presets ajustados para claridad, velocidad o fidelidad — y guarda tu configuración favorita como un perfil que puedes recuperar con un clic.

Tus claves son tuyas

Trae tu propia clave, cifrada en el dispositivo — o ejecuta con la clave SaaS gestionada. Tu elección, en cada sesión.

0+ Idiomas, entrante y saliente
0kHz Voz traducida de calidad de estudio
0 Modos — ver y hablar
Cero Controladores virtuales a instalar
Código abierto · privado por defecto

Tuyo para confiar,
tuyo para inspeccionar.

Voxis se ofrece como aplicación SaaS oficial y como versión de código abierto en GitHub. El motor de audio es el mismo — y puedes leer exactamente lo que hace.

  • Motor de código abierto

    Inspecciona, bifurca y autoaloja el motor de escritorio desde la versión pública de GitHub.

  • Claves cifradas en el dispositivo

    Las claves propias se sellan con Fernet, vinculadas a tu máquina y cuenta — inútiles si se copian en otro lugar.

  • La detección de voz se ejecuta localmente

    El Silero VAD decide qué es voz en tu máquina, antes de que se envíe cualquier cosa para traducción.

  • Las transcripciones se quedan contigo

    Las transcripciones guardadas se escriben en tu propio disco — nunca en una nube que no controlas.

routing.py
# Same Live session lifecycle — two key sources
if IS_OFFICIAL_RELEASE:
    key = server.session_key()      # SaaS: per-session
else:
    key = byok.load(user_id)        # BYOK: local only

# Fernet, bound to MachineGuid + user_id
fkey = sha256(
    machine_guid, user_id, "voxis-byok-v1"
)

session = LiveTranslator(
    model = "gemini-3.5-live-translate-preview",
    target = cfg.target_language_incoming,
    sample_rate_out = 24000,
)
session.stream()   # quota enforced server-side
Precios

Empieza gratis. Escala cuando crezcas.

Cada plan desbloquea el motor completo — ambos modos, todos los idiomas. Solo eliges cuántos minutos necesitas.

Developer (BYOK)

Para ingenieros que compilan desde el código fuente. Ejecuta localmente con tu propia clave API de Gemini — tu clave se queda en tu dispositivo.

$0 / De por vida
Acceso de por vida
  • Acceso al repositorio de GitHub
  • Integración BYOK y procesamiento local
  • Soporte de la comunidad y transparencia del código
Bifurcar en GitHub

Creator

Aplicación oficial de Microsoft Store con 700 minutos gestionados al mes. Sin configuración, sin claves API requeridas.

$19 /mes
700 minutos gestionados / mes
  • Aplicación oficial de Microsoft Store
  • 700 minutos gestionados / mes
  • Sin claves API requeridas
Más popular

Pro

Para agencias y usuarios avanzados. 1.500 minutos gestionados al mes con enrutamiento DSP prioritario y licencia de uso comercial.

$39 /mes
1.500 minutos gestionados / mes
  • 1.500 minutos gestionados / mes
  • Enrutamiento DSP prioritario
  • Licencia de uso comercial

Enterprise

Para equipos y organizaciones.

A medida
Minutos ilimitados
  • Todo lo incluido en Pro
  • Autoalojamiento y BYOK a escala
  • Soporte dedicado y SLA
Contactar ventas

Los precios son suscripciones mensuales facturadas a través de Stripe; cancela en cualquier momento desde tu cuenta. Las nuevas cuentas incluyen 10 minutos gratuitos — o aporta tu propia clave para traducir con tu propia cuota.

Deja de leer.
Empieza a entender.

Descarga Voxis y convierte cualquier sonido que produzca tu ordenador en tu idioma — en vivo.

Windows 10 y 11 · Gratis para empezar · Sin tarjeta de crédito

FAQ

Preguntas frecuentes

Última actualización: junio de 2026

¿Qué es Voxis?

Voxis es una aplicación de traducción de voz en tiempo real para Windows que traduce el audio que reproduce tu ordenador — vídeos, juegos, llamadas y reuniones — a tu idioma mientras escuchas, y lo reproduce con una voz natural. Funciona como interpretación simultánea en vivo: capta el audio del sistema directamente (sin controladores — sin cables de audio virtuales), detecta el habla en el dispositivo y cuenta con tecnología Gemini Live.

¿Voxis es traducción en tiempo real o interpretación simultánea?

Ambos. Voxis realiza interpretación en tiempo real de lo que reproduce tu PC — escucha, traduce y reproduce el resultado con un pequeño retraso, para que sigas un vídeo, stream o reunión en vivo en lugar de leer subtítulos después.

¿Voxis necesita cables de audio virtuales o un bot de reuniones?

No. Voxis captura el audio del sistema de Windows directamente a través del loopback WASAPI — sin cables de audio virtuales (VB-CABLE), sin configuración de controladores y sin un bot que se una a tu llamada de Zoom, Teams o Google Meet. La mayoría de las herramientas de traducción en vivo dependen de uno u otro; Voxis se ejecuta localmente junto a tu audio.

¿En qué se diferencia de los subtítulos?

Las herramientas de subtítulos muestran leyendas que tienes que leer, lo que aparta tu vista de la pantalla. Voxis reproduce la traducción con una voz natural con atenuación psicoacústica y sincronización de latencia, para que puedas seguir viendo, jugando o hablando mientras escuchas en tu propio idioma.

¿Qué puede traducir Voxis?

Todo lo que reproduce tu ordenador: vídeos y noticias extranjeros, audio de juegos, cursos en línea, podcasts y llamadas de Zoom, Teams o Discord. Un modo de reunión bidireccional traduce ambas partes de una conversación en tiempo real.

¿Es privado Voxis y cuánto cuesta?

La detección de voz se ejecuta en el dispositivo. Puedes traer tu propia clave API de Gemini (Developer / BYOK, gratis) para traducir enteramente con tu propia cuota, o usar minutos de nube gestionada — Creator ($19/mes) y Pro ($39/mes). Las nuevas cuentas incluyen 10 minutos gratuitos.