A tradução que fala de volta.
Em tempo real.
A maioria dos tradutores ao vivo só exibe legendas. Voxis reproduz cada vídeo, jogo e reunião no seu idioma — no momento em que acontece. Sem drivers. Sem nada para ler.
Disponível na Microsoft Store Também disponível como extensão para Chrome
Zero drivers.
Captura de áudio direta.
Sem VB-CABLE, sem placas de som virtuais. Voxis captura o mix do sistema diretamente na camada WASAPI e reduz o volume de outros processos na fonte, prevenindo loops de feedback.
Dois caminhos.
Suas chaves ou nossa nuvem.
Voxis está disponível como motor auto-hospedado no GitHub e como build SaaS gerenciado. Use suas próprias chaves localmente para total privacidade, ou deixe nosso backend Go de alta velocidade rotear a tradução instantaneamente.
Escolha Seu Nível de Execução
Voxis oferece um verdadeiro framework open-core. Execute localmente com soberania total de hardware, ou use nossa nuvem gerenciada de alta velocidade com um login simples.
GitHub / BYOK
Assuma o controle total da sua configuração de tradução. Traga sua própria chave de API do Gemini, execute o motor localmente e inspecione o código open-core diretamente no GitHub.
- Sua chave Gemini é criptografada no dispositivo
- Custo de infraestrutura zero (pague o provedor de LLM diretamente)
- Motor open-source totalmente auditável
Versão de Lançamento Oficial
A experiência premium gerenciada. Obtenha o app oficial da Microsoft Store com captura WASAPI ultrarrápida. Autentique instantaneamente via nosso backend Go auth-core de alta performance, rastreando sessões e cotas de minutos gerenciados pelo PocketBase.
Backend Go Auth-Core
Assinatura de token JWT, limitação de taxa de sessão e criptografia zero-trust.
Cotas de Minutos na Nuvem
Armazenamento PocketBase de alta velocidade rastreando cotas em tempo real.
Um motor. Toda conversa.
As melhores ideias estão
presas por trás do idioma.
Uma palestra revolucionária em japonês. Um colega em Berlim. Uma streamer em São Paulo. Hoje você pausa, copia, cola em um tradutor, perde o momento — e lê em vez de ouvir.
Legendas interrompem o fluxo
Ler texto enquanto assiste significa perder as expressões, o ritmo, a atmosfera. A tradução deve chegar aos seus ouvidos, não roubar seus olhos.
Momentos ao vivo não esperam
Reuniões e transmissões acontecem em tempo real. Ferramentas de copiar e colar foram feitas para documentos — não para uma conversa que já está três frases à frente.
A configuração atrapalha
Cabos virtuais, regras de roteamento, cadeias de áudio frágeis. A maioria das ferramentas exige que você se torne um engenheiro de áudio antes de ouvir uma única palavra.
Da onda sonora à compreensão
Voxis fica discretamente ao lado do áudio do seu sistema e o transforma em uma voz traduzida — quatro etapas, todas rodando ao vivo no stream.
Áudio do sistema, sem drivers
O WASAPI loopback com exclusão de processo captura exatamente o mix que você ouve — e exclui o próprio Voxis, para que nunca traduza sua própria voz.
Somente fala real
O Silero VAD local isola a fala do ruído e da música, enquanto o áudio original é reduzido suavemente para que a tradução possa liderar.
Gemini Live, em streaming
Uma sessão ao vivo de fala para fala traduz conforme as palavras chegam — sem aguardar frases completas, sem idas e vindas de copiar e colar.
Voz natural, sincronizada
Uma voz de 24 kHz é reproduzida nos seus fones de ouvido — ou em um microfone virtual para chamadas. Como está sincronizada com a sala, nunca parece atrasada.
Um app, feito para
assistir e conversar.
Vídeo e Jogos
Tradução unidirecional de tudo que é reproduzido — streams, filmes, aulas, gameplay ao vivo. O original é reduzido, a tradução lidera.
- Captura o áudio do sistema sem nenhum roteamento
- Redução inteligente mantém a música em segundo plano
- Legendas na tela e transcrição ao vivo opcionais
Reunião
Tradução bidirecional para Teams, Zoom e Meet. Você os ouve no seu idioma; eles ouvem você no deles — através de um microfone virtual.
- Duas sessões Live independentes, entrada e saída
- Sua voz traduzida em qualquer app de chamada
- Funciona com o microfone e caixas que você já usa
Projetado para o momento
Cada detalhe ajustado para que a tradução pareça parte do áudio — não uma camada parafusada por cima.
Sem drivers por design
Sem VB-CABLE, sem placa de som virtual, sem diagramas de roteamento. Voxis captura o mix do sistema diretamente e reduz outros apps na fonte. Instale, entre, ouça — essa é toda a configuração.
Redução nível estúdio
Um redutor psicoacústico abre espaço para a voz traduzida enquanto preserva a música e a ambientação do original.
Voz que você escolhe
Escolha uma voz Gemini natural para o áudio traduzido.
Transcrição ao vivo
Cada tradução flui para uma transcrição e uma sobreposição opcional — salve em arquivo quando terminar.
Consciente da latência
Um estimador de RTT mantém a voz traduzida alinhada com o original para que o diálogo nunca perca a sincronia.
Predefinições de qualidade e perfis
Alterne entre predefinições ajustadas para clareza, velocidade ou fidelidade — e salve sua configuração favorita como perfil que pode ser acessado com um clique.
Suas chaves ficam com você
Traga sua própria chave, criptografada no dispositivo — ou use a chave SaaS gerenciada. Sua escolha, a cada sessão.
Para confiar,
para inspecionar.
Voxis está disponível como app SaaS oficial e como build open-source no GitHub. O motor de áudio é o mesmo — e você pode ler exatamente o que ele faz.
-
Motor open-source
Inspecione, faça fork e auto-hospede o motor desktop a partir do build público no GitHub.
-
Chaves criptografadas no dispositivo
Chaves próprias são seladas com Fernet, vinculadas à sua máquina e conta — inúteis se copiadas em outro lugar.
-
Detecção de fala roda localmente
O Silero VAD decide o que é fala na sua máquina antes de qualquer coisa ser enviada para tradução.
-
As transcrições ficam com você
As transcrições salvas são escritas no seu próprio disco — nunca em uma nuvem que você não controla.
# Same Live session lifecycle — two key sources
if IS_OFFICIAL_RELEASE:
key = server.session_key() # SaaS: per-session
else:
key = byok.load(user_id) # BYOK: local only
# Fernet, bound to MachineGuid + user_id
fkey = sha256(
machine_guid, user_id, "voxis-byok-v1"
)
session = LiveTranslator(
model = "gemini-3.5-live-translate-preview",
target = cfg.target_language_incoming,
sample_rate_out = 24000,
)
session.stream() # quota enforced server-side
Comece grátis. Escale quando quiser.
Todo plano desbloqueia o motor completo — ambos os modos, todos os idiomas. Você só escolhe quantos minutos precisa.
Developer (BYOK)
Para engenheiros que compilam do código-fonte. Rode localmente com sua própria chave de API do Gemini — sua chave fica no seu dispositivo.
- Acesso ao Repositório GitHub
- Integração BYOK e Processamento Local
- Suporte da Comunidade e Transparência do Código
Creator
App oficial da Microsoft Store com 700 minutos gerenciados por mês. Zero configuração, sem chaves de API necessárias.
- App oficial da Microsoft Store
- 700 Minutos Gerenciados / mês
- Sem chaves de API necessárias
Pro
Para agências e usuários avançados. 1.500 minutos gerenciados por mês com roteamento prioritário de pipeline DSP e licenciamento para uso comercial.
- 1.500 Minutos Gerenciados / mês
- Roteamento prioritário de pipeline DSP
- Licenciamento para uso comercial
Enterprise
Para equipes e organizações.
- Tudo do Pro
- Auto-hospedagem e BYOK em escala
- Suporte dedicado e SLA
Os preços são assinaturas mensais cobradas via Stripe; cancele a qualquer momento na sua conta. Novas contas incluem 10 minutos gratuitos — ou traga sua própria chave para traduzir na sua cota.
Pare de ler.
Comece a entender.
Baixe o Voxis e transforme qualquer som do seu computador no seu próprio idioma — ao vivo.
Windows 10 e 11 · Gratuito para começar · Sem cartão de crédito
Perguntas frequentes
Última atualização: junho de 2026
O que é o Voxis?
Voxis é um app de tradução de voz em tempo real para Windows que traduz o áudio reproduzido pelo computador — vídeos, jogos, chamadas e reuniões — para o seu idioma enquanto você ouve, e fala de volta com uma voz natural. Funciona como interpretação simultânea ao vivo: captura o áudio do sistema diretamente (sem drivers — sem cabos de áudio virtual), detecta a fala localmente e é alimentado pelo Gemini Live.
O Voxis é em tempo real ou interpretação simultânea?
Os dois. O Voxis realiza interpretação em tempo real de tudo o que seu PC reproduz — ele ouve, traduz e fala o resultado de volta com apenas um pequeno atraso, para que você acompanhe um vídeo, stream ou reunião ao vivo em vez de ler legendas depois.
O Voxis precisa de cabos de áudio virtual ou bot de reunião?
Não. O Voxis captura o áudio do sistema Windows diretamente pelo WASAPI loopback — sem cabos de áudio virtual (VB-CABLE), sem configuração de drivers e sem bot que entre na sua chamada do Zoom, Teams ou Google Meet. A maioria das ferramentas de tradução ao vivo depende de um ou de outro; o Voxis roda localmente junto com seu áudio.
Como é diferente das legendas?
Ferramentas de legenda mostram textos que você precisa ler, desviando seus olhos da tela. O Voxis fala a tradução com uma voz natural, com redução psicoacústica e sincronização de latência, para que você continue assistindo, jogando ou conversando enquanto ouve no seu próprio idioma.
O que o Voxis pode traduzir?
Tudo que seu computador reproduz: vídeos e noticiários em idiomas estrangeiros, áudio de jogos, cursos online, podcasts e chamadas no Zoom, Teams ou Discord. Um modo de reunião bidirecional traduz os dois lados de uma conversa em tempo real.
O Voxis é privado e quanto custa?
A detecção de fala roda localmente. Você pode usar sua própria chave de API do Gemini (Developer / BYOK, gratuito) para traduzir inteiramente com sua própria cota, ou usar minutos gerenciados na nuvem — Creator ($19/mês) e Pro ($39/mês). Novas contas incluem 10 minutos gratuitos.