Sesten sese çeviri nedir?
Sesten sese çeviri — bazen sesli çeviri veya S2ST olarak da anılır — bir dildeki sesi alır ve başka bir dilde ses döndürür. Girdi bir sestir; çıktı da bir ses. İşte çoğu insanın bildiği çeviriden — metin yazıp sonucu okuduğun ya da bir videonun göz gezdirmen için bir satır altyazı gösterdiği çeviriden — asıl fark budur.
Eksiksiz bir S2ST hattı üç şey yapar: söylenen kelimeleri tanır, anlamlarını çevirir ve bunları sesli söyleyen yeni bir ses sentezler. VoxisLive bu zinciri kesintisiz çalıştırır, böylece sonuç orijinal konuşmacıdan birkaç saniye sonra kulağına ulaşır — bir konuşmayı, bir dersi ya da bir sahneyi olurken takip edecek kadar yakın. Gözlerin oyunda, slaytlarda ya da konuşan kişide kalır.
Duymak neden okumaya üstün?
Altyazılar işe yarar ama bir bedeli vardır: bakışını ekranın altına çekmek, metni çözmek, tekrar yukarı dönmek — dakikada defalarca. Hızlı bir sahnede görüntüleri kaçırırsın; bir oyunda anı kaçırırsın; bir toplantıda konuşmacıyı izlemeyi bırakırsın. Okumak, izlemenin üzerine binen ikinci bir görevdir.
Sesli çeviri bu görevi ortadan kaldırır. Anladığın dil, gördüğün her şey önünde dururken hoparlörlerinden gelir — canlı etkinliklerin duvara transkript kaydırmak yerine kulaklığa konuşan tercümanlar kullanmasının nedeni de tam olarak budur. İstersen altyazılar yine var: herhangi bir oturumun ardından TXT, SRT veya VTT transkriptini dışa aktar. Bunlar bir kayıttır, o an güvendiğin şey değil.
Yerel bir simültane tercüman
VoxisLive, sistem sesini Windows WASAPI process-loopback ile yakalar — sanal kablo yok, ek sürücü yok, aramanda bot yok — ve kendi çıkışını dışlar, böylece az önce ürettiği sesi asla çevirmez.
Yakalanan konuşma, yerel bir simültane tercüman modeline gider: bir cümlenin bitmesini beklemek yerine konuşmacı henüz konuşurken çevirmeye başlar ve birkaç saniye geriden gelir — tıpkı bir insan tercümanın konferans kabininde çalıştığı gibi. Bu kısa, istikrarlı gecikme, çıktının kesik kesik yerine canlı hissettiren şeydir.
İki mod
Video / Oyun modunda çeviri tek yönlüdür: diğer ses senin diline gelir ve orijinal ses kısılır, böylece sesli çeviri net biçimde üstte oturur. Toplantı modunda ise çift yönlüdür: karşı taraf senin diline çevrilir, kendi konuşman da onların diline çevrilip bir sanal mikrofona verilir — katılımcı listesinde bot olmadan.
VoxisLive, Windows 10 ve 11'de çalışır ve 79 hedef dil konuşur. Microsoft Store'dan edin ya da ücretsiz açık kaynaklı sürümü GitHub'dan kendi anahtarınla çalıştır.