DeepL, companie de traduceri cunoscută pentru instrumentele sale de text, a lansat astăzi o suită de traducere voce-voce, care acoperă cazuri de utilizare precum întâlniri, conversații mobile și web, și conversații de grup pentru lucrătorii din prima linie prin aplicații personalizate.
Compania lansează, de asemenea, un API care permite dezvoltatorilor și companiilor externe să construiască pe baza tehnologiei DeepL pentru cazuri de utilizare personalizate, cum ar fi call center-urile.
"După ce am petrecut atâția ani în traducerea textelor, vocea a fost un pas natural pentru noi", a declarat CEO-ul DeepL, Jarek Kutylowski, pentru TechCrunch într-un interviu. "Am parcurs un drum lung în ceea ce privește traducerea textelor și traducerea documentelor. Dar ne-am gândit că nu există un produs excelent pentru traducerea vocală în timp real."
Kutylowski a spus că provocările în crearea unui produs de traducere în timp real se concentrează pe găsirea unui echilibru între reducerea latenței - întârzierea dintre momentul în care cineva vorbește și momentul în care se redă audio tradus - și menținerea unor rezultate precise.
DeepL lansează add-on-uri pentru platforme precum Zoom și Microsoft Teams, unde ascultătorii pot auzi fie traduceri în timp real în timp ce alții vorbesc în limbi native, fie pot urmări text tradus în timp real pe ecran. Acest program este în prezent în acces anticipat, iar compania invită organizațiile să se alăture unei liste de așteptare.
Compania are, de asemenea, un produs pentru conversații mobile și web care pot avea loc personal sau de la distanță. DeepL permite, de asemenea, utilizatorilor să participe la o conversație de grup în setări precum sesiuni de training sau ateliere de lucru, permițând participanților să se alăture printr-un cod QR.
DeepL a declarat că tehnologia sa voce-voce poate, de asemenea, să învețe și să se adapteze la vocabular personalizat, cum ar fi termeni specifici industriei și nume de companii și personale.
Kutylowski a spus că AI reimaginează cum va arăta serviciul clienți în următorii ani. El a menționat că un strat de traducere ajută companiile să ofere suport în limbi în care personalul calificat este rar și costisitor de angajat.
Compania a declarat că controlează întregul stack voce-voce. Cu toate acestea, sistemul actual convertește vorbirea în text, aplică traducerea, apoi o convertește înapoi în vorbire. DeepL consideră că, deoarece a lucrat la traducerea textelor de ani de zile, are un avantaj în ceea ce privește calitatea traducerii. În viitor, compania dorește să dezvolte un model de traducere vocală end-to-end care să sară peste etapa de text în întregime.
DeepL se confruntă cu concurența mai multor startup-uri bine finanțate care lucrează în colțuri adiacente ale spațiului. Sanas, care anul trecut a strâns 65 de milioane de dolari de la Quadrille Capital și Teleperformance, folosește AI pentru a modifica accentul unui vorbitor în timp real - un instrument destinat în principal agenților call center. Camb.AI, cu sediul în Dubai, se concentrează pe sinteza și traducerea vorbirii pentru companiile media și de divertisment Amazon Web Services, ajutându-le să dubleze și să localizeze conținut video la scară. Palabra, susținută de firma Seven Seven Six a co-fondatorului Reddit, Alexis Ohanian, construiește un motor de traducere a vorbirii în timp real, conceput pentru a păstra atât semnificația, cât și vocea originală a vorbitorului, punându-l în competiție mai directă cu ceea ce construiește acum DeepL.

