Evenimentul zilei

Ma06182019

ActualizatMie, 15 Mai 2013 12pm

Back Sunteți aici:Actualitate Din tara Curiozitati VIDEO// Computerele îţi pot reproduce vocea aproape perfect. Tehnologia este momentan destul de periculoasă

VIDEO// Computerele îţi pot reproduce vocea aproape perfect. Tehnologia este momentan destul de periculoasă

23 Mai 2019 - 

Compania Dessa, specializată în AI, a dezvolat un algoritm machine learning numit RealTalk care poate „învăţa” să vorbească. 

Media

În funcţie de mostre, acesta poate reproduce aproape perfect vocea celui care a fost folosit pentru „antrenament”, iar demonstraţia tehnologiei este cel puţin impresionantă. Dessa a folosit vocea lui Joe Rogan, faimos comediant şi actor, cu o voce greu de confundat pentru a prezenta tehnologia RealTalk, scrie go4it.

Joe Rogan este popular printre fanii show-urilor de comedie de pe internet, dar şi printre cei care ascultă podcast-uri. Acesta a lansat aproape 1.300 de episoade ale emisiunii sale Joe Rogan Experience, iar Dessa a folosit toate episoadele pentru a pune bazele unui model vocal. Astfel, folosind texte scrise, algoritmul îl poate imita pe Joe Rogan aproape perfect, vocea fiind redată exact aşa cum se aude în emisiunea sa. Practic, dacă nu ai şti în prealabil, ai putea spune că vocea a fost înregistrată în studioul său, fiind imitate perfect chiar şi micile defecte de sunet caracteristice microfoanelor.

Desigur, vocea lui Joe Rogan a fost folosită şi pentru că există foarte mult material disponibil pentru a fi folosit pentru învăţarea algoritmului. În cazul altor persoane care nu apar atât de mult în înregistrări audio publice, acurateţea ar putea fi mult mai limitată. Totuşi Dessa spune că în viitor un computer ar putea să înveţe să vorbească precum o persoană reală folosind doar câteva secunde de înregistrare, folosind modelele precedente pe care le are la dispoziţie pentru a compensa.

Această tehnologie ridică însă multe semne de întrebare: cum vor putea fi combătute situaţiile în care aceasta este folosită în scopuri negative, precum utilizarea vocii unui utilizator pentru a păcăli membri ai familiei celui a cărui voce o foloseşti, sau pentru a truca declaraţiile unui politician? Momentan, este greu de spus, însă pot fi evidente avantajele: pot fi realizaţi în prezent asistenţi virtuali folosind voci celebre, sau poţi realiza aplicaţii care să răspundă mai natural la cerinţele utilizatorilor, fără a avea replici înregistrate în prealabil.

Dessa spune însă că nu va lansa acest model de machine learning public, întrucât tehnologia este momentan destul de periculoasă.

 

Lasă un comentariu