Questa intelligenza artificiale è in grado di disegnare delle facce tramite la voce


Vi sarà capitato di sentire la voce di una persona sconosciuta, immaginando nella vostra mente il suo volto, con più o meno successo. Ebbene, dovete sapere che un algoritmo è ora in grado di riprodurre lo stesso esperimento. Come funzionerà? Trovate la risposta in questo articolo.
L'algoritmo si chiama Speech2Face ed è stato creato da un gruppo di scienziati, formando la rete neurale utilizzando milioni di video disponibili su Internet, in cui è stato possibile sentir parlare più di 100000 persone. Secondo quanto scritto dai ricercatori nel loro studio, l'algoritmo utilizza i dati ottenuti per sviluppare associazioni tra le linee vocali e alcune caratteristiche fisiche del volto umano. In seguito, l'intelligenza artificiale si è occupata di ritrarre graficamente i volti usando solo la voce come riferimento.

I risultati della ricerca sono stati oggetto di critica lo scorso 23 maggio, durante la pre-pubblicazione arXiv. Tuttavia, tali dati non sono stati ancora contrastati da altri scienziati che lavorano nello stesso campo.
Quanto è accurato l'algoritmo? Possiamo dire che fortunatamente l'intelligenza artificiale non è ancora in grado di identificare gli individui sulla sola base di campioni delle loro voci. Piuttosto, la rete neurale identifica i tratti associati ad alcuni fattori, come il sesso, l'età e l'etnia, ma questi tratti sono condivisi da un numero considerevole di persone. Pertanto, le immagini generate rappresentano più un ritratto "mediocre" che accurato.
-
San Francisco pone il veto al riconoscimento facciale
Detto questo, Speech2Face ha generato alcuni ritratti con sorprendente precisione, ma ha anche mostrato alcune debolezze di fronte alle variazioni di lingua e/o di pronuncia. Ad esempio, l'AI ha prodotto due ritratti totalmente diversi della stessa persona, dopo averla ascoltata parlare cinese e inglese. In ogni caso, il talento dell'algoritmo nell ritrarre gli esseri umani si dimostra decisamente più efficiente rispetto ai gatti.

Pensate sia possibile riprodurre immagini di persone ascoltando la loro voce?
Fonte: LiveScience