Questa intelligenza artificiale è in grado di disegnare delle facce tramite la voce

2 min per leggere 2 min Nessun commento 0

12 giu 2019, 11:30

AI robot 06 — © metamorworks/Shutterstock

Andrés Castellano

Leggere in altre lingue:

English / Français / Español

Vi sarà capitato di sentire la voce di una persona sconosciuta, immaginando nella vostra mente il suo volto, con più o meno successo. Ebbene, dovete sapere che un algoritmo è ora in grado di riprodurre lo stesso esperimento. Come funzionerà? Trovate la risposta in questo articolo.

L'algoritmo si chiama Speech2Face ed è stato creato da un gruppo di scienziati, formando la rete neurale utilizzando milioni di video disponibili su Internet, in cui è stato possibile sentir parlare più di 100000 persone. Secondo quanto scritto dai ricercatori nel loro studio, l'algoritmo utilizza i dati ottenuti per sviluppare associazioni tra le linee vocali e alcune caratteristiche fisiche del volto umano. In seguito, l'intelligenza artificiale si è occupata di ritrarre graficamente i volti usando solo la voce come riferimento.

Intelligenza artificiale: cos’è e come può aiutarci?

2019 06 12 IA hace retratos 1 — Foto e ritratti riprodotti dall'AI. Si è comportata bene? / © LiveScience

I risultati della ricerca sono stati oggetto di critica lo scorso 23 maggio, durante la pre-pubblicazione arXiv. Tuttavia, tali dati non sono stati ancora contrastati da altri scienziati che lavorano nello stesso campo.

Quanto è accurato l'algoritmo? Possiamo dire che fortunatamente l'intelligenza artificiale non è ancora in grado di identificare gli individui sulla sola base di campioni delle loro voci. Piuttosto, la rete neurale identifica i tratti associati ad alcuni fattori, come il sesso, l'età e l'etnia, ma questi tratti sono condivisi da un numero considerevole di persone. Pertanto, le immagini generate rappresentano più un ritratto "mediocre" che accurato.

San Francisco pone il veto al riconoscimento facciale

Detto questo, Speech2Face ha generato alcuni ritratti con sorprendente precisione, ma ha anche mostrato alcune debolezze di fronte alle variazioni di lingua e/o di pronuncia. Ad esempio, l'AI ha prodotto due ritratti totalmente diversi della stessa persona, dopo averla ascoltata parlare cinese e inglese. In ogni caso, il talento dell'algoritmo nell ritrarre gli esseri umani si dimostra decisamente più efficiente rispetto ai gatti.

2019 06 12 IA hace retratos 2 — L'AI non è altrettanto talentuosa nel riprodurre immagini di gatti. / © LiveScience

Pensate sia possibile riprodurre immagini di persone ascoltando la loro voce?

Fonte: LiveScience