В США нейросеть нарисовала портрет по голосу

Американские разработчики из Массачусетского технологического института разработали нейросетевую модель Speech2Face. Данная программа способна по сонограмме речи человека создавать изображение его лица, базируясь при этом на 3 ключевых параметрах: расе, поле и возрасте.

Программа по голосу даже может определить некоторые особенности человека, к примеру, его национальность и индивидуальные черты. В результате этого можно приблизительно представить, как выглядит человек, однако это изображение, конечно, не будет достаточно точным. Специалисты загрузили в нейросеть больше миллиона коротких видеороликов с разговорами свыше 100 тыс. человек. Программа проанализировала голоса. При этом чтобы оценить точность работы, исследователи сравнили пол, этнические характеристики, примерный возраст человека на видео и портрета, созданного по голосу.

В результате модель достаточно неплохо распознала все индивидуальные особенности каждого человека. Программа хорошо угадывает пол, однако редко определяет возраст с точностью до 10 лет. Лучше всего нейросеть рисует европейцев и азиатов. Эксперты объясняют эту особенность неравномерным распределением рас в выборке.

Islam-today

Социальные комментарии Cackle