Американские разработчики из Массачусетского технологического института разработали нейросетевую модель Speech2Face. Данная программа способна по сонограмме речи человека создавать изображение его лица, базируясь при этом на 3 ключевых параметрах: расе, поле и возрасте.
Программа по голосу даже может определить некоторые особенности человека, к примеру, его национальность и индивидуальные черты. В результате этого можно приблизительно представить, как выглядит человек, однако это изображение, конечно, не будет достаточно точным. Специалисты загрузили в нейросеть больше миллиона коротких видеороликов с разговорами свыше 100 тыс. человек. Программа проанализировала голоса. При этом чтобы оценить точность работы, исследователи сравнили пол, этнические характеристики, примерный возраст человека на видео и портрета, созданного по голосу.
В результате модель достаточно неплохо распознала все индивидуальные особенности каждого человека. Программа хорошо угадывает пол, однако редко определяет возраст с точностью до 10 лет. Лучше всего нейросеть рисует европейцев и азиатов. Эксперты объясняют эту особенность неравномерным распределением рас в выборке.
Islam-today
Социальные комментарии Cackle