Искусственный интеллект Google читает по губам лучше человека
Алгоритмы искусственного интеллекта, разработанные командой Google DeepMind в сотрудничестве с учеными Оксфордского университета, превзошли человека в умении понимать речь наблюдением артикуляции говорящего. У созданной ими программы результаты оказались на 35% лучше, чем у профессионального "считывателя" по губам.
Как сообщает New Scientist, ИИ-систему Google обучили на шести телешоу (таких как Newsnight, BBC Breakfast и Question Time), которые выходили в эфир с 2010-го по 2015-й года, "скормив" ей видео общей продолжительностью 5 тысяч часов (около 118 тысяч предложений). Эффективность алгоритмов проверялась на новых выпусках телепрограмм, транслировавшихся с марта по сентябрь 2016-го.
Из случайной выборки 200 видеофрагментов человек, профессиональный чтец по губам, безошибочно распознал только 12,4% произнесенных слов, в то время как компьютерные алгоритмы — 46,8%. При этом полученные результаты могли быть еще лучше, однако в некоторых случаях аудио и видео отставали почти на секунду, что мешало ИИ правильно выстраивать ассоциативные связи.