Google совершила прорыв в области распознавания образов
Две группы ученых, работающих независимо друг от друга, объявили о создании продвинутых алгоритмов, способных распознавать и описывать объекты на фотографиях и видеороликах с гораздо более высокой точностью, чем когда-либо прежде. Примерно одинакового успеха добились инженеры Google и сотрудники Стэнфордского университета.
До недавнего времени технологии так называемого компьютерного зрения могли "видеть" на изображении отдельные объекты, однако понимание картинки в целом для них было недоступным. Новые алгоритмы, которые вовлекают искусственные нейронные сети, способные к машинному обучению, ушли далеко вперед и теперь могут описывать происходящее обычным человеческим языком.
"Я считаю, что пиксельные данные в изображениях и видео — это темная материя Интернета, — сказал директор лаборатории искусственного интеллекта Стэнфордского университета Фэй-Фэй Ли, — "Теперь мы можем начать его освещать". Ученые из Стэнфорда рассказали о достижениях в техническом отчете, а команда Google выложила статью на сайт arXiv.org.
Результаты, полученные обеими группами, очень похожи. Они позволят описать миллиарды изображений и видео в Интернете (в частности, в сервисе "Картинки Google"), которые зачастую плохо или вообще не документированы, и, соответственно, улучшить по ним поиск. На данный момент поисковые алгоритмы Google отталкиваются только от описания, которое предоставил сам пользователь, загрузивший ту или иную картинку.