Google совершила прорыв в области распознавания образов

19 ноября 2014

Две группы ученых, работающих независимо друг от друга, объявили о создании продвинутых алгоритмов, способных распознавать и описывать объекты на фотографиях и видеороликах с гораздо более высокой точностью, чем когда-либо прежде. Примерно одинакового успеха добились инженеры Google и сотрудники Стэнфордского университета.

До недавнего времени технологии так называемого компьютерного зрения могли "видеть" на изображении отдельные объекты, однако понимание картинки в целом для них было недоступным. Новые алгоритмы, которые вовлекают искусственные нейронные сети, способные к машинному обучению, ушли далеко вперед и теперь могут описывать происходящее обычным человеческим языком.

"Я считаю, что пиксельные данные в изображениях и видео — это темная материя Интернета, — сказал директор лаборатории искусственного интеллекта Стэнфордского университета Фэй-Фэй Ли, — "Теперь мы можем начать его освещать". Ученые из Стэнфорда рассказали о достижениях в техническом отчете, а команда Google выложила статью на сайт arXiv.org.

Результаты, полученные обеими группами, очень похожи. Они позволят описать миллиарды изображений и видео в Интернете (в частности, в сервисе "Картинки Google"), которые зачастую плохо или вообще не документированы, и, соответственно, улучшить по ним поиск. На данный момент поисковые алгоритмы Google отталкиваются только от описания, которое предоставил сам пользователь, загрузивший ту или иную картинку.

The New York Times

Cайт веб-разработчика, программиста Ruby on Rails ESV Corp. Екатеринбург, Москва, Санкт-Петербург, Новосибирск, Первоуральск

Google совершила прорыв в области распознавания образов

Языку программирования Ruby 30 лет! Выпущен релиз 4.0.0

dyn Trait и impl Trait в языке программирования Rust

Трейт-объекты в Rust: dyn и &dyn