Компьютерная программа узнаёт всё о любом предмете, анализируя картинки

19 июня 2014

Ассоциация "слово-изображение" является одним из основных механизмов человеческой памяти. В детстве она помогает человеку изучить язык по вербализации того, что он видит, а во взрослом возрасте люди расширяют набор понятий или учат иностранные языки. Теперь исследователи из Вашингтонского университета (University of Washington) и Алленского института искусственного интеллекта (Allen Institute for Artificial Intelligence) создали первую полностью автоматизированную компьютерную программу под названием LEVAN, которая самостоятельно учит себя всему на основе концепции визуализации, связывая слова с изображениями.

LEVAN расшифровывается как Learning EVerything about Anything ("изучая всё обо всём"). Программа ищет определенное слово из миллионов строчек текста в Google-книгах. Затем слово связывается с изображениями, найденными в Интернете. Такой подход, по мнению разработчиков, даёт LEVAN возможность узнать все возможные значения слова. В конце концов программа отображает результат как широкий список изображений, который пользователь может изучить для быстрого и подробного понимания предмета.

"Суть программы заключается в поиске ассоциаций между текстовыми и визуальными данными, – рассказывает Али Фархади (Ali Farhadi), доцент кафедры компьютерной науки и техники. – Программа учится объединять широкий набор фраз с пикселями в изображениях. Это значит, что она может распознавать конкретные понятия, когда видит их".

Как только вводится слово, LEVAN ищет результаты и сохраняет только визуальные модификаторы для своих понятий. Абстрактные понятия, которые нельзя визуализировать (например, "моя лошадь"), игнорируются, в то время как более конкретные понятия, вроде "скачущая лошадь", "деревянная лошадь", остаются. Затем программа ищет доступные изображения, которые объединяются с понятиями, сочетаются и классифицируются для показа пользователю.

В отличие от других систем ассоциаций, таких как Watson, которые группируют заданные слова, чтобы найти связанные фразы, алгоритм LEVAN эффективно сочетает в себе группирование слов и распознавание образов.

На сегодняшний день система включает в себя более 50 тысяч вариаций 150 понятий, и отметила более 10 миллионов изображений как потенциально соответствующие. Однако 150 понятий – очень ограниченный набор, поэтому LEVAN предстоит ещё немало учиться. Исследователи приглашают всех желающих поучаствовать в проекте и предложить свои слова на странице программы.

В будущем систему планируется использовать для повышения эффективности обучения.

vesti.ru

Cайт веб-разработчика, программиста Ruby on Rails ESV Corp. Екатеринбург, Москва, Санкт-Петербург, Новосибирск, Первоуральск

Компьютерная программа узнаёт всё о любом предмете, анализируя картинки

Определение приватных констант и методов класса в Ruby

Как предоставить возможность использования Ruby, установленного с помощью rbenv, всем пользователям в Linux Debian

Организация безопасного доступа scp и sftp с ограничениями ChrootDirectory