29 ноября, 2017

Нейронная сеть учится узнавать человека на изображении с камер видеонаблюдения

29.11.2017

Исследовательская команда из компании Disney разработала программное обеспечение, позволяющее находить человека на изображении от различных телекамер, объединённых в одну систему. Действие этого ПО основано на распознавании лиц и нейронных сетях.

Для компании Disney задача отслеживания перемещений человека по территории, контролируемой определённым количеством камер видеонаблюдения, крайне актуальна. Её решение позволило бы поднять на новый уровень мониторинг парка «Диснейленд». При этом данная задача, именуемая «реидентификацией», достаточно сложна, поскольку лицо одного и того же человека фиксируется разными камерами по-разному — при разном освещении, под разными углами, на разном фоне.

Современный подход к решению этой задачи чаще всего основан на построении моделей, которые описывают объект наблюдения с помощью признаков, не меняющихся при переходе от камеры к камере. Вместо этого для сравнения изображения от разных камер применяется также построение «функции несхожести».

Объединить оба подхода позволяют современные технологии глубокого обучения, то есть те технологии машинного обучения, которые моделируют абстрактные соотношения высокого уровня. При этом используются так называемые конволюционные (свёрточные) нейронные сети. Однако в таком случае для достижения эффективного результата требуется автоматически составлять описание тысяч объектов для каждой пары камер в системе.

Исследователи из компании Disney применили новый подход, который они называют «пространственной пирамидоподобной структурой». При этом подходе нейронная сеть, предназначенная для узнавания человека на изображении от разных камер, учится распознавать не целое лицо, а небольшие прямоугольные участки, выделяемые по определённому алгоритму, которые у авторов разработки именуются «субрегионами».

ПО, изучающее схожесть людей на изображении, идентифицирует не лицо целиком, а только субрегионы. В итоге система определяет пространственное положение отдельных субрегионов. Именно это позволяет ей успешно выполнять свою задачу при сравнении изображений лиц, получаемых в разных условиях.

Количество показов: 226