Г

Гистограмма направленных градиентов

Гистограмма направленных градиентов (англ. Histogram of oriented gradients, HOG) это дескриптор признаков который используется в компьютерном зрении и обработке изображений с целью распознавания объектов. Метод подсчитывает направления градиентов в локальных точках изображения. Он близок к гистограммы ориентированных границ, SIFT дескриптора, и значение формы, но отличается там, что рассчитывается в плотной сетке равномерно расположенных клеток и для повышения точности использует локальную нормализацию контраста.

Навнит Далаль и Билл Триггс исследователи из Французский национальный институт исследований в области компьютерных наук и управления (англ. French National Institute for Research in Computer Science and Control, INRIA), впервые описали HOG дескриптор в 2005 Конференция по компьютерного зрения и распознавания образов (CVPR). В этой работе они сосредоточили усилия на выявлении пешеходов в статических изображениях, с тех пор они расширили тесты на выявлении людей на видео, а также некоторые виды животных и машины на статических изображениях.

Преимущества и недостатки

HOG дескриптор имеет несколько ключевых преимуществ перед другими дескрипторами. Поскольку он работает с локальными клетками он нечувствителен к геометрическим и фотометрических преобразований кроме ориентации объекта. Эти преобразования сказываются для участков больших размеров. Кроме того, как обнаружили Далаль и Триггс, глубокое разбиения пространства, сильная локальная фотометрическая нормализация позволяет игнорировать движение пешеходов, если они поддерживают вертикальное положение тела. Таким образом HOG частности подходит для обнаружения людей на изображениях.

Реализация

Вычисление градиента

Наиболее простой способ — это применить 1-D разностную маску в горизонтальном и вертикальном направлениях. Это можно сделать используя следующие маски:

Гистограмма направленных градиентов и Гистограмма направленных градиентов

Далаль и Триггс работали с другими, более сложными масками, такими как 3×3 Оператор Собеля. Также они экспериментировали с размытием Гаусса перед применением разностной маски, но обнаружили, что на практике без размытия алгоритм работает лучше.

Группировка направлений

Второй шаг — это создание гистограмм направленных градиентов. Каждый пиксель из ячейки добавляет взвешенный голос гистограммы направленных градиентов основываясь на величине и направлению градиента. Ячейки в свою очередь могут быть прямоугольными, или круглой формы, и каналы гистограммы могут быть разделены равномерно между 0 и 180 или между 0 и 360 в зависимости от того исчисляется «знаковый», или «беззнаковый градиент». Далаль и Триггс определили, что беззнаковый градиент и гистограммы с 9-ю каналами дуют лучший результат в их задачи по выявлению людей. Для определения величины веса пикселя может быть использована величина градиента или функция величины.

Метод опорных векторов

Заключительным этапом в распознании образов используя гистограмму направленных градиентов является подача дескрипторов на система распознавания на основе обучения с учителем. Метод опорных векторов (SVM) это бинарный классификатор который находит оптимальную гиперплоскость в качестве функции принятия решений. Классификатор тренируется, а затем он может принимать решения о предоставлении объекта, такого как человек, в дополнительных тестовых изображений.

Показать больше

Похожие статьи

Добавить комментарий

Проверьте также
Закрыть
Кнопка «Наверх»
Закрыть
Закрыть