Ф

Функция сглаживания

Для работы алгоритма линейного слежения нам нужно иметь надлежащим образом сглаживать изображение. Конечно, сглаживание может оказаться нужным и для других целей, чем распознавания образов, например для художественных. Есть некоторая специфика сглаживания для различных целей.

Художественная специфика

Например, в художественных целях мы можем использовать сглаживание для смены слайдов в презентации. Первый слайд расплывается (уменьшается наводка на резкость), а спустя следующий слайд начинает появляться, увеличивая резкость. Здесь особых требований к дифференцируемости функции сглаживания не предъявляется. Несущественным является отсутствие подушко-образной дисторсии, например мы можем взять функцию, задается матрицей:

Функция сглаживания

в этой процедуре сглаживания мы берем центральный пиксель с коэффициентом 2, а соседние с ним — с коэффициентом 1. В этой функции по диагоналям сглаживания проявляется сильнее, чем в горизонтальном или вертикальном направлениях. Первая специфика художественного сглаживания — что его результат не анализируется компьютером, а предназначен для показа человеку. Вторая специфика — мы должны обязательно обрабатывать всю картинку (или некоторую область), и не можем ограничиваться отдельными выборочными пикселями.

Специфика для распознавания образов

В алгоритме линейного слежения другие требования.

Первая специфика — результат сглаживания должен иметь хорошие аналитические свойства, чтобы программа делала из него выводы. Алгоритм сглаживания должен приближаться к формуле свертки от непрерывных переменных, которую в векторном виде записывается так:

Функция сглаживания

здесь — распределение интенсивности (величины пикселей) на оригинальном изображении,

Функция сглаживания — Результат сглаживания,
Функция сглаживания — Функция сглаживания.

Для того, чтобы мы могли дифференцировать сглаженную картинку, функция сглаживания должна быть непрерывной и иметь первые производные. Если производные будут разрывы первого рода (скачки), то взятие интеграла в формуле (2) повышает на единицу гладкость функции, и результат будет непрерывные первые производные и разрывные (но ограничены) вторые производные.

Также желательно, чтобы в случае одинакового действия в горизонтальном и вертикальгному направлениях, функция действовала так же и по всем другим направлениям, чтобы избежать подушко-образной дисторсии. То есть эта функция должна зависеть только от расстояния до центральной точки:

Функция сглаживания

Кроме того функция должна быть положительной и монотонно убывающей. А также превращаться в ноль (или становиться пренебрежимо малой) после некоторой конечной расстояния — чтобы мы могли проводить усреднение в пределах одного объекта, а не примешивая пиксели соседнего.

Вторая специфика — не надо применять сглаживание ко всем пикселей (это было бы пустой тратой процессорного времени), достаточно делать анализ только вблизи контуров или характерных точек объекта, чтобы судить о движении или форму всего объекта.

Выбор функции

Если с требованиями предыдущего пункта добавить еще одно требование, чтобы функция была достаточно простой и легко исчислялась, то самым естественным кандидатами будут следующие функции:

Функция сглаживания

где — небольшой целое число, а параметр задает размер области усреднения (математики эту область называют носителем функции), а — нормирующий множитель.

Функция постоянная в круге и имеет скачек (разрыв первого рода) на границе круга. Функция непрерывна но имеет разрывную производную, и вполне подходит для использования в алгоритме линейного слежения.

Функции (4) легко обобщаются для случая, когда нам нужны разные охвата усреднения по горизонтали и вертикали:

Функция сглаживания

и область усреднения будет эллипс.

Можно даже сделать этот эллипс наклоненным под углом:

Функция сглаживания

Некоторые вычисления

Для уверенного применения алгоритма линейного слежения нам надо сделать оценку сверху разницы:

Функция сглаживания

Эта оценка достаточно сложная, и будет проделана на отдельной странице. Здесь же мы сделаем некоторые простые вычисления.

Найдем нормирующий множитель функции такой, чтобы результатом усреднения равномерной засветки было то же число.

Функция сглаживания
Функция сглаживания

В реальных изображениях интенсивность находится в пределах от нуля до некоторого максимального значения. Это является следствием того, что датчики света имеют верхний порог. Этот факт приводит к тому, что производная сглаженной интенсивности тоже не превышает некоторого максимального числа. Найдем это число для случая. Для этого продифференцируем (2) по координате:

Функция сглаживания
Функция сглаживания

В последнем интеграле сделаем замену переменных:

Функция сглаживания

тогда

Функция сглаживания

Поскольку второй множитель под интегралом находится в пределах от нуля до, то выражение (11) всегда меньше:

Функция сглаживания

С круговой симметрии функции (9) мы можем сделать вывод, что число (12) ограничивает модуль градиента:

Функция сглаживания

Применение к задачам распознавания образов

Аналитические свойства сглаженной интенсивности позволяют: 1. следить за движением объектов; 2. вычислять градиент растрового изображения, причем достаточно гладкой для нужд дальнейшей векторизации; 3. Делать аффинное поиск на фотографии объекта с внутренней структурой (например лицо человека).

Показать больше

Похожие статьи

Добавить комментарий

Проверьте также
Закрыть
Кнопка «Наверх»
Закрыть
Закрыть