Сегментация при распознании изображений

Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 15:07, 19 декабря 2016.

Задача сегментации и распознавания изображений технически комплексная. Она делится на несколько больших сегментов (подзадач):

Рис. 1 Этапы алгоритмов распознавания изображения

Основная задача распознавания: понять, относится ли данные на изображении к классу искомых объектов. Основные технические сложности, возникающие в данном случае:

  1. Изображения предъявляются на сложном фоне;
  2. Искомые области имеют сложную геометрию;
  3. Входные данные имеют шум или дезориентирующую информацию;
  4. Различные части изображения имеют различные характеристики (подсветка, освещенность, помехи)

Для решения задачи на различных этапах применяют различные подходы и методы сегментации, нормализации и распознавания. На приведенном рисунке представлены основные методы, существующие и применяющиеся на сегодняшний день (методы, имеющие подметоды, обозначены жирной рамкой):

Pис. 2 Некоторые методы применяемые при распознавании изображений

Предварительная обработка - применяется практически всегда после снятия информации с видеодатчика и преследует целью снижение помех на изображении, возникших в результате дискретизации и квантования, а также подавления внешних шумов. Как правило, это операции усреднения и выравнивания гистограмм.

Сегментация - процесс поиска однородных областей на изображении. Этот этап весьма трудный и в общем виде не алгоритмизированный для произвольных изображений. Наиболее распространены методы сегментации, основанные на определении однородных яркостей (цветов) или однородностей типа текстур.

Улучшение/фильтрация - могут использоваться после проведения сегментации, и преследует ту же цель что и предварительная обработка: снижение помех на изображении, возникших в результате дискретизации и квантования, а также подавления внешних шумов.

Распознавание - чаще всего конечный этап обработки, лежащий в основе процессов интерпретации и понимания. Входными для распознавания являются изображения, выделенные в результате сегментации и, частично, отреставрированные. Они отличаются от эталонных изображений геометрическими и яркостными искажениями, а также сохранившимися шумами. Для реальных задач распознавания применяются, в основном, четыре подхода, использующие методы: корреляционные, основанные на принятии решений по критерию близости с эталонами; признаковые и синтаксические - наименее трудоемкие и нормализации, занимающие промежуточное положение по объему вычислений. В рамках каждого подхода есть свои конкретные алгоритмы, имеющие определенную область применения, которая зависит от характера различий входных и эталонных изображений, от помеховой обстановки в поле зрения, требований к объемам вычислений и скорости принятия решений.