Виды компьютерной графики. Трехмерность изображения

Трехмерные и двумерные изображения: модели, алгоритмы и области анализа

П.А. Чочиа

Аннотация - Рассматриваются вопросы модификации двухмасштабной модели и алгоритмов обработки при переходе от двумерных к трехмерным изображениям. Показаны изменения области анализа, алгоритмов фильтрации, декомпозиции изображений и обнаружения объектов. Предложены быстрые алгоритмы вычисления локального среднего и порядковых статистик по скользящему окну для 3Б-изображений.

Ключевые слова - Обработка изображений, трехмерное изображение, модель изображений, алгоритм обработки, область анализа, быстрые алгоритмы.

I. Введение

Когда употребляют термин «трехмерное изображение» зачастую понимают совершенно различные виды данных -, основные из которых следующие.

1. Данные, задаваемые функцией трех координат и являющиеся гомеоморфным отображением некоторого объемного участка трехмерного пространства, включая все содержащиеся в нем объекты.

2. Стереоскопическое изображение, состоящее из пары двумерных изображений, за счет диспаратности дающих наблюдателю представление о расположении объектов.

3. Изображение, являющееся проекцией трехмерной сцены (например, аксонометрической), позволяющее оценить форму и расположение объектов, но при этом остающееся двумерным.

4. Двумерное изображение, каждая точка которого соответствует некоторым координатам в трехмерном пространстве, например дальности или рельефу.

5. Особым способом сформированные изображения, создающие образы объектов, например голограммы.

6. Видеопоследовательности, содержащие набор кадров объектов. Такие данные могут представляться в виде трехмерного массива, но одна из координат при этом является не пространственной, а координатой времени.

Далее под трехмерным или ЗБ-изображением (непрерывным или дискретным) будут пониматься изображения исключительно первого типа. По существу, 3D-изображение представляет собой расширение обычного 2D-изображения путем добавления еще одного пространственного измерения.

Способы формирования трехмерного изображения могут быть различными; наиболее известным является

П.А. Чочиа, к.т.н., с.н.с., Институт проблем передачи информации РАН, г. Москва. (e-mail: [email protected])).

томографическое сканирование - рентгеновская компьютерная томография или магнитно-резонансная томография. Возможно получение 3D-изображения в результате сейсморазведки при геологических исследованиях, в микроскопии при использовании объектива с переменным фокусным расстоянием, при компьютерном моделировании трехмерных объектов и сцен, или каким-то иным образом.

Обработка и анализ трехмерных изображений играют в настоящее время существенную роль во многих областях исследований, особенно в медицине и геологии. В настоящей работе рассмотрены вопросы расширения модели двумерного изображения и применения ее к трехмерным изображениям, вопросы модификации операций частотной и пространственной фильтраций при переходе в 3D, вопросы сглаживания и декомпозиции изображений ,, фильтрации помех, обнаружения контуров и объектов, а также вычислительные аспекты реализации некоторых алгоритмов для трехмерных изображений .

Большинство алгоритмов фильтрации при переходе от двумерных к трехмерным сигналам модифицируются сравнительно просто. Это будет показано на примерах наиболее распространенных алгоритмов, основанных на частотной и пространственной фильтрациях.

II. Особенности трехмерного изображения В дискретном виде 3D-изображение представляется массивом X = размерами MxNxK. Как и в 2D, значение каждого элемента xmnk есть квантованное на (xmax+1) градаций значение логарифма яркости (энергии) 0 < xmnk < xmax, которое для краткости будем называть просто яркостью. Дискретный элемент 3D-изображения принято называть вексель. Трехмерное изображение, отображающее некоторую сцену, можно рассматривать состоящим из плотно упакованных связных трехмерных областей (объектов), соответствующих деталям сцены. Областью или объектом будем называть максимальное по размеру связное множество элементов изображения, имеющих близкие, возможно плавно меняющиеся значения яркости. Области могут соприкасаться произвольным образом, в том числе одна область может быть полностью окружена другой. На границах соседних областей значения яркости должны заметно различаться. Не соприкасающиеся области могут иметь произвольные, в том числе и совпадающие яркости. Пространственные границы между соседними областями, как объектами различающейся яркости, называют контурами. 3D-изображения характеризуются

International Journal of Open Information Technologies ISSN: 2307-8162 vol. 2, no. 11, 2014

следующими свойствами:

3D-изображение - совокупность объектов, плотно заполняющих пространство изображения;

Контуры в 3D-изображении - пространственные границы между объектами;

Сечение 3D-изображения плоскостью и проекция его на плоскость любого направления дают двумерный сигнал со всеми свойствами обычного 2D-изображения.

III. Области анализа

Область анализа - подмножество исходных данных, используемое в оценке параметров. Методы, в которых для каждой точки (или малых фрагментов) изображения используются свои параметры обработки, определяемые по ограниченной и, как правило, центрированной в данной точке области анализа, называют локальными.

Рассмотрим связное множество элементов xijle Vd(xmnk) таких, которые отстоят от центрального элемента xmnk на расстояние не далее, чем d и вместе составляют фигуру некоторой задаваемой формы. При d < 2a3 множество Vd(xmnk), окружающее центральный элемент (воксель) xmnk, будем называть окрестностью и обозначать Vmnk, а при d >>1 - фрагментом и обозначать Wmnk. Отметим, что в зависимости от выполняемых операций сам центральный элемент xmnk может как принадлежать, так и не принадлежать Vd(x). Соответственно, операции вида

ymnk = f{xijl 1 xijl e Vd(xmnk) }, (1)

в которых результат в каждой точке (m,n,k) зависит лишь от значений элементов xijl, входящих в Vd(xmnk), называются локальными операциями.

При переходе из 2D в 3D варианты симметричных окрестностей и соседства элементов претерпевают следующие изменения. Окрестность из 2x2 элементов (4 пикселя) становится окрестностью из 2x2x2 элементов (8 вокселей), в которой каждый воксель соседствует с каждым. В двумерной окрестности из 3x3 элементов (9 пикселей), как известно, можно рассматривать два варианта соседства элементов: 4-соседство (только по сторонам пикселей) и 8-соседство (по сторонам и вершинам пикселей) . Аналогом первого из них в 3D будет окрестность с 6-соседством вокселей (Рис. 1,а). Аналогом второго - окрестность с 26-соседством вокселей (Рис. 1,в). Возможен промежуточный вариант с 18-соседством вокселей (Рис. 1,б). Выбор варианта окрестности обычно определяется контекстом задачи и используемым алгоритмом.

Рис. 1. Окрестности и соседства вокселей в 3D: а) 6-соседство; б) 18-соседство; в) 26-соседство.

В некоторых случаях нас интересует не весь набор точек, попадающих в область анализа, а лишь некоторое его подмножество, включающее центральный элемент, которое будем называть областью принадлежности. Способ выбора области принадлежности зависит от

задачи; некоторые варианты рассмотрены в разделе VI.

IV. Двухмасштабная многокомпонентная модель

ТРЕХМЕРНОГО ИЗОБРАЖЕНИЯ

Для формулировки сведений об основных свойствах изображений - топологических (форм, размеров областей и контурных перепадов между ними) и статистических (взаимосвязи значений элементов) необходима соответствующая модель изображения. Чтобы быть полезной, она должна описывать свойства изображений на расстояниях, обусловленных особенностями задач, а также давать возможности для построения эффективных алгоритмов обработки и анализа изображений.

Статистические взаимосвязи элементов изображения, находящихся на больших расстояниях, существенно отличаются от аналогичных свойств близлежащих элементов и их не удается описать одними и теми же соотношениями. Для обычного двумерного изображения была разработана двухмасштабная многокомпонентная модель, достаточно хорошо описывающая взаимосвязи элементов и на малых расстояниях в несколько шагов дискретизации, и на больших - соразмерных размерам объектов изображения . Она с успехом может быть перенесена на 3D-изображения.

Значения элементов 3D-изображения X = при этом будут представляться в виде суммы статистически независимых компонент:

xmnk Smnk ^ tmnk + ^mnk (2)

Первый член суммы - кусочно-гладкая компонента Smnk, определяющая уровни яркости протяженных областей изображения; tmnk - текстурно-детальная компонента, несущая информацию о текстуре и мелких деталях; £,mnk - шумовая компонента, определяемая шумами регистратора, аналого-цифрового преобразователя и др. Все компоненты предполагаются

независимыми и аддитивными, а tmnk и £,mnk - нормально распределенными и несмещенными.

A. Масштаб малого размера

На масштабе малого размера (масштабе элементов окрестности) рассматривается сравнительно небольшое связное множество элементов, расположенных на расстоянии нескольких шагов дискретизации. Как и в двумерной модели , элементы трехмерного изображения разделяются на два непересекающихся множества: попадающие на граничные участки (контурные) и не попадающие (внутренние), составляющие вместе полное изображение. Окрестность Vmnk элемента xmnk рассматривается как группа из R элементов xrmnk e Vmnk, r = 1,...,R, ближайших к xmnk, и попадающих в то же множество (контурное или внутреннее), что и элемент xmnk (Рис. 2).

Методом наименьших квадратов проводится гиперплоскость, наиболее близкая значениям элементов из Vmnk, составляющая с гиперплоскостью, ориентированной вдоль осей координат MNK, некоторый угол, величина и направление которого в точке (m,n,k) характеризуется вектором gmnk. В точке r окрестности проведенная гиперплоскость отличается от значения

International Journal of Open Information Technologies ISSN: 2307-8162 vol. 2, no. 11, 2014

xrmnk на случайную величину yrmnk . Такое представление

позволяет связать значения элементов окрестности

XLk ^ Vmnk фоРМУлой:

Xmnk ^mnk + Р gmnk + У mnk , (3)

где pmnk - значение проведенной гиперплоскости в центральной точке окрестности (m,n,k), pr - расстояние между центральным элементом Xmnk и xrmnk, grmnk - величина проекции gmnk на вектор из Xmnk в xrmnk, а yrmnk -

случайная величина.

Вводится понятие контурной маски E = : emnk = 1 для контурных и emnk = 0 для внутренних элементов. Обозначая для контурных и внутренних элементов grmnk

через Vmnk и Vmnk , а Ymnk через Cmnk и hmnk

соответственно, представим grmnk и jrmnk в виде сумм

grmnk = emnk R1 .

3. Из элементов Vmnk выбираются z таких xrmnk e V,

(r = 1,..., z), что попадают в интервал (XV - AV, XV + AV), где AV - его полуширина. По значениям Xrmnk из данного интервала, подсчитывается среднее :

Xmnk A(V mnk , Xmnk ,

A(Vmnk , Xmnk , n , А) = - Ё X

где XV - AV < Xmnk < XV + AV.

4. Аналогично п. 2, по гистограмме фрагмента H"Wnk и

W r»W r>W/ W/т 3\

заданному n находятся значения R1 = R (n /L) и rw = rw(1 - nW/L3). Значение XW находится сравнением

X„„k с RW и RW:

mnk, если RW < Xmrk < RV ; XW = RW ,

RW , если X„„k > RW

если Xmnk < R1W ; и X"

5. Сглаженное значение Smnk находится как медиана по усеченной гистограмме фрагмента HmWnk - той ее части,

которая расположена в интервале (X - A , X + A):

Smnk = med(Wm„k, Xmnk , nW, AW).

Рис. 4. Результат декомпозиции: исходное изображение (слева), сглаженная компонента S„n (справа) и графики отмеченной строки.

Полученное значение Smnk считается искомой сглаженной компонентой. Упрощенный вариант данного алгоритма был позже опубликован в под названием билатеральная фильтрация. Пример декомпозиции двумерного изображения размерами 256x256 элементов с фрагментом сглаживания Wmnk размерами 15x15 элементов показан на Рис. 4.

E. Обнаружение объектов заданного объема В показано, что изложенный выше алгоритм декомпозиции можно использовать для обнаружения объектов на изображении. Аналогично 2D-изображе-ниям, для которых решается задача обнаружения объектов по их площади, в трехмерной модификации ставится задача обнаружения объектов по их объему.

По аналогии с двумерной, трехмерная задача также допускает формулировку в трех вариантах: обнаружение объектов с объемом (т.е. числом элементов) N j меньше заданного T1, больше заданного T2, и обнаружение объектов, имеющих объем в интервале T1 < N] < T2.

1) Обнаружение объектов с N1 > T Предполагается, что изображение состоит из достаточно ровного фона (большая область U0), на которой имеется набор небольших областей U1,...,UJ, отстоящих друг от друга достаточно далеко, и можно выбрать некоторый размер фрагмента L (L3/2 > T) такой, что в любой фрагмент Wmnk попадает не более одной области c N] > T, либо несколько меньших, но при условии EN1 < T (U1 _ W). В п. 5 алгоритма декомпозиции (25) выберем nW= T, a R"W = R(T/L3) и R2W = R(1-T/L3). Обработкой изображения с данными значениями R1W и R2W получим:

т.е. сглаженную компоненту исходного изображения, на которой остались области с N] > T, обнаруживаемые детектором со значением порога S(U0) ± 5, где S(U0) - средняя яркость фона, а 5 < mini{IS(U1) - S(U 0)l}; (S(U 1) - яркости соответствующих областей).

2) Обнаружение объектов с N1 < T

Сглаженная компонента Smnk, в (25) содержит лишь области с N1 > T, а области с N1 < T содержатся в разностной компоненте tmn = (Xmn - ^mn) - Smn. Детекция объектов с N1 < T достигается пороговым обнаружением в точках, где ltmnl > 5 (5 - порог обнаружения).

3) Обнаружение объектов с Tj < N] < T2 Возможны два варианта решения.

В первом случае сначала выберем nW = T1. Тогда сглаженная компонента Smnk в (25) будет содержать объекты с N] > T1. Осуществим повторную ее обработку алгоритмом (25) с nW = T2 (T2 > T1). Очевидно, во вновь полученной сглаженной компоненте S’mnk будут содержаться лишь объекты с N1 > T1. Взяв разность ymnk = ISmnk - S’mnkl получим сигнал, содержащий объекты в диапазоне T1 < N] < T2. Недостаток данного решения - алгоритм получается двухпроходовым.

Второй вариант. Обратим внимание, что при анализе гистограмм по окрестности и фрагменту используются два разных порога (nV и nW). Выберем размеры окрестности l и фрагмента L больше обычного - такими, чтобы l3 > 2T1 и L3 > 2T2. Задав R1V и RV, как

International Journal of Open Information Technologies ISSN: 2307-8162 vol. 2, no. 11, 2014

RV = RV(T1/l2) и RV = RV(1 - ТУ/2), после операции (24) будем иметь xmnk, которое уже не содержит области с N] < Т1. Далее в п. 5 алгоритма декомпозиции, при анализе HW, зададим RW и R2W как RW = RW(T2/L3) и rw = rw(1 - t2/l3). Получив значение Smnk в (25), возьмем разность ymnk = I xmnk - Smnk\, на которой объекты выделяются пороговым обнаружением.

Отметим, что как понятие площади в двумерном случае, так и понятие объема в трехмерном варианте алгоритма используются в несколько необычном смысле - как «локальный» объем, т.е. объем той части объекта, которая попадает внутрь фрагмента Wmnk.

VII. Некоторые вычислительные алгоритмы

A. Сумма по прямоугольному параллелепипеду Введем обозначение для суммы по фрагменту 2Б-изображения:

т.е. S(j)(mn) - сумма значений элементов xuv, попадающих в прямоугольный фрагмент, диагональные точки которого имеют координаты (i,j) и (m-1,n-1). Обратим внимание, что фрагмент при этом не включает точку с координатами (m,n) и соответствующие ей строку и столбец. Аналогично для трехмерного изображения, S(ijl)(mnk) - сумма значений элементов xijl в прямоугольном параллелепипеде с координатами углов (i,j,l) и (m-1,n-1,k-1):

Для двумерного изображения классический способ вычисления суммы S(mn)(m+Hn+L) по скользящему прямоугольному фрагменту размерами HxL элементов при переходе от элемента (m,n) к элементу (m,n+1) сводится к формуле

S(m,n+1)(m+H,n+L+1) S (m,n)(m+H,n+L) S(m,n)(m+H,n+1) +S(m,n+L)(m+H,n+L+1), (26)

где последние два члена - суммы элементов по левому (удаляемому) и правому (добавляемому) столбцам фрагмента. Алгоритм требует 4 операции независимо от размеров фрагмента - 2 операции в выражении (26) и две операции на пересчет каждой из сумм по столбцу S(m,n)(m+H,n+V) при переходе от строки m к строке m+1. Дополнительно требуется N ячеек для хранения сумм по столбцам.

При переходе к 3Б-изображению, формула (26) будет модифицирована для скользящего прямоугольного параллелепипеда размерами HxLxJ:

S(m,n,k+1)(m+H,n+L,k+J+1) S(m,n,k)(m+H,n+L,k+J) S(m,n,k)(m+H,n+L,k+1)+ + S(m,n,k+J)(m+H,n+L,k+J+1), (27)

где последние два члена - суммы элементов по левой (удаляемой) и правой (добавляемой) граням

параллелепипеда. Данный алгоритм требует уже 6 арифметических операции независимо от размеров фрагмента - 2 операции в выражении (27), две операции на пересчет каждой из сумм по граням и две на пересчет сумм по столбцам. Кроме того, требуется K

ячеек для хранения массива сумм по граням и NxK ячеек для хранения сумм по столбцам.

Для двумерного изображения известен и другой алгоритм вычисления суммы по прямоугольнику произвольного размера. Пусть для каждой точки (m,n) подсчитаны суммы Smn = S(0,0)(m,n) по прямоугольнику с диагональными элементами x00 и xm-1,n-1. Тогда сумма S(ij)(mn) значений элементов внутри прямоугольника с угловыми координатами (i, j) и (m-1,n-1) будет:

S(ij)(mn) Smn Sm,j Si,

что в среднем для каждого элемента изображения требует 2 операции для вычисления суммы Smn и 3 операции для вычислений по формуле (28). Однако для хранения сумм Smn требуется уже MxN ячеек, равное размеру изображения. Преимуществом является то, что за те же 3 операции можно вычислять S(ij)(mn) для любых значений координат, а не только по скользящему фрагменту.

Алгоритм (28) также может быть модифицирован для трехмерного изображения. Пусть для каждой точки (m,n,k) подсчитаны суммы Smnk по прямоугольному параллелепипеду с диагональными элементами x000 и xm-1,n-1,k-1, т.е. Smnk = S(ooo)(mnk). Нетрудно показать, что в таком случае сумма S(ijl)(mnk) значений элементов внутри параллелепипеда с угловыми координатами (i, j, l) и (m-1,n-1,k-1) вычисляется при помощи следующей операции:

S(ijl)(mnk) = Smnk -Smjk -Smnl -Sink +Smjl +Sijk +Sinl -Sijl. (29)

Таким образом с учетом того, что для вычисления каждого из значений Smnk требуется 3 арифметических операции, для вычисления суммы S(ijl)(mnk) для каждого элемента трехмерного изображения потребуется в среднем 10 арифметических операций. Объем дополнительно требуемой памяти составит MxNxK ячеек с разрядностью, достаточной для значений сумм Smnk.

Аналогично можно находить дисперсии по фрагменту D(ijl)(mnk), вычисляя значения сумм квадратов S(mnk)(x2) для каждой из точек (m,n,k) и для прямоугольного параллелепипеда S(ijl)(mnk)(x2), и затем пользуясь формулой

D(ijl)(mnk) = {S(ijl)(mnk)(x) - (S(ijl)(mnk)) }/N(ijl)(mnk), (30)

где S(ijl)(mnk)(x2) - сумма квадратов значений элементов, попадающих в параллелепипед, а общее число точек в параллелепипеде равно N(ijl)(mnk) = (m-i)x(n-j)x(k-l).

B. Порядковые статистики по прямоугольному параллелепипеду

Основой для вычисления порядковых статистик по фрагменту W как 2D- так и 3Б-изображения служит гистограмма распределения значений яркости по этому фрагменту hW(x), а также ее интегральная характеристика FW(x):

FW (x) = Z hW (i) ; FW(xmax) = NW, (3 1)

где xmax - максимально возможное значение яркости, а NW - число точек во фрагменте W. Порядковые статистики вида RW(n), где 0 < n < NW, представляют собой зависимость:

RW(n) = z, если FW(z-1) < n < FW(z). (32)

Алгоритм скользящего вычисления гистограммы по

International Journal of Open Information Technologies ISSN: 2307-8162 vol. 2, no. 11, 2014

фрагменту строится аналогично формулам (26) и (27), т.е. при смещении фрагмента к следующей точке производится удаление точек на одной грани фрагмента и добавление точек на противоположной грани . В двумерном случае алгоритм скользящего вычисления гистограммы по фрагменту при переходе от точки (m,n) к соседней точке (m,n+1) требует в среднем 2H числа операций (H - число строк во фрагменте). В трехмерном случае при переходе от точки (m,n,k) к точке (m,n,k+1) потребуется уже 2HxL операций, где HxL - число точек в грани параллелепипеда, перпендикулярной направлению смещения K.

В трехмерном случае число требуемых операций растет пропорционально произведению HxL. Однако, если (HxL) > (xmax+1), то вместо операций со значениями отдельных точек выгодно заранее сформировать гистограммы для граней параллелепипеда hj)(mnk+1)(x), а

затем осуществлять операции вычитания и прибавления таких гистограмм:

hW (x) = hW (x) - hF (x) +

h(i,j,k+1Xm,n,k+J+1)(x) h(ijk)(m,n,k+J)(X) h(ijk)(m,n,k+1)(x)

H(i,j,k+J)(m,n,k+J+1)(X) ,

где J - размер фрагмента в направлении смещения K. Действия по формуле (33) требуют в среднем 2(xmax+1) арифметических операций на одну точку изображения независимо от размера параллелепипеда. Для пересчета гистограмм по граням параллелепипеда hfjk)(mnk+1)(x)

нужно дополнительно в среднем 2L операций на точку и (xmax+1)xK ячеек памяти для хранения K гистограмм.

Число операций (xmax+1), требуемое для прибавле-ния/вычитания каждой из гистограмм по граням параллелепипеда hFjk)(mnk +1)(x), можно уменьшить, если

воспользоваться пространственной корреляцией обрабатываемых данных. На участках с медленным изменением яркости, которых на реальных изображениях обычно большинство, размах значений элементов сравнительно невелик - в несколько раз меньше полного диапазона в (xmax+1) градаций. Добавив к каждой из гистограмм hFjk)(mnk +1)(x) по 2 ячейки для

запоминания минимального и максимального значений распределения, и, соответственно, обрабатывая лишь указываемый диапазон градаций, удается дополнительно в несколько раз сократить общее число операций.

VIII. Заключение

Рассмотрены вопросы модификации двумерных модели и алгоритмов обработки изображений в применении к трехмерным изображениям. Показаны варианты изменения области анализа, алгоритмов фильтрации, декомпозиции изображений и обнаружения объектов, которые сравнительно несложно модифицируются при переходе от 2D- к 3Б-изображениям. Предложены вычислительные алгоритмы, сокращающие количество операций при определении значений среднего и порядковых статистик по скользящему фрагменту для 3D- изображения.

Библиография

Toriwaki J., Yoshida H. Fundamentals of Three-Dimensional Digital Image Processing. New York: Springer, 2009.

Красильников Н. Цифровая обработка 2D и 3D изображений. СПб.: BHV-Петербург, 2011.

Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2012.

Чочиа П.А. “Двухмасштабная модель изображения”. В кн.

Кодирование и обработка изображений. М.: Наука, 1988, С. 69-87.

Чочиа П.А. Обработка и анализ изображений на основе двухмасштабной модели: Препринт ИППИ АН СССР. М.: ВИНИТИ, 1986.

Ахмед Н., Рао К. Ортогональные преобразования при обработке цифровых сигналов. М.: Связь, 1980.

Chochia P.A. “Image Enhancement Using Sliding Histograms”. Computer Vision, Graphics, Image Processing, 1988, vol. 44, no. 2, pp. 211-229.

Прэтт У. Цифровая обработка изображений. М.: Мир, 1982. Т. 1, 2.

Робертс Л. “Автоматическое восприятие трехмерных объектов”. В кн. Интегральные роботы. М.: Мир, 1973, С. 162-208.

Чочиа П.А. “Цифровая фильтрация импульсных помех на телевизионных изображениях”. Техника средств связи: сер. Техника телевидения, 1984, вып.1, C. 26-36.

Чочиа П.А. “Сглаживание изображения при сохранении контуров”. В кн. Кодирование и обработка изображений. М.: Наука, 1988, С. 87-98.

Чочиа П.А. “Некоторые алгоритмы обнаружения объектов на основе двухмасштабной модели изображения”. Информационные процессы, 2014, Т. 14, № 2, С. 117-136.

Lee J.S. “Digital Image Smoothing and the Sigma Filter”. Computer Vision, Graphics, Image Processing, 1983, vol. 24, no. 2. pp. 255-269.

Tomasi C., Manduchi R. “Bilateral filtering for gray and color images”. Proc. IEEE 6th Int. Conf. on Computer Vision, Bombay, India, 1998, pp. 839-846

Чочиа П.А. “Параллельный алгоритм вычисления скользящей гистограммы”. Автометрия, 1990, № 2, С. 40-44.

Чочиа П.А. “Модификация модели и алгоритмов обработки при переходе от двумерных к трехмерным изображениям.” В кн. IX

Международная научно-практическая конференция “Современные информационные технологии и ИТ-образование." Сборник избранных трудов. М.: МГУ, 2014, С. 820-833.

International Journal of Open Information Technologies ISSN: 2307-8162 vol. 2, no. 11, 2014

Three-dimensional and two-dimensional images: modification of image model, analysis area processing algorithms

Abstract - The specificities of three dimensional images are formulated. The adaptation of analysis area and two-scale image model to 3D-images is studied. The modifications of various image processing algorithms to 3D-images are demonstrated. Fast algorithms for calculating local average and order statistics in the moving window for 3D-images are proposed.

Keywords - Image processing, three-dimensional image, image model, image processing algorithm, analysis area, fast algorithms.

2D (two dimensions) – вид компьютерной графики. Такое изображение всегда будет выглядеть плоским, так как в нем используется только два измерения – ширина и высота. Используется для создания логотипов, карт, сайтов, рекламных баннеров, в играх и интерфейсах приложений, мультфильмах и видеофильмах. Несмотря на то, что 2D графика выглядит как плоское изображение, за счет теней можно добиться эффекта объемных объектов (но не фотореалистичности).

Макеты рекламных материалов, созданные для Museo Argentino de Ciencias Naturales (Музей естественных наук, Буэнос Айрес). Автор: Lucas Rod .


Видео для одного из проектов Rijksmuseum . Видеоряд включает в себя изображения 211 произведений из онлайн коллекции музея.


Интерактивная игра для детей о жизни динозавров, нарисованная в формате 2D-графики.

2D графика бывает трех видов:

  • Векторная графика: изображение представлено в виде геометрических форм, что дает максимальную точность построенного изображения. Такой формат картинки легко редактируется, масштабируется, поворачивается, деформируется, и позволяет имитировать трехмерность. Из недостатков вектора можно отметить отсутствие реалистичности и невозможность использования эффектов. Векторная графика подходит для рисования чертежей и схем, используется для масштабируемых шрифтов, деловой графики, для элементов брендбука (логотипы, декоративные узоры и т.п.), применяется для создания мультфильмов и различных роликов, а также в печати (обеспечивает высокое качество изображения).
  • Растровая графика: картинка формируется из точек различного цвета (так называемых пикселей), которые образуют строки и столбцы. Такие изображения обладают высокой реалистичностью, за счет возможности применения разнообразных эффектов. Недостатком растрового формата является слабая масштабируемость (при уменьшении или увеличении картинки теряется ее качество).
    Растровые форматы рисунков используются при создании веб-страниц в Интернете, мобильных приложений, любых интерфейсов, в цифровой живописи и т.д.

    Пример-иллюстрация разницы между изображением векторным и растровым.

    Пример музейного приложения для сенсорных устройств:

  • Фрактальная графика: изображение состоит из частей, которые в каком-то смысле подобны целому — увеличенные части объекта походят на сам объект и друг на друга. В компьютерной графике фракталы используются для построения изображений природных объектов, таких как деревья, кусты, горные ландшафты, поверхности морей и так далее.

    Интерактивная инсталляция в

Человек способен по двухмерной картинке составить весьма полное представление о расстояниях до изображенных объектов, их форме и размерах, и таким образом полностью воспринять трехмерный мир во всей его глубине. Как мы этого добиваемся?

Как известно человек с помощью глаз непосредственно видит именно двухмерную картинку. То, что мы видим можно запечатлеть, например, с помощью фотоаппарата, распечатать на листе бумаги (т.е. в двухмерной плоскости) и повесить на стену, таким образом изображение, поступающее к нам в мозг от глаз двухмерное.

Однако и глядя на реальные объекты, и на фотографии, и при просмотре видео, мы умудряемся вытянуть из данных двухмерных картинок столько информации, что они начинают нам казаться объемными, как-бы трехмерными. Мы очень хорошо воспринимаем относительное расположение объектов в пространстве только лишь за счет зрения. Вид зрения, который позволяет воспринять форму, размеры и расстояние до объектов называется – стереоскопическим зрением. Человек обладает таким зрением и добивается этого за счет следующих эффектов:

  • Бинокулярное зрение. Человек имеет два глаза. На сетчатке каждого из глаз формируется слегка различное двухмерное изображение одной и той же трехмерной сцены. На основе жизненного опыта и огромных вычислительных способностей, мозг сопоставляя эти два слегка различающиеся изображения, формирует представление о трехмерности картинки. Лучше всего этот эффект срабатывает при рассматривании близких объектов, таких расстояние до которых хоть как-то сравнимо с расстоянием между глазами. При рассматривании объектов, удаленных на расстояние более пяти метров, этот эффект уже почти не сказывается. Сразу также оговоримся, что в виду того, что бинокулярное зрение – это не единственный фактор, позволяющий видеть в 3D, и так как сфера его применения ограничена несколькими метрами, то отсутствие двух глаз не стало бы катастрофой для человека. Мы тем не менее смогли бы видеть в 3D, просто нам бы понадобилось больше жизненного опыта и времени, чтобы научиться применять остальные эффекты. Это утверждение подтверждается очень легко. Просто закройте один глаз. Ну что, перестали видеть в 3D? Нет!
  • Смещение объектов при движении наблюдателя. При движении наблюдателя картинка, которую он видит постоянно меняется, при этом близкие объекты меняют свое положение на этой картинке значительно быстрее, чем далекие, которые медленно изменяют свое положение в поле зрения наблюдателя. И опять-таки, большой жизненный опыт и вычислительные способности мозга, позволяют по скорости перемещения объектов в поле зрения хорошо воспринять расстояние до них. Кстати, фактически перемещением одного глаза на расстояние равное расстоянию между глазами, можно заменить бинокулярное зрение, ведь действительно, мозг в итоге сможет сопоставить те же две картинки, что и сразу от двух глаз. Однако этот метод требует больших усилий и постоянного движения, а также картинки ведь будут запечатлены не в один и тот же момент времени, т.е. могут быть уже разными. Поэтому бинокулярное зрение всё же очень полезная опция, которая очень помогает при работе с близкими объектами, чем человек обычно и занимается.
  • Жизненный опыт. Большинство людей хорошо представляют размеры многих привычных объектов, таких как деревья, другие люди, автомобили, окна, двери и так далее. Обладая этими знаниями, можно неплохо оценить расстояние до одного из таких объектов (а значит и до тех объектов, которые расположены рядом), в зависимости от того, какую часть от общего поля зрения они занимают. Например, Вы сразу догадаетесь, что девочка на фото ниже, расположена значительно ближе к наблюдателю чем башня до верхушки которой она якобы дотягивается...
  • Задымленность далеких объектов. Атмосфера всё же имеет определенную степень непрозрачности. Поэтому очень далекие объекты выглядят задымленными. Так по степени задымленности можно определять какой из далеких объектов расположен дальше, а какой ближе к наблюдателю. Это очень полезный эффект, ведь для далеких объектов плохо работают остальные способы построения трехмерного изображения.
  • Перспектива, тени и освещение. По конфигурации теней и степени освещенности той или иной части предмета, на основе большого жизненного опыта мозг хорошо воспринимает форму объектов. Перспектива – эффект в соответствии с которым, например, две параллельные линии в пространстве сходятся в точку на изображении при большом удалении от наблюдателя. Мозг умеет очень хорошо воспринимать информацию, поступающую к нему за счет этого эффекта.
  • Способность глаза сфокусироваться только на одной дальности. Глаз, как и любой оптический прибор не может видеть одинаково хорошо картинку во всей её глубине, он может сфокусироваться только на некоторой конкретной дальности. Таким образом, наиболее четкими нам видятся объекты, на которых мы в данный момент сфокусированы, а более близкие и дальние объекты кажутся слегка размытыми. Мозг владеет информацией о том, на какой дальности в данный момент сфокусированы глаза. Так фокусируя взгляд на разных дальностях мы способны как бы просканировать всё пространство во всей его глубине.
  • Близкие объекты закрывают дальние. Этот очевидный эффект хотя и кажется очень простым, тем не менее вносит большой вклад в построение трехмерной картинки. Ведь нет ничего проще, чем понять, что один объект находится дальше другого, если он им частично закрыт.
  • Изображение поясняющее пункт №3.

    Изображение поясняющее пункт №4.

    Изображение поясняющее пункт №5.

    Изображение поясняющее пункт №6.

    После того, как мы проговорили все эффекты на основе которых наше зрение позволяет нам воспринимать трехмерную картинку можно также сделать одно небольшое замечание насчет 3D-кино.

    Дело в том, что в любом кино используются все перечисленные выше эффекты, кроме самого первого – «бинокулярного зрения». Ну а в 3D-кино, за счет специальных технологий добавляется и бинокулярность. При просмотре фильмов в 3D для каждого глаза за счет очков формируется слегка различное изображение.

    Однако нужно отметить, что это не вносит существенного улучшения в картинку. Ведь как уже говорилось, и с помощью одного глаза, имея большой жизненный опыт, можно фактически без потери качества видеть всю глубину картинки (за счет остальных шести эффектов, используемых в любом кино).

    Кроме того, бинокулярное зрение полезно на небольших расстояниях, а в фильмах зачастую мы наблюдаем широкие сцены, а не рассматриваем маленькие объекты с близкого расстояния, поэтому данный эффект частенько вообще не заметен.



    Статьи по теме: