Пространственная дискретизация. Обработка графической информации

Автор Панькова Оксана Владимировна December 1, 2017

В те времена, когда еще компьютеры обладали не настолько мощными возможностями, как сейчас, ни о каком преобразовании изображений на бумаге или на пленке не могло быть и речи. Сейчас же принято считать, что таким объектам соответствует аналоговая форма. С появлением новых технологий стало возможным производить оцифровку (например, при помощи сканеров). Благодаря этому появилась так называемая дискретная форма изображений. Но каким же образом производится перевод графики из одной формы в другую? Кратко о сути таких методов далее и будет рассказано максимально подробно и просто, чтобы каждый пользователь понял, о чем идет речь.

Что такое пространственная дискретизация в информатике?

Для начала рассмотрим общее понятие, объяснив его самым простым языком. Из одной формы в другую графическое изображение преобразуется путем пространственной дискретизации. Чтобы понять, что это такое, рассмотрим простой пример.

Если взять какую-нибудь картину, написанную акварельными красками, нетрудно заметить, что все переходы являются плавными (непрерывными). А вот на отсканированном изображении, которое было напечатано на струйном принтере, таких переходов нет, поскольку оно состоит из множества мелких точек, называемых пикселями. Получается, что пиксель – это своего рода строительный кирпичик, который обладает определенными свойствами (например, имеет свой цвет или оттенок). Из таких кирпичиков и складывается полное изображение.

В чем состоит суть метода пространственной дискретизации?

Если говорить о сути самого метода преобразования графики при помощи таких технологий, можно привести еще один пример, который поможет понять, как это все работает.

Оцифрованные изображения, что при сканировании, что при выводе на экран компьютерного монитора, что при печати, можно сравнить еще и неким подобием мозаики. Только здесь в качестве одного кусочка мозаики выступает пиксель. Это есть одна из основных характеристик всех современных устройств. Как уже можно было догадаться, чем больше таких точек, и чем меньше размер каждой из них, тем более плавными будут переходы. В конечном счете именно их количество для каждого конкретного устройства определяет его разрешающую способность. В информатике для такой характеристики принято рассчитывать количество пикселей (точек) на дюйм (dpi – dot per inch), причем и вертикальном, и в горизонтальном направлении.

Таким образом, создается двумерная пространственная сетка, чем-то напоминающая обычную систему координат. Для каждой точки в такой системе можно задавать собственные параметры, которые будут отличаться от соседних точек.

Факторы, влияющие на качество кодирования

Но не только вышеописанные примеры в полной мере отражают то, как работает пространственная дискретизация. Кодирование графической информации учитывает еще несколько важных параметров, от которых зависит качество оцифрованного изображения. Они применяются не только к самим изображениям, но и к воспроизводящим графику устройствам.

В первую очередь, сюда относят следующие характеристики:

частота дискретизации;
разрешающая способность;
глубина цвета.

Частота дискретизации

Под частотой дискретизации понимается размер фрагментов, из которых состоит изображение. Этот параметр в равной степени можно встретить в характеристиках оцифрованных изображений, сканеров, принтеров, мониторов и графических карт.

Правда, тут есть одна загвоздка. Дело в том, что при повышении общего числа точек можно получить более высокую частоту. Но ведь при этом соответственно в большую сторону меняется и размер файла сохраняемого исходного объекта. Чтобы избежать этого, в настоящее время применяется искусственное поддержание размера на одном постоянном уровне.

Понятие разрешающей способности

Об этом параметре уже было упомянуто. Однако если посмотреть на устройства вывода изображений, тут картина несколько другая.

В качестве примера параметров, которые использует пространственная дискретизация, рассмотрим сканеры. Так, например, в характеристиках устройства указано разрешение 1200 х 1400 точек на дюйм. Сканирование производится путем перемещения полосы светочувствительных элементов вдоль сканируемого изображения. Но вот первое число обозначает оптическое разрешение самого устройства (количество сканирующих элементов в одном дюйме полосы), а второе относится к аппаратному разрешению и определяет количество «микроперемещений» полосы со сканирующими элементами по изображению при прохождении одного дюйма картинки.

Глубина цвета

Перед нами еще один важный параметр, без учета которого понять в полной мере, что такое пространственная дискретизация. Глубина цвета (или глубина кодирования) обычно выражается в битах (то же самое, кстати, можно отнести и к глубине звука) и определяет количество цветов, которые были задействованы при построении изображения, но в конечном итоге относится к палитрам (наборам цветов).

Например, если рассмотреть черно-белую палитру, в которой содержится всего два цвета (без учета градаций оттенков серого), количество информации при кодировании каждой точки можно вычислить по приведенной формуле, учитывая, что N – общее количество цветов (в нашем случае N=2), а I – количество состояний, которые может принимать каждая точка (в нашем случае I=1, поскольку вариантов может только два: или черный, или белый цвет). Таким образом, N^I=2¹=1 бит.

Квантование

Пространственная дискретизация также может учитывать и параметр, называемый квантованием. Что это такое? В чем-то это напоминает методику интерполирования.

Суть процесса состоит в том, что величина отсчета сигнала заменяется ближайшим соседним значением из фиксированного набора, который представляет собой список уровней квантования.

Чтобы лучше разобраться, как преобразовывается графическая информация, посмотрите на изображение выше. На нем представлена графика в исходной (аналоговой форме), изображение с применение квантования и побочные искажения, называемые шумами. На втором фото сверху можно увидеть своеобразные переходы. Они носят название шкалы квантования. Если все переходы одинаковы, шкала называется равномерной.

Цифровое кодирование

При преобразовании графической информации следует учесть, что, в отличие от аналогового сигнала, квантовый сигнал может принимать только совершенно определенное фиксированное количество значений. Это позволяет преобразовать их в набор символов и знаков, последовательность которых называют кодом. Финальная последовательность называется кодовым словом.

Каждое кодовое слово соответствует одному интервалу квантования, а для кодирования используется двоичный код. При этом иногда следует еще учитывать и скорость передачи данных, которая представляет собой произведение частоты дискретизации на длину кодового слова и выражается в битах в секунду (bps). Грубо говоря, это не что иное, как максимально возможное количество передаваемых двоичных символов в единицу времени.

Пример расчета видеопамяти для отображения на мониторе растрового изображения

Наконец, еще один важный аспект, связанный с тем, что представляет собой пространственная дискретизация. Растровые изображения на экране монитора воспроизводятся по определенным правилам и требуют затрат памяти.

Например, на мониторе установлен графический режим с разрешением 800 х 600 точек на дюйм и глубиной цвета 24 бит. Общее количество точек будет равно 800 х 600 х 24 бит = 11 520 000 бит, что соответствует или 1 440 000 байт, или 1406,25 Кб, или 1,37 Мб.

Способы сжатия видеоинформации

Технология пространственной дискретизации, как уже понятно, применима не только к графике, но и к видеоизображениям, которые в некотором смысле тоже можно отнести к графической (визуальной) информации. Правда, оцифровка такого материала до некоторых пор производилась с ограниченными возможностями, поскольку конечные файлы оказывались такими огромными, что держать их на компьютерном жестком диске было нецелесообразно (вспомните хотя бы исходный формат AVI, в свое время разработанный специалистами компании Microsoft).

С появлением алгоритмов M-JPEG, MPEG-4 и H.64 стало возможно уменьшать конечные файлы с коэффициентом уменьшения размера в 10-400 раз. Многие могут возразить по поводу того, что сжатое видеоизображение будет иметь более низкое качество по сравнению с оригиналом. В некотором смысле так оно и есть. Однако в таких технологиях уменьшение размера можно производить и с потерей качества, и без потерь.

Различают два основных метода, по которым производится сжатие: внутрикадровое и межкадровое. Оба таких варианта основаны на исключении из изображения повторяющихся элементов, однако не затрагивают, например, изменения яркости, цвета и т.д. Что в первом, что во втором случае, разница между сценами в одном кадре или между двумя соседними является незначительной, поэтому разница на глаз особо не заметна. Зато при удалении из файла вышеуказанных элементов, разница в размере между исходным и конечным изображением весьма существенная.

Одним из самых интересных, хотя и довольно сложных методов, которые использует пространственная дискретизация для сжатия изображений, является технология, получившая название дискретного косинусного преобразования, предложенная В. Ченом в 1981 году. Основана она на матрице, в которой, в отличие от исходной, описывающей только величины отсчетов, представлены значения скорости их изменения.

Таким образом, ее можно рассматривать, как некую сетку изменения скоростей в вертикальном и горизонтальном направлениях. Размер каждого блока определяется технологией JPEG и имеет размер 8 х 8 пикселей. А вот сжатие применяется к каждому отдельно взятому блоку, а не к целому изображению. Таким образом, разница между исходным и конечным материалом становится еще менее заметной. Иногда в компьютерной терминологии такую методику называют еще субдискретизацией.

Далее для яркости и цветности может применяться описанное выше квантование, при котором каждая величина косинусного преобразования делится на коэффициент квантования, который можно найти в специальных таблицах, полученных на основе так называемых психофизических тестов.

Сами же таблицы соответствуют строго определенным классам блоков, сгруппированных по активности (равномерное изображение, неструктурированное изображение, горизонтальный или вертикальный перепад и т.д.). Иными словами, для каждого блока устанавливаются свои собственные значения, которые неприменимы к соседним или тем, что отличаются классом.

кодирование графической информации пространственная дискретизация

Наконец, после квантования на основе кода Хаффмана производится удаление избыточных коэффициентов (сокращение избыточности), что позволяет получить для последующего кодирования кодовое слово с длиной менее одного бита для каждого коэффициента (VLC). Далее формируется линейная последовательность, для которой применяется метод зигзагообразного считывания, что группирует значения в конечной матрице в виде значащих величин и последовательностей нулей. А вот как раз их и можно убрать. Остальные комбинации сжимаются стандартным способом.

А вообще, специалисты особо не рекомендуют производить кодирование графической информации с использованием технологий JPEG, поскольку они имеют ряд недостатков. Во-первых, многократное пересохранение файлов неизменно приводит к ухудшению качества. Во-вторых, из-за того, что объекты, закодированные при помощи JPEG, не могут содержать прозрачных областей, применять такие методы к графическим изображениям или сканируемым образцам художественной графики можно только в том случае, если они по вертикали и горизонтали не превышают размер в 200 пикселей. В противном случае ухудшение качества конечного изображения будет выражено очень ярко.

Правда, алгоритмы JPEG стали основой для технологий сжатия MPEG, а также для множества стандартов конференц-связи вроде H.26X и H32X.

Вместо послесловия

Вот кратко и все, что касается понимания вопросов, связанных преобразованием аналоговой формы графики и видео в дискретную (по аналогии такие методики используются и для звука). Описанные технологии достаточно сложны для понимания рядовым пользователем, однако некоторые важные составляющие основных методик понять все-таки можно. Здесь не рассматривались вопросы настройки мониторов для получения максимально качественной картинки. Однако по интересующему нас вопросу можно отметить, что устанавливать максимально возможное разрешение стоит не всегда, поскольку завышенные параметры могут привести к неработоспособности устройства. То же самое касается и частоты обновления экрана. Лучше использовать рекомендованные производителем значения или те, которые операционная система после установки соответствующих драйверов и управляющего программного обеспечения предлагает использовать по умолчанию.

Что же касается самостоятельного сканирования или перекодирования информации из одного формата в другой, следует использовать специальные программы и конвертеры, однако для того, чтобы избежать понижения качества, максимально возможным сжатием с целью уменьшения размеров конечных файлов, лучше не увлекаться. Такие методы применимы только для тех случаев, когда информацию нужно сохранить на носителях с ограниченным объемом (например, CD/DVD-диски). Но в случае наличия достаточного места на винчестере, или когда требуется создать презентацию для трансляции на большом экране, или распечатать фотографии на современном оборудовании (фотопринтеры не в счет), качеством лучше не пренебрегать.

Добавить комментарий