Rambler's Top100
 
 
  04 декабря 2008 года Компьюлента
CIO
Терралаб
Бизнес-журнал
в поле зрения | обзоры и тесты | своя игра | интерактив
Дайджест вэйвлет-анализа, в двух формулах и 22 рисунках.
Автор: Леонид Левкович-Маслюк
Опубликовано в журнале "Компьютерра" №8 от 02 марта 1998 года

Введение

Предположим, что мы хотим изучить какой-то сигнал, например, временной ряд. Идея многомасштабного анализа (относящиеся сюда английские слова - multiscale и multiresolution), состоит в том, чтобы взглянуть на сигнал сначала под микроскопом, потом - через лупу, потом отойти на пару шагов, потом посмотреть совсем издалека.

Эта идея реализуется разными способами, но все они сводятся к последовательному огрублению той информации, которая дана изначально. Иногда действуют наоборот - сначала сильно огрубляют сигнал, смотрят на те особенности, которые еще сохранились, и начинают уточнять их положение.

Что это нам дает? Во-первых, мы можем выявлять локальные особенности сигнала и классифицировать их по интенсивности. Например, в обработке изображений широко распространена многомасштабная локализация резких границ (multiscale edge detection). Очень резкие перепады яркости заметны и на малых, и на больших масштабах. В некоторых задачах можно считать их наиболее информативной частью изображения, и вычислять с большой точностью, пренебрегая всем остальным. Вообще, подход последовательного уточнения чего-либо при переходе от крупного масштаба к мелкому возникает в самых разных областях обработки информации и прикладной математики. Хороший пример - многосеточные схемы в вычислительной физике.

Во-вторых, таким образом визуализируется динамика изменения сигнала вдоль "оси масштабов". Если резкие скачки во многих случаях можно заметить невооруженным глазом, то взаимодействие событий на мелких масштабах, перерастающее в крупномасштабные явления, увидеть очень сложно. Например, фрактальная структура каких-либо графиков или поверхностей бывает связана с (статистической) однородностью их строения на различных пространственных масштабах. Многомасштабный анализ помогает количественно охарактеризовать эту однородность. Скачки динамики по "масштабной переменной" могут нести не менее важную информацию, чем резкие изменения по времени или по пространству. Так, при анализе космических снимков земной поверхности выяснилось, что имеется несколько характерных масштабов, на которых фрактальные параметры меняются скачком. Также, и в экологии, и в экономике очень полезно выявлять ситуации, когда мелкомасштабная активность начинает влиять на крупномасштабную картину.

Часто в задачах обоих этих типов важнее найти не сами разномасштабные версии сигнала, а различия между ними, детали, которые исчезают при переходе от более тонкого масштаба к более грубому.

Вейвлет-анализ возник при обработке записей сейсмодатчиков в нефтеразведке и с самого начала был ориентирован как раз на локализацию разномасштабных деталей. Выросшую из этих идей технику теперь обычно называют непрерывным вейвлет-анализом. Ее основные приложения: локализация и классификация особых точек сигнала, вычисление его различных фрактальных характеристик, частотно-временной анализ нестационарных сигналов. Например, у таких сигналов, как музыка и речь, спектр радикально меняется во времени, а характер этих изменений - очень важная информация. Основным идеям непрерывного вейвлет-анализа и его приложений посвящен раздел 2.

Другая ветвь вейвлет-анализа - ортогональный вейвлет-анализ. О нем подробно рассказывается в разделе 3. Именно ортогональному вейвлет-анализу обязана своей популярностью вся эта тематика, с ним связана "вейвлет-революция" конца восьмидесятых годов. Главные применения - сжатие данных и подавление шумов.

Кроме этих двух важнейших частей вейвлет-анализа, имеется еще множество вариаций, которые очень кратко обрисованы в разделе 4. Там же приведен список важнейшей литературы, и электронные адреса, по которым можно найти много информации и полезные программы. А теперь перейдем, наконец, к изложению предмета статьи.

Непрерывный вейвлет-анализ.

Рис.

Главными действующими лицами этого раздела будут две функции, изображенные на рис. 1. Это - два самых, пожалуй, популярных вейвлета: "сомбреро" (Mexican hat) и вейвлет Морле (Morlet wavelet). График любого вейвлета выглядит примерно так же (заметим, что вейвлет Морле - комплекснозначный, на рисунке изображены его вещественная и мнимая части). Более точно, для того, чтобы функция могла называться вейвлетом, должны выполняться два условия.

  1. Ее среднее значение (т.е. интеграл по всей прямой) равно нулю.
  2. Функция быстро убывает при .

Теперь возьмем произвольный сигнал - некоторую функцию f(x) (переменную x будем называть временем), и произведем ее вейвлет-анализ при помощи вейвлета .

Результатом вейвлет-анализа этого сигнала будет функция Wf(x,a), которая зависит уже от двух переменных - от времени x и от масштаба a. Для каждой пары x и a (a>0) рецепт вычисления значения Wf(x,a) следующий:

  1. Растянуть вейвлет в a раз по горизонтали и в 1/a раз по вертикали.

  2. Сдвинуть его в точку x. Полученный вейвлет обозначим .

  3. "Усреднить" значения сигнала в окрестности точки a при помощи .

На рис. 2 показано, что надо сделать. В нижней части изображен график функции f(x), в верхней - условными цветами - распределение значений Wf(x,a) (по горизонтали - переменная x, по вертикали - ось a в логарифмическом масштабе, на которой маленькие масштабы расположены ниже больших. Самый маленький масштаб соответствует шагу сетки, на которой задана исходная функция). Синими столбиками изображены графики при разных значениях a и x. Выделенные участки графика исходной функции поточечно умножаются на значения оказавшихся над ними синих столбиков, потом все это суммируется. Абсолютная величина суммы определяет, какого цвета будет точка (x,a) на верхней картинке (на рисунке эти точки обведены красными кружочками). Это делается для всех пар (x,a).

Строгое определение выглядит так (это первая из двух обещанных формул).

(1)

На математическом языке можно сказать, что при фиксированном значении a Wf(x,a) есть свертка исходной функции с растянутым в a раз вейвлетом.

Посмотрим, какую информацию о сигнале можно получить из таких картинок. На рисунке 3 показано вейвлет-преобразование (с помощью "сомбреро") гладкой функции с единственной особенностью. Яркий конус точно указывает своей вершиной расположение этой особенности. Почему так происходит? На каждом уровне a = const стоит свертка f(x) с растянутой версией . В каждой точке это разность средних значений f по тем участкам, где положительна, и по тем, где она отрицательна. Так как среднее значение самой равно нулю, свертка напоминает "размазанную" производную данной функции. На малых масштабах размазывания почти нет, так как быстро убывает при удалении от x, и мы видим скачок вейвлет-преобразования (на картинке это более яркий цвет) вблизи самой особенности. На больших же масштабах растянутый вейвлет "задевает" особую точку, даже если он "приложен" к графику далеко от нее. Чем лучше вейвлет "сконцентрирован" во времени, тем точнее будет локализация особенностей.

А почему бы просто не вычислить производную или, скажем, вторые разности? В данном случае результат будет тот же - скачок в особой точке. Но давайте вернемся к рис. 2. Там тоже видны характерные яркие конусы, вырастающие из аналогичных особенностей функции. Но они соответствуют только самым сильным особенностям, имеющим большую амплитуду. Функция, которую мы изучаем, фрактальна, она не имеет производной нигде. Поэтому вторые разности дали бы совершенно хаотическую картину. Чтобы в ней разобраться, пришлось бы все сглаживать и перемасштабировать - что мы и делаем, проводя вейвлет-анализ! Мы пришли бы к аналогичной процедуре, но с плохим вейвлетом - плохим для другой важной задачи: выявления динамики локальных частот. Сейчас станет ясно, почему вейвлеты с рисунка 1 для этой задачи хороши.

Обратимся к рис. 4. В верхней части изображено вейвлет-преобразование (на этот раз с помощью функции Морле, она лучше приспособлена к частотно-временному анализу) суммы двух чистых гармоник. В нижней - вещественная часть самой этой суммы. Четко выделяются две яркие горизонтальные полосы вида и . Частоты гармоник легко определить по этим значениям; они пропорциональны и .

.

ТАКЖЕ В РАЗДЕЛЕ
04 ноября 2008 года
Все будет х….о! 
04 ноября 2008 года
Продолжение следует 
28 октября 2008 года
Танцы на игле 
28 октября 2008 года
Чудесный порошок 
 
САМОЕ ПОПУЛЯРНОЕ
Неделя после Fallout
Продажи новой игры из серии Fallout, разработанной студией Bethesda, идут очень неплохо - и это при том, что первый патч принёс игрокам кучу проблем, а японцы, оказалось, лишились части одного из квестов.
Текстовые развлечения
Поработаем в жанре ASCII Art и расскажем, как научиться рисовать при помощи символов, как переводить изображение любого формата в текстовый файл и как взглянуть на интерфейс Windows сквозь призму псевдографики.
Такие разные спутники
Александр Трухачев, директор российского представительства MIO Technology, завел свой блог на "КТ-Онлайн", чтобы рассказать об особенностях рынка потребительской электроники в России. Но для начала - о GPS и ГЛОНАСС.
О Смысле Всего Сущего
Евгений Козловский так обстоятельно подошел к вопросам читателей "КТ-Онлайн", что интервью пришлось разделить на две части. Но историю происхождения "Огородов" можно узнать уже сегодня!
/  бумажный номер

Тема номера: Кризис в ИТ Читайте на сайте тему номера "Кризис в ИТ" и другие статьи из журнала "Компьютерра" от 04 ноября 2008 года
  Архив номеров журнала

О проекте | Реклама на сайте | Рассылки сайта | КПК–версия | RSS-трансляция

© ООО «Компьютерра–Онлайн», 1997 — 2008.
При цитировании и использовании любых материалов ссылка на портал «Компьютерра–Онлайн» обязательна (для Интернет–изданий — www.computerra.ru)
Редакция сайта: site@computerra.ru
Техподдержка сайта: websupport@computerra.ru
Редакция журнала: inform@computerra.ru
Отдел рекламы: reklama@computerra.ru
Телефон: (495) 232–22–61, (495) 232–22–63
Работает на «Битрикс: Управление сайтом»
Почта защищена сервером «СПАМОРЕЗ»
Трилан — продвижение сайта,
поисковая оптимизация сайта

Сайт работает на сервере DEPO Computers
Rambler's Top100