DSP > Теория ЦОС > Основы ЦОС: Курс лекций

ЛК1>Введение в теорию цифровой обработки сигналов (ЦОС). Сигналы. Основные статистические характеристики сигналов

Тема: Области применения ЦОС. Цифровые сигналы и их статистические характеристики.

1. Теория цифровой обработки сигналов – одно из наиболее активно развивающихся направлений ХХІ века, объединяющее научные исследования и инженерную практику. Развитие этого направления привело к революционным изменениям в целом ряде областей человеческой деятельности – коммуникации, обработке изображений для медицины, радиолокации, обработке звука и пр.

Каждая прикладная область применяет свою технику цифровой обработки сигналов – алгоритмы, математический аппарат, специальные технологии. Кончено, успехи в развитии отдельных отраслей деятельности оказывают существенное влияние на развитие общей теории цифровой обработки сигналов. Поэтому, изучение теории цифровой обработки сигналов можно разделить на два основных направления:

– изучение общих положений теории ЦОС, используемых во всех областях;

– изучение специальных технологий, соответствующих конкретной области применения;

2. В отличие от других направлений компьютерных наук, теория цифровой обработки сигналов работает с уникальным типом данных – сигналами. В большинстве случаев, сигналы являются информацией разнообразных датчиков, измеряющих параметры реального мира – сейсмические колебания, видимые изображения предметов, звуковые колебания и пр. Цифровая обработка сигналов – это математический аппарат, алгоритмы и технологии, применяемые для работы с сигналами, после их преобразования в цифровую форму.

На практике, теория ЦОС стала применяться в 1960 – 1970 годах, когда появились первые вычислительные машины. Первые компьютеры были достаточно громоздкими, дорогими, поэтому использовались для решения задач в наиболее важных областях. Такими областями применения были:

– радиолокация (радары) и эхолокация (сонары) – для обеспечения задач государственной безопасности;

– нефтедобыча и нефтепереработка – область деятельности с большими капиталовложениями и долей прибыли;

– космические исследования – из-за уникальности исследуемых сигналов (отсутствие повторяемости или очень большой период повторяемости);

– медицинское оборудование (томография, ультразвуковая локация и пр.) – вопросы, связанные с жизнью человека.

Революционное развитие компьютерной техники в 1980 – 1990 годах существенно расширило области применения теории ЦОС. Сейчас цифровая обработка сигналов используется не только для решения государственных или военных задач, но и во многих коммерческих областях деятельности человека – мобильная телефония, проигрыватели компакт-дисков, электронная голосовая почта и др.

Алгоритмы и методы цифровой обработки сигналов нашли применение в целом ряде областей человеческой деятельности, например:

1. Космические исследования – обработка изображений, сжатие данных, создание различных интеллектуальных датчиков.

2. Медицина – диагностика (томография, рентгеноскопия, ультразвук и пр.), анализ электрокардиограмм, хранение и обработка информации.

3. Коммерческие направления – сжатие звука и изображения для мультимедиа-приложений, создания спецэффектов для видео, проведение видеоконференций и пр.

4. Телефония – сжатие голоса и данных, уменьшение влияния отраженного сигнала (эффект эха), коммутация сигналов, фильтрация.

5. Военная техника – радиолокация, эхолокация (сонары), создание интеллектуального оружия, кодирование систем связи.

6. Промышленность – разведка нефти и полезных ископаемых, контроль и управление различными процессами, неразрушающий контроль, различные системы проектирования.

7. Научные направления – сейсмография, анализ и обработка данных, спектральный анализ, моделирование различных процессов.

Соответственно, меняется и отношение к теории ЦОС как к науке. Если в 1980 годах это была дисциплина, которую изучали только научные работники, в 1990 годах ее стали преподавать для некоторых инженерных специальностей, то сейчас это базовая дисциплина, необходимая для подготовки научных и инженерных кадров для большинства областей человеческой деятельности.

Теория цифровой обработки сигналов очень тесно связана с другими дисциплинами (иногда сложно провести четкую границу между ними). К таким дисциплинам, например, относятся:

– теория передачи информации;

– численный анализ;

– теория вероятности и статистический анализ;

– теория измерений;

– аналоговая электроника;

– цифровая электроника;

3. Сигналы описывают зависимость одного параметра от другого. Наиболее распространенные сигналы в аналоговой электронике описывают зависимость напряжения от времени.

Рисунок 1.1 Классификация сигналов

Сигналы, параметры которых имеют непрерывный диапазон значений, называются непрерывными сигналами. При прохождении непрерывных сигналов через аналогово-цифровые преобразователи (АЦП), их параметры становятся квантованными. Сигналы, содержащие квантованные параметры, называются дискретными илицифровыми сигналами.

При графическом изображении цифрового сигнала, по вертикальной оси (обобщающее название – амплитуда) откладываются значения сигнала. Вертикальная ось еще носит названия: ось y, зависимая величина, диапазон значений или ордината. Горизонтальная ось назевается ось х, независимая величина, область значений или абсцисса. В общем виде, по горизонтальной оси откладываются номера отсчетов сигнала.

Термин «область значений» широко используется в ЦОС. Наиболее широко распространенными сигналами являются сигналы, область значений которых представляется во временной области, в частотной области илив пространственной области.

4. Среднее значение (µ или mean) – среднее арифметическое, полученное по всем отсчетам сигнала. В математическом виде это выглядит так:

            (1.1)

µ – среднее значение;

– значение очередного отсчета сигнала;

N – количество отсчетов сигнала.

В электронике среднее значение характеризует постоянную составляющую (DC) сигнала. В сигнале присутствует еще и переменная составляющая (AC), которая характеризует отклонение сигнала от среднего значения. Для описания переменной составляющей сигнала используется такой параметр, как среднее квадратичное отклонение, СКО (standard deviation), обозначаемое греческой буквой s.

Выражение описывает величину отклонения і-того отсчета от среднего значения. Если просуммировать отклонения, полученные для каждого отсчета, а затем результат усреднить (т.е. разделить на количество отсчетов), то мы получим значение среднего отклонения. Только все частные отклонения необходимо брать по абсолютной величине, чтобы исключить их взаимную компенсацию.

Среднее отклонение – число, отражающее усредненное значение отклонения амплитудных значений отсчетов сигнала от его среднего значения. Во многих практических задачах особый интерес представляет не величина отклонения сигнала от его среднего значения, а мощность (энергия) этих отклонений. Например – при воздействии случайного шума на электрический сигнал, результирующий сигнал получается не сложением амплитуд этих сигналов, а сложением их мощностей.

В отличие от среднего отклонения, среднее квадратичное отклонение или СКО несет информацию о мощности отклонения сигнала от среднего значения. Математическая формула для расчета СКО выглядит так:

           (1.2)

– значение очередного отсчета сигнала;

– среднее значение сигнала;

N – количество отсчетов сигнала;

s – среднее квадратичное отклонение;

В другом виде эта формула записывается так:

        (1.3)

Обратите внимание, что усреднение здесь происходит по
отсчетам, а не по отсчетам.

В статистике значение носит еще название девиация (variance). СКО показывает, насколько близки отклонения сигнала к его среднему значению. В электронике существует еще один термин –среднеквадратичное отклонение (root-mean-square, rms). Если СКО характеризует только переменную составляющую сигнала, то rms характеризует как переменную, так и постоянную его составляющую.

Рисунок 1.2 Соотношение между амплитудой и СКО для некоторых стандартных сигналов.

Такой способ вычисления среднего значения и СКО применим для большинства случаев, но он имеет два ограничения. Во-первых, при большом различии между СКО и средним значением могут получиться слишком большие или слишком маленькие числа. Это может привести к появлению ошибок округления. Во-вторых, при появлении новых отсчетов сигнала, придется заново пересчитывать значения СКО и среднего значения. Для решения этой проблемы используется другой способ вычислений, называемый скользящей статистикой. Для этого способа нет необходимости пересчитывать заново все отсчеты сигнала. Формула для вычисления СКО выглядит следующим образом:

(1.4)

или в другом виде:

        (1.5)

sum – сумма всех текущих значений отсчетов сигнала;

sum of squares – сумма квадратов всех текущих значений отсчетов сигнала;

N – текущее количество отсчетов сигнала.

Для расчета этих статистических характеристик достаточно сохранять всего лишь три параметра – (1) количество отсчетов в сигнале, (2) сумму значений текущих отсчетов этого сигнала и (3) сумму квадратов значений текущих отсчетов сигнала. С каждым новым отсчетом сигнала эти параметры обновляются.

Понятия среднего значения и СКО носят еще один физический смысл в электронике. Среднее значение описывает измеряемую величину, СКО описывает шум или другие помехи. В этом случае величина СКО интересна только в сопоставлении со средним значением. Для этого случая вводятся еще два термина:отношение сигнал-шум (signal-to-noise ratio, SNR) – среднее значение, деленное на СКО; и коэффициент девиации (coefficient of variation, CV) – СКО, деленное на среднее значение. Наилучшим сигналом является тот, у которого большое значение SNR и небольшое значение CV.

5. Статистические характеристики, применяемые для обработки цифровых данных, используются для характеристики обрабатываемых сигналов. Вероятностные характеристики в ЦОС применяются для описания процессов, порождающих эти сигналы.

Допустим, какой-то процесс с постоянными вероятностными характеристиками используется для генерации сигнала. При обработке этого сигнала его статистические характеристики могут меняться от измерения к измерению. Эти случайные ошибки, появляющиеся при обработке данных, носят название «статистическая девиация», «статистическая флуктуация» или «статистический шум». Поэтому, когда речь идет о среднем значении или СКО, необходимо четко понимать, о чем идет речь – о принимаемом сигнале или о процессе, его порождающем.

Для случайных сигналов, состоящих из N отсчетов, существует формула, связывающая статистическую ошибку, полученную при определении среднего значения для принятого сигнала и среднее значение порождающего этот сигнал процесса.

        (1.6)

– ошибка определения среднего значения для порождающего процесса;

s – СКО;

N – количество отсчетов сигнала;

Из этой формулы видно, что при малых значениях N величина ошибки большая, а с повышением N ошибка уменьшается. Эта закономерность в теории вероятности носит название строгого закона больших чисел, который утверждает, что ошибка стремится к нулю при N, стремящемся к бесконечности.

При расчете СКО принятого сигнала, в среднем значении присутствует статистический шум, который уменьшает значение СКО. Для компенсации этого искажения при расчете СКО вместо числа N берется число N-1 для усреднения сигнала. Другими словами, если в формуле для расчета СКО усреднение происходит по N-1, мы получим СКО для порождающего процесса; если мы усредним по N – получим СКО для анализируемого сигнала.

Если порождающий процесс имеет изменяющиеся характеристики (среднее значение и(или) СКО), то такой процесс называется нестационарным.

6. Для статической обработки сигналов, состоящих из большого количества отсчетов, широко применяютсягистограммы (histogram). Гистограмма это график, в котором по оси х откладываются возможные значения для каждого отсчета сигнала (например, для 8-разрядного числа – это значения от 0 до 255), а по оси у – количество отсчетов сигнала, имеющих данное значение. Сумма всех величин гистограммы должна соответствовать количеству отсчетов сигнала:

        (1.7)

N – количество отсчетов сигнала;

М – максимально возможное значение сигнала;

Ні – количество отсчетов сигнала с заданным значением (отображенным на гистограмме).

Рисунок 1.3 Пример гистограммы

Тогда для расчета статистических характеристик сигнала используются не все индивидуальные отсчеты, а уже сгруппированные по своим значениям отсчеты. Среднее значение и СКО рассчитываются по следующим формулам:

        (1.8)

– среднее значение сигнала;

N – общее количество отсчетов сигнала;

М – максимально возможное значение сигнала;

і – текущее значение сигнала;

Hі количество отсчетов сигнала, принимающее текущее значение.

        (1.9)

значение СКО. Остальные параметры те же, что и в предыдущем выражении.

Это более быстрые алгоритмы расчета статистических характеристик. Понятие гистограммы применимо только к обрабатываемому сигналу. Соответствующий параметр, используемый для описания порождающих процессов, называется плотностью вероятности (probability mass function, pmf). Гистограмма всегда строится для конечного числа отсчетов сигнала, а плотность вероятности может быть получена для бесконечного числа отсчетов (количество отсчетов сигналов с определенным значением), тогда по вертикальной оси графика плотности вероятности откладываются относительные величины (т.е. количество отсчетов с данным значением, деленное на общее количество отсчетов). Эти значения лежат в пределах от 0 до 1, а их сумма равна 1. Т.е., плотность вероятности показывает, с какой вероятностью может быть сгенерировано то или иное значение сигнала.

Понятие гистограмма и плотность вероятности применимы только для дискретных сигналов. Для непрерывных сигналов используется плотность распределения вероятности (probability density function (pdf) или probability distribution function). Эта функция имеет тот же смысл, что и плотность вероятности для дискретных сигналов и изображается на графиках непрерывной линией. Для расчета вероятности появления в аналоговом сигнале значений, лежащих в определенном диапазоне, необходимо взять интеграл от огибающей функции плотности распределения вероятности в пределах заданного диапазона. Т.е. вероятность определяется площадью фигуры, ограниченной заданным диапазоном.

Рисунок 1.4 Связь между гистограммой, плотностью вероятности и плотностью распределения вероятности

Если пределы интегрирования бесконечны (т.е. от -∞ до +∞), то значение этого интеграла равно 1.

7. Сигналы, формируемые случайными процессами, обычно имеют колоколообразную форму огибающей плотности распределения вероятности. Такой закон распределения называется нормальным или Гауссовым (в честь германского математика Карла Фридриха Гаусса (1777 – 1855)). Сигналы с таким распределением наиболее часто встречаются в природе. Огибающая функция такого распределения записывается в следующем виде:

        (1.10)

Для получения полной функции, к выражению для огибающей необходимо добавить желательную величину среднего значения и СКО s. Дополнительно, выражение должно быть нормализовано, т.е. площадь поверхности, расположенной под огибающей, должна быть равной 1 (что и требуется для плотности распределения вероятности). Результирующая формула, описывающая нормальное распределение, выглядит следующим образом:

        (1.11)


– плотность распределения вероятности;

– среднее значение;

s – СКО;

Рисунок 1.5 Примеры функции плотности распределения вероятности

Среднее значение определяет расположение центра функции плотности распределения вероятности, а СКО – ширину этой функции. Одно из интересных свойств функции Гаусса – очень затянутый спад к нулю (пологий фронт).

Как говорилось ранее, для получения значения вероятности необходимо проинтегрировать функцию плотности распределения вероятности.

Рисунок 1.6 Интегральная функция распределения

Интеграл от гауссовой функции настолько важен, что получил собственное название – интегральная функция распределения (cumulative distribution function, cdf). Взять интеграл от такой функции простыми способами сложно, поэтому используются методы численного интегрирования (или табличная форма).

8. Случайный шум – очень важный сигнал в электронике и ЦОС. С его помощью тестируются различные алгоритмы ЦОС. Для реализации случайных последовательностей в языках программирования используются специальные операторы (например, RND). Эти операторы генерируют случайную последовательность чисел в диапазоне от 0 до 1 с равномерным распределением. Для получения последовательности с нормальным распределением существуют два способа:

– суммирование 12 сигналов, сгенерированных командой RND (для одного сигнала , а для двенадцати = 1);

– использование двух случайных сигналов, объединенных уравнением:

        (1.12)

R1 и R2 – две случайные последовательности;

cos – значение функции cos в радианах.

Для получения требуемых характеристик сигнала, полученную последовательность необходимо умножить на требуемое значение СКО и прибавить к нему требуемое среднее значение.

9. Погрешность и точность – термины, применяемые для характеристики методов и систем, занимающихся измерением, оценкой и прогнозированием. Во всех этих случаях сравнение идет относительно одного известного значения. Это значение называется истинная величина (true value). Погрешность (precision) и точность (accuracy) – это два способа описания ошибки, существующей между измеряемой величиной и истинным значением. При большом количестве измерений все полученные значения распределяются по нормальному закону (центральная граничная теорема). Среднее значение соответствует центру распределения, а СКО характеризует его ширину.

Точность измерения определяется как величина сдвига, между полученным средним значением и истинной величиной. Ширина разброса измеренных параметров называется погрешностью измерений, которая зависит от величины СКО, отношения сигнал-шум, коэффициента девиации.

Если измерения проведены с хорошей точностью, но с большой погрешностью, тогда результирующая гистограмма будет иметь в центре истинное значение, но большую «размытость». Это говорит о плохойповторяемости процесса измерения. Большая погрешность – результат случайных ошибок. Усреднение нескольких измерений всегда уменьшает погрешность. Погрешность зависит от случайных шумов.

Если измерение сделано с плохой точностью, но с малой погрешностью, тогда результирующая гистограмма будет узкой, но ее центр будет смещен относительно истинного значения. Плохая точность – результатсистематических ошибок. Говорят, что точность зависит от качества калибровки системы.

Для реальных систем – если ошибки устраняются после проведения нескольких измерений, то это ошибки погрешности. Если ошибки устраняются после калибровки системы – это ошибки точности.


Комментарии: