Transformada de Fourier bidimensional da propriedade. transformada de Fourier

19 Bilhete 1. Operação de dilatação

2. Características espaciais-espectrais

operações de dilatação.

Sejam A e B conjuntos do espaço Z 2 . A dilatação de um conjunto A em relação a um conjunto B (ou em relação a B) é denotada por A⊕B e é definida como

Pode ser reescrito da seguinte forma:

O conjunto B será chamado de conjunto formador de estrutura ou primitivo de dilatação.

(11) baseia-se na obtenção de uma reflexão central do conjunto B em relação às suas coordenadas iniciais (centro B), então deslocando este conjunto para o ponto z, dilatando o conjunto A ao longo de B - o conjunto de todos esses deslocamentos z, no qual e A coincidem em pelo menos um elemento.

Esta definição não é a única. No entanto, o procedimento de dilatação é, de certa forma, semelhante à operação de convolução que é realizada em conjuntos.


Características espectrais espaciais

De acordo com (1.8), a transformada de Fourier bidimensional é definida como

Onde w x, w y são frequências espaciais.

O quadrado do módulo do espectro M( w x, w y) = |Ф( w x, w y)| 2 pode ser usado para calcular uma série de recursos. Integração de funções M(w x, w y) pelo ângulo no plano de frequências espaciais fornece uma característica de frequência espacial que é invariante em relação ao deslocamento e rotação da imagem. Ao introduzir a função M(w x, w y) em coordenadas polares, escrevemos esse recurso na forma


Onde q= arctano ( w y/w x); r 2 = w x 2 +w y 2 .

O recurso é invariável em relação à escala


20 bilhetes 1. Operação de erosão

A transformada discreta de Fourier bidimensional da matriz de amostra da imagem é definida como uma série:

onde , e a transformação inversa discreta tem a forma:

Por analogia com a terminologia da transformada contínua de Fourier, as variáveis ​​são chamadas de frequências espaciais. Cabe destacar que nem todos os pesquisadores utilizam a definição (4,97), (4,98). Alguns preferem colocar todas as constantes de escala na expressão inversa, enquanto outros invertem os sinais nos kernels.

Como os núcleos de transformação são simétricos e separáveis, a transformação bidimensional pode ser realizada como sucessivas transformações unidimensionais sobre as linhas e colunas da matriz da imagem. As funções básicas de transformação são expoentes com expoentes complexos, que podem ser decompostos em componentes seno e cosseno. Por isso,

O espectro da imagem tem muitas características estruturais interessantes. Componente espectral na origem do plano de frequência

igual ao aumento N vezes o valor médio (sobre o plano original) do brilho da imagem.

Substituindo na igualdade (4,97)

onde e são constantes, temos:

Para quaisquer valores inteiros e o segundo fator exponencial de igualdade (4.101) torna-se um. Assim, em ,

que indica a periodicidade do plano de frequência. Este resultado é ilustrado na Figura 4.14, a.

O espectro de Fourier 2D de uma imagem é essencialmente uma representação do campo 2D como uma série de Fourier. Para que tal representação seja válida, a imagem original também deve ter uma estrutura periódica, ou seja, têm um padrão que se repete vertical e horizontalmente (Fig. 4.14, b). Assim, a borda direita da imagem é adjacente à esquerda e a borda superior é adjacente à parte inferior. Devido a descontinuidades nos valores de brilho nesses locais, componentes adicionais aparecem no espectro da imagem, que se encontram nos eixos coordenados do plano de frequência. Esses componentes não estão relacionados aos valores de brilho dos pixels internos da imagem, mas são necessários para reproduzir suas bordas nítidas.

Se uma matriz de amostras de imagem descreve um campo de luminância, os números serão reais e positivos. No entanto, o espectro de Fourier desta imagem geralmente tem valores complexos. Como o espectro contém um componente que representa as partes real e imaginária, ou a fase e o módulo dos componentes espectrais para cada frequência, pode parecer que a transformada de Fourier aumenta a dimensão da imagem. Este, no entanto, não é o caso, uma vez que tem simetria sob conjugação complexa. Se em igualdade (4.101) definimos e igual a inteiros, então após a conjugação complexa obtemos a igualdade:

Com a ajuda de substituição e src=http://electrono.ru/wp-content/image_post/osncifr/pic126_15.gif> podemos mostrar que

Devido à presença de simetria conjugada complexa, quase metade dos componentes espectrais são redundantes, ou seja, eles podem ser formados a partir dos componentes restantes (Fig. 4.15). É claro que harmônicos que caem não no meio-plano inferior, mas no semiplano direito podem, é claro, ser considerados componentes em excesso.

A análise de Fourier no processamento de imagens é usada para os mesmos propósitos dos sinais unidimensionais. No entanto, no domínio da frequência, as imagens não representam nenhuma informação significativa, o que torna a transformada de Fourier não uma ferramenta tão útil para análise de imagens. Por exemplo, quando uma transformada de Fourier é aplicada a um sinal de áudio unidimensional, uma forma de onda complexa e difícil de formalizar no domínio do tempo é transformada em um espectro de fácil compreensão no domínio da frequência. Por comparação, tomando a transformada de Fourier (transformada de Fourier) de uma imagem, transformamos a informação ordenada no domínio espacial (domínio espacial) em uma forma codificada no domínio da frequência (domínio da frequência). Resumindo, não espere que a transformada de Fourier o ajude a entender as informações codificadas nas imagens.

Da mesma forma, não se refira ao domínio da frequência ao projetar um filtro. A principal característica das imagens é a borda - a linha que separa um um objeto ou região de outro objeto ou áreas. Como os contornos da imagem contêm uma ampla faixa de componentes de frequência, tentar alterar a imagem manipulando o espectro de frequência é uma tarefa ineficaz. Filtros de processamento de imagem são normalmente projetados no domínio espacial, onde a informação é apresentada em sua forma mais simples e acessível. Ao resolver problemas de processamento de imagem, é necessário operar em termos de operações suavização e sublinha contornos (domínio espacial) do que em termos de filtro passa-alta e filtro passa-baixa(domínio da frequência).

Apesar disso, a análise de imagens de Fourier tem várias propriedades úteis. Por exemplo, convolução no domínio espacial corresponde a multiplicação no domínio da frequência. Isso é importante porque a multiplicação é uma operação matemática mais simples do que a convolução. Tal como acontece com os sinais 1D, esta propriedade permite a convolução FFT e várias técnicas de deconvolução. Outra propriedade útil no domínio da frequência é teorema do setor de Fourier, que estabelece correspondências entre a imagem e suas projeções (vistas da mesma imagem de lados diferentes). Este teorema forma a base teórica de direções como tomografia computadorizada, fluoroscopia amplamente utilizado na medicina e na indústria.

O espectro de frequência de uma imagem pode ser calculado de várias maneiras, mas o método mais prático para calcular o espectro é o algoritmo FFT. Ao usar o algoritmo FFT, a imagem original deve conter N linhas e N colunas e o número N deve ser um múltiplo da potência de 2, ou seja, 256, 512, 1024 e

etc. Se a imagem original não for uma potência de 2 em dimensão, os pixels de valor zero devem ser adicionados para preencher a imagem no tamanho desejado. Devido ao fato de que a transformada de Fourier preserva a ordem das informações, as amplitudes dos componentes de baixa frequência estarão localizadas nos cantos do espectro bidimensional, enquanto os componentes de alta frequência estarão em seu centro.

Como exemplo, considere o resultado da transformada de Fourier de uma imagem de microscópio eletrônico do estágio de entrada de um amplificador operacional (Fig. 4.16). Como o domínio da frequência pode conter pixels com valores negativos, a escala de cinza dessas imagens é deslocada de tal forma que valores negativos são percebidos como pontos escuros na imagem, valores zero como cinza e valores positivos como pontos brilhantes. Normalmente, os componentes de baixa frequência do espectro da imagem são muito maiores em amplitude do que os de alta frequência, o que explica a presença de pontos muito claros e muito escuros nos quatro cantos da imagem do espectro (Fig. 4.16, b). Como pode ser visto na figura, um típico

A filtragem linear de imagens pode ser realizada tanto no domínio espacial quanto no domínio da frequência. Neste caso, considera-se que frequências espaciais "baixas" correspondem ao conteúdo principal da imagem - o fundo e objetos de grande porte, e frequências espaciais "altas" - objetos de pequeno porte, pequenos detalhes de grandes formas e o ruído componente.

Tradicionalmente, métodos baseados em $\textit(Fourier transform)$ são usados ​​para mover para a região de frequências espaciais. Nos últimos anos, métodos baseados em $\textit(wavelet-transform (wavelet-transform))$ também encontraram uso crescente.

Transformada de Fourier.

A transformada de Fourier permite representar quase qualquer função ou conjunto de dados como uma combinação de funções trigonométricas, como seno e cosseno, o que permite identificar componentes periódicos nos dados e avaliar sua contribuição para a estrutura dos dados originais ou a forma dos dados. a função. Tradicionalmente, existem três formas principais da transformada de Fourier: a transformada integral de Fourier, a série de Fourier e a transformada discreta de Fourier.

A transformada integral de Fourier transforma uma função real em um par de funções reais ou uma função complexa em outra.

A função real $f(x)$ pode ser expandida em termos de um sistema ortogonal de funções trigonométricas, ou seja, pode ser representada como

$$ f\left(x \right)=\int\limits_0^\infty (A\left(\omega \right)) \cos \left((2\pi \omega x) \right)d\omega -\ int\limits_0^\infty (B\left(\omega \right)) \sin \left((2\pi \omega x) \right)d\omega , $$

onde $A(\omega)$ e $B(\omega)$ são chamadas de transformadas integrais de cosseno e seno:

$$ A\left(\omega \right)=2\int\limits_(-\infty )^(+\infty ) (f\left(x \right)) \cos \left((2\pi \omega x )\right)dx; \quad B\left(\omega \right)=2\int\limits_(-\infty )^(+\infty ) (f\left(x \right)) \sin \left((2\pi \omega x )\right)dx. $$

A série de Fourier representa a função periódica $f(x)$ definida no intervalo $$ como uma série infinita em senos e cossenos. Ou seja, a função periódica $f(x)$ está associada a uma sequência infinita de coeficientes de Fourier

$$ f\left(x \right)=\frac(A_0 )(2)+\sum\limits_(n=1)^\infty (A_n ) \cos \left((\frac(2\pi xn)( b-a)) \right)+\sum\limits_(n=1)^\infty (B_n \sin \left((\frac(2\pi xn)(b-a)) \right)), $$

$$ A_n =\frac(2)(b-a)\int\limits_a^b (f\left(x \right)) \cos \left((\frac(2\pi nx)(b-a)) \right)dx ; \quad B_n =\frac(2)(b-a)\int\limits_a^b (f\left(x \right)) \sin \left((\frac(2\pi nx)(b-a)) \right)dx . $$

A transformada discreta de Fourier transforma uma sequência finita de números reais em uma sequência finita de coeficientes de Fourier.

Seja $\left\( (x_i ) \right\), i= 0,\ldots, N-1 $ uma sequência de números reais - por exemplo, leituras de brilho de pixel ao longo de uma linha de imagem. Esta sequência pode ser representada como uma combinação de somas finitas da forma

$$ x_i =a_0 +\sum\limits_(n=1)^(N/2) (a_n ) \cos \left((\frac(2\pi ni)(N)) \right)+\sum\limits_ (n=1)^(N/2) (b_n \sin \left((\frac(2\pi ni)(N)) \right)), $$

$$ a_0 =\frac(1)(N)\sum\limits_(i=0)^(N-1) (x_i) , \quad a_(N/2) =\frac(1)(N)\sum \limits_(i=0)^(N-1) (x_i ) \left((-1) \right)^i, \quad a_k =\frac(2)(N)\sum\limits_(i=0) ^(N-1) (x_i \cos \left((\frac(2\pi ik)(N)) \right)), $$

$$ b_k =\frac(2)(N)\sum\limits_(i=0)^(N-1) (x_i \sin \left((\frac(2\pi ik)(N)) \right) ), \quad i\le k

A principal diferença entre as três formas da transformada de Fourier é que se a transformada integral de Fourier é definida sobre todo o domínio da função $f(x)$, então a série e a transformada discreta de Fourier são definidas apenas em um conjunto discreto de pontos, que é infinito para a série de Fourier e finito para as transformações discretas.

Como pode ser visto a partir das definições da transformada de Fourier, o maior interesse para os sistemas de processamento de sinal digital é a transformada discreta de Fourier. Dados obtidos de mídias digitais ou fontes de informação são conjuntos ordenados de números escritos como vetores ou matrizes.

Geralmente, assume-se que os dados de entrada para uma transformação discreta são uma amostra uniforme com um passo de $\Delta $, enquanto o valor $T=N\Delta $ é chamado de comprimento do registro ou período principal. A frequência fundamental é igual a $1/T$. Assim, na transformada discreta de Fourier, os dados de entrada são decompostos em frequências que são um múltiplo inteiro da frequência fundamental. A frequência máxima determinada pela dimensão dos dados de entrada é igual a $1/2 \Delta $ e é chamada de $\it(Frequência de Nyquist)$. A contabilização da frequência de Nyquist é essencial ao usar uma transformada discreta. Se os dados de entrada tiverem componentes periódicos com frequências superiores à frequência de Nyquist, então ao calcular a transformada discreta de Fourier, os dados de alta frequência serão substituídos por uma frequência mais baixa, o que pode levar a erros na interpretação dos resultados da transformada discreta.

Uma ferramenta importante para análise de dados também é $\it(energy spectrum)$. A intensidade do sinal na frequência $\omega $ é determinada da seguinte forma:

$$ P \left(\omega \right)=\frac(1)(2)\left((A \left(\omega \right)^2+B \left(\omega \right)^2) \right ). $$

Este valor é frequentemente chamado de $\it(signal energy)$ na frequência $\omega $. De acordo com o teorema de Parseval, a energia total do sinal de entrada é igual à soma das energias em todas as frequências.

$$ E=\sum\limits_(i=0)^(N-1) (x_i^2 ) =\sum\limits_(i=0)^(N/2) (P \left((\omega _i) \direita)) . $$

Um gráfico de potência versus frequência é chamado de espectro de energia ou espectro de potência. O espectro de energia permite revelar periodicidades ocultas nos dados de entrada e avaliar a contribuição de certos componentes de frequência para a estrutura dos dados de entrada.

Representação complexa da transformada de Fourier.

Além da forma trigonométrica da transformada discreta de Fourier, $\it(representação complexa)$ é amplamente utilizada. A forma complexa da transformada de Fourier é amplamente utilizada na análise multivariada e, em particular, no processamento de imagens.

A transição da forma trigonométrica para a forma complexa é realizada com base na fórmula de Euler

$$ e^(j\omega t)=\cos \omega t+j\sin \omega t, \quad j=\sqrt (-1) . $$

Se a sequência de entrada for números complexos $N$, então sua transformada discreta de Fourier será

$$ G_m =\frac(1)(N)\sum\limits_(n=1)^(N-1) (x_n ) e^(\frac(-2\pi jmn)(N)), $$

e a transformação inversa

$$ x_m =\sum\limits_(n=1)^(N-1) (G_n ) e^(\frac(2\pi jmn)(N)). $$

Se a sequência de entrada é uma matriz de números reais, então existe uma transformação discreta complexa e uma seno-cosseno para ela. A relação dessas representações é expressa da seguinte forma:

$$ a_0 =G_0 , \quad G_k =\left((a_k -jb_k ) \right)/2, \quad 1\le k\le N/2; $$

os valores restantes $N/2$ da transformação são conjugados complexos e não carregam informações adicionais. Portanto, o gráfico do espectro de potência da transformada discreta de Fourier é simétrico em relação a $N/2$.

Transformação rápida de Fourier.

A maneira mais simples de calcular a Transformada Discreta de Fourier (DFT) é a soma direta, que resulta em operações $N$ por coeficiente. Existem coeficientes $N$ no total, então a complexidade total é $O\left((N^2) \right)$. Essa abordagem não é de interesse prático, pois existem formas muito mais eficientes de calcular a DFT, chamada de transformada rápida de Fourier (FFT), que possui complexidade $O(N\log N)$. A FFT só se aplica a sequências que têm um comprimento (número de elementos) múltiplo de uma potência de 2. O princípio mais geral por trás do algoritmo FFT é dividir a sequência de entrada em duas sequências de meio comprimento. A primeira sequência é preenchida com dados de numeração par e a segunda sequência é preenchida com dados de numeração ímpar. Isto permite calcular os coeficientes DFT através de duas transformações $N/2$.

Denote $\omega _m =e^(\frac(2\pi j)(m))$, então $G_m =\sum\limits_(n=1)^((N/2)-1) (x_(2n) ) ) \omega _(N/2)^(mn) +\sum\limits_(n=1)^((N/2)-1) (x_(2n+1) ) \omega _(N/2) ^(mn) \omega _N^m $.

Por $ m< N/2$ тогда можно записать $G_m =G_{\textrm{even}} \left(m \right)+G_{\textrm{odd}} \left(m \right)\omega _N^m $. Учитывая, что элементы ДПФ с индексом б ольшим, чем $N/2$, являются комплексно сопряженными к элементам с индексами меньшими $N/2$, можно записать $G_{m+(N/2)} =G_{\textrm{even}} \left(m \right)-G_{\textrm{odd}} \left(m \right)\omega _N^m $. Таким образом, можно вычислить БПФ длиной $N$, используя два ДПФ длиной $N/2$. Полный алгоритм БПФ заключается в рекурсивном выполнении вышеописанной процедуры, начиная с объединения одиночных элементов в пары, затем в четверки и так до полного охвата исходного массива данных.

Transformada de Fourier bidimensional.

A transformada discreta de Fourier para uma matriz bidimensional de números $M\vezes N$ é definida da seguinte forma:

$$ G_(uw) =\frac(1)(NM)\sum\limits_(n=1)^(N-1) (\sum\limits_(m=1)^(M-1) (x_(mn) ) ) ) e^((-2\pi j\left[ (\frac(mu)(M)+\frac(nw)(N)) \right]) ), $$

e a transformação inversa

$$ x_(mn) =\sum\limits_(u=1)^(N-1) (\sum\limits_(w=1)^(M-1) (G_(uw) ) ) e^( (2 \pi j\left[ (\frac(mu)(M)+\frac(nw)(N)) \right]) ). $$

No caso de processamento de imagem, os componentes da transformada de Fourier 2D são chamados de $\textit(frequências espaciais)$.

Uma propriedade importante da transformada de Fourier bidimensional é a possibilidade de seu cálculo usando o procedimento FFT unidimensional:

$$ G_(uw) =\frac(1)(N)\sum\limits_(n=1)^(N-1) ( \left[ (\frac(1)(M)\sum\limits_(m= 0)^(M-1) (x_(mn) e^(\frac(-2\pi jmw)(M))) ) \right] ) e^(\frac(-2\pi jnu)(N) ), $$

Aqui, a expressão entre colchetes é uma transformação de linha unidimensional da matriz de dados, que pode ser realizada com uma FFT unidimensional. Assim, para obter uma transformada de Fourier bidimensional, deve-se primeiro calcular as transformações unidimensionais das linhas, escrever os resultados na matriz original e calcular as transformações unidimensionais para as colunas da matriz resultante. Ao calcular a transformada de Fourier bidimensional, as baixas frequências serão concentradas nos cantos da matriz, o que não é muito conveniente para o processamento posterior das informações recebidas. Para traduzir a representação da transformada de Fourier bidimensional, na qual as baixas frequências estão concentradas no centro da matriz, pode-se realizar um procedimento simples, que consiste em multiplicar os dados originais por $-1^(m+n)$ .

Na fig. 16 mostra a imagem original e sua transformada de Fourier.

Imagem em tons de cinza e sua imagem de Fourier (imagens obtidas no sistema LabVIEW)

Convolução usando a transformada de Fourier.

A convolução das funções $s(t)$ e $r(t)$ é definida como

$$ s\ast r\cong r\ast s\cong \int\limits_(-\infty )^(+\infty ) (s(\tau)) r(t-\tau)d\tau . $$

Na prática, é preciso lidar com a convolução discreta, na qual funções contínuas são substituídas por conjuntos de valores nos nós de uma grade uniforme (geralmente uma grade inteira é tomada):

$$ (r\ast s)_j \cong \sum\limits_(k=-N)^P (s_(j-k) r_k ). $$

Aqui $-N$ e $P$ definem um intervalo além do qual $r(t) = 0$.

Ao calcular a convolução usando a transformada de Fourier, utiliza-se a propriedade da transformada de Fourier, segundo a qual o produto das imagens das funções no domínio da frequência equivale à convolução dessas funções no domínio do tempo.

Para calcular a reconciliação, é necessário transformar os dados originais no domínio da frequência, ou seja, calcular sua transformada de Fourier, multiplicar os resultados da transformação e realizar a transformada de Fourier inversa, restaurando a representação original.

A única sutileza na operação do algoritmo está relacionada ao fato de que, no caso de uma transformada discreta de Fourier (em oposição a uma contínua), duas funções periódicas são convolvidas, ou seja, nossos conjuntos de valores \u200b\ u200bespecifique precisamente os períodos dessas funções, e não apenas os valores​​em alguma seção separada do eixo. Ou seja, o algoritmo considera que o ponto $x_(N )$ é seguido não por zero, mas pelo ponto $x_(0)$, e assim por diante em um círculo. Portanto, para que a convolução seja calculada corretamente, é necessário atribuir ao sinal uma sequência de zeros suficientemente longa.

Filtrando imagens no domínio da frequência.

Os métodos de filtragem linear estão entre os métodos bem estruturados para os quais foram desenvolvidos esquemas computacionais eficientes baseados em algoritmos de convolução rápida e análise espectral. Em geral, algoritmos de filtragem linear realizam uma transformação da forma

$$ f"(x,y) = \int\int f(\zeta -x, \eta -y)K (\zeta , \eta) d \zeta d \eta , $$

onde $K(\zeta ,\eta)$ é o kernel da transformação linear.

Com uma representação discreta do sinal, a integral nesta fórmula degenera em uma soma ponderada de amostras da imagem original dentro de uma certa abertura. Neste caso, a escolha do kernel $K(\zeta ,\eta)$ de acordo com um ou outro critério de otimalidade pode levar a uma série de propriedades úteis (suavização gaussiana na regularização do problema de diferenciação numérica de uma imagem , etc).

Os métodos de processamento linear são implementados de forma mais eficaz no domínio da frequência.

O uso da imagem de Fourier da imagem para realizar operações de filtragem se deve principalmente ao maior desempenho de tais operações. Via de regra, realizar a transformada de Fourier bidimensional direta e inversa e multiplicar pelos coeficientes da imagem de Fourier do filtro leva menos tempo do que realizar uma convolução bidimensional da imagem original.

Os algoritmos de filtragem no domínio da frequência são baseados no teorema da convolução. No caso bidimensional, a transformação de convolução se parece com isso:

$$ G\left((u,v) \right)=H\left((u,v) \right)F\left((u,v) \right), $$

onde $G$ é a transformada de Fourier do resultado da convolução, $H$ é a transformada de Fourier do filtro e $F$ é a transformada de Fourier da imagem original. Ou seja, no domínio da frequência, a convolução bidimensional é substituída pela multiplicação elemento a elemento das imagens da imagem original e do filtro correspondente.

Para realizar o rollup, você precisa fazer o seguinte:

  1. Multiplique os elementos da imagem original por $-1^(m+n)$ para centralizar a imagem de Fourier.
  2. Calcule a transformada de Fourier de $F(u,v)$ usando a FFT.
  3. Multiplique a transformada de Fourier de $F(u,v)$ pela função de frequência do filtro $H(u,v)$.
  4. Calcule a transformada inversa de Fourier.
  5. Multiplique a parte real da transformação inversa por $-1^(m+n)$.

A relação entre a função de filtro no domínio da frequência e no domínio espacial pode ser determinada usando o teorema da convolução

$$ \Phi \left[ (f\left((x,y) \right)\ast h(x,y)) \right]=F\left((u,v) \right)H\left(( u,v) \direita), $$

$$ \Phi \left[ (f\left((x,y) \right)h(x,y)) \right]=F\left((u,v) \right)\ast H\left(( u,v)\direito). $$

A convolução de uma função com uma função impulso pode ser representada da seguinte forma:

$$ \sum\limits_(x=0)^M (\sum\limits_(y=0)^N (s\left((x,y) \right)) ) \delta \left((x-x_0 , y-y_0 ) \right)=s(x_0 ,y_0). $$

Transformada de Fourier da função impulso

$$ F\left((u,v) \right)=\frac(1)(MN)\sum\limits_(x=0)^M (\sum\limits_(y=0)^N (\delta \ left((x,y) \right) ) ) e^( (-2\pi j\left((\frac(ux)(M)+\frac(vy)(N)) \right)) ) =\ frac(1)(MN). $$

Seja $f(x,y) = \delta (x,y)$, então a convolução

$$ f\left((x,y) \right)\ast h(x,y)=\frac(1)(MN)h\left((x,y) \right), $$

$$ \Phi \left[ (\delta \left((x,y) \right)\ast h(x,y)) \right]=\Phi \left[ (\delta \left((x,y) \right)) \right]H\left((u,v) \right)=\frac(1)(MN)H\left((u,v) \right). $$

Pode-se observar a partir dessas expressões que as funções de filtro nos domínios de frequência e espacial estão interligadas por meio da transformada de Fourier. Para uma determinada função de filtro no domínio da frequência, você sempre pode encontrar o filtro correspondente no domínio espacial aplicando a transformada inversa de Fourier. O mesmo vale para o caso inverso. Usando esta relação, é possível determinar o procedimento para a síntese de filtros lineares espaciais.

  1. Determinamos as características necessárias (forma) do filtro no domínio da frequência.
  2. Realizamos a transformada inversa de Fourier.
  3. O filtro resultante pode ser usado como uma máscara para convolução espacial, enquanto o tamanho da máscara pode ser reduzido em relação ao tamanho do filtro original.

($\textit(Filtro passa-baixa ideal)$) $H(u,v)$ é $$H(u,v) = 1, \quad \mbox(if)D(u,v)< D_0 ,$$ $$H(u,v) = 0, \quad \mbox{если }D(u,v) \ge D_0 ,$$ где $D\left({u,v} \right)=\sqrt {\left({u-\frac{M}{2}} \right)^2+\left({v-\frac{N}{2}} \right)^2}$ - расстояние от центра частотной плоскости.

($\textit(Filtro passa-alta ideal)$) é obtido invertendo o filtro passa-baixa ideal:

$$ H"(u,v) = 1-H(u,v). $$

Aqui, os componentes de baixa frequência são completamente suprimidos, mantendo os de alta frequência. No entanto, como no caso de um filtro passa-baixa ideal, seu uso é repleto de aparência de distorção significativa.

Várias abordagens são usadas para projetar filtros com distorção mínima. Um deles é a síntese de filtros baseada em expoentes. Esses filtros introduzem distorção mínima na imagem resultante e são convenientes para síntese no domínio da frequência.

Amplamente utilizada no processamento de imagens é uma família de filtros baseados na função gaussiana real.

$\textit(Filtro Gaussiano Passa Baixo)$ tem a forma

$$ h\left(x \right)=\sqrt (2\pi ) \sigma Ae^(-2\left((\pi \sigma x) \right)^2) \mbox( e ) H\left( u \right)=Ae^(-\frac(u^2)(2\sigma ^2)) $$

Quanto mais estreito o perfil do filtro no domínio da frequência (quanto maior $\sigma $), mais amplo ele é no domínio espacial.

($\textit(Filtro Gaussiano Passa Alta)$) tem a forma

$$ h\left(x \right)=\sqrt (2\pi ) \sigma _A Ae^(-2\left((\pi \sigma _A x) \right)^2)-\sqrt (2\pi ) \sigma _B Be^(-2\left((\pi \sigma _B x) \right)^2 ), $$

$$ H\left(u \right)=Ae^(-\frac(u^2)(2\sigma _A^2 ))-Be^(-\frac(u^2)(2\sigma _B^2 )). $$

No caso bidimensional ($\it(low-pass)$) o filtro gaussiano fica assim:

$$ H\left((u,v) \right)=e^(-\frac(D^2\left((u,v) \right))(2D_0^2 )). $$

($\it(High-Pass)$) O filtro gaussiano tem a forma

$$ H\left((u,v) \right)=1-e^(-\frac(D^2\left((u,v) \right))(2D_0^2 )). $$

Considere um exemplo de filtragem de imagem (Fig. 1) no domínio da frequência (Fig. 17 - 22). Observe que a filtragem de frequência de uma imagem pode fazer sentido tanto para suavização ($\textit(filtragem passa-baixa)$) quanto para realçar contornos e pequenos objetos ($\textit(filtragem passa-alta)$).

Como pode ser visto a partir da fig. 17, 19, à medida que o "poder" de filtragem no componente de baixa frequência da imagem aumenta, o efeito de "desfocagem aparente" ou $\it(blur)$ da imagem torna-se mais pronunciado. Ao mesmo tempo, grande parte do conteúdo de informação da imagem passa gradualmente para o componente de alta frequência, onde no início são observados apenas os contornos dos objetos (Fig. 18, 20 - 22).

Consideremos agora o comportamento dos filtros passa-alta e passa-baixa (Fig. 23 - 28) na presença de ruído gaussiano aditivo na imagem (Fig. 7).

Como pode ser visto a partir da fig. 23, 25, as propriedades dos filtros de baixa frequência para suprimir o ruído aleatório aditivo são semelhantes às propriedades dos filtros lineares considerados anteriormente - com poder de filtro suficiente, o ruído é suprimido, mas o preço disso é um forte desfoque dos contornos e "desfocagem" de toda a imagem. A componente de alta frequência da imagem ruidosa deixa de ser informativa, pois além das informações de contorno e objeto, a componente de ruído agora também está totalmente presente ali (Fig. 27, 28).

A utilização de métodos de frequência é mais adequada quando o modelo estatístico do processo de ruído e/ou a função de transferência óptica do canal de transmissão da imagem são conhecidos. É conveniente levar em conta esses dados a priori escolhendo um filtro controlável generalizado (pelos parâmetros $\sigma$ e $\mu$) da seguinte forma como filtro de restauração:

$$ F(w_1,w_2)= \left[ ( \frac (1) (P(w_1,w_2)) )\right] \cdot \left[ (\frac ((\vert P(w_1,w_2)) \vert )^2) (\vert P(w_1,w_2) \vert ^2 + \alpha \vert Q(w_1,w_2) \vert ^2) )\right]. $$

onde $ 0< \sigma < 1$, $0 < \mu < 1$ - назначаемые параметры фильтра, $P(w_{1}$, $w_{2})$ - передаточная функция системы, $Q(w_{1}$, $w_{2})$ - стабилизатор фильтра, согласованный с энергетическим спектром фона. Выбор параметров $\sigma = 1$, $\mu = 0$ приводит к чисто инверсной фильтрации, $\sigma =\mu = 1$ к \it{винеровской фильтрации}, что позволяет получить изображение, близкое к истинному в смысле минимума СКО при условии, что спектры плотности мощности изображения и его шумовой компоненты априорно известны. Для дальнейшего улучшения эффекта сглаживания в алгоритм линейной (винеровской) фильтрации вводят адаптацию, основанную на оценке локальных статистик: математического ожидания $M(P)$ и дисперсии $\sigma (P)$. Этот алгоритм эффективно фильтрует засоренные однородные поверхности (области) фона. Однако при попадании в скользящее окно обработки неоднородных участков фона импульсная характеристика фильтра сужается ввиду резкого изменения локальных статистик, и эти неоднородности (контуры, пятна) передаются практически без расфокусировки, свойственной неадаптивным методам линейной фильтрации.

As vantagens dos métodos de filtragem linear incluem seu significado físico claro e facilidade de análise dos resultados. No entanto, com uma deterioração acentuada na relação sinal-ruído, com possíveis variantes de ruído de área e a presença de ruído de impulso de alta amplitude, os métodos de pré-processamento linear podem não ser suficientes. Nesta situação, os métodos não lineares são muito mais poderosos.

Deixe ser f(x 1 , x 2) é uma função de duas variáveis. Por analogia com a transformada de Fourier unidimensional, podemos introduzir uma transformada de Fourier bidimensional:

A função em valores fixos ω 1 , ω 2 descreve uma onda plana no plano x 1 , x 2 (Figura 19.1).

As quantidades ω 1 , ω 2 têm o significado de frequências espaciais e a dimensão milímetros−1 , e a função F(ω 1 , ω 2) determina o espectro de frequências espaciais. Uma lente esférica é capaz de calcular o espectro de um sinal óptico (Figura 19.2). Na Figura 19.2, as seguintes notações são introduzidas: φ - distância focal,

Figura 19.1 - Para a definição de frequências espaciais

A transformada de Fourier bidimensional tem todas as propriedades da transformada unidimensional, além disso, notamos duas propriedades adicionais, cuja demonstração decorre facilmente da definição da transformada de Fourier bidimensional.


Figura 19.2 - Cálculo do espectro do sinal óptico usando
lente esférica

Fatoração. Se um sinal bidimensional é fatorado,

então seu espectro também é fatorado:

Simetria radial. Se o sinal 2D é radialmente simétrico, isso é

Onde é a função Bessel de ordem zero. A fórmula que determina a relação entre um sinal bidimensional radialmente simétrico e seu espectro espacial é chamada de transformada de Hankel.


AULA 20. Transformada discreta de Fourier. filtro passa-baixa

A Transformada Direta de Fourier Discreta Bidimensional (DFT) transforma uma imagem dada em um sistema de coordenadas espaciais ( x, y), em uma transformação de imagem discreta bidimensional especificada no sistema de coordenadas de frequência ( você, v):

A Transformada Inversa Discreta de Fourier (IDFT) tem a forma:

Pode-se ver que a DFT é uma transformação complexa. O módulo dessa transformação representa a amplitude do espectro da imagem e é calculado como a raiz quadrada da soma dos quadrados das partes real e imaginária da DFT. A fase (ângulo de deslocamento de fase) é definida como o arco tangente da razão entre a parte imaginária da DFT e a parte real. O espectro de energia é igual ao quadrado da amplitude do espectro, ou a soma dos quadrados das partes imaginária e real do espectro.



Teorema de convolução

De acordo com o teorema da convolução, a convolução de duas funções no domínio do espaço pode ser obtida pela ODFT do produto de suas DFT, ou seja,

A filtragem no domínio da frequência permite selecionar a resposta em frequência do filtro a partir da DFT da imagem, proporcionando a transformação necessária da imagem. Considere a resposta de frequência dos filtros mais comuns.