Two-dimensional Fourier transform ng property. Fourier na pagbabago

19 Ticket 1. Pagpapalawak ng operasyon

2. Mga tampok na spatial-spectral

pagpapatakbo ng dilatation.

Hayaang ang A at B ay mga set mula sa espasyo Z 2 . Ang pagluwang ng isang set A na may kinalaman sa isang set B (o may kinalaman sa B) ay tinutukoy ng A⊕B at tinukoy bilang

Maaari itong muling isulat sa sumusunod na anyo:

Ang set B ay tatawaging structure-forming set o dilation primitive.

(11) ay batay sa pagkuha ng isang sentral na pagmuni-muni ng set B na nauugnay sa mga paunang coordinate nito (gitna B), pagkatapos ay inililipat ang set na ito sa puntong z, pinalawak ang set A kasama ang B - ang hanay ng lahat ng naturang mga shift z, kung saan at A coincide sa hindi bababa sa isang elemento.

Ang kahulugan na ito ay hindi lamang isa. Gayunpaman, ang pamamaraan ng dilation sa ilang mga paraan ay katulad ng operasyon ng convolution na ginagawa sa mga set.


Mga tampok na spatial na parang multo

Alinsunod sa (1.8), ang two-dimensional Fourier transform ay tinukoy bilang

saan w x, w y ay mga spatial frequency.

Ang parisukat ng modulus ng spectrum M( w x, w y) = |Ф( w x, w y)| 2 ay maaaring gamitin upang makalkula ang isang bilang ng mga tampok. Pagsasama ng function M(w x, w y) sa pamamagitan ng anggulo sa eroplano ng mga spatial na frequency ay nagbibigay ng tampok na spatial-frequency na invariant na may paggalang sa paglilipat at pag-ikot ng imahe. Sa pamamagitan ng pagpapakilala ng function M(w x, w y) sa mga polar coordinates, isinusulat namin ang feature na ito sa form


saan q= arctan ( w y/w x); r 2 = w x 2 +w y 2 .

Ang feature ay invariant kaugnay ng scale


20 na tiket 1. Pagpapatakbo ng pagguho

Ang discrete two-dimensional Fourier transform ng sample matrix ng imahe ay tinukoy bilang isang serye:

kung saan , at ang discrete inverse transformation ay may anyo:

Sa pamamagitan ng pagkakatulad sa terminolohiya ng tuluy-tuloy na pagbabagong Fourier, ang mga variable ay tinatawag na spatial frequency. Dapat tandaan na hindi lahat ng mananaliksik ay gumagamit ng kahulugan (4.97), (4.98). Mas gusto ng ilan na ilagay ang lahat ng mga constant ng sukat sa kabaligtaran na expression, habang ang iba ay binabaligtad ang mga palatandaan sa mga butil.

Dahil simetriko at mapaghihiwalay ang mga kernel ng transformation, maaaring isagawa ang two-dimensional na pagbabagong-anyo bilang sunud-sunod na one-dimensional na pagbabago sa mga row at column ng image matrix. Ang mga pangunahing pag-andar ng pagbabagong-anyo ay mga exponents na may mga kumplikadong exponents, na maaaring mabulok sa mga bahagi ng sine at cosine. kaya,

Ang spectrum ng imahe ay may maraming kawili-wiling mga tampok sa istruktura. Spectral component sa pinagmulan ng frequency plane

katumbas ng pagtaas sa N beses ang average (sa orihinal na eroplano) na halaga ng liwanag ng imahe.

Pagpapalit sa pagkakapantay-pantay (4.97)

kung saan at mga pare-pareho, nakukuha natin:

Para sa anumang mga halaga ng integer at ang pangalawang exponential factor ng pagkakapantay-pantay (4.101) ay nagiging isa. Kaya, sa ,

na nagpapahiwatig ng periodicity ng frequency plane. Ang resultang ito ay inilalarawan sa Figure 4.14, a.

Ang 2D Fourier spectrum ng isang imahe ay mahalagang representasyon ng 2D field bilang isang serye ng Fourier. Upang maging wasto ang naturang representasyon, ang orihinal na imahe ay dapat ding magkaroon ng periodic structure, i.e. magkaroon ng pattern na umuulit nang patayo at pahalang (Larawan 4.14, b). Kaya, ang kanang gilid ng imahe ay katabi ng kaliwa, at ang tuktok na gilid ay katabi ng ibaba. Dahil sa mga discontinuities sa mga halaga ng liwanag sa mga lugar na ito, lumilitaw ang mga karagdagang bahagi sa spectrum ng imahe, na namamalagi sa mga coordinate axes ng frequency plane. Ang mga sangkap na ito ay hindi nauugnay sa mga halaga ng liwanag ng mga panloob na pixel ng imahe, ngunit kinakailangan ang mga ito upang kopyahin ang matalim na mga gilid nito.

Kung ang isang hanay ng mga sample ng larawan ay naglalarawan ng field ng luminance, kung gayon ang mga numero ay magiging totoo at positibo. Gayunpaman, ang Fourier spectrum ng larawang ito sa pangkalahatan ay may mga kumplikadong halaga. Dahil ang spectrum ay naglalaman ng isang bahagi na kumakatawan sa tunay at haka-haka na mga bahagi, o ang bahagi at modulus ng mga spectral na bahagi para sa bawat dalas, maaaring tila ang Fourier transform ay nagpapataas ng dimensyon ng imahe. Gayunpaman, hindi ito ang kaso, dahil mayroon itong simetrya sa ilalim ng kumplikadong conjugation. Kung sa pagkakapantay-pantay (4.101) itinakda namin at katumbas ng mga integer, pagkatapos ay pagkatapos ng kumplikadong conjugation makuha namin ang pagkakapantay-pantay:

Sa tulong ng pagpapalit at src=http://electrono.ru/wp-content/image_post/osncifr/pic126_15.gif> maipapakita namin iyon

Dahil sa pagkakaroon ng kumplikadong conjugate symmetry, halos kalahati ng mga spectral na bahagi ay lumalabas na kalabisan, i.e. maaari silang mabuo mula sa natitirang mga bahagi (Larawan 4.15). Siyempre, ang mga harmonika na nahuhulog hindi sa mas mababa, ngunit sa kanang kalahating eroplano ay maaaring, siyempre, ituring na labis na mga bahagi.

Ang fourier analysis sa pagpoproseso ng imahe ay ginagamit para sa parehong mga layunin tulad ng para sa isang-dimensional na signal. Gayunpaman, sa frequency domain, ang mga imahe ay hindi kumakatawan sa anumang makabuluhang impormasyon, na ginagawang ang Fourier transform ay hindi isang kapaki-pakinabang na tool para sa pagsusuri ng imahe. Halimbawa, kapag ang Fourier transform ay inilapat sa isang one-dimensional na audio signal, ang isang hard-to-formal at kumplikadong waveform sa time domain ay binago sa isang madaling maunawaan na spectrum sa frequency domain. Bilang paghahambing, sa pamamagitan ng pagkuha ng Fourier transform (Fourier transform) ng isang imahe, binago namin ang order na impormasyon sa spatial domain (spatial domain) sa isang naka-encode na form sa frequency domain (frequency domain). Sa madaling salita, huwag asahan na ang Fourier transform ay makakatulong sa iyong maunawaan ang impormasyong naka-encode sa mga larawan.

Gayundin, huwag sumangguni sa frequency domain kapag nagdidisenyo ng filter. Ang pangunahing tampok na katangian sa mga imahe ay ang hangganan - ang linya na naghihiwalay sa isa isang bagay o rehiyon mula sa iba bagay o mga lugar. Dahil ang mga contour sa imahe ay naglalaman ng isang malawak na hanay ng mga bahagi ng dalas, kung gayon ang pagsisikap na baguhin ang imahe sa pamamagitan ng pagmamanipula sa frequency spectrum ay isang hindi epektibong gawain. Ang mga filter sa pagpoproseso ng imahe ay karaniwang idinisenyo sa spatial na domain, kung saan ang impormasyon ay ipinakita sa pinakasimple at pinaka-naa-access na anyo nito. Kapag nilulutas ang mga problema sa pagproseso ng imahe, sa halip ay kinakailangan na gumana sa mga tuntunin ng mga operasyon pagpapakinis at salungguhit contours (spatial domain) kaysa sa mga tuntunin ng HIGH pass filter at mababang pass filter(domain ng dalas).

Sa kabila nito, ang pagsusuri ng imahe ng Fourier ay may ilang mga kapaki-pakinabang na katangian. Halimbawa, pagkakagulo sa spatial domain ay tumutugon sa pagpaparami sa frequency domain. Mahalaga ito dahil ang multiplikasyon ay isang mas simpleng operasyong matematika kaysa convolution. Tulad ng sa mga 1D signal, pinapayagan ng property na ito ang FFT convolution at iba't ibang diskarte sa deconvolution. Ang isa pang kapaki-pakinabang na katangian sa frequency domain ay Fourier sector theorem, na nagtatatag ng mga pagsusulatan sa pagitan ng larawan at sa mga projection nito (mga view ng parehong larawan mula sa magkaibang panig). Ang teorama na ito ay bumubuo ng teoretikal na batayan ng mga direksyon tulad ng computed tomography, fluoroscopy malawakang ginagamit sa medisina at industriya.

Ang frequency spectrum ng isang imahe ay maaaring kalkulahin sa maraming paraan, ngunit ang pinakapraktikal na paraan para sa pag-compute ng spectrum ay ang FFT algorithm. Kapag gumagamit ng FFT algorithm, dapat na naglalaman ang orihinal na larawan N mga linya at N column, at ang numero N dapat ay isang multiple ng kapangyarihan ng 2, i.e. 256, 512, 1024 at

atbp. Kung ang pinagmulang larawan ay hindi isang multiple ng isang kapangyarihan ng 2 sa dimensyon, pagkatapos ay dapat na idagdag ang mga zero-value pixel upang i-pad ang larawan sa nais na laki. Dahil sa ang katunayan na ang Fourier transform ay nagpapanatili ng pagkakasunud-sunod ng impormasyon, ang mga amplitude ng mga low-frequency na bahagi ay matatagpuan sa mga sulok ng dalawang-dimensional na spectrum, habang ang mga high-frequency na bahagi ay nasa gitna nito.

Bilang halimbawa, isaalang-alang ang resulta ng Fourier transform ng isang electron microscope na imahe ng input stage ng operational amplifier (Fig. 4.16). Dahil ang frequency domain ay maaaring maglaman ng mga pixel na may mga negatibong halaga, ang gray na sukat ng mga larawang ito ay inililipat sa paraang ang mga negatibong halaga ay nakikita bilang mga madilim na punto sa imahe, mga zero na halaga bilang kulay abo, at mga positibong halaga bilang maliwanag na mga punto. Karaniwan, ang mga bahagi ng low-frequency ng spectrum ng imahe ay mas malaki sa amplitude kaysa sa mga high-frequency, na nagpapaliwanag ng pagkakaroon ng napakaliwanag at napakadilim na tuldok sa apat na sulok ng spectrum na imahe (Larawan 4.16, b). Tulad ng makikita mula sa figure, isang tipikal

Ang linear na pag-filter ng mga imahe ay maaaring isagawa pareho sa spatial at frequency na mga domain. Sa kasong ito, isinasaalang-alang na ang "mababa" na mga spatial na dalas ay tumutugma sa pangunahing nilalaman ng imahe - ang background at malalaking sukat na mga bagay, at "mataas" na mga spatial na dalas - maliit na laki ng mga bagay, maliliit na detalye ng malalaking hugis at ingay. sangkap.

Ayon sa kaugalian, ang mga pamamaraan na batay sa $\textit(Fourier transform)$ ay ginagamit upang lumipat sa rehiyon ng mga spatial na frequency. Sa mga nakalipas na taon, ang mga pamamaraan na batay sa $\textit(wavelet-transform (wavelet-transform))$ ay natagpuan din ang pagtaas ng paggamit.

Fourier na pagbabago.

Binibigyang-daan ka ng Fourier transform na kumatawan sa halos anumang function o set ng data bilang isang kumbinasyon ng mga trigonometriko na function tulad ng sine at cosine, na nagbibigay-daan sa iyo upang matukoy ang mga pana-panahong bahagi sa data at suriin ang kanilang kontribusyon sa istruktura ng orihinal na data o hugis ng ang function. Ayon sa kaugalian, mayroong tatlong pangunahing anyo ng Fourier transform: ang integral Fourier transform, ang Fourier series, at ang discrete Fourier transform.

Binabago ng integral na Fourier transform ang isang tunay na function sa isang pares ng mga tunay na function o isang kumplikadong function sa isa pa.

Ang tunay na function na $f(x)$ ay maaaring palawakin sa mga tuntunin ng isang orthogonal system ng trigonometriko function, iyon ay, maaari itong katawanin bilang

$$ f\left(x \right)=\int\limits_0^\infty (A\left(\omega \right)) \cos \left((2\pi \omega x) \right)d\omega -\ int\limits_0^\infty (B\left(\omega \right)) \sin \left((2\pi \omega x) \right)d\omega , $$

kung saan ang $A(\omega)$ at $B(\omega)$ ay tinatawag na integral cosine at sine transforms:

$$ A\left(\omega \right)=2\int\limits_(-\infty )^(+\infty ) (f\left(x \right)) \cos \left((2\pi \omega x )\kanan)dx; \quad B\left(\omega \right)=2\int\limits_(-\infty )^(+\infty ) (f\left(x \right)) \sin \left((2\pi \omega x )\kanan)dx. $$

Ang Fourier series ay kumakatawan sa periodic function na $f(x)$ na tinukoy sa interval $$ bilang isang infinite series sa mga sine at cosine. Ibig sabihin, ang periodic function na $f(x)$ ay nauugnay sa isang infinite sequence ng Fourier coefficients

$$ f\left(x \right)=\frac(A_0 )(2)+\sum\limits_(n=1)^\infty (A_n ) \cos \left((\frac(2\pi xn)( b-a)) \right)+\sum\limits_(n=1)^\infty (B_n \sin \left((\frac(2\pi xn)(b-a)) \right)) , $$

$$ A_n =\frac(2)(b-a)\int\limits_a^b (f\left(x \right)) \cos \left((\frac(2\pi nx)(b-a)) \right)dx ; \quad B_n =\frac(2)(b-a)\int\limits_a^b (f\left(x \right)) \sin \left((\frac(2\pi nx)(b-a)) \right)dx . $$

Binabago ng discrete Fourier transform ang isang may hangganang pagkakasunod-sunod ng mga tunay na numero sa isang may hangganang pagkakasunod-sunod ng Fourier coefficients.

Hayaang ang $\left\( (x_i ) \right\), i= 0,\ldots, N-1 $ ay isang sequence ng mga tunay na numero - halimbawa, ang mga pagbabasa ng pixel brightness sa isang linya ng imahe. Ang pagkakasunud-sunod na ito ay maaaring katawanin bilang isang kumbinasyon ng mga finite sums ng form

$$ x_i =a_0 +\sum\limits_(n=1)^(N/2) (a_n ) \cos \left((\frac(2\pi ni)(N)) \right)+\sum\limits_ (n=1)^(N/2) (b_n \sin \left((\frac(2\pi ni)(N)) \right)) , $$

$$ a_0 =\frac(1)(N)\sum\limits_(i=0)^(N-1) (x_i ) , \quad a_(N/2) =\frac(1)(N)\sum \limits_(i=0)^(N-1) (x_i ) \left((-1) \right)^i, \quad a_k =\frac(2)(N)\sum\limits_(i=0) ^(N-1) (x_i \cos \left((\frac(2\pi ik)(N)) \right)), $$

$$ b_k =\frac(2)(N)\sum\limits_(i=0)^(N-1) (x_i \sin \left((\frac(2\pi ik)(N)) \right) ), \quad i\le k

Ang pangunahing pagkakaiba sa pagitan ng tatlong anyo ng Fourier transform ay kung ang integral na Fourier transform ay tinukoy sa buong domain ng function na $f(x)$, kung gayon ang serye at ang discrete Fourier transform ay tinukoy lamang sa isang discrete set ng mga puntos, na walang katapusan para sa seryeng Fourier at may hangganan para sa mga discrete na pagbabago.

Tulad ng makikita mula sa mga kahulugan ng Fourier transform, ang pinakamalaking interes para sa mga digital signal processing system ay ang discrete Fourier transform. Ang data na nakuha mula sa digital media o mga pinagmumulan ng impormasyon ay mga nakaayos na hanay ng mga numero na nakasulat bilang mga vector o matrice.

Karaniwang ipinapalagay na ang input data para sa isang discrete transformation ay isang pare-parehong sample na may isang hakbang na $\Delta $, habang ang halaga na $T=N\Delta $ ay tinatawag na haba ng record, o ang pangunahing panahon. Ang pangunahing dalas ay katumbas ng $1/T$. Kaya, sa discrete Fourier transform, ang input data ay nabubulok sa mga frequency na isang integer multiple ng pangunahing frequency. Ang maximum frequency na tinutukoy ng dimensyon ng input data ay katumbas ng $1/2 \Delta $ at tinatawag na $\it(Nyquist frequency)$. Ang accounting para sa dalas ng Nyquist ay mahalaga kapag gumagamit ng discrete transform. Kung ang data ng pag-input ay may mga pana-panahong bahagi na may mga frequency na lumalampas sa dalas ng Nyquist, kung gayon kapag kinakalkula ang discrete Fourier transform, ang high-frequency na data ay papalitan ng mas mababang frequency, na maaaring humantong sa mga error sa pagbibigay-kahulugan sa mga resulta ng discrete transform.

Ang isang mahalagang tool para sa pagsusuri ng data ay ang $\it(energy spectrum)$. Ang lakas ng signal sa dalas na $\omega $ ay tinutukoy bilang mga sumusunod:

$$ P \left(\omega \right)=\frac(1)(2)\left((A \left(\omega \right)^2+B \left(\omega \right)^2) \right ). $$

Ang halagang ito ay madalas na tinatawag na $\it(signal energy)$ sa dalas na $\omega $. Ayon sa parseval's theorem, ang kabuuang enerhiya ng input signal ay katumbas ng kabuuan ng mga energies sa lahat ng frequency.

$$ E=\sum\limits_(i=0)^(N-1) (x_i^2 ) =\sum\limits_(i=0)^(N/2) (P \left((\omega _i ) \tama)). $$

Ang isang plot ng kapangyarihan laban sa dalas ay tinatawag na spectrum ng enerhiya o spectrum ng kapangyarihan. Ginagawang posible ng spectrum ng enerhiya na ipakita ang mga nakatagong periodicity sa input data at suriin ang kontribusyon ng ilang partikular na frequency component sa structure ng input data.

Kumplikadong representasyon ng Fourier transform.

Bilang karagdagan sa trigonometriko na anyo ng discrete Fourier transform, ang $\it(complex representation)$ ay malawakang ginagamit. Ang kumplikadong anyo ng Fourier transform ay malawakang ginagamit sa pagsusuri ng multivariate at, lalo na, sa pagproseso ng imahe.

Ang paglipat mula sa trigonometriko hanggang sa kumplikadong anyo ay isinasagawa batay sa formula ng Euler

$$ e^(j\omega t)=\cos \omega t+j\sin \omega t, \quad j=\sqrt (-1) . $$

Kung ang input sequence ay $N$ complex number, ang discrete Fourier transform ay magiging

$$ G_m =\frac(1)(N)\sum\limits_(n=1)^(N-1) (x_n ) e^(\frac(-2\pi jmn)(N)), $$

at ang kabaligtaran na pagbabago

$$ x_m =\sum\limits_(n=1)^(N-1) (G_n ) e^(\frac(2\pi jmn)(N)). $$

Kung ang input sequence ay isang array ng mga totoong numero, mayroong parehong complex at isang sine-cosine discrete transformation para dito. Ang kaugnayan ng mga representasyong ito ay ipinahayag tulad ng sumusunod:

$$ a_0 =G_0 , \quad G_k =\left((a_k -jb_k ) \right)/2, \quad 1\le k\le N/2; $$

ang natitirang $N/2$ na halaga ng pagbabago ay kumplikadong conjugate at walang karagdagang impormasyon. Samakatuwid, ang graph ng power spectrum ng discrete Fourier transform ay simetriko na may kinalaman sa $N/2$.

Mabilis na Fourier Transform.

Ang pinakasimpleng paraan upang makalkula ang Discrete Fourier Transform (DFT) ay direktang pagsusuma, na nagreresulta sa $N$ na operasyon sa bawat koepisyent. Mayroong $N$ coefficient sa kabuuan, kaya ang kabuuang pagiging kumplikado ay $O\left((N^2) \right)$. Ang diskarte na ito ay hindi praktikal na interes, dahil may mas mahusay na mga paraan upang makalkula ang DFT, na tinatawag na mabilis na Fourier transform (FFT), na may $O (N\log N)$ kumplikado. Nalalapat lang ang FFT sa mga sequence na may haba (bilang ng mga elemento) na isang multiple ng isang kapangyarihan na 2. Ang pinaka-pangkalahatang prinsipyo sa likod ng FFT algorithm ay ang hatiin ang input sequence sa dalawang kalahating haba na sequence. Ang unang sequence ay puno ng even-numbered na data, at ang pangalawang sequence ay puno ng odd-numbered na data. Ginagawa nitong posible na kalkulahin ang mga coefficient ng DFT sa pamamagitan ng dalawang $N/2$ na pagbabago.

Tukuyin ang $\omega _m =e^(\frac(2\pi j)(m))$, pagkatapos ay $G_m =\sum\limits_(n=1)^((N/2)-1) (x_(2n ) ) \omega _(N/2)^(mn) +\sum\limits_(n=1)^((N/2)-1) (x_(2n+1) ) \omega _(N/2) ^(mn) \omega _N^m $.

Para sa $m< N/2$ тогда можно записать $G_m =G_{\textrm{even}} \left(m \right)+G_{\textrm{odd}} \left(m \right)\omega _N^m $. Учитывая, что элементы ДПФ с индексом б ольшим, чем $N/2$, являются комплексно сопряженными к элементам с индексами меньшими $N/2$, можно записать $G_{m+(N/2)} =G_{\textrm{even}} \left(m \right)-G_{\textrm{odd}} \left(m \right)\omega _N^m $. Таким образом, можно вычислить БПФ длиной $N$, используя два ДПФ длиной $N/2$. Полный алгоритм БПФ заключается в рекурсивном выполнении вышеописанной процедуры, начиная с объединения одиночных элементов в пары, затем в четверки и так до полного охвата исходного массива данных.

Dalawang-dimensional na pagbabagong Fourier.

Ang discrete Fourier transform para sa isang two-dimensional array ng $M\times N$ na mga numero ay tinukoy bilang sumusunod:

$$ G_(uw) =\frac(1)(NM)\sum\limits_(n=1)^(N-1) (\sum\limits_(m=1)^(M-1) (x_(mn ) ) ) e^((-2\pi j\left[ (\frac(mu)(M)+\frac(nw)(N)) \right]) ), $$

at ang kabaligtaran na pagbabago

$$ x_(mn) =\sum\limits_(u=1)^(N-1) (\sum\limits_(w=1)^(M-1) (G_(uw) ) ) e^( (2 \pi j\left[ (\frac(mu)(M)+\frac(nw)(N)) \right]) ). $$

Sa kaso ng pagpoproseso ng imahe, ang mga bahagi ng 2D Fourier transform ay tinatawag na $\textit(spatial frequency)$.

Ang isang mahalagang katangian ng two-dimensional Fourier transform ay ang posibilidad ng pagkalkula nito gamit ang one-dimensional na pamamaraan ng FFT:

$$ G_(uw) =\frac(1)(N)\sum\limits_(n=1)^(N-1) ( \left[ (\frac(1)(M)\sum\limits_(m= 0)^(M-1) (x_(mn) e^(\frac(-2\pi jmw)(M))) ) \right] ) e^(\frac(-2\pi jnu)(N) ), $$

Dito, ang expression sa mga square bracket ay isang one-dimensional na row transformation ng data matrix, na maaaring gawin gamit ang isang one-dimensional na FFT. Kaya, para makakuha ng two-dimensional na Fourier transform, kailangan munang kalkulahin ang one-dimensional row transformations, isulat ang mga resulta sa orihinal na matrix, at kalkulahin ang one-dimensional transformations para sa mga column ng resultang matrix. Kapag kinakalkula ang two-dimensional Fourier transform, ang mga mababang frequency ay ipo-concentrate sa mga sulok ng matrix, na hindi masyadong maginhawa para sa karagdagang pagproseso ng impormasyong natanggap. Upang isalin ang representasyon ng two-dimensional Fourier transform, kung saan ang mga mababang frequency ay puro sa gitna ng matrix, maaari kang magsagawa ng isang simpleng pamamaraan, na binubuo sa pagpaparami ng orihinal na data sa $-1^(m+n)$ .

Sa fig. Ipinapakita ng 16 ang orihinal na imahe at ang pagbabagong Fourier nito.

Grayscale na imahe at ang Fourier na imahe nito (mga larawang nakuha sa LabVIEW system)

Convolution gamit ang Fourier transform.

Ang convolution ng mga function na $s(t)$ at $r(t)$ ay tinukoy bilang

$$ s\ast r\cong r\ast s\cong \int\limits_(-\infty )^(+\infty ) (s(\tau)) r(t-\tau)d\tau . $$

Sa pagsasagawa, ang isang tao ay kailangang harapin ang discrete convolution, kung saan ang mga tuluy-tuloy na pag-andar ay pinapalitan ng mga hanay ng mga halaga sa mga node ng isang pare-parehong grid (karaniwang isang integer grid ay kinuha):

$$ (r\ast s)_j \cong \sum\limits_(k=-N)^P (s_(j-k) r_k ). $$

Dito tinukoy ng $-N$ at $P$ ang isang saklaw na lampas kung saan ang $r(t) = 0$.

Kapag kinakalkula ang convolution gamit ang Fourier transform, ginagamit ang property ng Fourier transform, ayon sa kung saan ang produkto ng mga larawan ng mga function sa frequency domain ay katumbas ng convolution ng mga function na ito sa time domain.

Upang kalkulahin ang pagkakasundo, kinakailangan na baguhin ang orihinal na data sa frequency domain, iyon ay, kalkulahin ang kanilang Fourier transform, i-multiply ang mga resulta ng pagbabago, at isagawa ang inverse Fourier transform, ibalik ang orihinal na representasyon.

Ang tanging subtlety sa pagpapatakbo ng algorithm ay nauugnay sa katotohanan na sa kaso ng isang discrete Fourier transform (kumpara sa isang tuluy-tuloy), dalawang pana-panahong pag-andar ang pinagsama-sama, iyon ay, ang aming mga hanay ng mga halaga \u200b\ u200bstiyak na tiyak ang mga panahon ng mga function na ito, at hindi lamang ang mga halaga sa ilang hiwalay na seksyon ng axis. Iyon ay, isinasaalang-alang ng algorithm na ang puntong $x_(N )$ ay sinusundan hindi ng zero, ngunit ng puntong $x_(0)$, at iba pa sa isang bilog. Samakatuwid, upang makalkula nang tama ang convolution, kinakailangan na magtalaga ng isang sapat na mahabang pagkakasunud-sunod ng mga zero sa signal.

Pag-filter ng mga larawan sa frequency domain.

Ang mga pamamaraan ng linear na pagsala ay kabilang sa mga mahusay na nakabalangkas na pamamaraan kung saan nabuo ang mga mahusay na computational scheme batay sa mabilis na convolution algorithm at spectral analysis. Sa pangkalahatan, ang mga linear filtering algorithm ay nagsasagawa ng pagbabago ng form

$$ f"(x,y) = \int\int f(\zeta -x, \eta -y)K (\zeta , \eta) d \zeta d \eta , $$

kung saan ang $K(\zeta ,\eta)$ ay ang kernel ng linear transformation.

Sa isang discrete representation ng signal, ang integral sa formula na ito ay bumababa sa isang timbang na kabuuan ng mga sample ng orihinal na imahe sa loob ng isang partikular na siwang. Sa kasong ito, ang pagpili ng kernel $K(\zeta ,\eta)$ alinsunod sa isa o iba pang pamantayan ng optimality ay maaaring humantong sa isang bilang ng mga kapaki-pakinabang na katangian (Gaussian smoothing sa regularization ng problema ng numerical differentiation ng isang imahe , atbp.).

Ang mga pamamaraan ng pagpoproseso ng linear ay pinaka-epektibong ipinatupad sa frequency domain.

Ang paggamit ng Fourier na imahe ng imahe upang magsagawa ng mga pagpapatakbo ng pag-filter ay pangunahing dahil sa mas mataas na pagganap ng mga naturang operasyon. Bilang isang patakaran, ang pagsasagawa ng direkta at kabaligtaran na two-dimensional na Fourier na pagbabago at pagpaparami sa mga coefficient ng Fourier na imahe ng filter ay tumatagal ng mas kaunting oras kaysa sa pagsasagawa ng dalawang-dimensional na convolution ng orihinal na imahe.

Ang mga algorithm sa pag-filter sa frequency domain ay batay sa convolution theorem. Sa dalawang-dimensional na kaso, ang pagbabagong-anyo ng convolution ay ganito:

$$ G\left((u,v) \right)=H\left((u,v) \right)F\left((u,v) \right), $$

kung saan ang $G$ ay ang Fourier transform ng resulta ng convolution, ang $H$ ay ang Fourier transform ng filter, at ang $F$ ay ang Fourier na transform ng orihinal na imahe. Iyon ay, sa frequency domain, ang two-dimensional convolution ay pinalitan ng element-wise multiplication ng mga imahe ng orihinal na imahe at ang kaukulang filter.

Upang maisagawa ang rollup, kailangan mong gawin ang sumusunod:

  1. I-multiply ang mga elemento ng orihinal na imahe sa $-1^(m+n)$ upang igitna ang Fourier na imahe.
  2. Kalkulahin ang Fourier transform ng $F(u,v)$ gamit ang FFT.
  3. I-multiply ang Fourier transform ng $F(u,v)$ sa frequency function ng filter na $H(u,v)$.
  4. Kalkulahin ang inverse Fourier transform.
  5. I-multiply ang tunay na bahagi ng inverse transformation sa $-1^(m+n)$.

Ang ugnayan sa pagitan ng filter function sa frequency domain at spatial domain ay maaaring matukoy gamit ang convolution theorem

$$ \Phi \left[ (f\left((x,y) \right)\ast h(x,y)) \right]=F\left((u,v) \right)H\left(( u,v) \right), $$

$$ \Phi \left[ (f\left((x,y) \right)h(x,y)) \right]=F\left((u,v) \right)\ast H\left(( u,v)\kanan). $$

Ang convolution ng isang function na may isang impulse function ay maaaring kinakatawan bilang mga sumusunod:

$$ \sum\limits_(x=0)^M (\sum\limits_(y=0)^N (s\left((x,y) \right)) ) \delta \left((x-x_0 , y-y_0 ) \right)=s(x_0 ,y_0). $$

Fourier na pagbabago ng impulse function

$$ F\left((u,v) \right)=\frac(1)(MN)\sum\limits_(x=0)^M (\sum\limits_(y=0)^N (\delta \ kaliwa((x,y) \kanan) ) ) e^( (-2\pi j\left((\frac(ux)(M)+\frac(vy)(N)) \right)) ) =\ frac(1)(MN). $$

Hayaan ang $f(x,y) = \delta (x,y)$, pagkatapos ay ang convolution

$$ f\left((x,y) \right)\ast h(x,y)=\frac(1)(MN)h\left((x,y) \right), $$

$$ \Phi \left[ (\delta \left((x,y) \right)\ast h(x,y)) \right]=\Phi \left[ (\delta \left((x,y)) \right)) \right]H\left((u,v) \right)=\frac(1)(MN)H\left((u,v) \right). $$

Makikita mula sa mga expression na ito na ang mga function ng filter sa frequency at spatial na domain ay magkakaugnay sa pamamagitan ng Fourier transform. Para sa isang ibinigay na function ng filter ng frequency ng domain, palagi mong mahahanap ang kaukulang spatial domain filter sa pamamagitan ng paglalapat ng inverse Fourier transform. Ang parehong ay totoo para sa reverse case. Gamit ang kaugnayang ito, posibleng matukoy ang pamamaraan para sa synthesis ng spatial linear na mga filter.

  1. Tinutukoy namin ang mga kinakailangang katangian (hugis) ng filter sa frequency domain.
  2. Ginagawa namin ang inverse Fourier transform.
  3. Ang resultang filter ay maaaring gamitin bilang isang mask para sa spatial convolution, habang ang laki ng mask ay maaaring mabawasan kumpara sa laki ng orihinal na filter.

($\textit(Ideal na low-pass na filter)$) $H(u,v)$ ay $$H(u,v) = 1, \quad \mbox(if )D(u,v)< D_0 ,$$ $$H(u,v) = 0, \quad \mbox{если }D(u,v) \ge D_0 ,$$ где $D\left({u,v} \right)=\sqrt {\left({u-\frac{M}{2}} \right)^2+\left({v-\frac{N}{2}} \right)^2}$ - расстояние от центра частотной плоскости.

($\textit(Ideal na high-pass na filter)$) ay nakukuha sa pamamagitan ng pag-invert ng perpektong low-pass na filter:

$$ H"(u,v) = 1-H(u,v). $$

Dito, ang mga low-frequency na bahagi ay ganap na pinipigilan habang pinapanatili ang mga high-frequency. Gayunpaman, tulad ng sa kaso ng isang perpektong low-pass na filter, ang paggamit nito ay puno ng hitsura ng makabuluhang pagbaluktot.

Iba't ibang mga diskarte ang ginagamit upang magdisenyo ng mga filter na may kaunting pagbaluktot. Isa sa mga ito ay exponent-based na filter synthesis. Ang ganitong mga filter ay nagpapakilala ng kaunting pagbaluktot sa nagreresultang imahe at maginhawa para sa synthesis sa frequency domain.

Malawakang ginagamit sa pagproseso ng imahe ay isang pamilya ng mga filter batay sa tunay na Gaussian function.

$\textit(Low Pass Gaussian Filter)$ ang may form

$$ h\left(x \right)=\sqrt (2\pi ) \sigma Ae^(-2\left((\pi \sigma x) \right)^2) \mbox(at ) H\left( u \right)=Ae^(-\frac(u^2)(2\sigma ^2)) $$

Kung mas makitid ang profile ng filter sa frequency domain (mas malaki ang $\sigma $), mas malawak ito sa spatial domain.

($\textit(High Pass Gaussian Filter)$) ang may form

$$ h\left(x \right)=\sqrt (2\pi ) \sigma _A Ae^(-2\left((\pi \sigma _A x) \right)^2)-\sqrt (2\pi ) \sigma _B Be^(-2\left((\pi \sigma _B x) \right)^2 ), $$

$$ H\left(u \right)=Ae^(-\frac(u^2)(2\sigma _A^2 ))-Be^(-\frac(u^2)(2\sigma _B^2 )). $$

Sa dalawang-dimensional na kaso ($\it(low-pass)$) ang Gaussian filter ay ganito ang hitsura:

$$ H\left((u,v) \right)=e^(-\frac(D^2\left((u,v) \right))(2D_0^2 )). $$

($\it(High-Pass)$) Ang Gaussian filter ay may form

$$ H\left((u,v) \right)=1-e^(-\frac(D^2\left((u,v) \right))(2D_0^2 )). $$

Isaalang-alang ang isang halimbawa ng pag-filter ng imahe (Fig. 1) sa frequency domain (Fig. 17 - 22). Tandaan na ang dalas ng pag-filter ng isang imahe ay maaaring magkaroon ng kahulugan kapwa para sa pagpapakinis ($\textit(low-pass filtering)$) at para sa pag-highlight ng mga contour at maliliit na bagay ($\textit(high-pass filtering)$).

Gaya ng makikita sa fig. 17, 19, habang tumataas ang "kapangyarihan" ng pag-filter sa low-frequency na bahagi ng larawan, nagiging mas malinaw ang epekto ng "apparent defocusing" o $\it(blur)$ ng larawan. Kasabay nito, ang isang malaking bahagi ng nilalaman ng impormasyon ng imahe ay unti-unting pumasa sa bahagi ng mataas na dalas, kung saan ang mga contour lamang ng mga bagay ay sinusunod sa simula (Larawan 18, 20 - 22).

Isaalang-alang natin ngayon ang pag-uugali ng mga high-pass at low-pass na mga filter (Fig. 23 - 28) sa pagkakaroon ng additive Gaussian noise sa imahe (Fig. 7).

Gaya ng makikita sa fig. 23, 25, ang mga katangian ng mga low-frequency na mga filter para sa pagsugpo sa additive random na ingay ay katulad ng mga katangian ng dating itinuturing na mga linear na filter - na may sapat na kapangyarihan ng filter, ang ingay ay pinigilan, ngunit ang presyo para dito ay isang malakas na paglabo ng mga contour at "defocusing" ng buong imahe. Ang high-frequency na bahagi ng maingay na imahe ay huminto sa pagiging nagbibigay-kaalaman, dahil bilang karagdagan sa contour at object na impormasyon, ang sangkap ng ingay ay ganap na naroroon din doon (Larawan 27, 28).

Ang paggamit ng mga pamamaraan ng dalas ay pinakaangkop kapag ang istatistikal na modelo ng proseso ng ingay at/o ang optical transfer function ng channel ng paghahatid ng imahe ay kilala. Maginhawang isaalang-alang ang naturang priori data sa pamamagitan ng pagpili ng isang pangkalahatang nakokontrol (sa pamamagitan ng mga parameter na $\sigma$ at $\mu$) na filter ng sumusunod na form bilang isang nagpapanumbalik na filter:

$$ F(w_1,w_2)= \left[ ( \frac (1) (P(w_1,w_2)) )\right] \cdot \left[ (\frac ((\vert P(w_1,w_2) \vert )^2) (\vert P(w_1,w_2) \vert ^2 + \alpha \vert Q(w_1,w_2) \vert ^2) )\right]. $$

kung saan $0< \sigma < 1$, $0 < \mu < 1$ - назначаемые параметры фильтра, $P(w_{1}$, $w_{2})$ - передаточная функция системы, $Q(w_{1}$, $w_{2})$ - стабилизатор фильтра, согласованный с энергетическим спектром фона. Выбор параметров $\sigma = 1$, $\mu = 0$ приводит к чисто инверсной фильтрации, $\sigma =\mu = 1$ к \it{винеровской фильтрации}, что позволяет получить изображение, близкое к истинному в смысле минимума СКО при условии, что спектры плотности мощности изображения и его шумовой компоненты априорно известны. Для дальнейшего улучшения эффекта сглаживания в алгоритм линейной (винеровской) фильтрации вводят адаптацию, основанную на оценке локальных статистик: математического ожидания $M(P)$ и дисперсии $\sigma (P)$. Этот алгоритм эффективно фильтрует засоренные однородные поверхности (области) фона. Однако при попадании в скользящее окно обработки неоднородных участков фона импульсная характеристика фильтра сужается ввиду резкого изменения локальных статистик, и эти неоднородности (контуры, пятна) передаются практически без расфокусировки, свойственной неадаптивным методам линейной фильтрации.

Kasama sa mga bentahe ng mga linear na paraan ng pagsala ang kanilang malinaw na pisikal na kahulugan at kadalian ng pagsusuri ng mga resulta. Gayunpaman, na may matalim na pagkasira sa ratio ng signal-to-noise, na may posibleng mga variant ng areal noise at pagkakaroon ng high-amplitude impulse noise, maaaring hindi sapat ang mga linear na pamamaraan ng preprocessing. Sa sitwasyong ito, ang mga nonlinear na pamamaraan ay mas makapangyarihan.

Hayaan f(x 1 , x 2) ay isang function ng dalawang variable. Sa pamamagitan ng pagkakatulad sa one-dimensional na Fourier transform, maaari naming ipakilala ang isang two-dimensional Fourier transform:

Ang function sa fixed values ​​​​ω 1 , ω 2 ay naglalarawan ng plane wave sa eroplano x 1 , x 2 (Larawan 19.1).

Ang mga dami ω 1 , ω 2 ay may kahulugan ng spatial frequency at ang dimensyon mm−1 , at ang function na F(ω 1 , ω 2) ay tumutukoy sa spectrum ng spatial frequency. Ang isang spherical lens ay may kakayahang kalkulahin ang spectrum ng isang optical signal (Figure 19.2). Sa Figure 19.2, ang mga sumusunod na notasyon ay ipinakilala: φ - focal length,

Figure 19.1 - Sa kahulugan ng spatial frequency

Ang two-dimensional Fourier transform ay may lahat ng mga katangian ng one-dimensional na pagbabago, bilang karagdagan, tandaan namin ang dalawang karagdagang mga katangian, ang patunay nito ay madaling sumusunod mula sa kahulugan ng two-dimensional na Fourier transform.


Figure 19.2 - Pagkalkula ng spectrum ng optical signal gamit
spherical lens

Factorization. Kung ang isang two-dimensional na signal ay naka-factor,

pagkatapos ay ang spectrum nito ay pinangkat din:

Radial symmetry. Kung ang 2D signal ay radially symmetrical, iyon ay

Nasaan ang zero order Bessel function. Ang formula na tumutukoy sa kaugnayan sa pagitan ng isang radially symmetric two-dimensional signal at ang spatial spectrum nito ay tinatawag na Hankel transform.


LECTURE 20. Discrete Fourier transform. mababang pass filter

Binabago ng Direct Two-Dimensional Discrete Fourier Transform (DFT) ang isang imahe na ibinigay sa isang spatial coordinate system ( x, y), sa isang two-dimensional discrete image transformation na tinukoy sa frequency coordinate system ( ikaw, v):

Ang Inverse Discrete Fourier Transform (IDFT) ay may anyo:

Makikita na ang DFT ay isang kumplikadong pagbabago. Ang module ng pagbabagong ito ay kumakatawan sa amplitude ng spectrum ng imahe at kinakalkula bilang square root ng kabuuan ng mga parisukat ng tunay at haka-haka na mga bahagi ng DFT. Ang phase (phase shift angle) ay tinukoy bilang ang arc tangent ng ratio ng haka-haka na bahagi ng DFT sa tunay na bahagi. Ang spectrum ng enerhiya ay katumbas ng parisukat ng amplitude ng spectrum, o ang kabuuan ng mga parisukat ng haka-haka at totoong mga bahagi ng spectrum.



Convolution theorem

Ayon sa convolution theorem, ang convolution ng dalawang function sa space domain ay maaaring makuha ng ODFT ng produkto ng kanilang DFT, i.e.

Ang pag-filter sa frequency domain ay nagbibigay-daan sa iyong gamitin ang DFT ng imahe upang piliin ang frequency response ng filter na nagbibigay ng kinakailangang pagbabago ng imahe. Isaalang-alang ang dalas ng pagtugon ng mga pinakakaraniwang filter.