Mga pamamaraan ng matematika sa comparative linguistics.

Panimula

Kabanata 1. Ang kasaysayan ng aplikasyon ng mga pamamaraang matematikal sa linggwistika

1.1. Ang Pagbuo ng Structural Linguistics sa Pagliko ng ika-19 hanggang ika-20 Siglo

1.2. Paglalapat ng mga pamamaraang matematikal sa linggwistika sa ikalawang kalahati ng ikadalawampu siglo

Kabanata 2. Mga piling halimbawa ng paggamit ng matematika sa linggwistika

2.1. Pagsasalin ng makina

2.2.Mga pamamaraang istatistika sa pag-aaral ng wika

2.3. Pag-aaral ng wika sa pamamagitan ng mga pamamaraan ng pormal na lohika

2.4. Mga prospect para sa aplikasyon ng mga pamamaraan ng matematika sa linggwistika

Konklusyon

Panitikan

Apendise 1. Ronald Schleifer. Ferdinand de Saussure

Appendix 2. Ferdinand de Saussure (pagsasalin)

Panimula

Sa ika-20 siglo, nagkaroon ng patuloy na kalakaran tungo sa interaksyon at interpenetration ng iba't ibang larangan ng kaalaman. Ang mga hangganan sa pagitan ng mga indibidwal na agham ay unti-unting lumalabo; parami nang parami ang mga sangay ng mental na aktibidad na "nasa junction" ng kaalaman sa humanitarian, teknikal at natural na agham.

Ang isa pang halatang tampok ng modernidad ay ang pagnanais na pag-aralan ang mga istruktura at ang mga elemento ng bumubuo nito. Samakatuwid, ang isang pagtaas ng lugar, kapwa sa siyentipikong teorya at sa praktika, ay ibinibigay sa matematika. Ang pakikipag-ugnay, sa isang banda, sa lohika at pilosopiya, sa kabilang banda, sa mga istatistika (at, dahil dito, sa mga agham panlipunan), ang matematika ay tumagos nang mas malalim at mas malalim sa mga lugar na sa loob ng mahabang panahon ay itinuturing na puro. "makatao", pagpapalawak ng kanilang potensyal na heuristic (ang sagot sa tanong na "magkano" ay kadalasang makakatulong sa pagsagot sa mga tanong na "ano" at "paano"). Ang lingguwistika ay walang pagbubukod.

Ang layunin ng aking pamanahong papel ay maikling i-highlight ang koneksyon sa pagitan ng matematika at isang sangay ng linggwistika bilang linggwistika. Mula noong 1950s, ginamit ang matematika sa linggwistika upang lumikha ng isang teoretikal na kagamitan para sa paglalarawan ng istruktura ng mga wika (parehong natural at artipisyal). Gayunpaman, dapat sabihin na hindi ito agad nakahanap ng gayong praktikal na aplikasyon para sa sarili nito. Sa una, ang mga pamamaraan ng matematika sa linggwistika ay nagsimulang gamitin upang linawin ang mga pangunahing konsepto ng linggwistika, gayunpaman, sa pag-unlad ng teknolohiya ng computer, ang gayong teoretikal na premise ay nagsimulang makahanap ng aplikasyon sa pagsasanay. Ang paglutas ng mga gawain tulad ng pagsasalin ng makina, pagkuha ng impormasyon ng makina, awtomatikong pagpoproseso ng teksto ay nangangailangan ng panimula ng bagong diskarte sa wika. Hinarap ng mga linguist ang tanong: kung paano matututong kumatawan sa mga pattern ng linggwistika sa anyo kung saan maaari silang direktang ilapat sa teknolohiya. Ang terminong "mathematical linguistics", na popular sa ating panahon, ay tumutukoy sa anumang linguistic na pananaliksik na gumagamit ng mga eksaktong pamamaraan (at ang konsepto ng eksaktong mga pamamaraan sa agham ay palaging malapit na nauugnay sa matematika). Ang ilang mga siyentipiko sa mga nakaraang taon ay naniniwala na ang expression mismo ay hindi maaaring itaas sa ranggo ng isang termino, dahil hindi ito nangangahulugang anumang espesyal na "linggwistika", ngunit isang bagong direksyon lamang na nakatuon sa pagpapabuti, pagtaas ng katumpakan at pagiging maaasahan ng mga pamamaraan ng pananaliksik sa wika. . Gumagamit ang Linguistics ng parehong quantitative (algebraic) at non-quantitative na mga pamamaraan, na naglalapit dito sa mathematical logic, at, dahil dito, sa pilosopiya, at maging sa sikolohiya. Kahit na binanggit ni Schlegel ang pakikipag-ugnayan ng wika at kamalayan, at si Ferdinand de Saussure, isang kilalang linggwista noong unang bahagi ng ikadalawampu siglo (sasabihin ko ang tungkol sa kanyang impluwensya sa pag-unlad ng mga pamamaraan ng matematika sa linggwistika sa ibang pagkakataon), ikinonekta ang istraktura ng wika sa pag-aari nito. sa mga tao. Ang modernong mananaliksik na si L. Perlovsky ay higit pa, na tinutukoy ang dami ng mga katangian ng wika (halimbawa, ang bilang ng mga kasarian, mga kaso) na may mga kakaibang katangian ng pambansang kaisipan (higit pa tungkol dito sa Seksyon 2.2, "Mga Paraan ng Istatistika sa Linggwistika").

Ang pakikipag-ugnayan ng matematika at lingguwistika ay isang multifaceted na paksa, at sa aking trabaho ay hindi ko tatalakayin ang lahat, ngunit, una sa lahat, sa mga inilapat na aspeto nito.

Kabanata I. Kasaysayan ng Paglalapat ng mga Pamamaraang Matematika sa Linggwistika

1.1 Ang pagbuo ng structural linguistics sa simula ng XIX - XX na siglo

Ang paglalarawan sa matematika ng wika ay batay sa ideya ng wika bilang isang mekanismo, na bumalik sa sikat na Swiss linguist noong unang bahagi ng ikadalawampu siglo, si Ferdinand de Saussure.

Ang unang link ng kanyang konsepto ay ang teorya ng wika bilang isang sistema na binubuo ng tatlong bahagi (ang wika mismo ay wika, pananalita - password, at aktibidad sa pagsasalita - wika), kung saan ang bawat salita (miyembro ng system) ay hindi isinasaalang-alang sa sarili nito, ngunit may kaugnayan sa iba pang mga miyembro. Bilang isa pang kilalang lingguwista, ang Dane Louis Hjelmslev, sa kalaunan ay nabanggit, si Saussure "ang unang humingi ng isang istruktural na diskarte sa wika, iyon ay, isang siyentipikong paglalarawan ng wika sa pamamagitan ng pagtatala ng mga ugnayan sa pagitan ng mga yunit."

Sa pag-unawa sa wika bilang isang hierarchical na istraktura, si Saussure ang unang nagbigay ng problema sa halaga at kahalagahan ng mga yunit ng lingguwistika. Ang mga hiwalay na phenomena at mga kaganapan (sabihin, ang kasaysayan ng pinagmulan ng mga indibidwal na Indo-European na mga salita) ay dapat na pag-aralan hindi sa kanilang sarili, ngunit sa isang sistema kung saan sila ay nauugnay sa mga katulad na bahagi.

Itinuring ng istrukturang yunit ng wika ng Saussure ang salitang, "sign", kung saan pinagsama ang tunog at kahulugan. Wala sa mga elementong ito ang umiiral nang walang isa't isa: samakatuwid, naiintindihan ng katutubong nagsasalita ang iba't ibang lilim ng kahulugan ng polysemantic na salita bilang isang hiwalay na elemento sa kabuuan ng istruktura, sa wika.

Kaya, sa teorya ni F. de Saussure makikita ang interaksyon ng linggwistika, sa isang banda, sa sosyolohiya at sikolohiyang panlipunan (dapat tandaan na sa parehong oras, ang phenomenology ni Husserl, ang psychoanalysis ni Freud, ang teorya ng relativity ni Einstein ay umuunlad, nagaganap ang mga eksperimento sa anyo at nilalaman sa panitikan, musika, at sining), sa kabilang banda, sa matematika (ang konsepto ng pagkakapare-pareho ay tumutugma sa algebraic na konsepto ng wika). Ang ganitong konsepto ay nagbago sa konsepto ng linguistic na interpretasyon tulad ng: Ang mga penomena ay nagsimulang bigyang kahulugan hindi kaugnay sa mga sanhi ng kanilang paglitaw, ngunit may kaugnayan sa kasalukuyan at hinaharap. Ang interpretasyon ay tumigil na maging independyente sa mga intensyon ng isang tao (sa kabila ng katotohanan na ang mga intensyon ay maaaring impersonal, "walang malay" sa kahulugan ng Freudian ng salita).

Ang paggana ng mekanismo ng linggwistika ay ipinakikita sa pamamagitan ng aktibidad ng pagsasalita ng mga katutubong nagsasalita. Ang resulta ng pagsasalita ay ang tinatawag na "mga tamang teksto" - mga pagkakasunud-sunod ng mga yunit ng pagsasalita na sumusunod sa ilang mga pattern, na marami sa mga ito ay nagbibigay-daan sa paglalarawan ng matematika. Ang teorya ng mga paraan upang ilarawan ang syntactic na istraktura ay tumatalakay sa pag-aaral ng mga pamamaraan para sa matematikal na paglalarawan ng mga tamang teksto (pangunahin ang mga pangungusap). Sa ganitong istraktura, ang mga analohiya sa linggwistika ay tinukoy hindi sa tulong ng kanilang mga likas na katangian, ngunit sa tulong ng mga relasyon sa sistema ("structural").

Ang mga ideya ni Saussure ay binuo sa Kanluran ng mga nakababatang kontemporaryo ng dakilang Swiss linguist: sa Denmark - L. Hjelmslev, na nabanggit ko na, na nagbunga ng algebraic theory ng wika sa kanyang akdang "Fundamentals of Linguistic Theory", sa the USA - E. Sapir, L. Bloomfield, C. Harris, sa Czech Republic - Russian scientist-emigrant N. Trubetskoy.

Ang mga regular na istatistika sa pag-aaral ng wika ay nagsimulang harapin ng walang iba kundi ang tagapagtatag ng genetika, si Georg Mendel. Noong 1968 lamang natuklasan ng mga philologist na, sa mga huling taon ng kanyang buhay, siya ay nabighani sa pag-aaral ng linguistic phenomena gamit ang mga pamamaraan ng matematika. Dinala ni Mendel ang pamamaraang ito sa linggwistika mula sa biology; noong dekada 1990, tanging ang pinakamapangahas na linggwista at biologist ang nag-angkin ng pagiging posible ng naturang pagsusuri. Sa mga archive ng monasteryo ng St. Tomasz sa Brno, na ang abbot ay si Mendel, ang mga sheet ay natagpuan na may mga hanay ng mga apelyido na nagtatapos sa "mann", "bauer", "mayer", at may ilang mga fraction at kalkulasyon. Sa pagsisikap na matuklasan ang mga pormal na batas ng pinagmulan ng mga pangalan ng pamilya, gumawa si Mendel ng mga kumplikadong kalkulasyon, kung saan isinasaalang-alang niya ang bilang ng mga patinig at katinig sa wikang Aleman, ang kabuuang bilang ng mga salita na isinasaalang-alang niya, ang bilang ng mga apelyido, atbp.

Sa ating bansa, ang istrukturang lingguwistika ay nagsimulang umunlad sa halos parehong oras tulad ng sa Kanluran - sa pagliko ng ika-19-20 siglo. Kasabay ng F. de Saussure, ang konsepto ng wika bilang isang sistema ay binuo sa kanilang mga gawa ng mga propesor ng Kazan University F.F. Fortunatov at I.A. Baudouin de Courtenay. Ang huli ay nakipag-ugnayan nang mahabang panahon kay de Saussure, ayon sa pagkakabanggit, ang Geneva at Kazan na mga paaralan ng linggwistika ay nakipagtulungan sa isa't isa. Kung si Saussure ay matatawag na ideologist ng "eksaktong" mga pamamaraan sa linggwistika, kung gayon ang Baudouin de Courtenay ay naglatag ng mga praktikal na pundasyon para sa kanilang aplikasyon. Siya ang unang naghiwalay ng linggwistika (bilang tumpak isang agham na gumagamit ng mga istatistikal na pamamaraan at functional dependence) mula sa philology (isang komunidad ng mga humanitarian na disiplina na nag-aaral ng espirituwal na kultura sa pamamagitan ng wika at pananalita). Ang siyentipiko mismo ay naniniwala na "ang linggwistika ay maaaring maging kapaki-pakinabang sa malapit na hinaharap, napalaya lamang mula sa ipinag-uutos na unyon sa philology at kasaysayang pampanitikan" . Ang ponolohiya ay naging "lugar ng pagsubok" para sa pagpapakilala ng mga pamamaraang matematikal sa linggwistika - ang mga tunog bilang "mga atom" ng sistema ng wika, na may limitadong bilang ng mga madaling masusukat na katangian, ay ang pinaka maginhawang materyal para sa pormal at mahigpit na pamamaraan ng paglalarawan. Itinatanggi ng ponolohiya ang pagkakaroon ng kahulugan sa tunog, kaya inalis ang salik na "tao" sa mga pag-aaral. Sa ganitong diwa, ang mga ponema ay parang pisikal o biyolohikal na bagay.

Ang mga ponema, bilang pinakamaliit na elemento ng lingguwistika na katanggap-tanggap para sa persepsyon, ay kumakatawan sa isang hiwalay na globo, isang hiwalay na "phenomenological reality". Halimbawa, sa Ingles, ang tunog na "t" ay maaaring mabigkas nang iba, ngunit sa lahat ng pagkakataon, ang isang taong nagsasalita ng Ingles ay mapapansin ito bilang "t". Ang pangunahing bagay ay ang ponema ay gaganap ng kanyang pangunahing - makabuluhang - function. Bukod dito, ang mga pagkakaiba sa pagitan ng mga wika ay tulad na ang mga uri ng isang tunog sa isang wika ay maaaring tumutugma sa iba't ibang mga ponema sa isa pa; halimbawa, ang "l" at "r" sa Ingles ay magkaiba, habang sa iba pang mga wika ang mga ito ay mga uri ng parehong ponema (tulad ng Ingles na "t", binibigkas na mayroon o walang aspirasyon). Ang malawak na bokabularyo ng anumang natural na wika ay isang hanay ng mga kumbinasyon ng mas maliit na bilang ng mga ponema. Sa Ingles, halimbawa, 40 ponema lamang ang ginagamit sa pagbigkas at pagsulat ng halos isang milyong salita.

Ang mga tunog ng isang wika ay isang sistematikong nakaayos na hanay ng mga tampok. Noong 1920s-1930s, kasunod ni Saussure, Jacobson at N.S. Trubetskoy ay pinili ang "mga natatanging tampok" ng mga ponema. Ang mga tampok na ito ay batay sa istraktura ng mga organo ng pagsasalita - dila, ngipin, vocal cord. Halimbawa, sa Ingles ang pagkakaiba sa pagitan ng "t" at "d" ay ang pagkakaroon o kawalan ng isang "boses" (ang pag-igting ng mga vocal cord) at ang antas ng boses na nagpapakilala sa isang ponema mula sa isa pa. Kaya, ang ponolohiya ay maaaring ituring na isang halimbawa ng pangkalahatang tuntunin sa wika na inilarawan ni Saussure: "May mga pagkakaiba lamang sa wika". Kahit na ito ay mas mahalaga: ang pagkakaiba ay karaniwang nagpapahiwatig ng eksaktong mga kondisyon kung saan ito matatagpuan; ngunit sa wika ay mayroon lamang mga pagkakaiba na walang tiyak na kondisyon. Isinasaalang-alang man natin ang "pagtatalaga" o "signified" - sa wika ay walang mga konsepto o tunog na umiiral bago ang pagbuo ng sistema ng wika.

Kaya, sa Saussurean linguistics, ang pinag-aralan na phenomenon ay nauunawaan bilang isang hanay ng mga paghahambing at pagsalungat ng wika. Ang wika ay parehong pagpapahayag ng kahulugan ng mga salita at isang paraan ng komunikasyon, at ang dalawang tungkuling ito ay hindi kailanman nagtutugma. Mapapansin natin ang paghahalili ng anyo at nilalaman: ang mga linguistic contrast ay tumutukoy sa mga istrukturang yunit nito, at ang mga yunit na ito ay nakikipag-ugnayan upang lumikha ng isang tiyak na makabuluhang nilalaman. Dahil random ang mga elemento ng wika, hindi maaaring maging batayan ang contrast o combination. Nangangahulugan ito na sa isang wika, ang mga natatanging tampok ay bumubuo ng isang phonetic contrast sa ibang antas ng pag-unawa, ang mga ponema ay pinagsama sa mga morpema, mga morpema sa mga salita, mga salita sa mga pangungusap, atbp. Sa anumang kaso, isang buong ponema, salita, pangungusap, atbp. ay higit pa sa kabuuan ng mga bahagi nito.

Iminungkahi ni Saussure ang ideya ng isang bagong agham ng ikadalawampu siglo, na hiwalay sa linggwistika, na pinag-aaralan ang papel ng mga palatandaan sa lipunan. Tinawag ni Saussure ang science semiology na ito (mula sa Greek na "semeîon" - isang tanda). Ang "agham" ng semiotics, na umunlad sa Silangang Europa noong 1920s-1930s at sa Paris noong 1950s-1960s, ay nagpalawak ng pag-aaral ng wika at mga istrukturang linggwistika sa mga natuklasang pampanitikan na binubuo (o binabalangkas) sa tulong ng mga istrukturang ito. Bilang karagdagan, sa takip-silim ng kanyang karera, kasabay ng kanyang kurso sa pangkalahatang linggwistika, si Saussure ay nakikibahagi sa isang "semiotic" na pagsusuri ng huling Romanong tula, sinusubukang tumuklas ng sadyang binubuo ng mga anagram ng mga wastong pangalan. Ang pamamaraang ito sa maraming paraan ay kabaligtaran ng rasyonalismo sa pagsusuri sa linggwistika: ito ay isang pagtatangka na pag-aralan sa isang sistema ang problema ng "probability" sa wika. Ang ganitong pananaliksik ay nakakatulong na tumuon sa "tunay na bahagi" ng posibilidad; ang "pangunahing salita" kung saan hinahanap ni Saussure ang isang anagram ay, ayon kay Jean Starobinsky, "isang kasangkapan para sa makata, hindi ang pinagmulan ng buhay ng tula." Ang tula ay nagsisilbing palitan ang mga tunog ng keyword. Ayon kay Starobinsky, sa pagsusuring ito, "Hindi sumasali si Saussure sa paghahanap ng mga nakatagong kahulugan." Sa kabaligtaran, sa kanyang mga gawa, ang pagnanais na maiwasan ang mga tanong na may kaugnayan sa kamalayan ay kapansin-pansin: "dahil ang tula ay ipinahayag hindi lamang sa mga salita, kundi pati na rin sa kung ano ang ibinubunga ng mga salitang ito, ito ay lampas sa kontrol ng kamalayan at nakasalalay lamang sa ang mga batas ng wika” (tingnan ang . Appendix 1).

Ang pagtatangka ni Saussure na pag-aralan ang mga wastong pangalan sa huling Romanong tula ay binibigyang-diin ang isa sa mga bahagi ng kanyang pagsusuri sa linggwistika - ang arbitraryong katangian ng mga palatandaan, gayundin ang pormal na esensya ng linggwistika ni Saussure, na hindi kasama ang posibilidad ng pagsusuri ng kahulugan. Napagpasyahan ni Todorov na ngayon ang mga gawa ni Saussure ay tila lubos na pare-pareho sa kanilang pag-aatubili na pag-aralan ang mga simbolo ng isang kababalaghan na may malinaw na tinukoy na kahulugan [Appendix 1]. Sa paggalugad ng mga anagram, binibigyang-pansin lamang ni Saussure ang pag-uulit, ngunit hindi ang mga nakaraang opsyon. . . . Sa pag-aaral ng Nibelungenlied, tinukoy niya ang mga simbolo upang italaga lamang ang mga ito sa mga maling pagbabasa: kung hindi sinasadya, ang mga simbolo ay hindi umiiral. Pagkatapos ng lahat, sa kanyang mga akda sa pangkalahatang linggwistika, ginawa niya ang pagpapalagay ng pagkakaroon ng isang semiology na naglalarawan hindi lamang ng mga palatandaang pangwika; ngunit ang palagay na ito ay limitado sa pamamagitan ng katotohanan na ang semiology ay maaari lamang maglarawan ng random, arbitrary na mga palatandaan.

Kung ito ay talagang gayon, ito ay dahil lamang sa hindi niya maisip ang "intensiyon" na walang bagay; hindi niya lubusang madugtungan ang agwat sa pagitan ng anyo at nilalaman - sa kanyang mga akda ay naging tanong ito. Sa halip, bumaling siya sa "linguistic legitimacy". Sa pagitan, sa isang banda, ang mga konsepto ng ikalabinsiyam na siglo batay sa kasaysayan at mga subjective na haka-haka, at mga pamamaraan ng random na interpretasyon batay sa mga konseptong ito, at, sa kabilang banda, mga istruktural na konsepto na nagbubura ng oposisyon sa pagitan ng anyo at nilalaman (paksa at bagay) , kahulugan at pinagmulan sa structuralism, psychoanalysis, at maging sa quantum mechanics, ang mga sinulat ni Ferdinand de Saussure sa linguistics at semiotics ay nagmamarka ng pagbabago sa pag-aaral ng mga kahulugan sa wika at kultura.

Ang mga siyentipikong Ruso ay kinatawan din sa Unang Internasyonal na Kongreso ng mga Linguist sa The Hague noong 1928. S. Kartsevsky, R. Yakobson at N. Trubetskoy ay gumawa ng isang ulat na sinuri ang hierarchical na istraktura ng wika - sa diwa ng mga pinaka-modernong ideya para sa simula ng huling siglo. Si Jakobson sa kanyang mga akda ay bumuo ng mga ideya ni Saussure na ang mga pangunahing elemento ng isang wika ay dapat pag-aralan, una sa lahat, na may kaugnayan sa kanilang mga tungkulin, at hindi sa mga dahilan ng kanilang paglitaw.

Sa kasamaang palad, pagkatapos na maluklok si Stalin noong 1924, ang linggwistika ng Russia, tulad ng maraming iba pang mga agham, ay ibinalik. Maraming mga mahuhusay na siyentipiko ang napilitang mangibang-bayan, pinaalis sa bansa o namatay sa mga kampo. Noong kalagitnaan ng dekada 1950, naging posible ang isang tiyak na pluralismo ng mga teorya—higit pa sa Seksyon 1.2.

1.2 Paglalapat ng mga pamamaraang matematikal sa linggwistika sa ikalawang kalahati ng ikadalawampu siglo

Sa kalagitnaan ng ikadalawampu siglo, apat na paaralang pangwika sa daigdig ang nabuo, na ang bawat isa ay naging ninuno ng isang tiyak na "eksaktong" pamamaraan. Leningrad Phonological School(ang ninuno nito ay isang mag-aaral ng Baudouin de Courtenay L.V. Shcherba) ay gumamit ng isang psycholinguistic na eksperimento batay sa pagsusuri sa pagsasalita ng mga katutubong nagsasalita bilang pangunahing pamantayan para sa paglalahat ng tunog sa anyo ng isang ponema.

Mga siyentipiko Prague Linguistic Circle, lalo na, ang tagapagtatag nito na si N.S. Si Trubetskoy, na lumipat mula sa Russia, ay bumuo ng teorya ng mga pagsalungat - ang semantikong istraktura ng wika ay inilarawan nila bilang isang hanay ng mga oppositionally constructed semantic units - Sem. Ang teoryang ito ay inilapat sa pag-aaral hindi lamang sa wika, kundi pati na rin sa kulturang masining.

Mga ideologo Amerikanong deskriptibismo ay mga linggwista na sina L. Bloomfield at E. Sapir. Ang wika ay ipinakita sa mga deskriptibista bilang isang hanay ng mga pahayag sa pagsasalita, na siyang pangunahing layunin ng kanilang pag-aaral. Ang kanilang pokus ay sa mga tuntunin ng siyentipikong paglalarawan (kaya ang pangalan) ng mga teksto: ang pag-aaral ng organisasyon, pag-aayos at pag-uuri ng kanilang mga elemento. Ang pormalisasyon ng mga pamamaraang analitikal sa larangan ng ponolohiya at morpolohiya (pagbuo ng mga prinsipyo para sa pag-aaral ng wika sa iba't ibang antas, pagsusuri sa pamamahagi, pamamaraan ng mga direktang nasasakupan, atbp.) ay humantong sa pagbabalangkas ng mga pangkalahatang katanungan ng pagmomolde ng linggwistika. Ang kawalan ng pansin sa plano ng nilalaman ng wika, gayundin ang paradigmatikong panig ng wika, ay hindi nagbigay-daan sa mga deskriptibista na ganap na bigyang-kahulugan ang wika bilang isang sistema.

Noong 1960s, nabuo ang teorya ng mga pormal na gramatika, na lumitaw pangunahin dahil sa gawain ng pilosopo at lingguwistang Amerikano na si N. Chomsky. Siya ay nararapat na ituring na isa sa mga pinakatanyag na modernong siyentipiko at pampublikong pigura, maraming mga artikulo, monograp at kahit isang buong dokumentaryo ang nakatuon sa kanya. Sa pangalan ng isang panimula na bagong paraan ng paglalarawan ng syntactic na istraktura na naimbento ni Chomsky - generative (generative) grammar - ang kaukulang kalakaran sa linggwistika ay tinawag generativism.

Si Chomsky, isang inapo ng mga imigrante mula sa Russia, ay nag-aral ng linguistics, matematika at pilosopiya sa Unibersidad ng Pennsylvania mula noong 1945, na malakas na naiimpluwensyahan ng kanyang gurong si Zelig Harris - tulad ni Harris, isinasaalang-alang ni Chomsky at isinasaalang-alang pa rin ang kanyang pampulitikang pananaw na malapit sa anarkismo (siya ay kilala bilang kritiko ng umiiral na sistemang pampulitika ng US at bilang isa sa mga espirituwal na pinuno ng anti-globalismo).

Ang unang pangunahing gawaing pang-agham ni Chomsky, ang master's thesis na "Morpolohiya ng Modernong Hebrew » (1951) ay nanatiling hindi nai-publish. Natanggap ni Chomsky ang kanyang titulo ng doktor mula sa Unibersidad ng Pennsylvania noong 1955, ngunit karamihan sa pananaliksik na pinagbabatayan ng kanyang disertasyon (nai-publish nang buo noong 1975 sa ilalim ng pamagat na The Logical Structure of Linguistic Theory) at ang kanyang unang monograph, Syntactic Structures (1957, Rus. trans . 1962), ay ginanap sa Harvard University noong 1951-1955. Sa parehong 1955, lumipat ang siyentipiko sa Massachusetts Institute of Technology, kung saan siya ay naging propesor noong 1962.

Ang teorya ni Chomsky ay dumaan sa ilang yugto sa pag-unlad nito.

Sa unang monograph na "Syntactic Structures", ipinakita ng siyentipiko ang wika bilang isang mekanismo para sa pagbuo ng isang walang katapusang hanay ng mga pangungusap gamit ang isang may hangganang hanay ng mga paraan ng gramatika. Upang ilarawan ang mga katangian ng lingguwistika, iminungkahi niya ang mga konsepto ng malalim (nakatago mula sa direktang pang-unawa at nabuo ng isang sistema ng recursive, ibig sabihin, maaaring ilapat nang paulit-ulit, mga panuntunan) at ibabaw (direktang pinaghihinalaang) mga istrukturang gramatika, pati na rin ang mga pagbabagong naglalarawan sa paglipat mula sa malalalim na istruktura hanggang sa ibabaw. Ang ilang mga istraktura sa ibabaw ay maaaring tumutugma sa isang malalim na istraktura (halimbawa, isang passive na istraktura Ang kautusan ay nilagdaan ng pangulo nagmula sa parehong Deep Structure bilang aktibong construct Pinirmahan ng Pangulo ang kautusan) at kabaliktaran (kaya, ang kalabuan mahal ng ina ang anak na babae inilarawan bilang resulta ng isang pagkakataon ng mga istruktura sa ibabaw na bumalik sa dalawang magkaibang malalim, kung saan ang ina ay ang nagmamahal sa anak na babae, at sa isa pa, ang minamahal ng anak na babae).

Ang pamantayang teorya ni Chomsky ay itinuturing na "Aspects" na modelo na itinakda sa aklat ni Chomsky na "Aspects of the Theory of Syntax". Sa modelong ito, sa unang pagkakataon, ang mga tuntunin ng semantikong interpretasyon ay ipinakilala sa pormal na teorya, na nag-uugnay ng kahulugan sa malalim na mga istruktura. Sa Aspekto, ang linguistic competence ay laban sa paggamit ng wika (performance), ang tinatawag na Katz-Postal hypothesis tungkol sa pangangalaga ng kahulugan sa panahon ng pagbabago ay pinagtibay, na may kaugnayan kung saan ang konsepto ng opsyonal na pagbabago ay hindi kasama, at isang apparatus ng Ang mga tampok na sintaktik na naglalarawan sa pagkakatugma ng leksikal ay ipinakilala.

Noong 1970s, nagtrabaho si Chomsky sa teorya ng kontrol at pagbubuklod (GB-theory - mula sa mga salita pamahalaan at nagbubuklod) ay mas pangkalahatan kaysa sa nauna. Sa loob nito, tinalikuran ng siyentipiko ang mga tiyak na panuntunan na naglalarawan sa mga istrukturang sintaktik ng mga partikular na wika. Ang lahat ng mga pagbabago ay napalitan ng isang unibersal na paglipat ng pagbabago. Sa loob ng balangkas ng teorya ng GB, mayroon ding mga pribadong module, na ang bawat isa ay may pananagutan para sa sarili nitong bahagi ng grammar.

Kamakailan lamang, noong 1995, naglagay si Chomsky ng isang minimalist na programa, kung saan ang wika ng tao ay inilalarawan tulad ng machine language. Ito ay isang programa lamang, hindi isang modelo o isang teorya. Sa loob nito, kinilala ni Chomsky ang dalawang pangunahing subsystem ng kagamitan ng wika ng tao: ang lexicon at ang computing system, pati na rin ang dalawang interface - phonetic at logical.

Ang mga pormal na gramatika ni Chomsky ay naging klasiko para sa paglalarawan hindi lamang natural kundi pati na rin ang mga artipisyal na wika - sa partikular, mga programming language. Ang pag-unlad ng istrukturang linggwistika sa ikalawang kalahati ng ika-20 siglo ay maaaring ituring na isang "Chomskian revolution".

Moscow Phonological School, na ang mga kinatawan ay sina A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, gumamit ng katulad na teorya sa pag-aaral ng phonetics. Unti-unti, ang mga "eksaktong" pamamaraan ay nagsisimula nang ilapat patungkol hindi lamang sa phonetics, kundi pati na rin sa syntax. Parehong linguist at mathematician, dito at sa ibang bansa, ay nagsisimulang pag-aralan ang istruktura ng wika. Noong 1950s at 60s, nagsimula ang isang bagong yugto sa pakikipag-ugnayan sa pagitan ng matematika at linggwistika sa USSR, na nauugnay sa pag-unlad ng mga sistema ng pagsasalin ng makina.

Ang impetus para sa pagsisimula ng mga gawaing ito sa ating bansa ay ang mga unang pag-unlad sa larangan ng pagsasalin ng makina sa Estados Unidos (bagaman ang unang mekanisadong kagamitan sa pagsasalin ni P.P. Smirnov-Troyansky ay naimbento sa USSR noong 1933, ito, bilang primitive. , ay hindi naging laganap). Noong 1947, gumawa sina A. Butt at D. Britten ng isang code para sa pagsasalin ng salita-sa-salita gamit ang isang computer; makalipas ang isang taon, iminungkahi ni R. Richens ang isang panuntunan para sa paghahati ng mga salita sa mga stems at mga pagtatapos sa pagsasalin ng makina. Ibang-iba ang mga taon na iyon sa ngayon. Ang mga ito ay napakalaki at mamahaling mga makina na umabot sa buong mga silid at nangangailangan ng malaking kawani ng mga inhinyero, operator at programmer upang mapanatili ang mga ito. Karaniwan, ang mga computer na ito ay ginamit upang magsagawa ng mga kalkulasyon sa matematika para sa mga pangangailangan ng mga institusyong militar - ang bago sa matematika, pisika at teknolohiya na pinagsilbihan, una sa lahat, ang mga gawaing militar. Sa mga unang yugto, ang pagbuo ng MP ay aktibong suportado ng militar, habang (sa mga kondisyon ng Cold War) ang direksyon ng Russian-English na binuo sa USA, at ang direksyon ng Anglo-Russian sa USSR.

Noong Enero 1954, ang Georgetown Experiment, ang unang pampublikong pagpapakita ng pagsasalin mula sa Ruso sa Ingles sa makina ng IBM-701, ay naganap sa Massachusetts Technical University. Abstract ng mensahe tungkol sa matagumpay na pagpasa ng eksperimento, na ginawa ni D.Yu. Panov, ay lumitaw sa RJ "Mathematics", 1954, No. 10: "Pagsasalin mula sa isang wika patungo sa isa pa gamit ang isang makina: isang ulat sa unang matagumpay na pagsubok."

Si D. Yu. Panov (sa oras na iyon ay direktor ng Institute of Scientific Information - INI, kalaunan ay VINITI) ay umakit kay I. K. Belskaya, na kalaunan ay pinamunuan ang machine translation group sa Institute of Precise Mathematics at Computer Engineering ng USSR Academy of Sciences, upang magtrabaho sa pagsasalin ng makina. Sa pagtatapos ng 1955, ang unang karanasan ng pagsasalin mula sa Ingles sa Russian sa tulong ng BESM machine ay nagsimula noon. Ang mga programa para sa BESM ay pinagsama-sama ng N.P. Trifonov at L.N. Korolev, na ang tesis ng Ph.D. ay nakatuon sa mga pamamaraan para sa pagbuo ng mga diksyunaryo para sa pagsasalin ng makina.

Kaayon, ang trabaho sa pagsasalin ng makina ay isinagawa sa Kagawaran ng Applied Mathematics ng Mathematical Institute ng USSR Academy of Sciences (ngayon ay M.V. Keldysh Institute of Applied Mathematics ng Russian Academy of Sciences). Sa inisyatiba ng mathematician na si A.A. Lyapunov. Kasama niya ang O.S. Kulagin at ang kanyang mga mag-aaral na T.D. Sina Wentzel at N.N. Ricco. Ang mga ideya nina Lyapunov at Kulagina tungkol sa posibilidad ng paggamit ng teknolohiya upang magsalin mula sa isang wika patungo sa isa pa ay inilathala sa journal Nature, 1955, No. 8. Mula sa katapusan ng 1955, T.N. Moloshnaya, na pagkatapos ay nagsimulang independiyenteng trabaho sa algorithm ng pagsasalin ng English-Russian.

Naaalala ni R. Frumkina, na sa oras na iyon ay nakikibahagi sa algorithm ng pagsasalin mula sa Espanyol, na sa yugtong ito ng gawain ay mahirap gumawa ng anumang mga pare-parehong hakbang. Mas madalas kailangan kong sundin ang heuristic na karanasan - sarili ko o mga kasamahan.

Gayunpaman, ang unang henerasyon ng mga sistema ng pagsasalin ng makina ay napakadi-perpekto. Ang lahat ng mga ito ay batay sa sunud-sunod na mga algorithm ng pagsasalin "salita sa pamamagitan ng salita", "parirala sa pamamagitan ng parirala" - ang mga koneksyon sa semantiko sa pagitan ng mga salita at pangungusap ay hindi isinasaalang-alang sa anumang paraan. Halimbawa, ang mga pangungusap ay: Hinahanap ni John ang kanyang kahon ng laruan.Sa wakas ay natagpuan niya ito. Ang kahon ay nasa panulat.Tuwang-tuwa si John. (Hinahanap ni John ang kanyang kahon ng laruan. Sa wakas ay natagpuan niya ito. Nasa playpen ang kahon. Tuwang-tuwa si John.).” Ang "Pulat" sa kontekstong ito ay hindi isang "panulat" (kasangkapan sa pagsulat), ngunit isang "playpen" ( play-pen). Ang kaalaman sa mga kasingkahulugan, kasalungat at matalinghagang kahulugan ay mahirap ipasok sa isang computer. Ang isang promising na direksyon ay ang pagbuo ng mga computer system na nakatuon sa paggamit ng isang tao na tagasalin.

Sa paglipas ng panahon, ang mga direktang sistema ng pagsasalin ay pinalitan ng mga T-system (mula sa salitang Ingles na "paglipat" - pagbabagong-anyo), kung saan isinagawa ang pagsasalin sa antas ng mga istrukturang sintaktik. Ang mga algorithm ng mga T-system ay gumamit ng mekanismo na naging posible upang bumuo ng isang syntactic na istraktura ayon sa mga tuntunin ng grammar ng wika ng input na pangungusap (katulad ng kung paano itinuro ang isang banyagang wika sa mataas na paaralan), at pagkatapos ay i-synthesize ang output na pangungusap. sa pamamagitan ng pagbabago sa istrukturang sintaktik at pagpapalit ng mga kinakailangang salita mula sa diksyunaryo.

Nagsalita si Lyapunov tungkol sa pagsasalin sa pamamagitan ng pagkuha ng kahulugan ng isinalin na teksto at paglalahad nito sa ibang wika. Ang diskarte sa pagbuo ng mga machine translation system batay sa pagkuha ng semantic representation ng input sentence sa pamamagitan ng semantic analysis at synthesis ng input sentence ayon sa nakuha na semantic representation ay itinuturing pa rin na pinakaperpekto. Ang ganitong mga sistema ay tinatawag na I-systems (mula sa salitang "interlingua"). Gayunpaman, ang gawain ng paglikha ng mga ito, na itinakda noong huling bahagi ng 50s at unang bahagi ng 60s, ay hindi pa ganap na nalutas sa ngayon, sa kabila ng mga pagsisikap ng International Federation of IFIP, ang komunidad ng mundo ng mga siyentipiko sa larangan ng pagproseso ng impormasyon.

Naisip ng mga siyentipiko kung paano gawing pormal at bumuo ng mga algorithm para sa pagtatrabaho sa mga teksto, kung anong mga diksyunaryo ang dapat ipasok sa makina, kung anong mga pattern ng linguistic ang dapat gamitin sa pagsasalin ng makina. Ang tradisyunal na lingguwistika ay walang ganoong mga ideya - hindi lamang sa mga tuntunin ng semantika, kundi pati na rin sa mga tuntunin ng syntax. Sa oras na iyon, walang mga listahan ng mga syntactic constructions para sa anumang wika, ang mga kondisyon para sa kanilang compatibility at interchangeability ay hindi pinag-aralan, ang mga patakaran para sa pagbuo ng malalaking yunit ng syntactic structure mula sa mas maliliit na elemento ng constituent ay hindi binuo.

Ang pangangailangan na lumikha ng mga teoretikal na pundasyon ng pagsasalin ng makina ay humantong sa pagbuo at pag-unlad ng matematikal na lingguwistika. Ang nangungunang papel sa bagay na ito sa USSR ay ginampanan ng mga mathematician na si A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, mga linggwista na si V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Ang disertasyon ni Kulagina ay nakatuon sa pag-aaral ng pormal na teorya ng mga gramatika (kasabay ng N. Khomsky sa USA), iniharap ni Kuznetsov ang gawain ng axiomatization ng linguistics, na bumalik sa mga gawa ni F.F. Fortunatov.

Noong Mayo 6, 1960, ang Decree ng Presidium ng USSR Academy of Sciences "Sa pagbuo ng mga istruktura at matematikal na pamamaraan para sa pag-aaral ng wika" ay pinagtibay, at ang mga kaukulang dibisyon ay nilikha sa Institute of Linguistics at Institute of the Institute. Wikang Ruso. Mula noong 1960, sa nangungunang makataong unibersidad ng bansa - ang philological faculty ng Moscow State University, Leninrad, Novosibirsk na unibersidad, Moscow State Institute of Foreign Languages ​​​​- nagsimulang magsanay sa larangan ng awtomatikong pagproseso ng teksto.

Gayunpaman, ang mga gawa sa pagsasalin ng makina sa panahong ito, na tinatawag na "klasiko", ay may teoretikal sa halip na praktikal na interes. Ang mga cost-effective na machine translation system ay nagsimulang malikha lamang noong dekada otsenta ng huling siglo. Pag-uusapan ko ito mamaya sa Seksyon 2.1, Machine Translation.

Kasama sa 1960s - 70s ang malalim na teoretikal na pag-unlad gamit ang mga pamamaraan ng set theory at mathematical logic, tulad ng field theory at fuzzy set theory.

Ang may-akda ng field theory sa linguistics ay ang Sobyet na makata, tagasalin at linguist na si V.G. Admoni. Una niyang binuo ang kanyang teorya batay sa wikang Aleman. Para kay Admoni, ang konsepto ng "patlang" ay tumutukoy sa isang arbitraryong hindi walang laman na hanay ng mga elementong pangwika (halimbawa, "lexical field", "semantic field").

Ang istraktura ng field ay heterogenous: ito ay binubuo ng isang core, ang mga elemento nito ay mayroong kumpletong hanay ng mga feature na tumutukoy sa isang set, at isang periphery, ang mga elemento nito ay maaaring magkaroon ng parehong feature ng isang ibinigay na set (hindi lahat) at mga kapitbahay. Magbibigay ako ng isang halimbawa na naglalarawan sa pahayag na ito: halimbawa, sa Ingles, ang larangan ng mga tambalang salita (“day-dream” - “dream” ay mahirap ihiwalay sa larangan ng mga parirala (“tear gas” - “tear gas”) .

Ang teorya ng fuzzy set na nabanggit na sa itaas ay malapit na nauugnay sa field theory. Sa USSR, ang mga linggwista na si V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, gayunpaman, ang ninuno nito ay ang American mathematician na si L. Zadeh, na noong 1965 ay naglathala ng artikulong "Fuzzy Logic". Sa pagbibigay ng katwiran sa matematika para sa teorya ng fuzzy set, itinuring ni Zade ang mga ito batay sa materyal na lingguwistika.

Sa teoryang ito, hindi gaanong pinag-uusapan ang tungkol sa pag-aari ng mga elemento sa isang naibigay na set (АОа), kundi tungkol sa antas ng membership na ito (mАОа), dahil ang mga peripheral na elemento ay maaaring kabilang sa ilang mga larangan sa isang antas o iba pa. Si Zade (Lofti-zade) ay isang katutubong ng Azerbaijan, hanggang sa edad na 12 ay nagkaroon siya ng kasanayan sa pakikipag-usap sa apat na wika - Azerbaijani, Russian, English at Persian - at gumamit ng tatlong magkakaibang mga alpabeto: Cyrillic, Latin, Arabic. Kapag tinanong ang isang siyentipiko kung ano ang karaniwan sa pagitan ng fuzzy set theory at linguistics, hindi niya itinatanggi ang koneksyon na ito, ngunit nilinaw niya: "Hindi ako sigurado na ang pag-aaral ng mga wikang ito ay may malaking epekto sa aking pag-iisip. Kung ito ang kaso, pagkatapos lamang subconsciously. Sa kanyang kabataan, nag-aral si Zadeh sa isang Presbyterian school sa Tehran, at pagkatapos ng Ikalawang Digmaang Pandaigdig ay lumipat siya sa Estados Unidos. "Ang tanong ay hindi kung ako ay isang Amerikano, Ruso, Azerbaijani o ibang tao," sabi niya sa isa sa mga pag-uusap, "Ako ay hinubog ng lahat ng mga kultura at mga tao na ito at medyo komportable sa bawat isa sa kanila." Sa mga salitang ito mayroong isang bagay na katulad sa kung ano ang nagpapakilala sa teorya ng mga malabo na hanay - isang pag-alis mula sa hindi malabo na mga kahulugan at matalim na mga kategorya.

Sa ating bansa, noong dekada 70, isinalin at pinag-aralan ang mga gawa ng mga Kanluraning dalubwika noong ikadalawampu siglo. I.A. Isinalin ni Melchuk ang mga gawa ni N. Chomsky sa Russian. SA. Iniuugnay ni Slyusareva sa kanyang aklat na "The Theory of F. de Saussure in the Light of Modern Linguistics" ang mga postulate ng pagtuturo ni Saussure sa mga aktwal na problema ng linggwistika noong dekada 70. May tendensiya tungo sa karagdagang mathematization ng linggwistika. Ang mga nangungunang domestic unibersidad ay mga tauhan ng pagsasanay sa espesyalidad na "Mathematical (theoretical, applied) linguistics". Kasabay nito sa Kanluran ay mayroong isang matalim na paglukso sa pag-unlad ng teknolohiya ng kompyuter, na nangangailangan ng higit at higit pang mga bagong pundasyong pangwika.

Kaya, sa buong ika-20 siglo nagkaroon ng convergence ng eksaktong at humanities. Ang pakikipag-ugnayan ng matematika sa linggwistika ay lalong nakahanap ng mga praktikal na aplikasyon. Higit pa tungkol dito sa susunod na kabanata.

Kabanata 2. Mga piling halimbawa ng paggamit ng matematika sa linggwistika

2.1 Pagsasalin sa makina

Ang ideya ng pagsasalin mula sa isang wika patungo sa isa pa sa tulong ng isang unibersal na mekanismo ay lumitaw ilang siglo bago nagsimula ang mga unang pag-unlad sa lugar na ito - noong 1649, iminungkahi ni Rene Descartes ang ideya ng isang wika kung saan ang mga katumbas na ideya ng ang iba't ibang wika ay ipahahayag ng isang simbolo. Ang mga unang pagtatangka na ipatupad ang ideyang ito noong 1930s-40s, ang simula ng teoretikal na pag-unlad sa kalagitnaan ng siglo, ang pagpapabuti ng mga sistema ng pagsasalin sa tulong ng teknolohiya noong 1970s-80s, ang mabilis na pag-unlad ng teknolohiya ng pagsasalin sa huling dekada - ito ang mga yugto sa pagbuo ng machine translation bilang isang industriya. Ito ay mula sa mga gawa sa machine translation na ang computer linguistics bilang isang agham ay lumago.

Sa pag-unlad ng teknolohiya ng computer noong huling bahagi ng dekada 70 at unang bahagi ng dekada 80, itinakda ng mga mananaliksik ang kanilang sarili na mas makatotohanan at matipid na mga layunin - ang makina ay hindi naging isang katunggali (tulad ng ipinapalagay dati), ngunit isang katulong sa isang tagasalin ng tao. Ang pagsasalin ng makina ay huminto sa paglilingkod ng eksklusibong mga gawaing militar (lahat ng mga imbensyon at pananaliksik ng Sobyet at Amerikano, na pangunahing nakatuon sa Ruso at Ingles, ay nag-ambag sa Cold War sa isang paraan o iba pa). Noong 1978, ipinadala ang mga natural na salita sa wika sa Arpa interconnected network, at pagkalipas ng anim na taon, lumitaw ang unang microcomputer translation program sa Estados Unidos.

Noong dekada 70, binibili ng Commission of the European Communities ang English-French na bersyon ng Systran computer translator, na nag-order din ng French-English at Italian-English na bersyon, at ang Russian-to-English translation system na ginagamit ng US Armed Forces. Ito ay kung paano inilatag ang mga pundasyon ng proyekto ng EUROTRA.

Tungkol sa muling pagkabuhay ng machine translation noong 70-80s. Ang mga sumusunod na katotohanan ay nagpapatotoo: binibili ng Commission of the European Communities (CEC) ang English-French na bersyon ng Systran, gayundin ang sistema ng pagsasalin mula sa Russian patungo sa English (ang huli ay binuo pagkatapos ng ulat ng ALPAC at patuloy na ginagamit ng US Air Force at NASA); bilang karagdagan, ipinag-uutos ng CEC ang pagbuo ng mga bersyong French-English at Italian-English. Kasabay nito, mayroong mabilis na pagpapalawak ng mga aktibidad sa pagsasalin ng makina sa Japan; sa USA, iniutos ng Pan American Health Organization (PAHO) ang pagbuo ng isang Spanish-English na direksyon (SPANAM system); Pinopondohan ng US Air Force ang pagbuo ng isang machine translation system sa Linguistic Research Center sa University of Texas sa Austin; Ang pangkat ng TAUM sa Canada ay gumagawa ng kapansin-pansing pag-unlad sa pagbuo ng kanilang METEO (meteorological translation) system. Ang ilang mga proyekto ay nagsimula noong 70s at 80s. pagkatapos ay binuo sa ganap na komersyal na mga sistema.

Sa panahon ng 1978-93, 20 milyong dolyar ang ginugol sa pananaliksik sa larangan ng pagsasalin ng makina sa USA, 70 milyon sa Europa, at 200 milyon sa Japan.

Ang isa sa mga bagong pag-unlad ay ang teknolohiya ng TM (translation memory), na gumagana sa prinsipyo ng akumulasyon: sa panahon ng proseso ng pagsasalin, ang orihinal na segment (pangungusap) at ang pagsasalin nito ay nai-save, na nagreresulta sa pagbuo ng isang linguistic database; kung ang isang kapareho o katulad na segment ay matatagpuan sa bagong isinalin na teksto, ito ay ipinapakita kasama ng pagsasalin at isang indikasyon ng porsyento na tugma. Ang tagasalin pagkatapos ay gumawa ng desisyon (upang i-edit, tanggihan o tanggapin ang pagsasalin), ang resulta nito ay iniimbak ng system, kaya hindi na kailangang isalin ang parehong pangungusap nang dalawang beses. Ang isang kilalang komersyal na sistema batay sa teknolohiya ng TM ay kasalukuyang binuo ng TRADOS system (itinatag noong 1984).

Sa kasalukuyan, ilang dosenang kumpanya ang bumubuo ng mga komersyal na sistema ng pagsasalin ng makina, kabilang ang: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata Software; Linguistica b.v. at iba pa. Ngayon ay maaari mong gamitin ang mga serbisyo ng mga awtomatikong tagasalin nang direkta sa Web: alphaWorks; Online na Tagasalin ng PROMT; LogoMedia.net; Serbisyo sa Pagsasalin ng Babel Fish ng AltaVista; InfiniT.com; Pagsasalin ng Internet.

Ang mga komersyal na epektibong sistema ng pagsasalin ay lumitaw din sa ikalawang kalahati ng dekada 80 sa ating bansa. Ang mismong konsepto ng machine translation ay lumawak (nagsimula itong isama ang "paglikha ng isang bilang ng mga awtomatiko at automated na system at device na awtomatiko o semi-awtomatikong nagsasagawa ng buong ikot ng pagsasalin o mga indibidwal na gawain sa isang dialogue sa isang tao"), at tumaas ang laang-gugulin ng pamahalaan para sa pagpapaunlad ng industriyang ito.

Ang Russian, English, German, French at Japanese ay naging pangunahing wika ng mga domestic translation system. Ang All-Union Translation Center (VTsP) ay bumuo ng isang sistema para sa pagsasalin mula sa English at German sa Russian sa isang computer na ES-1035 -ANRAP. Binubuo ito ng tatlong diksyunaryo - input English at German at output Russian - sa ilalim ng isang software. Mayroong ilang mga pinapalitan na dalubhasang diksyunaryo - sa teknolohiya ng computer, programming, radio electronics, mechanical engineering, agrikultura, metalurhiya. Maaaring gumana ang system sa dalawang mode - awtomatiko at interactive, kapag ipinakita ng screen ang pinagmulang teksto at pagsasalin sa bawat parirala, na maaaring i-edit ng isang tao. Ang bilis ng pagsasalin ng teksto sa ANRAP (mula sa simula ng pag-type hanggang sa katapusan ng pag-print) ay humigit-kumulang 100 mga pahina bawat oras.

Noong 1989, nilikha ang isang pamilya ng mga komersyal na tagasalin ng uri ng SPRINT, nagtatrabaho sa Russian, English, German at Japanese. Ang kanilang pangunahing bentahe ay ang kanilang pagiging tugma sa IBM PC - kaya, ang mga domestic machine translation system ay umabot sa internasyonal na antas ng kalidad. Kasabay nito, ang isang sistema ng pagsasalin ng makina mula sa Pranses sa Russian FRAP ay binuo, na kinabibilangan ng 4 na yugto ng pagsusuri ng teksto: graphematic, morphological, syntactic at semantic. Sa LGPI sila. Herzen, ang trabaho ay isinasagawa sa isang apat na wika (Ingles, Pranses, Espanyol, Ruso) na sistemang SILOD-MP (Ingles-Russian at Franco-Russian na mga diksyunaryo ay ginamit sa industriyal na mode.

Para sa espesyal na pagsasalin ng mga teksto sa electrical engineering, umiral ang ETAP-2 system. Ang pagsusuri ng input text dito ay isinagawa sa dalawang antas - morphological at syntactic. Ang diksyunaryo ng ETAP-2 ay naglalaman ng humigit-kumulang 4 na libong mga entry; ang yugto ng pagbabago ng teksto - humigit-kumulang 1000 panuntunan (96 pangkalahatan, 342 pribado, ang iba ay diksyunaryo). Tiniyak ng lahat ng ito ang isang kasiya-siyang kalidad ng pagsasalin (halimbawa, ang pamagat ng patent na "Optical phase grid arrangement at coupling device na may ganoong arrangement" ay isinalin bilang "Isang optical phase grid device at isang connecting device na may ganoong device" - sa kabila ng ang tautolohiya, ang kahulugan ay napanatili).

Sa Minsk Pedagogical Institute of Foreign Languages, sa batayan ng English-Russian na diksyunaryo ng mga form at parirala ng salita, isang sistema para sa pagsasalin ng makina ng mga pamagat ay naimbento, sa Institute of Oriental Studies ng Academy of Sciences - isang sistema para sa pagsasalin. mula sa Hapon tungo sa Ruso. Ang unang awtomatikong serbisyo sa bokabularyo at terminolohiya (SLOTHERM) para sa computing at programming, na nilikha sa Moscow Research Institute of Automation Systems, ay naglalaman ng humigit-kumulang 20,000 termino sa isang paliwanag na diksyunaryo at mga espesyal na diksyunaryo para sa linguistic na pananaliksik.

Ang mga sistema ng pagsasalin ng makina ay unti-unting nagsimulang gamitin hindi lamang para sa kanilang nilalayon na layunin, ngunit bilang isang mahalagang bahagi ng mga awtomatikong sistema ng pag-aaral (para sa pagtuturo ng pagsasalin, pagsuri sa spelling at kaalaman sa gramatika).

Ang dekada 90 ay nagdala ng mabilis na pag-unlad ng merkado ng PC (mula sa desktop hanggang sa bulsa) at teknolohiya ng impormasyon, ang malawakang paggamit ng Internet (na nagiging mas internasyonal at multilinggwal). Ang lahat ng ito ay ginawa ang karagdagang pag-unlad ng mga awtomatikong sistema ng pagsasalin sa demand. Mula noong unang bahagi ng 1990s Ang mga domestic developer ay pumapasok din sa merkado ng mga sistema ng PC.

Noong Hulyo 1990, ang unang komersyal na sistema ng pagsasalin ng makina sa Russia na tinatawag na PROMT (Programmer's Machine Translation) ay ipinakita sa PC Forum sa Moscow. Nanalo ang PROMT sa kumpetisyon ng NASA para sa supply ng mga MP system (PROMT ang tanging kumpanyang hindi Amerikano dito. noong 1992, naglabas ang PROMT ng isang buong pamilya ng mga system sa ilalim ng bagong pangalan na STYLUS para sa pagsasalin mula sa English, German, French, Italian at Spanish sa Russian at mula sa Russian sa English, at ang unang machine translation system para sa Windows ay nilikha noong ang batayan ng STYLUS noong 1993. Noong 1994, inilabas ang STYLUS 2.0 para sa Windows 3.X/95/NT, at noong 1995-1996 ang ikatlong henerasyon ng mga machine translation system, ganap na 32-bit STYLUS 3.0 para sa Windows 95/NT, habang matagumpay na nakumpleto ang pagbuo ng ganap na bago, ang unang Russian-German at Russian-French na sistema ng pagsasalin ng makina sa mundo.

Noong 1997, nilagdaan ang isang kasunduan sa kumpanyang Pranses na Softissimo sa paglikha ng mga sistema ng pagsasalin mula sa Pranses sa Aleman at Ingles at sa kabaligtaran, at noong Disyembre ng taong ito, ang unang sistema ng pagsasalin ng Aleman-Pranses sa mundo ay inilabas. Sa parehong taon, ang kumpanya ng PROMT ay naglabas ng isang sistema na ipinatupad gamit ang Giant na teknolohiya, na sumusuporta sa ilang mga direksyon ng wika sa isang shell, pati na rin ang isang espesyal na tagasalin para sa pagtatrabaho sa Internet WebTranSite.

Noong 1998, isang buong konstelasyon ng mga programa ang inilabas sa ilalim ng bagong pangalan na PROMT 98. Pagkalipas ng isang taon, naglabas ang PROMT ng dalawang bagong produkto: isang natatanging software package para sa pagtatrabaho sa Internet - PROMT Internet, at isang tagasalin para sa mga corporate mail system - PROMT Mail Tagasalin. Noong Nobyembre 1999, kinilala ang PROMT bilang ang pinakamahusay na sistema ng pagsasalin ng makina na nasubok ng French magazine na PC Expert, na nalampasan ang mga katunggali nito ng 30 porsiyento. Ang mga espesyal na solusyon sa server ay binuo din para sa mga kliyente ng korporasyon - ang corporate translation server na PROMT Translation Server (PTS) at ang Internet solution na PROMT Internet Translation Server (PITS). Noong 2000, in-update ng PROMT ang buong linya ng mga produkto ng software sa pamamagitan ng pagpapalabas ng bagong henerasyon ng mga MT system: PROMT Translation Office 2000, PROMT Internet 2000 at Magic Gooddy 2000.

Ang online na pagsasalin na may suporta ng sistema ng PROMT ay ginagamit sa isang bilang ng mga domestic at dayuhang site: Online Translator ng PROMT, InfiniT.com, Translate.Ru, Lycos, atbp., pati na rin sa mga institusyon ng iba't ibang mga profile para sa pagsasalin ng mga dokumento ng negosyo, mga artikulo at liham (may mga translation system na direktang binuo sa Outlook Express at iba pang email client).

Sa ngayon, umuusbong ang mga bagong teknolohiya sa pagsasalin ng makina batay sa paggamit ng mga artificial intelligence system at mga istatistikal na pamamaraan. Ang huli ay tinalakay sa susunod na seksyon.

2.2 Mga pamamaraan ng istatistika sa pag-aaral ng wika

Malaking atensyon sa modernong linggwistika ang ibinibigay sa pag-aaral ng linguistic phenomena gamit ang mga pamamaraan ng quantitative mathematics. Madalas na nakakatulong ang quantitative data upang mas malalim na maunawaan ang mga phenomena na pinag-aaralan, ang kanilang lugar at papel sa sistema ng mga kaugnay na phenomena. Ang sagot sa tanong na "magkano" ay nakakatulong upang masagot ang mga tanong na "ano", "paano", "bakit" - ganyan ang heuristic na potensyal ng isang quantitative na katangian.

Ang mga pamamaraan ng istatistika ay may mahalagang papel sa pagbuo ng mga sistema ng pagsasalin ng makina (tingnan ang seksyon 2.1). Sa istatistikal na diskarte, ang problema sa pagsasalin ay isinasaalang-alang sa mga tuntunin ng isang maingay na channel. Isipin na kailangan nating isalin ang isang pangungusap mula sa Ingles sa Russian. Ang prinsipyo ng maingay na channel ay nag-aalok sa amin ng sumusunod na paliwanag ng kaugnayan sa pagitan ng isang Ingles at isang Russian na pangungusap: ang isang English na pangungusap ay walang iba kundi isang Russian na pangungusap na binaluktot ng ilang uri ng ingay. Upang mabawi ang orihinal na pangungusap na Ruso, kailangan nating malaman kung ano ang karaniwang sinasabi ng mga tao sa Russian at kung paano binaluktot ang mga pariralang Ruso sa Ingles. Isinasagawa ang pagsasalin sa pamamagitan ng paghahanap para sa gayong pangungusap na Ruso na nagpapalaki sa mga produkto ng walang kondisyong posibilidad ng pangungusap na Ruso at ang posibilidad ng pangungusap sa Ingles (orihinal) na ibinigay sa ibinigay na pangungusap na Ruso. Ayon sa teorama ni Bayes, ang Russian na pangungusap na ito ay ang pinaka-malamang na pagsasalin ng Ingles:

kung saan ang e ay ang pagsasalin ng pangungusap at ang f ay ang orihinal na pangungusap

Kaya kailangan namin ng isang modelo ng pinagmulan at isang modelo ng channel, o isang modelo ng wika at isang modelo ng pagsasalin. Ang modelo ng wika ay dapat magtalaga ng marka ng posibilidad sa anumang pangungusap sa target na wika (sa aming kaso, Russian), at ang modelo ng pagsasalin sa orihinal na pangungusap. (tingnan ang talahanayan 1)

Sa pangkalahatan, gumagana ang isang machine translation system sa dalawang mode:

1. Pagsasanay sa system: isang training corpus ng mga parallel na teksto ay kinuha, at gamit ang linear programming, ang mga naturang value ng translation correspondence table ay hinahanap na nagpapalaki sa posibilidad ng (halimbawa) ang Russian na bahagi ng corpus na may available na English ayon sa sa napiling modelo ng pagsasalin. Ang isang modelo ng wikang Ruso ay itinayo sa bahaging Ruso ng parehong corpus.

2. Pagsasamantala: batay sa nakuhang data para sa isang hindi pamilyar na pangungusap sa Ingles, hinahanap ang isang Ruso na nagpapalaki sa produkto ng mga probabilidad na itinalaga ng modelo ng wika at modelo ng pagsasalin. Ang program na ginagamit para sa naturang paghahanap ay tinatawag na decoder.

Ang pinakasimpleng modelo ng pagsasalin ng istatistika ay ang modelo ng literal na pagsasalin. Sa modelong ito, ipinapalagay na upang isalin ang isang pangungusap mula sa isang wika patungo sa isa pa, sapat na upang isalin ang lahat ng mga salita (lumikha ng isang "bag ng mga salita"), at ibibigay ng modelo ang kanilang pagkakalagay sa tamang pagkakasunud-sunod. Upang mabawasan P(a, f | e) hanggang P(a | e , f), i.e. mga probabilidad ng isang naibigay na pagkakahanay na binigyan ng isang pares ng mga pangungusap, ang bawat probabilidad na P(a, f | e) ay na-normalize ng kabuuan ng mga probabilidad ng lahat ng pagkakahanay ng isang ibinigay na pares ng mga pangungusap:

Ang pagpapatupad ng Viterbi algorithm na ginamit upang sanayin ang Modelo #1 ay ang mga sumusunod:

1. Ang buong talahanayan ng mga probabilidad ng pagsusulatan sa pagsasalin ay puno ng parehong mga halaga.

2. Para sa lahat ng posibleng variant ng magkapares na koneksyon ng mga salita, ang posibilidad na P(a, f | e) ay kinakalkula:

3. Ang mga halaga ng P(a, f | e) ay na-normalize upang makuha ang mga halaga ng P(a | e, f).

4. Ang dalas ng bawat pares ng pagsasalin ay kinakalkula, na tinimbang ayon sa posibilidad ng bawat opsyon sa pagkakahanay.

5. Ang mga resultang weighted frequency ay na-normalize at bumubuo ng isang bagong talahanayan ng mga probabilidad ng pagsusulatan sa pagsasalin

6. Ulitin ang algorithm mula sa hakbang 2.

Isaalang-alang, bilang halimbawa, ang pagsasanay ng isang katulad na modelo sa isang corpus ng dalawang pares ng mga pangungusap (Larawan 2):

puting bahay


Pagkatapos ng isang malaking bilang ng mga pag-ulit, makakakuha tayo ng isang talahanayan (Talahanayan 2), na nagpapakita na ang pagsasalin ay isinasagawa nang may mataas na katumpakan.


Gayundin, malawakang ginagamit ang mga pamamaraang istatistika sa pag-aaral ng bokabularyo, morpolohiya, syntax, at istilo. Ang mga siyentipiko mula sa Perm State University ay nagsagawa ng isang pag-aaral batay sa assertion na ang mga stereotypical na parirala ay isang mahalagang "building material" ng teksto. Binubuo ang mga pariralang ito ng "nuclear" na paulit-ulit na mga salita at mga dependent na salita-specifier at may binibigkas na pang-istilong pangkulay.

Sa istilong pang-agham, ang mga salitang "nuklear" ay maaaring tawaging: pananaliksik, pag-aaral, gawain, suliranin, tanong, kababalaghan, katotohanan, pagmamasid, pagsusuri atbp. Sa pamamahayag, ang ibang mga salita ay magiging "nuklear", na may tumaas na halaga partikular para sa teksto ng pahayagan: oras, tao, kapangyarihan, negosyo, aksyon, batas, buhay, kasaysayan, lugar atbp. (kabuuan 29)

Ang partikular na interes ng mga linguist ay ang propesyonal na pagkakaiba-iba ng pambansang wika, ang kakaibang paggamit ng bokabularyo at gramatika, depende sa uri ng hanapbuhay. Ito ay kilala na ang mga driver sa propesyonal na pagsasalita ay gumagamit ng form w tungkol sa fer, sabi ng mga medics k tungkol sa club sa halip na cocktail Yu sh - maaaring ibigay ang mga ganitong halimbawa. Ang gawain ng mga istatistika ay subaybayan ang pagkakaiba-iba ng pagbigkas at ang pagbabago sa pamantayan ng wika.

Ang mga pagkakaiba sa propesyonal ay humantong sa mga pagkakaiba hindi lamang sa gramatika, kundi pati na rin sa leksikal. Ipinangalan ang Yakut State University M.K. Ammosov, 50 mga talatanungan ay nasuri na may pinakakaraniwang mga reaksyon sa ilang mga salita sa mga manggagamot at tagabuo (Talahanayan 3).

Mga tagabuo

Tao

pasyente (10), personalidad (5)

lalaki (5)

mabuti

tulong (8), tulong (7)

masama (16)

isang buhay

kamatayan (10)

maganda (5)

kamatayan

bangkay (8)

buhay (6)

ang apoy

init (8), paso (6)

apoy (7)

daliri

kamay (14), panaritium (5)

malaki (7), index (6)

mata

paningin (6), mag-aaral, ophthalmologist (5 bawat isa)

kayumanggi (10), malaki (6)

ulo

isip (14), utak (5)

malaki (9), matalino (8), matalino (6)

matalo

kamalayan, buhay (4 bawat isa)

pera (5), hanapin (4)


Mapapansing mas madalas ang mga manggagamot kaysa sa mga tagabuo ay nagbibigay ng mga asosasyon na may kaugnayan sa kanilang mga propesyonal na aktibidad, dahil ang mga salitang pampasigla na ibinigay sa talatanungan ay may higit na kinalaman sa kanilang propesyon kaysa sa propesyon ng isang tagabuo.

Ang mga istatistikal na regularidad sa isang wika ay ginagamit upang lumikha ng mga diksyunaryo ng dalas - mga diksyunaryo na nagbibigay ng mga numerical na katangian ng dalas ng mga salita (mga anyo ng salita, mga parirala) ng anumang wika - ang wika ng manunulat, anumang akda, atbp. Karaniwan, ang dalas ng paglitaw ng ang isang salita ay ginagamit bilang isang katangian ng paglitaw ng isang salita sa teksto ng isang tiyak na volume

Ang modelo ng speech perception ay imposible nang walang diksyunaryo bilang mahalagang bahagi nito. Sa pang-unawa ng pagsasalita, ang pangunahing yunit ng pagpapatakbo ay ang salita. Mula rito, sa partikular, ang bawat salita ng pinaghihinalaang teksto ay dapat matukoy sa kaukulang yunit ng panloob na bokabularyo ng tagapakinig (o mambabasa). Natural lang na ipagpalagay na sa simula pa lang ang paghahanap ay limitado sa ilang subdomain ng diksyunaryo. Ayon sa karamihan sa mga modernong teorya ng speech perception, ang aktwal na phonetic analysis ng tunog na teksto sa isang tipikal na kaso ay nagbibigay lamang ng ilang bahagyang impormasyon tungkol sa posibleng phonological na hitsura ng salita, at ang ganitong uri ng impormasyon ay tumutugma sa hindi isa, ngunit isang tiyak na MARAMING salita. ng diksyunaryo; Samakatuwid, dalawang problema ang lumitaw:

(a) piliin ang naaangkop na hanay ayon sa ilang mga parameter;

(b) sa loob ng mga hangganan ng nakabalangkas na hanay (kung ito ay inilalaan nang sapat) upang "tanggalin" ang lahat ng mga salita, maliban sa isa lamang na pinakamahusay na tumutugma sa ibinigay na salita ng kinikilalang teksto. Isa sa mga diskarte sa "pag-dropout" ay ang pagbubukod ng mga mababang-dalas na salita. Ito ay sumusunod na ang bokabularyo para sa speech perception ay isang frequency dictionary. Ito ay ang paglikha ng isang bersyon ng computer ng dalas ng diksyunaryo ng wikang Ruso na ang unang gawain ng ipinakita na proyekto.

Batay sa materyal ng wikang Ruso, mayroong 5 mga diksyunaryo ng dalas (hindi binibilang ang mga diksyunaryo ng sangay). Pansinin lamang natin ang ilang pangkalahatang pagkukulang ng umiiral na mga diksyunaryo.

Ang lahat ng kilalang diksyonaryo ng dalas ng wikang Ruso ay batay sa pagproseso ng mga arrays ng nakasulat (naka-print) na mga teksto. Bahagyang para sa kadahilanang ito, kapag ang pagkakakilanlan ng isang salita ay higit na nakabatay sa pormal, graphical na pagkakataon, ang semantika ay hindi sapat na isinasaalang-alang. Bilang isang resulta, ang mga katangian ng dalas ay inilipat din, nabaluktot; halimbawa, kung ang compiler ng frequency dictionary ay nagsasama ng mga salita mula sa kumbinasyong "isa't isa" sa pangkalahatang istatistika ng paggamit ng salitang "kaibigan", kung gayon ito ay halos hindi makatwiran: dahil sa mga semantika, dapat nating aminin na ang mga ito ay na ibang mga salita, o sa halip, na ang isang independiyenteng yunit ng diksyunaryo ay kumbinasyon lamang sa kabuuan.

Gayundin, sa lahat ng umiiral na mga diksyunaryo, ang mga salita ay inilalagay lamang sa kanilang mga pangunahing anyo: mga pangngalan sa isahan na anyo, nominative case, mga pandiwa sa infinitive na anyo, atbp. Ang ilan sa mga diksyunaryo ay nagbibigay ng impormasyon tungkol sa dalas ng mga anyo ng salita, ngunit kadalasan ay hindi nila ito ginagawa nang pare-pareho nang sapat, hindi sa isang kumpletong paraan. Ang mga frequency ng iba't ibang anyo ng salita ng parehong salita ay halatang hindi tugma. Dapat isaalang-alang ng developer ng isang speech perception model na sa isang tunay na proseso ng perceptual, ito ay tiyak na isang tiyak na anyo ng salita na "nalulubog" sa teksto na napapailalim sa pagkilala: batay sa pagsusuri ng paunang seksyon ng exponent ng anyo ng salita, nabuo ang isang hanay ng mga salita na may magkaparehong simula, at ang paunang seksyon ng anyo ng salita ay hindi kinakailangang magkapareho sa paunang seksyon ng anyo ng diksyunaryo . Ito ay ang anyo ng salita na may isang tiyak na ritmikong istraktura, na isa ring napakahalagang parameter para sa perceptual na pagpili ng mga salita. Sa wakas, sa huling representasyon ng kinikilalang pagbigkas, muli, ang mga salita ay kinakatawan ng kaukulang mga anyo ng salita.

Maraming mga gawa na nagpapakita ng kahalagahan ng dalas sa proseso ng pagdama sa pagsasalita. Ngunit hindi namin alam ang mga gawa kung saan gagamitin ang dalas ng mga anyo ng salita - sa kabaligtaran, halos hindi binabalewala ng lahat ng may-akda ang dalas ng mga indibidwal na anyo ng salita, na eksklusibong tumutukoy sa mga lexemes. Kung ang mga resultang nakuha ng mga ito ay hindi itinuturing na artifact, kailangang ipagpalagay na ang katutubong nagsasalita sa anumang paraan ay may access sa impormasyon tungkol sa ratio ng mga frequency ng mga anyo ng salita at mga anyo ng diksyunaryo, ibig sabihin, sa katunayan, mga lexemes. Bukod dito, ang gayong paglipat mula sa isang anyo ng salita patungo sa isang lexeme, siyempre, ay hindi maipaliwanag ng natural na kaalaman sa kaukulang paradigm, dahil ang impormasyon ng dalas ay dapat gamitin bago ang pangwakas na pagkakakilanlan ng salita, kung hindi man ay nawawalan lamang ito ng kahulugan.

Ayon sa pangunahing istatistikal na katangian, posibleng matukoy gamit ang isang naibigay na kamag-anak na error na bahagi ng bokabularyo, na kinabibilangan ng mga salitang may mataas na dalas ng paglitaw, anuman ang uri ng teksto. Posible rin, sa pamamagitan ng pagpapasok ng sunud-sunod na pag-order sa diksyunaryo, upang makakuha ng isang serye ng mga diksyunaryo na sumasaklaw sa unang 100, 1000, 5000, atbp. ng mga madalas na salita. Ang mga istatistikal na katangian ng diksyunaryo ay interesado na may kaugnayan sa semantikong pagsusuri ng bokabularyo. Ang pag-aaral ng mga paksa-ideolohikal na grupo at mga larangang semantiko ay nagpapakita na ang mga lexical na asosasyon ay sinusuportahan ng mga semantikong link na nakatutok sa mga lexemes na may pinakakaraniwang kahulugan. Ang paglalarawan ng mga kahulugan sa loob ng patlang ng lexico-semantic ay maaaring isagawa sa pamamagitan ng pagtukoy ng mga salitang may pinakamaraming abstract na lexemes sa kahulugan. Tila, ang mga yunit ng diksyunaryo na "walang laman" (mula sa punto ng view ng mga nominative potencies) ay bumubuo ng isang homogenous na layer na ayon sa istatistika.

Ang mga bokabularyo para sa mga indibidwal na genre ay hindi gaanong mahalaga. Ang pag-aaral sa sukat ng kanilang pagkakapareho at ang likas na katangian ng mga distribusyon ng istatistika ay magbibigay ng kawili-wiling impormasyon tungkol sa qualitative stratification ng bokabularyo depende sa saklaw ng paggamit ng pagsasalita.

Ang pagsasama-sama ng malalaking dalas ng mga diksyunaryo ay nangangailangan ng paggamit ng teknolohiya ng computer. Ang pagpapakilala ng bahagyang mekanisasyon at automation sa proseso ng paggawa sa isang diksyunaryo ay kawili-wili bilang isang eksperimento sa pagproseso ng makina ng mga diksyunaryo para sa iba't ibang mga teksto. Ang ganitong diksyunaryo ay nangangailangan ng mas mahigpit na sistema para sa pagproseso at pag-iipon ng materyal sa bokabularyo. Sa miniature, ito ay isang information retrieval system na nakapagbibigay ng impormasyon tungkol sa iba't ibang aspeto ng teksto at bokabularyo. Ang ilang mga pangunahing kahilingan sa system na ito ay pinaplano mula pa sa simula: ang kabuuang bilang ng mga salita sa imbentaryo, ang mga istatistikal na katangian ng isang salita at buong mga diksyunaryo, ang pag-order ng madalas at bihirang mga zone ng diksyunaryo, atbp. Ang machine card file ay nagbibigay-daan sa iyo upang awtomatikong bumuo ng mga reverse na diksyunaryo para sa mga indibidwal na genre at pinagmulan. Maraming iba pang kapaki-pakinabang na istatistikal na impormasyon tungkol sa wika ang kukunin mula sa naipon na hanay ng impormasyon. Ang diksyunaryo ng dalas ng computer ay lumilikha ng isang pang-eksperimentong batayan para sa paglipat sa isang mas malawak na automation ng gawaing bokabularyo.

Ang data ng istatistika ng mga diksyonaryo ng dalas ay maaari ding malawakang magamit sa paglutas ng iba pang mga problema sa lingguwistika - halimbawa, sa pagsusuri at pagtukoy ng aktibong paraan ng pagbuo ng salita ng modernong wikang Ruso, paglutas ng mga isyu ng pagpapabuti ng mga graphics at spelling, na nauugnay sa pagsasaalang-alang. istatistikal na impormasyon tungkol sa bokabularyo (mahalagang isaalang-alang ang mga probabilistikong katangian ng mga kumbinasyon ng grapheme, mga uri ng mga kumbinasyon ng titik na natanto sa mga salita), praktikal na transkripsyon at transliterasyon. Ang mga istatistikal na parameter ng diksyunaryo ay magiging kapaki-pakinabang din sa paglutas ng mga problema sa pag-automate ng pag-type, pagkilala at awtomatikong pagbabasa ng literal na teksto.

Ang mga modernong paliwanag na diksyonaryo at gramatika ng wikang Ruso ay pangunahing itinayo batay sa panitikan at masining na mga teksto. May mga frequency na diksyunaryo ng wika ng A.S. Pushkin, A.S. Griboedova, F.M. Dostoevsky, V.V. Vysotsky at marami pang ibang may-akda. Sa Kagawaran ng Kasaysayan at Teorya ng Panitikan ng Estado ng Smolensk. Ang Pedagogical University ay nagtatrabaho sa loob ng ilang taon upang mag-compile ng mga frequency na diksyunaryo ng mga tekstong patula at prosa. Para sa pag-aaral na ito, napili ang mga diksyonaryo ng dalas ng lahat ng mga liriko ng Pushkin at dalawa pang makata ng ginintuang edad - "Woe from Wit" ni Griboedov at lahat ng tula ni Lermontov; Pasternak at limang iba pang makata ng Panahon ng Pilak - Balmont 1894-1903, "Mga Tula tungkol sa Magandang Babae" ni Blok, "Bato" ni Mandelstam, "Haligi ng Apoy" ni Gumilyov, "Anno Domini MCMXXI" ni Akhmatova at "Mga Sister ng Ang Aking Buhay" ni Pasternak at apat pang makata ng Panahon ng Bakal - "Mga Tula ni Yuri Zhivago", "Kapag lumiwanag", ang buong corpus ng lyrics ni M. Petrovs, "Malayo ang kalsada", "Windshield", "Paalam sa snow" at "Horseshoes" ni Mezhirov, "Antimirov" ni Voznesensky at "Snowballs" » Rylenkova.

Dapat pansinin na ang mga diksyunaryo na ito ay naiiba sa likas na katangian: ang ilan ay kumakatawan sa bokabularyo ng isang dramatikong gawain, ang iba - mga libro ng lyrics, o ilang mga libro, o ang buong corpus ng mga tula ng makata. Ang mga resulta ng pagsusuri na ipinakita sa papel na ito ay dapat gawin nang may pag-iingat, hindi sila maaaring kunin bilang isang ganap. Gayunpaman, sa tulong ng mga espesyal na hakbang, ang pagkakaiba sa ontological na kalikasan ng mga teksto ay maaaring mabawasan sa isang tiyak na lawak.

Sa mga nagdaang taon, ang pagsalungat sa pagitan ng kolokyal at pagsasalita sa libro ay naging mas malinaw na natanto. Ang isyung ito ay lalong matalas na tinalakay sa mga metodologo na humihingi ng turn sa pagtuturo patungo sa sinasalitang wika. Gayunpaman, ang pagtitiyak ng kolokyal na pananalita ay nananatiling hindi maipaliwanag.

Ang mga diksyunaryo ay naproseso sa pamamagitan ng paglikha ng isang user application sa kapaligiran ng EXCEL97 office program. Kasama sa application ang apat na worksheet ng EXCEL book - "Title Sheet", "Dictionaries" sheet na may paunang data, "Proximity" at "Distansya" na may mga resulta, pati na rin ang isang set ng mga macro.

Ang paunang impormasyon ay ipinasok sa sheet na "Mga Diksyunaryo". Ang mga diksyunaryo ng mga pinag-aralan na teksto ay isinusulat sa mga selulang EXCEL, ang huling hanay na S ay nabuo mula sa mga resultang nakuha at katumbas ng bilang ng mga salita na matatagpuan sa ibang mga diksyunaryo. Ang mga talahanayan na "Proximity" at "Mga Distansya" ay naglalaman ng mga kalkuladong sukat ng proximity M, correlation R at distansya D.

Ang application macros ay mga event-based programming procedures na nakasulat sa Visual Basic for Application (VBA). Ang mga pamamaraan ay batay sa mga bagay sa library ng VBA at ang kanilang mga pamamaraan sa pagproseso. Kaya, para sa mga pagpapatakbo na may mga worksheet ng application, ang pangunahing bagay na Worksheet (worksheet) at ang kaukulang paraan ng pag-activate ng sheet na Activate (activate) ay ginagamit. Ang pagtatakda ng hanay ng nasuri na source data sa Dictionary sheet ay isinasagawa sa pamamagitan ng Select method ng Range object (range), at ang paglilipat ng mga salita bilang mga value sa mga variable ay ginagawa bilang Value property (value) ng parehong Range bagay.

Sa kabila ng katotohanan na ang pagsusuri ng ugnayan ng ranggo ay nagpapaingat sa atin tungkol sa pag-asa ng mga paksa sa pagitan ng iba't ibang mga teksto, karamihan sa mga pinakamadalas na salita sa bawat teksto ay may mga tugma sa isa o higit pang mga teksto. Ipinapakita ng Column S ang bilang ng mga naturang salita sa 15 pinakamadalas na salita para sa bawat may-akda. Ang mga salitang naka-bold ay makikita lamang sa isang salita ng makata sa aming talahanayan. Ang Blok, Akhmatova at Petrovs ay walang mga naka-highlight na salita, mayroon silang S = 15. Ang tatlong makata na ito ay may parehong 15 na pinakamadalas na salita, naiiba lamang sila sa lugar sa listahan. Ngunit kahit na si Pushkin, na ang bokabularyo ay ang pinaka orihinal, ay may S = 8, at mayroong 7 naka-highlight na salita.

Ang mga resulta ay nagpapakita na mayroong isang tiyak na layer ng bokabularyo na tumutok sa mga pangunahing tema ng tula. Bilang isang tuntunin, ang mga salitang ito ay maikli: mula sa kabuuang bilang (225) ng solong pantig na paggamit ng salita 88, dalawang pantig 127, tatlong pantig 10. Kadalasan ang mga salitang ito ay kumakatawan sa mga pangunahing mitolohiya at maaaring magkapares: gabi - araw, lupa - langit (araw), Diyos - tao (tao), buhay - kamatayan, katawan - kaluluwa, Roma - mundo(sa Mandelstam); maaaring pagsamahin sa mga mythologem ng mas mataas na antas: langit, bituin, araw, lupa; sa isang tao, bilang panuntunan, ang katawan, puso, dugo, braso, binti, pisngi, mata ay namumukod-tangi. Sa mga estado ng tao, ang kagustuhan ay ibinibigay sa pagtulog at pag-ibig. Ang bahay at lungsod ay nabibilang sa mundo ng tao - Moscow, Roma, Paris. Ang pagkamalikhain ay kinakatawan ng mga lexemes salita at kanta.

Sina Griboedov at Lermontov ay halos walang mga salita na nagsasaad ng kalikasan sa mga madalas na salita. Mayroon silang tatlong beses na mas maraming mga salita na nagsasaad ng isang tao, mga bahagi ng kanyang katawan, mga elemento ng kanyang espirituwal na mundo. Pushkin at mga makata ng ikadalawampu siglo. ang mga pagtatalaga ng tao at kalikasan ay humigit-kumulang pantay. Sa mahalagang aspetong ito ng paksa, masasabi nating ang ikadalawampu siglo. sumunod kay Pushkin.

Minimal na Tema kaso kabilang sa mga pinaka-madalas na salita, ito ay matatagpuan lamang sa Griboyedov at Pushkin. Lermontov at mga makata ng ikadalawampu siglo. nagbibigay daan ito sa isang minimal na tema salita. Ang salita ay hindi ibinubukod ang mga gawa (ang biblikal na interpretasyon ng paksa: sa Bagong Tipan, ang lahat ng mga turo ni Jesucristo ay itinuturing na salita ng Diyos o salita ni Jesus, at kung minsan ay tinatawag ng mga apostol ang kanilang sarili na mga ministro ng Salita). Ang sagradong kahulugan ng salitang lexeme ay nakakumbinsi na ipinakita, halimbawa, sa taludtod ni Pasternak na "At ang imahe ng mundo, na inihayag sa Salita." Ang sagradong kahulugan ng lexeme salita kasabay ng at kaibahan sa mga gawain ng tao, ito ay nakakumbinsi na ipinakita sa tula ng parehong pangalan ni Gumilyov.

Ang mga token na matatagpuan lamang sa isang teksto ay nagpapakilala sa pagka-orihinal ng isang partikular na aklat o isang koleksyon ng mga aklat. Halimbawa, ang salitang "isip" ang pinakamadalas sa komedya ni Griboedov na "Woe from Wit" - ngunit hindi ito nangyayari sa mga pinakamadalas na salita sa ibang mga teksto. Ang tema ng isip ang pinakamahalaga sa komedya. Ang lexeme na ito ay kasama ng imahe ng Chatsky, at ang pangalan ng Chatsky ay ang pinakamadalas sa komedya. Kaya, ang gawain ay organikong pinagsama ang pinakamadalas na karaniwang pangngalan na may pinakamadalas na pangngalang pantangi.

Ang pinakamataas na koepisyent ng ugnayan ay nag-uugnay sa mga tema ng mga trahedya na aklat na "The Pillar of Fire" ni Gumilyov at "Anno Domini MCMXXI" ni Akhmatova. Sa 15 pinakamadalas na pangngalan, mayroong 10 pangkaraniwan, kabilang ang dugo, puso, kaluluwa, pag-ibig, salita, langit. Alalahanin na ang aklat ni Akhmatova ay may kasamang isang miniature na "Hindi ka mabubuhay ...", na isinulat sa pagitan ng pag-aresto kay Gumilyov at ng kanyang pagpatay.

Ang mga tema ng kandila at ang karamihan ng tao sa pinag-aralan na materyal ay matatagpuan lamang sa "Mga Tula ni Yuri Zhivago". Ang tema ng kandila sa mga talata mula sa nobela ay may maraming kontekstwal na kahulugan: nauugnay ito sa imahe ni Jesucristo, na may mga tema ng pananampalataya, kawalang-kamatayan, pagkamalikhain, petsa ng pag-ibig. Ang kandila ang pinakamahalagang pinagmumulan ng liwanag sa mga sentral na eksena ng nobela. Ang tema ng karamihan ay bubuo na may kaugnayan sa pangunahing ideya ng nobela, kung saan ang pribadong buhay ng isang tao na may hindi matitinag na mga halaga ay salungat sa imoralidad ng bagong estado, na binuo sa mga prinsipyo ng pagpapasaya sa karamihan. .

Kasama rin sa gawain ang ikatlong yugto, na makikita rin sa programa - ito ang pagkalkula ng pagkakaiba sa mga ordinal na bilang ng mga salita na karaniwan sa dalawang diksyunaryo at ang average na distansya sa pagitan ng parehong mga salita ng dalawang diksyunaryo. Ang yugtong ito ay nagbibigay-daan sa paglipat mula sa mga pangkalahatang uso sa pakikipag-ugnayan ng mga diksyunaryo na natukoy sa tulong ng mga istatistika tungo sa isang antas na papalapit sa teksto. Halimbawa, ang mga libro ng Gumilyov at Akhmatova ay makabuluhang nauugnay sa istatistika. Tinitingnan namin kung aling mga salita ang naging karaniwan para sa kanilang mga diksyonaryo, at, una sa lahat, pipiliin namin ang mga serial number na kaunti lang ang pagkakaiba o katumbas ng zero. Ang mga salitang ito ay may parehong bilang ng ranggo at, dahil dito, ang mga minimal na tema sa isipan ng dalawang makata ang parehong mahalaga. Susunod, dapat kang lumipat sa antas ng mga teksto at konteksto.

Nakakatulong din ang quantitative na pamamaraan upang pag-aralan ang mga katangian ng mga tao - mga katutubong nagsasalita. Sabihin, mayroong 6 na kaso sa Russian, walang mga kaso sa Ingles, at sa ilang mga wika ng mga mamamayan ng Dagestan, ang bilang ng mga kaso ay umabot sa 40. L. Perlovsky sa kanyang artikulong "Consciousness, Language and Culture" ay iniuugnay ang mga ito mga katangian na may ugali ng mga tao sa indibidwalismo o kolektibismo, na may pag-unawa sa mga bagay at phenomena nang hiwalay o may kaugnayan sa iba. Pagkatapos ng lahat, ito ay sa mundo na nagsasalita ng Ingles (walang mga kaso - ang bagay ay nakikita "sa pamamagitan ng kanyang sarili") na ang mga konsepto tulad ng indibidwal na kalayaan, liberalismo at demokrasya ay lumitaw (tandaan ko na ginagamit ko lamang ang mga konseptong ito na may kaugnayan sa wika, nang walang anumang mga katangian ng pagsusuri). Sa kabila ng katotohanan na ang gayong mga hula ay nananatili lamang sa antas ng mga matapang na pang-agham na hypotheses, nakakatulong silang tingnan ang mga pamilyar na phenomena sa isang bagong paraan.

Tulad ng nakikita natin, ang mga quantitative na katangian ay maaaring ilapat sa ganap na magkakaibang mga lugar ng linggwistika, na lalong lumalabo ang mga hangganan sa pagitan ng "eksakto" at "makatao" na mga pamamaraan. Ang linggwistika ay lalong gumagamit ng tulong hindi lamang sa matematika, kundi pati na rin sa teknolohiya ng kompyuter upang malutas ang mga problema nito.

2.3 Pag-aaral ng wika sa pamamagitan ng mga pamamaraan ng pormal na lohika

Sa mga di-quantitative na pamamaraan ng matematika, sa partikular, na may lohika, ang modernong teoretikal na lingguwistika ay nakikipag-ugnayan nang hindi gaanong mabunga kaysa sa dami. Ang mabilis na pag-unlad ng mga teknolohiya ng computer at ang paglago ng kanilang papel sa modernong mundo ay nangangailangan ng rebisyon ng diskarte sa pakikipag-ugnayan ng wika at lohika sa pangkalahatan.

Ang mga pamamaraan ng lohika ay malawakang ginagamit sa pagbuo ng mga pormal na wika, sa partikular, mga programming language, ang mga elemento nito ay ilang mga simbolo (katulad ng matematika), pinili (o binuo mula sa mga dating napiling simbolo) at binibigyang kahulugan sa isang tiyak na paraan, nauugnay. sa anumang "tradisyonal" na paggamit, pag-unawa at pag-unawa. mga function ng parehong mga simbolo sa ibang mga konteksto. Ang isang programmer ay patuloy na nakikitungo sa lohika sa kanyang trabaho. Ang kahulugan ng programming ay para lang turuan ang computer na mangatuwiran (sa pinakamalawak na kahulugan ng salita). Kasabay nito, ang mga pamamaraan ng "pangangatwiran" ay nagiging ibang-iba. Ang bawat programmer ay gumugugol ng ilang oras sa paghahanap ng mga bug sa kanilang sarili at sa mga programa ng ibang tao. Iyon ay, upang maghanap ng mga pagkakamali sa pangangatwiran, sa lohika. At nag-iiwan din ito ng marka. Mas madaling makakita ng mga lohikal na pagkakamali sa ordinaryong pagsasalita. Ang kamag-anak na pagiging simple ng mga wikang pinag-aralan ng mga logician ay nagbibigay-daan sa kanila na ipaliwanag ang mga istruktura ng mga wikang ito nang mas malinaw kaysa sa maabot ng mga linguist na nagsusuri ng eksklusibong kumplikadong mga natural na wika. Sa pagtingin sa katotohanan na ang mga wikang pinag-aralan ng mga logician ay gumagamit ng mga ugnayang kinopya mula sa mga natural na wika, ang mga logician ay nakakagawa ng makabuluhang kontribusyon sa pangkalahatang teorya ng wika. Ang sitwasyon dito ay katulad ng nangyayari sa pisika: ang physicist ay bumubuo rin ng mga theorems para sa perpektong pinasimple na mga kaso na hindi nangyayari sa kalikasan sa lahat - siya ay bumubuo ng mga batas para sa mga ideal na gas, perpektong likido, nagsasalita tungkol sa paggalaw sa kawalan ng friction, atbp. Para sa mga idealized na kaso na ito, maaaring magtatag ng mga simpleng batas na makatutulong nang malaki sa pag-unawa sa kung ano talaga ang nangyayari at kung ano ang malamang na mananatiling hindi alam sa physics kung sinubukan nitong isaalang-alang ang katotohanan nang direkta, sa lahat ng pagiging kumplikado nito.

Sa pag-aaral ng mga likas na wika, ang mga lohikal na pamamaraan ay ginagamit upang ang mga nag-aaral ng wika ay hindi "kabisaduhin" ng maraming salita hangga't maaari, ngunit mas maunawaan ang istraktura nito. Gumamit din si L. Shcherba sa kanyang mga lektura ng isang halimbawa ng pangungusap na binuo ayon sa mga batas ng wikang Ruso: "Ang isang kumikinang na kuzdra shteko ay nagboke ng bokra at nagkulot ng bokra," at pagkatapos ay tinanong ang mga estudyante kung ano ang ibig sabihin nito. Sa kabila ng katotohanan na ang kahulugan ng mga salita sa pangungusap ay nanatiling hindi malinaw (wala lang sila sa Russian), posible na malinaw na sagutin: "kuzdra" ang paksa, isang pambabae na pangngalan, sa isahan, nominative na kaso, " bokr” ay animated, at iba pa. Ang pagsasalin ng parirala ay naging ganito: "May isang bagay na pambabae nang sabay-sabay na gumawa ng isang bagay sa isang uri ng lalaking nilalang, at pagkatapos ay nagsimulang gumawa ng isang bagay na mahaba, unti-unting kasama ang kanyang anak." Ang isang katulad na halimbawa ng isang teksto (artistic) mula sa mga hindi umiiral na salita, na ganap na binuo ayon sa mga batas ng wika, ay ang Jabberwock ni Lewis Carroll (sa Alice in Wonderland, ipinaliwanag ni Carroll, sa pamamagitan ng bibig ng kanyang karakter na si Humpty Dumpty, ang kahulugan ng ang mga salitang inimbento niya: "luto" - alas-otso ng gabi, kapag oras na para magluto ng hapunan, "chlivky" - manipis at matalino, "shorek" - isang krus sa pagitan ng ferret, badger at corkscrew, "dive "- tumalon, sumisid, paikutin, "nava" - damo sa ilalim ng sundial (lumalawak nang kaunti sa kanan , medyo pakaliwa at isang maliit na likod), "ungol" - ungol at tumawa, "zelyuk" - a berdeng pabo, "myumzik" - isang ibon; ang kanyang mga balahibo ay magulo at lumalabas sa lahat ng direksyon, tulad ng isang walis, "mova" - malayo sa bahay) .

Isa sa mga pangunahing konsepto ng modernong lohika at teoretikal na lingguwistika, na ginagamit sa pag-aaral ng mga wika ng iba't ibang lohikal at matematikal na calculus, natural na mga wika, upang ilarawan ang ugnayan sa pagitan ng mga wika ng iba't ibang "antas" at upang makilala ang ugnayan sa pagitan ng Ang mga wikang isinasaalang-alang at ang mga paksa na inilarawan sa kanilang tulong, ay ang konsepto ng metalanguage. Ang metalanguage ay isang wikang ginagamit upang ipahayag ang mga paghatol tungkol sa ibang wika, ang bagay na wika. Sa tulong ng isang metalanguage, pinag-aaralan nila ang istruktura ng mga kumbinasyon ng karakter (ekspresyon) ng object ng wika, nagpapatunay ng mga teorema tungkol sa mga katangiang nagpapahayag nito, tungkol sa kaugnayan nito sa ibang mga wika, atbp. Ang wikang pinag-aaralan ay tinatawag ding paksang wika sa kaugnayan sa metalanguage na ito. Ang paksang wika at ang metalanguage ay maaaring ordinaryong (natural) na mga wika. Maaaring iba ang metalanguage sa object language (halimbawa, sa English textbook para sa mga Russian, Russian ang metalanguage, at English ang object language), ngunit maaari rin itong magkasabay o bahagyang naiiba, halimbawa, sa mga espesyal na terminolohiya. (Russian linguistic terminology is an element of the metalanguage). para ilarawan ang Russian language, ang tinatawag na semantic factors ay bahagi ng metalanguage para sa paglalarawan ng semantics ng natural na mga wika).

Itinuturo sa atin ng lohika ang isang mabungang pagkakaiba sa pagitan ng object ng wika at ng metalanguage. Ang object ng wika ay ang pinaka paksa ng lohikal na pananaliksik, at ang metalanguage ay ang hindi maiiwasang artipisyal na wika kung saan isinasagawa ang naturang pananaliksik. Ang lohikal na pag-iisip ay binubuo lamang sa pagbabalangkas ng mga relasyon at istruktura ng isang tunay na wika (object language) sa wika ng mga simbolo (metalanguage).

Ang metalanguage sa anumang kaso ay dapat na "hindi mas mahirap" kaysa sa layunin nitong wika (i.e., para sa bawat pagpapahayag ng huli sa metalanguage ay dapat mayroong pangalan nito, "pagsasalin") - kung hindi, kung ang mga kinakailangan na ito ay hindi natutugunan (na tiyak na tumatagal lugar sa natural na mga wika, kung ang mga espesyal na kasunduan ay hindi nagbibigay kung hindi man) lumitaw ang mga semantikong kabalintunaan (antinomies).

Habang parami nang parami ang mga bagong programming language na nilikha, na may kaugnayan sa problema ng mga tagasalin ng programming, nagkaroon ng isang kagyat na pangangailangan upang lumikha ng mga metalanguage. Sa kasalukuyan, ang Backus-Naur form metalanguage (dinaglat bilang BNF) ay ang pinakakaraniwang ginagamit para sa paglalarawan ng syntax ng mga programming language. Ito ay isang compact form sa anyo ng ilang mga formula na katulad ng mga mathematical. Para sa bawat konsepto ng wika ay may kakaibang metaformula (normal na pormula). Binubuo ito ng kaliwa at kanang bahagi. Ang kaliwang bahagi ay tumutukoy sa konsepto na tinutukoy, at ang kanang bahagi ay tumutukoy sa hanay ng mga tinatanggap na mga konstruksyon ng wika na pinagsama sa konseptong ito. Gumagamit ang formula ng mga espesyal na metacharacter sa anyo ng mga angle bracket, na naglalaman ng tinukoy na konsepto (sa kaliwang bahagi ng formula) o isang dating tinukoy na konsepto (sa kanang bahagi nito), at ang paghihiwalay ng kaliwa at kanang bahagi ay ipinahiwatig ng ang "::=" metacharacter, ang kahulugan nito ay katumbas ng mga salitang "by definition there is". Ang mga metalinguistic na formula ay naka-embed sa mga tagapagsalin sa ilang anyo; sa kanilang tulong, ang mga construct na ginamit ng programmer ay sinusuri para sa pormal na pagsunod sa alinman sa mga construct na syntactically valid sa wikang ito. Mayroon ding mga hiwalay na metalanguage ng iba't ibang agham - sa gayon, ang kaalaman ay umiiral sa anyo ng iba't ibang metalanguage.

Ang mga lohikal na pamamaraan ay nagsilbing batayan para sa paglikha ng mga artificial intelligence system batay sa konsepto ng connectionism. Ang koneksyonismo ay isang espesyal na kalakaran sa pilosopikal na agham, na ang paksa ay mga katanungan ng kaalaman. Sa loob ng balangkas ng trend na ito, ang mga pagtatangka ay ginagawa upang ipaliwanag ang mga intelektwal na kakayahan ng isang tao gamit ang mga artipisyal na neural network. Binubuo ng isang malaking bilang ng mga structural unit na katulad ng mga neuron, na may bigat na itinalaga sa bawat elemento na tumutukoy sa lakas ng koneksyon sa iba pang mga elemento, ang mga neural network ay pinasimple na mga modelo ng utak ng tao. Ang mga eksperimento sa mga neural network ng ganitong uri ay nagpakita ng kanilang kakayahang matutong magsagawa ng mga gawain tulad ng pagkilala ng pattern, pagbabasa, at pagtukoy ng mga simpleng istrukturang gramatika.

Ang mga pilosopo ay nagsimulang magkaroon ng interes sa koneksyonismo, dahil ang diskarte sa koneksyonista ay nangako na magbibigay ng alternatibo sa klasikal na teorya ng isip at ang ideya na malawakang pinanghahawakan sa loob ng teoryang ito na ang mga gawain ng isip ay katulad ng pagproseso ng simbolikong wika sa pamamagitan ng digital. kompyuter. Ang konseptong ito ay napakakontrobersyal, ngunit sa mga nakaraang taon ay nakahanap ito ng higit pang mga tagasuporta.

Ang lohikal na pag-aaral ng wika ay nagpatuloy sa konsepto ni Saussure ng wika bilang isang sistema. Ang katotohanan na ito ay patuloy na nagpapatuloy ay nagpapatunay muli sa katapangan ng siyentipikong haka-haka sa simula ng huling siglo. Ilalaan ko ang huling seksyon ng aking trabaho sa mga prospect para sa pagbuo ng mga pamamaraan ng matematika sa linggwistika ngayon.

2.4 Mga prospect para sa aplikasyon ng mga pamamaraan ng matematika sa linggwistika

Sa panahon ng teknolohiya ng kompyuter, ang mga pamamaraan ng matematikal na lingguwistika ay nakatanggap ng bagong pananaw sa pag-unlad. Ang paghahanap para sa mga solusyon sa mga problema ng linguistic analysis ay lalong ipinapatupad sa antas ng mga sistema ng impormasyon. Kasabay nito, ang automation ng proseso ng pagproseso ng materyal na lingguwistika, na nagbibigay sa mananaliksik ng mga makabuluhang pagkakataon at pakinabang, ay hindi maiiwasang maglagay ng mga bagong kinakailangan at gawain para sa kanya.

Ang kumbinasyon ng "eksakto" at "makatao" na kaalaman ay naging matabang lupa para sa mga bagong tuklas sa larangan ng linggwistika, computer science at pilosopiya.

Ang pagsasalin ng makina mula sa isang wika patungo sa isa pa ay nananatiling isang mabilis na lumalagong sangay ng teknolohiya ng impormasyon. Sa kabila ng katotohanan na ang pagsasalin na tinulungan ng computer ay hindi kailanman maihahambing sa kalidad sa pagsasalin ng tao (lalo na para sa mga tekstong pampanitikan), ang makina ay naging isang kailangang-kailangan na katulong sa isang tao sa pagsasalin ng malalaking volume ng teksto. Ito ay pinaniniwalaan na sa malapit na hinaharap ay malilikha ang higit pang mga advanced na sistema ng pagsasalin, batay sa pangunahing pagsusuri sa semantiko ng teksto.

Ang isang pantay na pangakong direksyon ay ang interaksyon ng linggwistika at lohika, na nagsisilbing pilosopikal na pundasyon para sa pag-unawa sa teknolohiya ng impormasyon at ang tinatawag na "virtual reality". Sa malapit na hinaharap, ang trabaho ay magpapatuloy sa paglikha ng mga artificial intelligence system - bagaman, muli, hindi ito magiging katumbas ng tao sa mga kakayahan nito. Ang ganitong kumpetisyon ay walang kabuluhan: sa ating panahon, ang makina ay dapat maging (at maging) hindi isang karibal, ngunit isang katulong sa tao, hindi isang bagay mula sa larangan ng pantasya, ngunit bahagi ng totoong mundo.

Ang pag-aaral ng wika sa pamamagitan ng mga istatistikal na pamamaraan ay nagpapatuloy, na ginagawang posible upang mas tumpak na matukoy ang mga katangian ng husay nito. Mahalagang mahanap ng pinakamatapang na hypotheses tungkol sa wika ang kanilang matematikal, at samakatuwid ay lohikal, patunay.

Ang pinakamahalagang bagay ay ang iba't ibang sangay ng aplikasyon ng matematika sa linggwistika, na dati ay medyo nakahiwalay, sa mga nagdaang taon ay naiugnay sa isa't isa, na nagkokonekta sa isang magkakaugnay na sistema, sa pamamagitan ng pagkakatulad sa sistema ng wika na natuklasan noong isang siglo ni Ferdinand de Saussure at Yvan Baudouin de Courtenay. Ito ang pagpapatuloy ng kaalamang siyentipiko.

Ang linggwistika sa modernong mundo ay naging pundasyon para sa pag-unlad ng teknolohiya ng impormasyon. Hangga't ang computer science ay nananatiling isang mabilis na umuunlad na sangay ng aktibidad ng tao, ang unyon ng matematika at linggwistika ay patuloy na gaganap ng papel nito sa pag-unlad ng agham.

Konklusyon

Sa paglipas ng ika-20 siglo, malayo na ang narating ng mga teknolohiya sa computer - mula sa militar hanggang sa mapayapang paggamit, mula sa isang makitid na hanay ng mga layunin hanggang sa pagtagos sa lahat ng larangan ng buhay ng tao. Ang matematika bilang isang agham ay nakakita ng bagong praktikal na kahalagahan sa pag-unlad ng teknolohiya ng kompyuter. Ang prosesong ito ay nagpapatuloy ngayon.

Ang dati nang hindi akalain na "tandem" ng "physicists" at "lyricists" ay naging realidad. Para sa buong pakikipag-ugnayan ng matematika at computer science sa humanities, kinakailangan ang mga kwalipikadong espesyalista mula sa magkabilang panig. Habang ang mga computer scientist ay lalong nangangailangan ng sistematikong makataong kaalaman (linguistic, cultural, philosophical) upang maunawaan ang mga pagbabago sa realidad sa kanilang paligid, sa interaksyon ng tao at teknolohiya, para makabuo ng parami nang paraming bagong linguistic at mental na konsepto, para magsulat mga programa, kung gayon ang anumang "Humanities" sa ating panahon para sa kanilang propesyonal na paglago ay dapat na makabisado ng hindi bababa sa mga pangunahing kaalaman sa pagtatrabaho sa isang computer.

Ang matematika, na malapit na magkakaugnay sa informatics, ay patuloy na umuunlad at nakikipag-ugnayan sa mga natural na agham at humanidades. Sa bagong siglo, ang trend patungo sa mathematization ng agham ay hindi humihina, ngunit, sa kabaligtaran, ay tumataas. Sa batayan ng dami ng data, ang mga batas ng pag-unlad ng wika, ang makasaysayang at pilosopikal na mga katangian ay naiintindihan.

Ang mathematical formalism ay pinakaangkop para sa paglalarawan ng mga pattern sa linguistics (tulad ng, sa katunayan, sa ibang mga agham, parehong humanidades at natural na agham). Ang sitwasyon kung minsan ay umuunlad sa agham sa paraang walang paggamit ng angkop na wikang matematikal, imposibleng maunawaan ang likas na katangian ng pisikal, kemikal, atbp. hindi posible ang proseso. Paglikha ng isang planetary model ng atom, ang sikat na English physicist ng XX century. Si E. Rutherford ay nakaranas ng mga kahirapan sa matematika. Noong una, hindi tinanggap ang kanyang teorya: hindi ito nakakumbinsi, at ang dahilan nito ay ang kamangmangan ni Rutherford sa teorya ng probabilidad, batay sa mekanismo kung saan posible lamang na maunawaan ang representasyon ng modelo ng mga pakikipag-ugnayan ng atomic. Napagtanto ito, na sa oras na iyon ang isang natitirang siyentipiko, ang may-ari ng Nobel Prize, ay naka-enrol sa seminar ng mathematician Professor Lamb at sa loob ng dalawang taon, kasama ang mga mag-aaral, ay dumalo sa isang kurso at nagtrabaho sa isang workshop sa teorya ng posibilidad. . Batay dito, nagawang ilarawan ni Rutherford ang pag-uugali ng elektron, na nagbibigay sa kanyang modelo ng istruktura na nakakumbinsi na katumpakan at nakakakuha ng pagkilala. Ganoon din sa linggwistika.

Nagtatanong ito, ano ang napaka-matematika sa layunin na mga phenomena, salamat sa kung saan maaari silang ilarawan sa wika ng matematika, sa wika ng mga katangian ng dami? Ito ay mga homogenous na yunit ng bagay na ipinamahagi sa espasyo at oras. Yaong mga agham na mas malayo kaysa sa iba patungo sa paghihiwalay ng homogeneity, at lumabas na mas angkop para sa paggamit ng matematika sa kanila.

Ang Internet, na mabilis na umunlad noong dekada 1990, ay nagsama-sama ng mga kinatawan ng iba't ibang bansa, mamamayan at kultura. Sa kabila ng katotohanan na ang Ingles ay patuloy na pangunahing wika ng internasyonal na komunikasyon, ang Internet ay naging multilinggwal sa ating panahon. Ito ay humantong sa pagbuo ng matagumpay na komersyal na mga sistema ng pagsasalin ng makina na malawakang ginagamit sa iba't ibang larangan ng aktibidad ng tao.

Ang mga network ng computer ay naging isang bagay ng pilosopikal na pagmuni-muni - parami nang parami ang mga bagong linguistic, lohikal, mga konsepto ng pananaw sa mundo ay nilikha na makakatulong upang maunawaan ang "virtual reality". Sa maraming mga gawa ng sining, nilikha ang mga senaryo - mas madalas na pesimistiko - tungkol sa pangingibabaw ng mga makina sa isang tao, at virtual reality - sa labas ng mundo. Malayo sa palaging ang gayong mga pagtataya ay naging walang kabuluhan. Ang teknolohiya ng impormasyon ay hindi lamang isang promising area para sa pamumuhunan ng kaalaman ng tao, ito rin ay isang paraan upang kontrolin ang impormasyon, at, dahil dito, sa pag-iisip ng tao.

Ang hindi pangkaraniwang bagay na ito ay may parehong negatibo at positibong panig. Negatibo - dahil ang kontrol sa impormasyon ay salungat sa hindi maiaalis na karapatang pantao sa libreng pag-access dito. Positibo - dahil ang kawalan ng kontrol na ito ay maaaring humantong sa mga sakuna na kahihinatnan para sa sangkatauhan. Sapat na upang alalahanin ang isa sa mga pinakamatalinong pelikula ng huling dekada - "When the World Ends" ni Wim Wenders, na ang mga karakter ay ganap na nahuhulog sa "virtual reality" ng kanilang sariling mga pangarap na naitala sa isang computer. Gayunpaman, hindi isang solong siyentipiko at hindi isang solong artista ang maaaring magbigay ng isang hindi malabo na sagot sa tanong: kung ano ang naghihintay sa agham at teknolohiya sa hinaharap.

Ang pagtutok sa "hinaharap", kung minsan ay tila kamangha-manghang, ay isang natatanging katangian ng agham noong kalagitnaan ng ikadalawampu siglo, nang ang mga imbentor ay naghangad na lumikha ng mga perpektong modelo ng teknolohiya na maaaring gumana nang walang interbensyon ng tao. Ipinakita ng panahon ang utopiang katangian ng naturang pananaliksik. Gayunpaman, hindi kinakailangan na hatulan ang mga siyentipiko para dito - kung wala ang kanilang sigasig noong 1950s - ang teknolohiya ng impormasyon ng 60s ay hindi makakagawa ng napakalakas na paglukso noong dekada 90, at wala tayo sa kung ano ang mayroon tayo ngayon.

Ang mga huling dekada ng ikadalawampu siglo ay nagbago sa mga priyoridad ng agham - ang pananaliksik, ang mga mapag-imbentong pathos ay nagbigay daan sa komersyal na interes. Muli, ito ay hindi mabuti o masama. Ito ay isang katotohanan kung saan ang agham ay lalong isinama sa pang-araw-araw na buhay.

Ang ika-21 siglo ay nagpatuloy sa kalakaran na ito, at sa ating panahon sa likod ng mga imbensyon ay hindi lamang katanyagan at pagkilala, ngunit, una sa lahat, pera. Ito rin ang dahilan kung bakit mahalagang tiyakin na ang pinakabagong mga nagawa ng agham at teknolohiya ay hindi mahuhulog sa mga kamay ng mga teroristang grupo o diktatoryal na rehimen. Ang gawain ay mahirap hanggang sa punto ng imposible; upang mapagtanto ito sa maximum ay ang gawain ng buong komunidad ng mundo.

Ang impormasyon ay isang sandata, at ang mga armas ay hindi gaanong mapanganib kaysa sa mga nuklear o kemikal - hindi lamang ito kumikilos nang pisikal, ngunit sa halip ay sikolohikal. Kailangang isipin ng sangkatauhan kung ano ang mas mahalaga para dito sa kasong ito - kalayaan o kontrol.

Ang pinakabagong mga pilosopikal na konsepto na may kaugnayan sa pag-unlad ng mga teknolohiya ng impormasyon at isang pagtatangka na maunawaan ang mga ito ay nagpakita ng mga limitasyon ng parehong natural-science materialism, na nangingibabaw noong ika-19 at unang bahagi ng ika-20 siglo, at matinding idealismo, na tumatanggi sa kahalagahan ng materyal na mundo. . Mahalaga para sa modernong kaisipan, lalo na ang kaisipan ng Kanluran, na mapagtagumpayan ang dualismong ito sa pag-iisip, kapag ang nakapaligid na mundo ay malinaw na nahahati sa materyal at ideal. Ang landas patungo dito ay isang diyalogo ng mga kultura, isang paghahambing ng iba't ibang mga punto ng pananaw sa mga nakapalibot na phenomena.

Paradoxically, ang teknolohiya ng impormasyon ay maaaring gumanap ng isang mahalagang papel sa prosesong ito. Ang mga network ng kompyuter, at lalo na ang Internet, ay hindi lamang isang mapagkukunan para sa libangan at masiglang aktibidad sa komersyo, ito rin ay isang paraan ng makabuluhan, kontrobersyal na komunikasyon sa pagitan ng mga kinatawan ng iba't ibang sibilisasyon sa modernong mundo, gayundin para sa isang diyalogo sa pagitan ng nakaraan at ang kasalukuyan. Masasabi nating itinutulak ng Internet ang spatial at temporal na mga hangganan.

At sa diyalogo ng mga kultura sa pamamagitan ng information technology, mahalaga pa rin ang papel ng wika bilang pinakamatandang unibersal na paraan ng komunikasyon. Kaya naman ang linggwistika, sa pakikipag-ugnayan sa matematika, pilosopiya at computer science, ay nakaranas ng pangalawang kapanganakan at patuloy na umuunlad ngayon. Ang takbo ng kasalukuyan ay magpapatuloy sa hinaharap - "hanggang sa katapusan ng mundo", tulad ng 15 taon na ang nakalilipas, ang parehong hinulaang V. Wenders. Totoo, hindi alam kung kailan mangyayari ang wakas na ito - ngunit mahalaga ba ito ngayon, dahil ang hinaharap ay magiging kasalukuyan pa rin.

Appendix 1

Ferdinand de Saussure

Ang Swiss linguist na si Ferdinand de Saussure (1857-1913) ay malawak na itinuturing na tagapagtatag ng modernong linggwistika sa mga pagtatangka nitong ilarawan ang istruktura ng wika sa halip na ang kasaysayan ng mga partikular na wika at mga anyo ng wika. Sa katunayan, ang pamamaraan ng Structuralism sa linguistics at literary studies at isang makabuluhang sangay ng Semiotics ay natagpuan ang kanilang pangunahing panimulang punto sa kanyang trabaho sa pagpasok ng ikadalawampu siglo. Pinagtatalunan pa nga na ang masalimuot ng mga estratehiya at konsepto na tinawag na "poststructuralism" – ang gawa nina Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes, at iba pa – ay iminungkahi ng gawa ni Saussure. sa linguistics at anagrammatic readings ng late Latin poetry.panitikan modernismo hanggang sa psychoanalysis at pilosopiya noong unang bahagi ng ikadalawampu siglo. Tulad ng pagtatalo nina Algirdas Julien Greimas at Joseph Courtés sa Semiotics and Language: An Analytic Dictionary, sa ilalim ng heading na "Interpretation," isang bagong paraan ng interpretasyon ang lumitaw noong unang bahagi ng ikadalawampu siglo na kinikilala nila sa Saussurean linguistics, Husserlian Phenomenology, at Freudian psychoanalysis. Sa mode na ito, "ang interpretasyon ay hindi na isang bagay ng pag-uugnay ng isang naibigay na nilalaman sa isang form na kung hindi man ay kulang ng isa; sa halip, ito ay isang paraphrase na bumubuo sa ibang paraan ng katumbas na nilalaman ng isang elementong nagpapakahulugan sa loob ng isang partikular na semiotic system" ( 159). sa ganitong pag-unawa sa "interpretasyon," ang anyo at nilalaman ay hindi naiiba; sa halip, ang bawat "form" ay, bilang kahalili, isang semantikong "nilalaman" din, isang "nagbibigay-kahulugan na anyo," upang ang interpretasyon ay nag-aalok ng isang analogical na paraphrase ng isang bagay na nagsasaad na sa loob ng ibang sistema ng kahulugan.

Ang ganitong reinterpretasyon ng anyo at pag-unawa – na inilalarawan ni Claude Lévi-Strauss sa isa sa kanyang pinaka-programmatic na mga artikulasyon ng konsepto ng structuralism, sa "Istruktura at Anyo: Mga Pagninilay sa isang Trabaho ni Vladimir Propp" - ay implicit sa Posthumous Course ni Saussure. sa General Linguistics (1916, trans., 1959, 1983).Sa kanyang buhay, medyo kaunti ang inilathala ni Saussure, at ang kanyang pangunahing gawain, ang Course, ay ang transkripsyon ng kanyang mga mag-aaral ng ilang kurso sa pangkalahatang linggwistika na kanyang inaalok noong 1907-11. Sa Kurso ay tinawag ni Saussure ang "pang-agham" na pag-aaral ng wika na taliwas sa gawain sa makasaysayang linggwistika na ginawa noong ikalabinsiyam na siglo. wika, makasaysayang (o "diachronic") linguistics ang pinagmulan at pag-unlad ng mga wikang Kanluranin mula sa isang pinagmumulan ng karaniwang wika, una ay isang "Indo-European" na wika at pagkatapos ay isang mas naunang "p roto-Indo-European" na wika.

Eksakto ang pag-aaral na ito ng mga natatanging paglitaw ng mga salita, na may kaakibat na palagay na ang pangunahing "yunit" ng wika ay, sa katunayan, ang positibong pag-iral ng mga "mga elemento ng salita," na kinuwestiyon ni Saussure. Ang kanyang gawain ay isang pagtatangka na bawasan ang masa ng mga katotohanan tungkol sa wika, na pinag-aralan nang napakaliit ng makasaysayang linggwistika, sa isang napapamahalaang bilang ng mga panukala. Ang "comparative school" ng ika-labing-siyam na siglo na Philology, sabi ni Saussure sa Course, "ay hindi nagtagumpay sa pag-set up ng tunay na agham ng linguistics" dahil "bigo itong hanapin ang kalikasan ng bagay ng pag-aaral nito" (3). Ang "kalikasan," sabi niya, ay matatagpuan hindi lamang sa "elemental" na mga salita na binubuo ng isang wika - ang tila "positibong" katotohanan (o "mga sangkap") ng wika - ngunit sa mga pormal na relasyon na nagdudulot ng mga iyon. "mga sangkap."

Ang sistematikong muling pagsusuri ni Saussure sa wika ay batay sa tatlong pagpapalagay. Ang una ay ang siyentipikong pag-aaral ng wika ay kailangang paunlarin at pag-aralan ang sistema sa halip na ang kasaysayan ng linguistic phenomena. Dahil dito, nakikilala niya ang mga partikular na pangyayari ng wika - ang partikular na "mga kaganapan sa pagsasalita," na itinalaga niya bilang parol - at ang wastong layunin ng linggwistika, ang sistema (o "kodigo") na namamahala sa mga kaganapang iyon, na itinalaga niya bilang langue. Ang ganitong sistematikong pag-aaral, bukod pa rito, ay nangangailangan ng isang " synchronic" na konsepto ng ugnayan ng mga elemento ng wika sa isang partikular na sandali kaysa sa "diachronic" na pag-aaral ng pag-unlad ng wika sa pamamagitan ng kasaysayan.

Ang palagay na ito ay nagbunga ng kung ano ang itinalaga ni Roman Jakobson noong 1929 bilang "istrukturalismo," kung saan "anumang hanay ng mga phenomena na sinusuri ng kontemporaryong agham ay itinuturing hindi bilang isang mekanikal na pagsasama-sama ngunit bilang isang istrukturang kabuuan ang mekanikal na konsepto ng mga proseso ay nagbubunga sa tanong. ng kanilang tungkulin" ("Romantic" 711). Sa bahaging ito, ipinapahayag ni Jakobson ang intensyon ni Saussure na tukuyin ang linggwistika bilang isang sistemang siyentipiko kumpara sa isang simple, "mekanikal" na pagtutuos ng mga makasaysayang aksidente. Kasabay nito, inilalarawan din ni Jakobson ang pangalawang batayan na palagay sa Saussurean – maaari nating ngayon ay tinatawag itong "istruktura" – linggwistika: na ang mga pangunahing elemento ng wika ay maaari lamang pag-aralan kaugnay ng kanilang mga tungkulin sa halip na kaugnay sa kanilang mga sanhi. European "mga salita"), ang mga pangyayari at entidad na iyon ay kailangang ilagay sa loob ng isang sistematikong balangkas kung saan nauugnay ang mga ito sa iba pang tinatawag na mga kaganapan at entidad. Ito ay isang radikal na reorientasyon sa pag-iisip ng karanasan at mga penomena, isa na ang kahalagahan ng pilosopo na si Ernst Cassirer ay inihambing sa "bagong agham ng Galileo na noong ikalabing pitong siglo ay nagbago sa ating kabuuan. konsepto ng pisikal na mundo" (sinipi sa Culler, Pursuit 2 4). Ang pagbabagong ito, gaya ng nabanggit nina Greimas at Courtés, ay muling nag-iisip ng "interpretasyon" at sa gayon ay muling nagkakaroon ng paliwanag at pag-unawa sa kanilang mga sarili. Sa halip na ang paliwanag ay "sa mga tuntunin ng isang kababalaghan" ng mga sanhi, upang, bilang isang "epekto," ito ay sa ilang mga paraan subordinate sa mga sanhi nito, ang paliwanag dito ay binubuo sa pagpapailalim ng isang kababalaghan sa nito na nakatuon sa hinaharap na "function" o "layunin." Ang paliwanag ay hindi na independyente sa mga intensyon o layunin ng tao (kahit na ang mga intensyon na iyon ay maaaring impersonal, communal, o, sa mga terminong Freudian, "walang malay").

Sa kanyang linguistics, tinupad ni Saussure ang pagbabagong ito partikular sa redefinition ng linguistic "word," na inilalarawan niya bilang linguistic "sign" at binibigyang-kahulugan sa functionalist terms. Ang tanda, sabi niya, ay ang unyon ng "isang konsepto at isang tunog na imahe," na tinawag niyang "signified at signifier " (66-67; ang pagsasalin ni Roy Harris noong 1983 ay nag-aalok ng mga terminong "signification" at "signal" ). Ang likas na katangian ng kanilang "kombinasyon" ay "functional" na hindi ang signified o ang signifier ay ang "sanhi" ng iba; sa halip, "bawat isa ang mga halaga nito mula sa isa" (8). elemento ng wika, ang sign , na may kaugnayan at ginagawa ang pangunahing pagpapalagay ng historikal na linggwistika, ibig sabihin, ang pagkakakilanlan ng mga elemental na yunit ng wika at kahulugan (i.e., "mga salita"), napapailalim sa mahigpit na pagsusuri. ang salitang "puno" bilang ang "parehong" salita ay hindi dahil ang salita ay binibigyang kahulugan ng mga likas na katangian – ito ay hindi isang "mekanikal na pagsasama-sama" ng gayong mga katangian - ngunit dahil ito ay tinukoy bilang isang elemento sa isang sistema, ang "kabuuan ng istruktura" , ng wika.

Ang ganitong relational (o "diacritical") na kahulugan ng isang entity ay namamahala sa konsepto ng lahat ng elemento ng wika sa structural linguistics. Ito ay pinakamalinaw sa pinakakahanga-hangang tagumpay ng Saussurean linguistics, ang pagbuo ng mga konsepto ng "ponema" at "mga natatanging katangian" ng wika. Ang mga ponema ay ang pinakamaliit na articulated at signifying unit ng isang wika. Ang mga ito ay hindi ang mga tunog na nangyayari sa wika ngunit ang mga "tunog na imahe" na binanggit ni Saussure, na nahuhuli ng mga nagsasalita – kahanga-hangang nahuhuli – bilang nagbibigay ng kahulugan. (Kaya, inilalarawan ni Elmar Holenstein ang linguistics ni Jakobson, na sumusunod kay Saussure sa mahahalagang paraan, bilang "phenomenological structuralism.") Ito ay para sa kadahilanang ito na ang nangungunang tagapagsalita para sa Prague School Structuralism, Jan Mukarovsky, ay nabanggit noong 1937 na "istruktura . . . ay isang phenomenological at hindi isang empirical reality; ito ay hindi ang gawain mismo, ngunit isang hanay ng mga functional na relasyon na matatagpuan sa kamalayan ng isang kolektibo (henerasyon, milieu, atbp.)" (sinipi sa Galan 35). Gayundin, si Lévi-Strauss, ang nangungunang tagapagsalita para sa istrukturalismong Pranses , binanggit noong 1960 na "ang istraktura ay walang natatanging nilalaman; ito ay kuntento mismo, at ang lohikal na organisasyon kung saan ito inaresto ay inaakalang pag-aari ng tunay" (167; tingnan din ang Jakobson, Fundamentals 27-28).

Ang mga ponema, kung gayon, ang pinakamaliit na nakikitang elemento ng wika, ay hindi mga positibong bagay kundi isang "phenomenological reality." Sa Ingles, halimbawa, ang ponema /t/ ay maaaring bigkasin sa maraming iba't ibang paraan, ngunit sa lahat ng pagkakataon ay makikilala ito ng isang nagsasalita ng Ingles bilang gumagana bilang isang /t/. Ang isang aspirated t (i.e., a t binibigkas na may parang h na hininga pagkatapos nito), isang mataas na tunog o mababang tunog na t, isang pinahabang tunog na t, at iba pa, ay lahat ay gagana sa parehong paraan sa pagkilala sa kahulugan ng "to" at "do" sa Ingles. Bukod dito, ang mga pagkakaiba sa pagitan ng mga wika ay tulad na ang phonological variation sa isang wika ay maaaring bumuo ng mga natatanging phonemes sa isa pa; kaya, ang Ingles ay nakikilala sa pagitan ng /l/ at /r/, samantalang ang ibang mga wika ay napakaayos na ang mga artikulasyong ito ay itinuturing na mga pagkakaiba-iba ng parehong ponema (tulad ng aspirated at unaspirated t sa Ingles). Sa bawat natural na wika, ang napakaraming posibleng salita ay kumbinasyon ng maliit na bilang ng mga ponema. Ang Ingles, halimbawa, ay nagtataglay ng wala pang 40 ponema na nagsasama-sama upang bumuo ng higit sa isang milyong iba't ibang salita.

Ang mga ponema ng wika ay mismong sistematikong nakaayos na mga istruktura ng mga tampok. Noong 1920s at 1930s, kasunod ng pangunguna ni Saussure ", ibinukod nina Jakobson at N. S. Trubetzkoy ang "mga natatanging katangian" ng mga ponema. Ang mga tampok na ito ay batay sa pisyolohikal na istruktura ng mga organ ng pagsasalita - dila, ngipin, vocal chords, at iba pa - na Binanggit ni Saussure sa Course at na inilalarawan ni Harris bilang "physiological phonetics" ( 39; Ang naunang pagsasalin ni Baskin ay gumagamit ng terminong "phonology" [(1959) 38]) – at sila ay pinagsama sa "mga bundle" ng binary opposition upang bumuo ng mga ponema. Halimbawa, sa Ingles ang pagkakaiba sa pagitan ng /t/ at /d/ ay ang pagkakaroon o kawalan ng "boses" (ang pakikipag-ugnayan ng mga vocal chords), at sa antas ng pagbigkas ng mga ponemang ito ay katumbas ng pagtukoy sa isa't isa. Sa ganitong paraan, ang ponolohiya ay isang tiyak na halimbawa ng isang pangkalahatang tuntunin ng wika na inilarawan ni Saussure: Sa wika ay may mga pagkakaiba lamang. mas mahalaga pa: ang pagkakaiba ay karaniwang nagpapahiwatig ng mga positibong termino kung saan naka-set up ang pagkakaiba; ngunit sa wika ay may mga pagkakaiba lamang na walang positibong termino. Kunin man natin ang signified o ang signifier, ang wika ay walang mga ideya o tunog na umiral bago ang linguistic system. ( 120)

Sa balangkas na ito, ang mga pagkakakilanlang pangwika ay tinutukoy hindi sa pamamagitan ng mga likas na katangian ngunit sa pamamagitan ng sistematikong ("istruktura") na mga relasyon.

Sinabi ko na ang phonology ay "sumusunod sa pangunguna" ni Saussure, dahil kahit na ang kanyang pagsusuri sa pisyolohiya ng produksyon ng wika ay "sa kasalukuyan," gaya ng sabi ni Harris, "tatawaging "pisikal," kumpara sa alinman sa "sikolohikal" o "functional." "" (Pagbasa 49), dahil dito sa Kurso ay ipinahayag niya ang direksyon at mga balangkas ng isang functional analysis ng wika. Katulad nito, ang kanyang tanging pinalawig na nai-publish na gawa, Mémoire sur le système primitif des voyelles dans les lanues indo-européennes (Memoir sa primitive na sistema ng mga patinig sa mga wikang Indo-European), na lumitaw noong 1878, ay ganap na nasa loob ng proyekto ng ikalabinsiyam- siglo makasaysayang linggwistika. Gayunpaman, sa loob ng gawaing ito, tulad ng ipinagtalo ni Jonathan Culler, ipinakita ni Saussure ang "kabuuan ng pag-iisip ng wika bilang isang sistema ng mga bagay na puro relasyon, kahit na nagtatrabaho sa gawain ng muling pagtatayo ng kasaysayan" (Saussure 66). Sa pamamagitan ng pagsusuri sa mga sistematikong istruktural na relasyon sa mga ponema upang isaalang-alang ang mga pattern ng paghahalili ng patinig sa umiiral na mga wikang Indo-European, iminungkahi ni Saussure na bilang karagdagan sa ilang iba't ibang ponema /a/, tiyak na mayroong isa pang ponema na maaaring pormal na ilarawan. "Ang dahilan kung bakit napaka-kahanga-hanga ang gawa ni Saussure," pagtatapos ni Culler, "ay ang katotohanan na makalipas ang halos limampung taon, nang matuklasan at ma-decipher ang cuneiform Hittite, ito ay natagpuang naglalaman ng isang ponema, nakasulat na h, na kumikilos tulad ng hula ni Saussure. . Natuklasan niya, sa pamamagitan ng isang pormal na pagsusuri, kung ano ang kilala ngayon bilang mga laryngeal ng Indo-European" (66).

Ang konseptong ito ng relational o diacritical na pagpapasiya ng mga elemento ng signification, na parehong implicit at tahasang sa Course, ay nagmumungkahi ng ikatlong palagay na namamahala sa structural linguistics, na tinatawag ni Saussure na "ang arbitrary na katangian ng sign." Sa pamamagitan nito, nangangahulugan siya na ang relasyon sa pagitan ng signifier at signified sa wika ay hindi kinakailangan (o "motivated"): ang isa ay madaling mahanap ang sound signifier arbre bilang signifier tree upang makiisa sa konseptong "puno". Ngunit higit pa rito, nangangahulugan ito na ang ipinahiwatig ay arbitrary din: ang isa ay madaling tukuyin ang konseptong "puno" sa pamamagitan ng makahoy na kalidad nito (na hindi kasama ang mga puno ng palma) gaya ng laki nito (na hindi kasama ang "mababang makahoy na halaman" na ating tumawag sa mga bushes). Dapat nitong linawin na ang pag-numero ng mga pagpapalagay na ipinakita ko ay hindi kumakatawan sa isang pagkakasunud-sunod ng priyoridad: bawat palagay – ang sistematikong katangian ng kahulugan (pinakamahusay na nahuhuli sa pamamagitan ng pag-aaral ng wika na "sabay-sabay"), ang relasyonal o "diakritikal" na katangian ng mga elemento ng signification, ang arbitrary na katangian ng mga palatandaan - nakukuha ang halaga nito mula sa iba.

Ibig sabihin, Saussurean linguistics ang mga phenomena na pinag-aaralan nito sa mga pangkalahatang relasyon ng kumbinasyon at contrast sa wika. Sa konseptong ito, ang wika ay parehong proseso ng pagpapahayag ng kahulugan (signification) at ang produkto nito (komunikasyon), at ang dalawang tungkuling ito ng wika ay hindi magkapareho o ganap na magkatugma (tingnan ang Schleifer, "Deconstruction"). Dito, makikita natin ang paghahalili sa pagitan ng anyo at nilalaman na inilalarawan nina Greimas at Courtés sa modernist na interpretasyon: ang wika ay nagpapakita ng mga kaibahan na pormal na tumutukoy sa mga yunit nito, at ang mga yunit na ito ay nagsasama-sama sa mga susunod na antas upang lumikha ng makabuluhang nilalaman. Dahil arbitraryo ang mga elemento ng wika, bukod dito, hindi masasabing basic ang contrast o combination. Kaya, sa wika ay nagsasama-sama ang mga natatanging katangian upang makabuo ng magkasalungat na ponema sa ibang antas ng pangamba, ang mga ponema ay nagsasama-sama upang makabuo ng mga magkasalungat na morpema, ang mga morpema ay nagsasama-sama upang makabuo ng mga salita, ang mga salita ay nagsasama-sama upang makabuo ng mga pangungusap, at iba pa. Sa bawat pagkakataon, ang buong ponema, o salita, o pangungusap, at iba pa, ay mas malaki kaysa sa kabuuan ng mga bahagi nito (tulad ng tubig, H2O, sa halimbawa ni Saussure [(1959) 103] ay higit pa sa mekanikal na pagsasama-sama. ng hydrogen at oxygen).

Ang tatlong pagpapalagay ng Kurso sa Pangkalahatang Linggwistika ay humantong kay Saussure na tumawag para sa isang bagong agham ng ikadalawampu siglo na lalampas sa agham pangwika upang pag-aralan ang "buhay ng mga palatandaan sa loob ng lipunan." Pinangalanan ni Saussure ang agham na ito na "semiology (mula sa Greek semeîon "sign")" (16). Ang "agham" ng semiotics, tulad ng ginawa sa Silangang Europa noong 1920s at 1930s at Paris noong 1950s at 1960s, ay nagpalawak ng pag-aaral ng wika at mga istrukturang linggwistika sa mga artifact na pampanitikan na binuo (o articulated) ng mga istrukturang iyon. Sa buong huling bahagi ng kanyang karera, bukod pa rito, kahit na siya ay nag-aalok ng mga kurso sa pangkalahatang linggwistika, itinuloy ni Saussure ang kanyang sariling "semiotic" na pagsusuri ng huli na tula ng Latin sa pagtatangkang tuklasin ang sadyang itinatagong mga anagram ng mga wastong pangalan. Ang paraan ng pag-aaral sa maraming paraan ay kabaligtaran ng functional rationalism ng kanyang linguistic analysis: sinubukan nito, gaya ng binanggit ni Saussure sa isa sa 99 na kuwaderno kung saan niya itinuloy ang pag-aaral na ito, na sistematikong suriin ang problema ng "pagkakataon," na " nagiging hindi maiiwasang pundasyon ng lahat" (sinipi sa Starobinski 101). Ang nasabing pag-aaral, gaya ng sinabi mismo ni Saussure, ay nakatuon sa "materyal na katotohanan" ng pagkakataon at kahulugan (binanggit 101), upang ang "theme-word" na ang anagram ay hinahanap ni Saussure, gaya ng sinabi ni Jean Starobinski, "ay, para sa makata. , isang instrumento, at hindi isang mahalagang mikrobyo ng tula. Ang tula ay kinakailangan upang muling gamitin ang phonic na materyales ng tema-salita" (45). Sa pagsusuring ito, sinabi ni Starobinski, "Hindi nawala si Saussure sa kanyang sarili sa paghahanap ng mga nakatagong kahulugan." Sa halip, ang kanyang akda ay tila nagpapakita ng pagnanais na iwasan ang lahat ng mga problema na nagmumula sa kamalayan: "Dahil ang tula ay hindi lamang natanto sa mga salita ngunit ito ay isang bagay na ipinanganak mula sa mga salita, ito ay nakatakas sa arbitraryong kontrol ng kamalayan upang umasa lamang sa isang uri ng lingguwistika legalidad. "(121).

Iyon ay, ang pagtatangka ni Saussure na tumuklas ng mga wastong pangalan sa huling mga tula ng Latin - ang tinatawag ni Tzvetan Todorov na pagbabawas ng isang "salita. . . to its signifier" (266) – emphasizes one of the elements that governed his linguistic analysis, the arbitrary nature of the sign. (It also emphasizes the formal nature of Saussurean linguistics – "Language," he asserts, "ay isang anyo at hindi isang sangkap" – na mabisang nag-aalis ng mga semantika bilang isang pangunahing bagay ng pagsusuri.) Bilang pagtatapos ni Todorov, ang gawa ni Saussure ay lumilitaw na kapansin-pansing homogenous ngayon sa pagtanggi nitong tanggapin ang mga simbolikong phenomena . . . . Sa kanyang pananaliksik sa anagrams, binibigyang-pansin lamang niya ang mga phenomena ng pag-uulit, hindi sa mga evocation. . . . Sa kanyang mga pag-aaral sa Nibelungen, kinikilala niya ang mga simbolo lamang upang maiugnay ang mga ito sa mga maling pagbabasa: dahil hindi ito sinasadya, ang mga simbolo ay hindi umiiral. Sa wakas sa kanyang mga kurso sa pangkalahatang linggwistika, pinag-isipan niya ang pagkakaroon ng semiology, at sa gayon ay ng mga palatandaan maliban sa mga linggwistika; ngunit ang paninindigang ito ay sabay-sabay na nililimitahan ng katotohanan na ang semiology ay nakatuon sa isang solong uri ng tanda: yaong mga arbitraryo. (269-70)

Kung ito ay totoo, ito ay dahil hindi maisip ni Saussure ang "intensiyon" nang walang paksa; hindi niya lubos na makatakas sa pagsalungat sa pagitan ng anyo at nilalaman na ang kanyang trabaho ay napakaraming nagawa upang itanong. Sa halip, ginamit niya ang "liguistic legality." Matatagpuan sa pagitan, sa isang banda, mga konsepto ng kasaysayan ng ikalabinsiyam na siglo, subjectivity, at ang paraan ng sanhi ng interpretasyon na pinamamahalaan ng mga konseptong ito at, sa kabilang banda, ang ikadalawampung siglo na "structuralist" na mga konsepto ng tinatawag ni Lévi-Strauss na "Kantianism without isang transendental na paksa" (na binanggit sa Connerton 23) – mga konseptong nagbubura ng oposisyon sa pagitan ng anyo at nilalaman (o paksa at bagay) at ang hierarchy ng foreground at background sa ganap na istrukturalismo, psychoanalysis, at kahit na quantum mechanics – ang gawa ni Ferdinand Si de Saussure sa linggwistika at semiotika ay sumasaklaw sa isang hudyat na sandali sa pag-aaral ng kahulugan at kultura.

Ronald Schleifer

Appendix 2

Ferdinand de Saussure (pagsasalin)

Ang Swiss linguist na si Ferdinand de Saussure (1857-1913) ay itinuturing na tagapagtatag ng modernong linggwistika, salamat sa kanyang mga pagtatangka na ilarawan ang istruktura ng wika, sa halip na ang kasaysayan ng mga indibidwal na wika at mga anyo ng salita. Sa pangkalahatan, ang mga pundasyon ng mga pamamaraang istruktural sa linggwistika at kritisismong pampanitikan at, sa malaking lawak, ang semiotika ay inilatag sa kanyang mga gawa sa pinakadulo simula ng ikadalawampu siglo. Napatunayan na ang mga pamamaraan at konsepto ng tinatawag na "post-structuralism", na nabuo sa mga akda nina Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes at iba pa, ay bumalik sa mga linggwistikong gawa ni Saussure at anagrammatic readings ng huling Romanong tula. Dapat pansinin na ang gawa ni Saussure sa linguistics at linguistic interpretation ay nakakatulong na maiugnay ang malawak na hanay ng mga intelektwal na disiplina, mula sa pisika hanggang sa mga inobasyong pampanitikan, psychoanalysis at pilosopiya noong unang bahagi ng ikadalawampu siglo. Sumulat sina A. J. Greimas at J. Kurte sa Semiotics and Language: "Ang isang analytical dictionary na may pamagat na "Interpretation" bilang isang bagong uri ng interpretasyon ay lumitaw sa simula ng ika-20 siglo kasama ang linguistics ng Saussure, ang phenomenology ni Husserl at ang psychoanalysis ni Freud. Sa ganoong kaso, "ang interpretasyon ay hindi ang pagpapatungkol ng isang ibinigay na nilalaman sa isang form na kung hindi man ay kulang ng isa; sa halip, ito ay isang paraphrase na bumubuo sa ibang paraan ng parehong nilalaman ng isang makabuluhang elemento sa loob ng isang partikular na semiotic system" (159 ). Sa ganitong pag-unawa sa "interpretasyon", ang anyo at nilalaman ay hindi mapaghihiwalay; sa kabaligtaran, ang bawat anyo ay puno ng semantikong kahulugan (“makabuluhang anyo”), kaya ang interpretasyon ay nag-aalok ng bago, katulad na muling pagsasalaysay ng isang bagay na makabuluhan sa ibang sistema ng pag-sign.

Ang isang katulad na pag-unawa sa anyo at nilalaman, na ipinakita ni Claude Lévi-Strauss sa isa sa mga pangunahing akda ng estrukturalismo, ("Istruktura at Anyo: Mga Pagninilay sa mga Gawa ni Vladimir Propp"), ay makikita sa posthumously-publish na libro ni Saussure na A Course sa General Linguistics (1916, trans., 1959, 1983). Sa panahon ng kanyang buhay, si Saussure ay naglathala ng kaunti, "Course" - ang kanyang pangunahing gawain - ay nakolekta mula sa mga tala ng mga mag-aaral na dumalo sa kanyang mga lektura sa pangkalahatang lingguwistika noong 1907-11. Sa Kurso, nanawagan si Saussure ng "pang-agham" na pag-aaral ng wika, na inihambing ito sa comparative-historical linguistics ng ikalabinsiyam na siglo. Ang gawaing ito ay maaaring ituring na isa sa mga pinakadakilang tagumpay ng pag-iisip ng Kanluranin: ang pagkuha ng mga indibidwal na salita bilang mga istruktural na elemento ng wika bilang batayan, ang historikal (o "diachronic") linguistics ay pinatunayan ang pinagmulan at pag-unlad ng mga wikang Kanlurang Europeo mula sa isang karaniwan, Indo-European na wika - at isang naunang Proto-Indo-European.

Ito ay tiyak na pag-aaral ng mga natatanging paglitaw ng mga salita, na may kaakibat na palagay na ang pangunahing "yunit" ng wika ay, sa katunayan, ang positibong pag-iral ng mga "mga elemento ng salita" na ito na kinuwestiyon ni Saussure. Ang kanyang trabaho ay isang pagtatangka na bawasan ang maraming mga katotohanan tungkol sa wikang kaswal na pinag-aralan ng comparative linguistics sa isang maliit na bilang ng mga theorems. Ang comparative philological school ng ika-19 na siglo, isinulat ni Saussure, "ay hindi nagtagumpay sa paglikha ng isang tunay na paaralan ng linggwistika" dahil "hindi nito naunawaan ang kakanyahan ng bagay ng pag-aaral" (3). Ang "esensya" na ito, sabi niya, ay namamalagi hindi lamang sa mga indibidwal na salita - ang "mga positibong sangkap" ng wika - kundi pati na rin sa mga pormal na koneksyon na tumutulong sa mga sangkap na ito na umiral.

Ang "pagsubok" ng wika ni Saussure ay batay sa tatlong pagpapalagay. Una, ang pang-agham na pag-unawa sa wika ay nakabatay hindi sa isang historikal, ngunit sa isang istruktural na kababalaghan. Samakatuwid, nakilala niya ang pagitan ng mga indibidwal na phenomena ng wika - "mga kaganapan sa pananalita", na tinukoy niya bilang "parole" - at ang nararapat, sa kanyang opinyon, bagay ng pag-aaral ng linggwistika, ang sistema (code, istraktura) na kumokontrol sa mga kaganapang ito ( "wika"). Ang ganitong sistematikong pag-aaral, bukod dito, ay nangangailangan ng "kasabay" na konsepto ng ugnayan sa pagitan ng mga elemento ng wika sa isang takdang sandali, sa halip na isang "diachronic" na pag-aaral ng pag-unlad ng isang wika sa pamamagitan ng kasaysayan nito.

Ang hypothesis na ito ang nangunguna sa kung ano ang tatawagin ni Roman Jakobson noong 1929 na "structuralism" - isang teorya kung saan "anumang hanay ng mga phenomena na sinisiyasat ng modernong agham ay itinuturing na hindi bilang isang mekanikal na akumulasyon, ngunit bilang isang istrukturang kabuuan kung saan ang nakabubuo na bahagi ay nauugnay sa ang function" ("Romantikong "711). Sa siping ito, binalangkas ni Jakobson ang ideya ni Saussure na tukuyin ang wika bilang isang istraktura, bilang kabaligtaran sa "mekanikal" na enumeration ng mga makasaysayang kaganapan. Bilang karagdagan, si Jakobson ay bumuo ng isa pang Saussurean assumption, na naging tagapagpauna ng structural linguistics: ang mga pangunahing elemento ng wika ay dapat pag-aralan na may kaugnayan hindi sa kanilang mga sanhi, ngunit sa kanilang mga tungkulin. Ang mga hiwalay na phenomena at mga kaganapan (sabihin, ang kasaysayan ng pinagmulan ng mga indibidwal na Indo-European na mga salita) ay dapat na pag-aralan hindi sa kanilang sarili, ngunit sa isang sistema kung saan sila ay nauugnay sa mga katulad na bahagi. Ito ay isang radikal na pagliko sa paghahambing ng mga phenomena sa nakapaligid na katotohanan, ang kahalagahan nito ay inihambing ng pilosopo na si Ernst Cassirer sa "agham ni Galileo, na nagpapalit ng mga ideya tungkol sa materyal na mundo noong ikalabing pitong siglo." , gaya ng tala nina Greimas at Kurthe, binabago ang ideya ng "interpretasyon", dahil dito, ang mga paliwanag mismo. Nagsimulang bigyang-kahulugan ang mga kababalaghan hindi kaugnay sa mga sanhi ng kanilang paglitaw, ngunit kaugnay ng epekto na maaari nilang magkaroon sa kasalukuyan at hinaharap. Ang interpretasyon ay tumigil na maging independiyente sa mga intensyon ng isang tao (sa kabila ng katotohanan na ang mga intensyon ay maaaring maging impersonal, "walang malay" sa kahulugan ng Freudian ng salita).

Sa kanyang linggwistika, lalo na ipinakita ni Saussure ang pagbabagong ito sa pagbabago ng konsepto ng salita sa linggwistika, na tinukoy niya bilang isang tanda at inilalarawan sa mga tuntunin ng mga tungkulin nito. Ang isang tanda para sa kanya ay isang kumbinasyon ng tunog at kahulugan, "signified at designation" (66-67; sa English translation ng 1983 ni Roy Harris - "signification" at "signal"). Ang likas na katangian ng tambalang ito ay "functional" (ni isa o ang iba pang elemento ay maaaring umiral nang wala ang isa't isa); bukod pa rito, "ang isa ay humihiram ng mga katangian mula sa iba" (8). Kaya, tinukoy ni Saussure ang pangunahing istrukturang elemento ng wika - ang tanda - at ginagawang batayan ng historikal na linggwistika ang pagkakakilanlan ng mga palatandaan sa mga salita, na nangangailangan ng partikular na mahigpit na pagsusuri. Samakatuwid, mauunawaan natin ang iba't ibang kahulugan ng, sabihin nating, ang parehong salitang "puno" - hindi dahil ang salita ay isang hanay lamang ng ilang mga katangian, ngunit dahil ito ay tinukoy bilang isang elemento sa sistema ng tanda, sa "kabuuan ng istruktura", sa wika.

Ang ganitong kamag-anak ("diacritical") na konsepto ng pagkakaisa ay sumasailalim sa konsepto ng lahat ng elemento ng wika sa istrukturang linggwistika. Ito ay lalong malinaw sa pinaka orihinal na pagtuklas ng Saussurean linguistics, sa pagbuo ng konsepto ng "ponema" at "mga natatanging katangian" ng wika. Ang mga ponema ay ang pinakamaliit sa sinasalita at makabuluhang mga yunit ng wika. Ang mga ito ay hindi lamang mga tunog na nangyayari sa wika, ngunit "mga tunog na imahe", sabi ni Saussure, na itinuturing ng mga katutubong nagsasalita bilang may kahulugan. (Dapat tandaan na tinawag ni Elmar Holenstein ang linggwistika ni Jakobson, na nagpapatuloy sa mga ideya at konsepto ng Saussure sa mga pangunahing probisyon nito, "phenomenological structuralism"). Iyon ang dahilan kung bakit ang nangungunang tagapagsalita ng Prague School of Structuralism, si Jan Mukarowski, ay naobserbahan noong 1937 na "istruktura. . . hindi isang empirical, ngunit isang phenomenological na konsepto; hindi ito ang resulta mismo, ngunit isang hanay ng mga makabuluhang ugnayan ng kolektibong kamalayan (henerasyon, iba pa, atbp.)”. Ang katulad na kaisipan ay ipinahayag noong 1960 ni Lévi-Strauss, ang pinuno ng estrukturalismong Pranses: “Ang istruktura ay walang tiyak na nilalaman; ito ay makabuluhan sa kanyang sarili, at ang lohikal na konstruksyon kung saan ito nakapaloob ay ang imprint ng realidad.

Sa turn, ang mga ponema, bilang ang pinakamaliit na elemento ng linguistic na katanggap-tanggap para sa persepsyon, ay kumakatawan sa isang hiwalay na integral na "phenomenological reality". Halimbawa, sa Ingles, ang tunog na "t" ay maaaring mabigkas nang iba, ngunit sa lahat ng pagkakataon, ang isang taong nagsasalita ng Ingles ay mapapansin ito bilang "t". Ang aspirated, itinaas o ibinaba, isang mahabang "t" na tunog, atbp. ay pantay na makikilala ang kahulugan ng mga salitang "to" at "do". Bukod dito, ang mga pagkakaiba sa pagitan ng mga wika ay tulad na ang mga uri ng isang tunog sa isang wika ay maaaring tumutugma sa iba't ibang mga ponema sa isa pa; halimbawa, ang "l" at "r" sa Ingles ay magkaiba, habang sa iba pang mga wika ang mga ito ay mga uri ng parehong ponema (tulad ng Ingles na "t", binibigkas nang may at walang aspirasyon). Ang malawak na bokabularyo ng anumang natural na wika ay isang hanay ng mga kumbinasyon ng mas maliit na bilang ng mga ponema. Sa Ingles, halimbawa, 40 ponema lamang ang ginagamit sa pagbigkas at pagsulat ng halos isang milyong salita.

Ang mga tunog ng isang wika ay isang sistematikong nakaayos na hanay ng mga tampok. Noong 1920s-1930s, kasunod ni Saussure, Jacobson at N.S. Trubetskoy ay pinili ang "mga natatanging tampok" ng mga ponema. Ang mga tampok na ito ay batay sa istruktura ng mga organo ng pagsasalita - dila, ngipin, vocal cord - Isinasaad ito ni Saussure sa "Course of General Linguistics", at tinawag ito ni Harris na "physiological phonetics" (sa naunang pagsasalin ni Baskin, ang terminong "phonology " ay ginagamit) - sila ay konektado sa "knots » durg laban sa isang kaibigan upang gumawa ng mga tunog. Halimbawa, sa Ingles, ang pagkakaiba sa pagitan ng "t" at "d" ay ang pagkakaroon o kawalan ng isang "boses" (ang pag-igting ng mga vocal cord), at ang antas ng boses na nagpapakilala sa isang ponema mula sa isa pa. Kaya, ang ponolohiya ay maaaring ituring na isang halimbawa ng pangkalahatang tuntunin sa wika na inilarawan ni Saussure: "May mga pagkakaiba lamang sa wika." Kahit na ito ay mas mahalaga: ang pagkakaiba ay karaniwang nagpapahiwatig ng eksaktong mga kondisyon kung saan ito matatagpuan; ngunit sa wika ay mayroon lamang mga pagkakaiba na walang tiyak na kondisyon. Isinasaalang-alang man natin ang "pagtatalaga" o "signified" - sa wika ay walang mga konsepto o tunog na umiiral bago ang pagbuo ng sistema ng wika.

Sa ganitong istraktura, ang mga analohiya sa linggwistika ay tinukoy hindi sa tulong ng kanilang mga likas na katangian, ngunit sa tulong ng mga relasyon sa sistema ("structural").

Nabanggit ko na na ang ponolohiya sa pagbuo nito ay umasa sa mga ideya ni Saussure. Bagama't ang kanyang pagsusuri sa linguistic physiology sa modernong panahon, sabi ni Harris, "ay tatawaging 'pisikal', kumpara sa 'psychological' o 'functional', sa The Course ay malinaw niyang ipinahayag ang direksyon at mga pangunahing prinsipyo ng functional analysis ng wika. Ang kanyang tanging nai-publish na akda noong nabubuhay pa siya, ang Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Mga tala sa orihinal na sistema ng patinig sa mga wikang Indo-European), na inilathala noong 1878, ay ganap na naaayon sa paghahambing na pangkasaysayang lingguwistika ng ika-19 na siglo. Gayunpaman, sa gawaing ito, sabi ni Jonathan Culler, ipinakita ni Saussure "ang pagiging mabunga ng ideya ng wika bilang isang sistema ng magkakaugnay na phenomena, kahit na sa muling pagtatayo nito sa kasaysayan." Sinusuri ang ugnayan sa pagitan ng mga ponema, na nagpapaliwanag ng paghalili ng mga patinig sa mga modernong wika ng grupong Indo-European, iminungkahi ni Saussure na bilang karagdagan sa maraming iba't ibang mga tunog na "a", dapat mayroong iba pang mga ponema na pormal na inilarawan. "Ang gumagawa ng isang espesyal na impresyon sa gawa ni Saussure," pagtatapos ni Kaller, "ay na halos 50 taon na ang lumipas, nang matuklasan at ma-decipher ang Hittite cuneiform, isang ponema ang natagpuan, sa pagsulat na tinutukoy ng "h", na kumilos tulad ng hinulaang ni Saussure. Sa pamamagitan ng pormal na pagsusuri, natuklasan niya ang kilala ngayon bilang guttural sound sa mga wikang Indo-European.

Sa konsepto ng isang kamag-anak (diacritical) na kahulugan ng mga palatandaan, parehong tahasan at ipinahiwatig sa Kurso, mayroong isang ikatlong pangunahing pagpapalagay ng istrukturang linggwistika, na tinawag ni Saussure na "arbitraryong katangian ng tanda." Sa pamamagitan nito ay nangangahulugan na ang ugnayan sa pagitan ng tunog at kahulugan sa wika ay hindi motibasyon ng anumang bagay: ang isang tao ay madaling ikonekta ang salitang "arbre" at ang salitang "puno" sa konsepto ng "puno". Bukod dito, nangangahulugan ito na ang tunog ay arbitrary din: maaari mong tukuyin ang konsepto ng "puno" sa pamamagitan ng pagkakaroon ng bark nito (maliban sa mga puno ng palma) at sa laki (maliban sa "mababang makahoy na halaman" - shrubs). Mula dito dapat na malinaw na ang lahat ng mga pagpapalagay na ipinakita ko ay hindi nahahati sa higit pa at hindi gaanong mahalaga: bawat isa sa kanila - ang sistematikong katangian ng mga palatandaan (pinaka naiintindihan sa "kasabay" na pag-aaral ng wika), ang kanilang kamag-anak (diacritical) kakanyahan, ang di-makatwirang kalikasan ng mga palatandaan - nagmula sa iba.

Kaya, sa Saussurean linguistics, ang pinag-aralan na phenomenon ay nauunawaan bilang isang hanay ng mga paghahambing at pagsalungat ng wika. Ang wika ay parehong pagpapahayag ng kahulugan ng mga salita (pagtatalaga) at ang kanilang resulta (komunikasyon) - at ang dalawang tungkuling ito ay hindi kailanman nag-tutugma (tingnan ang "Deconstruction of Language" ni Shleifer). Makikita natin ang paghahalili ng anyo at nilalaman na inilalarawan nina Greimas at Kurte sa pinakabagong bersyon ng interpretasyon: ang mga linguistic contrast ay tumutukoy sa mga istrukturang yunit nito, at ang mga unit na ito ay nakikipag-ugnayan sa sunud-sunod na mga antas upang lumikha ng isang tiyak na makabuluhang nilalaman. Dahil random ang mga elemento ng wika, hindi maaaring maging batayan ang contrast o combination. Nangangahulugan ito na sa isang wika, ang mga natatanging tampok ay bumubuo ng isang phonetic contrast sa ibang antas ng pag-unawa, ang mga ponema ay pinagsama sa contrasting morphemes, morphemes sa mga salita, mga salita sa mga pangungusap, atbp. Sa anumang kaso, isang buong ponema, salita, pangungusap, atbp. ay higit pa sa kabuuan ng mga bahagi nito (tulad ng tubig, sa halimbawa ni Saussure, ay higit pa sa kumbinasyon ng hydrogen at oxygen).

Tatlong pagpapalagay ng "Course of General Linguistics" ang humantong kay Saussure sa ideya ng isang bagong agham ng ikadalawampu siglo, na hiwalay sa linguistics, na pinag-aaralan ang "buhay ng mga palatandaan sa lipunan." Tinawag ni Saussure ang science semiology na ito (mula sa Greek na "semeîon" - isang tanda). Ang "agham" ng semiotics, na umunlad sa Silangang Europa noong 1920s at 1930s at sa Paris noong 1950s at 1960s, ay nagpalawak ng pag-aaral ng wika at mga istrukturang linggwistika sa mga natuklasang pampanitikan na binubuo (o binabalangkas) sa tulong ng mga istrukturang ito. Bilang karagdagan, sa takip-silim ng kanyang karera, na kahanay sa kanyang kurso sa pangkalahatang linggwistika, si Saussure ay nakikibahagi sa isang "semiotic" na pagsusuri ng huling Romanong tula, sinusubukang tumuklas ng sadyang binubuo ng mga anagram ng mga wastong pangalan. Ang pamamaraang ito sa maraming paraan ay kabaligtaran ng rasyonalismo sa pagsusuri sa wika nito: ito ay isang pagtatangka, gaya ng isinulat ni Saussure sa isa sa 99 na kuwaderno, na pag-aralan sa sistema ang problema ng "probability", na "naging batayan ng lahat. " Ang ganitong pagsisiyasat, ang sabi mismo ni Saussure, ay nakakatulong na tumuon sa "tunay na panig" ng posibilidad; Ang "pangunahing salita" kung saan hinahanap ni Saussure ang isang anagram ay, ayon kay Jean Starobinsky, "isang kasangkapan para sa makata, at hindi ang mapagkukunan ng buhay para sa tula. Ang tula ay nagsisilbing baligtarin ang mga tunog ng susing salita. Ayon kay Starobinsky, sa pagsusuring ito, "Hindi sumasali si Saussure sa paghahanap ng mga nakatagong kahulugan." Sa kabaligtaran, sa kanyang mga gawa, ang pagnanais na maiwasan ang mga tanong na may kaugnayan sa kamalayan ay kapansin-pansin: "dahil ang tula ay ipinahayag hindi lamang sa mga salita, kundi pati na rin sa kung ano ang ibinubunga ng mga salitang ito, ito ay lampas sa kontrol ng kamalayan at nakasalalay lamang sa mga batas ng wika.”

Ang pagtatangka ni Saussure na pag-aralan ang mga wastong pangalan sa huling Romanong tula (tinawag ito ni Tsvetan Todorov na isang pagdadaglat ng "isang salita ... bago ito isulat") ay binibigyang-diin ang isa sa mga bahagi ng kanyang pagsusuri sa linggwistika - ang arbitraryong katangian ng mga palatandaan, pati na rin ang ang pormal na kakanyahan ng Saussurean linguistics ("Wika," argues siya, "ang kakanyahan ng anyo, hindi ang kababalaghan"), na hindi kasama ang posibilidad ng pagsusuri ng kahulugan. Tinapos ni Todorov na ngayon ang mga sinulat ni Saussure ay tila kapansin-pansing pare-pareho sa kanilang pag-aatubili na pag-aralan ang mga simbolo [phenomena na may mahusay na tinukoy na kahulugan]. . . . Sa paggalugad ng mga anagram, binibigyang-pansin lamang ni Saussure ang pag-uulit, ngunit hindi ang mga nakaraang opsyon. . . . Sa pag-aaral ng Nibelungenlied, tinukoy niya ang mga simbolo upang italaga lamang ang mga ito sa mga maling pagbabasa: kung hindi sinasadya, ang mga simbolo ay hindi umiiral. Pagkatapos ng lahat, sa kanyang mga akda sa pangkalahatang linggwistika, ginawa niya ang pagpapalagay ng pagkakaroon ng isang semiology na naglalarawan hindi lamang ng mga palatandaang pangwika; ngunit ang palagay na ito ay limitado sa pamamagitan ng katotohanan na ang semilogy ay maaari lamang maglarawan ng mga random, arbitrary na mga palatandaan.

Kung ito ay talagang gayon, ito ay dahil lamang sa hindi niya maisip ang "intensiyon" na walang bagay; hindi niya lubusang madugtungan ang agwat sa pagitan ng anyo at nilalaman - sa kanyang mga akda ay naging tanong ito. Sa halip, bumaling siya sa "linguistic legitimacy". Sa pagitan, sa isang banda, ang mga konsepto ng ikalabinsiyam na siglo batay sa kasaysayan at subjective na haka-haka, at ang mga pamamaraan ng di-sinasadyang interpretasyon batay sa mga konseptong ito, at, sa kabilang banda, ang mga istruktural na konsepto na tinawag ni Levi-Strauss na "Kantianism without a transcendent aktor" - binubura ang oposisyon sa pagitan ng anyo at nilalaman (paksa at bagay), kahulugan at pinagmulan sa istrukturalismo, psychoanalysis at maging quantum mechanics, ang mga akda ni Ferlinand de Saussure sa linggwistika at semiotika ay nagmamarka ng pagbabago sa pag-aaral ng mga kahulugan sa wika at kultura.

Ronald Shleifer

Panitikan

1. Admoni V.G. Mga Batayan ng teorya ng gramatika / V.G. Admoni; USSR Academy of Sciences.-M.: Nauka, 1964.-104p.

4. Arnold I.V. Ang semantikong istruktura ng salita sa modernong Ingles at ang pamamaraan para sa pag-aaral nito. /I.V. Arnold - L .: Edukasyon, 1966. - 187 p.

6.Bashlykov A.M. Awtomatikong sistema ng pagsasalin. / A.M. Bashlykov, A.A. Sokolov. - M .: FIMA LLC, 1997. - 20 p.

7.Baudouin de Courtenay: Theoretical heritage and modernity: Abstracts of the reports of the international scientific conference / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 p.

8. A. V. Gladkiy, Mga Elemento ng Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 p.

9. Golovin, B.N. Wika at istatistika. /B.N. Golovin - M., 1971. - 210 p.

10. Zvegintsev, V.A. Teoretikal at inilapat na lingguwistika. / V.A. Zvegintsev - M., 1969. - 143 p.

11. Kasevich, V.B. Semantika. Syntax. Morpolohiya. // V.B. Kasevich -M., 1988. - 292 p.

12. Lekomtsev Yu.K. Panimula sa pormal na wika ng linggwistika / Yu.K. Lekomtsev. – M.: Nauka, 1983, 204 p., may sakit.

13. The Linguistic Heritage of Baudouin de Courtenay at the End of the 20th Century: Abstracts of the International Scientific and Practical Conference March 15-18, 2000. - Krasnoyarsk, 2000. - 125 p.

Matveeva G.G. Mga nakatagong kahulugan sa gramatika at pagkakakilanlan ng taong panlipunan (“portrait”) ng tagapagsalita / G.G. Matveev. - Rostov, 1999. - 174 p.

14. Melchuk, I.A. Karanasan sa pagbuo ng mga modelong pangwika "Ibig sabihin<-->Teksto". / I.A. Melchuk. - M., 1974. - 145 p.

15. Nelyubin L.L. Pagsasalin at inilapat na lingguwistika / L.L. Nelyubin. - M. : Mas mataas na paaralan, 1983. - 207 p.

16. Sa eksaktong paraan ng pananaliksik sa wika: sa tinatawag na "mathematical linguistics" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva at iba pa - M., 1961. - 162 p.

17. Piotrovsky L.G. Mathematical Linguistics: Textbook / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Mas mataas na paaralan, 1977. - 160 p.

18. Siya ay. Teksto, makina, tao. - L., 1975. - 213 p.

19. Siya ay. Applied Linguistics / Ed. A.S. Gerda. - L., 1986. - 176 p.

20. Revzin, I.I. mga modelo ng wika. M., 1963. Revzin, I.I. Modernong istruktural na lingguwistika. Mga problema at pamamaraan. M., 1977. - 239 p.

21. Revzin, I.I., Rozentsveig, V.Yu. Mga Batayan ng pangkalahatan at pagsasalin ng makina / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 p.

22. Slyusareva N.A. Ang teorya ni F. de Saussure sa liwanag ng modernong linggwistika / N.A. Slyusareva. - M.: Nauka, 1975. - 156 p.

23. Kuwago, L.Z. Analytical linguistics / L.Z. Kuwago - M., 1970. - 192 p.

24. Saussure F. de. Mga Tala sa Pangkalahatang Linggwistika / F. de Saussure; Per. mula kay fr. – M.: Pag-unlad, 2000. – 187 p.

25. Siya ay. Kurso ng Pangkalahatang Linggwistika / Per. mula kay fr. - Yekaterinburg, 1999. -426 p.

26. Mga istatistika ng pagsasalita at awtomatikong pagsusuri ng teksto / Ed. ed. R.G. Piotrovsky. L., 1980. - 223 p.

27. Stoll, P. Sets. Lohika. Axiomatic theories / R. Stoll; Per. mula sa Ingles. - M., 1968. - 180 p.

28. Tenier, L. Mga Batayan ng istrukturang syntax. M., 1988.

29. Ubin I.I. Automation ng mga aktibidad sa pagsasalin sa USSR / I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 p.

30. Faure, R., Kofman, A., Denis-Papin, M. Modern Mathematics. M., 1966.

31. Shenk, R. Pagproseso ng konseptong impormasyon. M., 1980.

32. Shikhanovich, Yu.A. Panimula sa modernong matematika (mga paunang konsepto). M., 1965

33. Shcherba L.V. Mga patinig na Ruso sa mga termino ng husay at dami / L.V. Shcherba - L.: Nauka, 1983. - 159 p.

34. Abdullah-zade F. Mamamayan ng mundo // Ogonyok - 1996. - No. 5. – p.13

35. V.A. Uspensky. Preliminary para sa mga mambabasa ng "New Literary Review" sa mga semiotic na mensahe ni Andrei Nikolaevich Kolmogorov. - Isang bagong pampanitikan na pagsusuri. –1997. - Hindi. 24. - S. 18-23

36. Perlovsky L. Kamalayan, wika at kultura. - Kaalaman ay kapangyarihan. –2000. 4 - S. 20-33

37. Frumkina R.M. Tungkol sa amin - pahilig. // Russian Journal. - 2000. - No. 1. – p. 12

38. Fitialov, S.Ya. Sa Syntax Modeling sa Structural Linguistics // Mga Problema ng Structural Linguistics. M., 1962.

39. Siya ay. Sa equivalence ng NN grammar at dependency grammar // Mga Problema ng Structural Linguistics. M., 1967.

40. Chomsky, N. Lohikal na pundasyon ng teoryang linggwistika // Bago sa linggwistika. Isyu. 4. M., 1965

41. Schleifer R. Ferdinand de Saussure//press. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. pindutin. jhu.ru

46. ​​tl.wikipedia.org

Talaan ng nilalaman
Panimula
Kabanata 1. Ang kasaysayan ng aplikasyon ng mga pamamaraang matematikal sa linggwistika
1.1. Ang Pagbuo ng Structural Linguistics sa Pagliko ng ika-19 hanggang ika-20 Siglo
1.2. Paglalapat ng mga pamamaraang matematikal sa linggwistika sa ikalawang kalahati ng ikadalawampu siglo
Konklusyon
Panitikan
Panimula
Sa ika-20 siglo, nagkaroon ng patuloy na kalakaran patungo sa interaksyon at interpenetration ng iba't ibang larangan ng kaalaman.Ang mga hangganan sa pagitan ng mga indibidwal na agham ay unti-unting lumalabo; parami nang parami ang mga sangay ng mental na aktibidad na "nasa junction" ng kaalaman sa humanitarian, teknikal at natural na agham.
Ang isa pang halatang tampok ng modernidad ay ang pagnanais na pag-aralan ang mga istruktura at ang mga elemento ng bumubuo nito. Samakatuwid, ang isang pagtaas ng lugar, kapwa sa siyentipikong teorya at sa praktika, ay ibinibigay sa matematika. Ang pakikipag-ugnay, sa isang banda, sa lohika at pilosopiya, sa kabilang banda, sa mga istatistika (at, dahil dito, sa mga agham panlipunan), ang matematika ay tumagos nang mas malalim at mas malalim sa mga lugar na sa loob ng mahabang panahon ay itinuturing na puro. "makatao", pagpapalawak ng kanilang heuristic na potensyal (ang sagot sa tanong na "magkano" ay kadalasang makakatulong sa pagsagot sa mga tanong na "ano" at "paano"). Ang linggwistika ay walang pagbubukod. Ang layunin ng aking pamanahong papel ay maikling i-highlight ang koneksyon sa pagitan ng matematika at tulad ng sangay ng linggwistika bilang linggwistika. Mula noong 1950s, ginamit ang matematika sa linggwistika upang lumikha ng isang teoretikal na kagamitan para sa paglalarawan ng istruktura ng mga wika (parehong natural at artipisyal). Gayunpaman, dapat sabihin na hindi ito agad nakahanap ng gayong praktikal na aplikasyon para sa sarili nito. Sa una, ang mga pamamaraan ng matematika sa linggwistika ay nagsimulang gamitin upang linawin ang mga pangunahing konsepto ng linggwistika, gayunpaman, sa pag-unlad ng teknolohiya ng computer, ang gayong teoretikal na premise ay nagsimulang mailapat sa pagsasanay. Ang paglutas ng mga gawain tulad ng pagsasalin ng makina, pagkuha ng impormasyon ng makina, awtomatikong pagpoproseso ng teksto ay nangangailangan ng panimula ng bagong diskarte sa wika. Isang tanong ang bumangon sa harap ng mga linggwista: kung paano matututong kumatawan sa mga pattern ng linggwistika sa anyo kung saan direktang mailalapat ang mga ito sa teknolohiya. Ang terminong "mathematical linguistics", na popular sa ating panahon, ay tumutukoy sa anumang linguistic na pananaliksik na gumagamit ng mga eksaktong pamamaraan (at ang konsepto ng eksaktong mga pamamaraan sa agham ay palaging malapit na nauugnay sa matematika). Naniniwala ang ilang mga siyentipiko sa mga nakaraang taon na ang mismong ekspresyon ay hindi maaaring itaas sa ranggo ng isang termino, dahil hindi ito nangangahulugang anumang espesyal na "linggwistika", ngunit isang bagong direksyon lamang na nakatuon sa pagpapabuti, pagtaas ng katumpakan at pagiging maaasahan ng mga pamamaraan ng pananaliksik sa wika. Gumagamit ang Linguistics ng parehong quantitative (algebraic) at non-quantitative na mga pamamaraan, na naglalapit dito sa mathematical logic, at, dahil dito, sa pilosopiya, at maging sa sikolohiya. Kahit na binanggit ni Schlegel ang pakikipag-ugnayan ng wika at kamalayan, at ang kilalang linggwista noong unang bahagi ng ikadalawampu siglo, si Ferdinand de Saussure (sasabihin ko ang tungkol sa kanyang impluwensya sa pag-unlad ng mga pamamaraan ng matematika sa linggwistika sa ibang pagkakataon), ikinonekta ang istraktura ng wika sa pag-aari nito. sa mga tao. Ang modernong mananaliksik na si L. Perlovsky ay nagpatuloy, na tinutukoy ang dami ng mga katangian ng wika (halimbawa, ang bilang ng mga kasarian, mga kaso) na may mga kakaibang katangian ng pambansang kaisipan (higit pa tungkol dito sa Seksyon 2. 2, "Mga Paraang Istatistika sa Linggwistika").
Ang pakikipag-ugnayan ng matematika at lingguwistika ay isang multifaceted na paksa, at sa aking trabaho ay hindi ko tatalakayin ang lahat, ngunit, una sa lahat, sa mga inilapat na aspeto nito.
Kabanata I. Kasaysayan ng Paglalapat ng mga Pamamaraang Matematika sa Linggwistika
1.1 Ang pagbuo ng structural linguistics sa simula ng XIX - XX na siglo
Ang matematikal na paglalarawan ng wika ay batay sa ideya ng wika bilang isang mekanismo, na bumalik sa sikat na Swiss linguist noong unang bahagi ng ikadalawampu siglo, si Ferdinand de Saussure.
Ang unang link ng kanyang konsepto ay ang teorya ng wika bilang isang sistema na binubuo ng tatlong bahagi (wika mismo - langue, speech - parole, at speech activity - langage), kung saan ang bawat salita (miyembro ng system) ay itinuturing na wala sa sarili. , ngunit may kaugnayan sa iba....

Anastasia Anufrieva, Mikhail Ivlev, Vsevolod Miroshnikov, Ekaterina Artyukh

Ang gawain ng mga mag-aaral sa ika-5 baitang. Proyekto ng pananaliksik: "Mathematical Linguistics". Pangkatang gawain sa mga paksa - matematika at isang wikang banyaga.

I-download:

Preview:

Pangunahing Kagawaran ng Edukasyon ng City Hall ng Novosibirsk

Palasyo ng Pagkamalikhain para sa mga Bata at Estudyante "Junior"

Buksan ang kumpetisyon ng lungsod ng mga proyekto sa pananaliksik

mga mag-aaral sa baitang 5-8

Direksyon: proyektong natural-matematika

Mathematics linguistics

Ivlev, Mikhail

Miroshnikov Vsevolod,

Artyukh Ekaterina

MBOUSOSH №26, Baitang 5

Distrito ng Kalininsky ng Novosibirsk

Mga tagapayo ng proyekto:Yasyurenko Maya Dmitrievna,

Guro ng matematika at computer science,

Sevastyanova Tatyana Sergeevna,

guro sa Ingles

I kategorya ng kwalipikasyon.

Mga contact number ng mga manager:

8-952-924-02-66 (Yasyurenko M.D.)

8-913-896-81-77 (Sevastyanova T.S.)

Novosibirsk 2013

Proyekto: "Mathematical Linguistics"

Mga kalahok sa proyekto:Anufrieva Anastasia, Ivlev Mikhail, Miroshnikov Vsevolod, Artyukh Ekaterina.

Mga tagapayo ng proyekto:Yasyurenko Maya Dmitrievna, guro ng matematika at informatics. Sevastyanova Tatyana Sergeevna, guro ng Ingles na I

kategoryang kwalipikado.

Baitang: 5A

Pangalan, numero ng institusyong pang-edukasyon kung saan isinagawa ang proyekto:MBOUSOSH №26, distrito ng Kalininsky, lungsod ng Novosibirsk

Lugar ng paksa:matematika, wikang banyaga.

Oras ng proyekto:Nobyembre 2012 - Pebrero 2013 (pangmatagalan)

Layunin ng proyekto: maghanap ng mga karaniwang batayan sa pagitan ng matematika at linggwistika.

Mga gawain:

  1. Kilalanin ang kasaysayan ng pag-unlad ng matematika at pagbuo ng linggwistika.
  2. Maghanap ng mga indibidwal na halimbawa ng aplikasyon ng matematika sa linggwistika.
  3. Upang pag-aralan ang mga prospect para sa aplikasyon ng mga pamamaraan ng matematika sa linggwistika. Gumawa ng mga konklusyon.

Uri ng proyekto (ayon sa uri ng aktibidad):paghahanap, pagsasaliksik

Mga ginamit na teknolohiya: multimedia

Form ng produkto ng proyekto:"Mathematical Linguistics" (multimedia presentation).

Pag-aaral:

- pagpili at pag-aaral ng teoretikal na materyal sa paksang ito;

- pagproseso ng natanggap na impormasyon;

- pagpapasiya ng mga prospect para sa aplikasyon ng mga pamamaraan ng matematika sa linggwistika.

Saklaw ng resulta ng proyekto:pang-edukasyon (matematika, wikang banyaga).

Panimula…………………………………………………………………………..2

Kabanata 1. Ang kasaysayan ng aplikasyon ng mga pamamaraang matematikal sa linggwistika

1.1. Kasaysayan ng matematika………………………………………………………………….3

1.2. Pagbuo ng linggwistika………………………………………………………………4

1.3. Mathematical linguistics…………………………………………………….8

Kabanata 2. Mga piling halimbawa ng paggamit ng matematika sa linggwistika

2.1. Pag-aaral ng wika sa pamamagitan ng mga pamamaraan ng pormal na lohika………………………………11

2.2. Mga prospect para sa aplikasyon ng mga pamamaraan ng matematika sa linggwistika ...... 13

Konklusyon...………………………………………………………………………… 14

Panitikan………………………………………………………………………… 15

Panimula.

Sa ikadalawampu siglo, nagkaroon ng takbo patungo sa interaksyon at interpenetration ng iba't ibang larangan ng kaalaman. Ang mga hangganan sa pagitan ng mga indibidwal na agham ay unti-unting lumalabo; parami nang parami ang mga sangay ng mental na aktibidad na "nasa junction" ng kaalaman sa humanitarian, teknikal at natural na agham.

Ang isa pang halatang tampok ng modernidad ay ang pagnanais na pag-aralan ang mga istruktura at ang mga elemento ng bumubuo nito. Samakatuwid, ang isang pagtaas ng lugar, kapwa sa siyentipikong teorya at sa praktika, ay ibinibigay sa matematika. Ang matematika ay tumagos nang mas malalim at mas malalim sa mga lugar na sa loob ng mahabang panahon ay itinuturing na purong "makatao", na nagpapalawak ng kanilang potensyal na heuristic (ang sagot sa tanong na "magkano" ay madalas na nakakatulong upang masagot ang mga tanong na "ano" at "paano"). Ang lingguwistika ay walang pagbubukod.

Ang layunin ng aming trabaho ay upang mai-highlight ang koneksyon sa pagitan ng matematika at isang sangay ng linggwistika bilang linggwistika. Sa una, ang mga pamamaraan ng matematika sa linggwistika ay nagsimulang gamitin upang linawin ang mga pangunahing konsepto ng linggwistika, gayunpaman, sa pag-unlad ng teknolohiya ng computer, ang gayong teoretikal na premise ay nagsimulang makahanap ng aplikasyon sa pagsasanay. Ang paglutas ng mga gawain tulad ng pagsasalin ng makina, pagkuha ng impormasyon ng makina, awtomatikong pagpoproseso ng teksto ay nangangailangan ng panimula ng bagong diskarte sa wika. Hinarap ng mga linguist ang tanong: kung paano matututong kumatawan sa mga pattern ng linggwistika sa anyo kung saan maaari silang direktang ilapat sa teknolohiya. Ang terminong "mathematical linguistics", na popular sa ating panahon, ay tumutukoy sa anumang linguistic na pananaliksik na gumagamit ng mga eksaktong pamamaraan (at ang konsepto ng eksaktong mga pamamaraan sa agham ay palaging malapit na nauugnay sa matematika). Gumagamit ang Linguistics ng parehong quantitative (algebraic) at non-quantitative na mga pamamaraan, na naglalapit dito sa mathematical logic, at, dahil dito, sa pilosopiya, at maging sa sikolohiya. Ang pilosopo ng Aleman, ang linguist na si Friedrich Schlegel ay nabanggit ang interaksyon ng wika at kamalayan, at ang kilalang linggwista noong unang bahagi ng ikadalawampu siglo, si Ferdinand de Saussure, ay nag-ugnay sa istruktura ng wika sa pag-aari nito sa mga tao. Ang pakikipag-ugnayan ng matematika at linggwistika ay isang multifaceted na paksa, at sa aming trabaho hindi namin tatalakayin ang lahat, ngunit, una sa lahat, sa mga inilapat na aspeto nito.

Kabanata 1. Ang kasaysayan ng aplikasyon ng mga pamamaraang matematikal sa linggwistika.

1.1. Kasaysayan ng matematika.

Sa Kasaysayan matematikaAyon sa kaugalian, mayroong ilang mga yugto sa pagbuo ng kaalaman sa matematika:

  1. Pagbuo ng konseptogeometric na pigura at numero bilang idealisasyontunay na mga bagay at hanay ng mga homogenous na bagay. Ang paglitaw ng pagbibilang at pagsukat, na naging posible upang ihambing ang iba't ibang mga numero, haba, lugar at volume.
  2. Ang pag-imbento ng mga operasyon sa aritmetika. Ang akumulasyon ng empirikal (sa pamamagitan ng pagsubok at pagkakamali) ng kaalaman tungkol sa mga katangian ng mga operasyong aritmetika, tungkol sa mga pamamaraan para sa pagsukat ng mga lugar atmga volumesimpleng pigura at katawan. Ang pag-unlad ay ginawa sa direksyong itoSumerian Babylonian, Intsik at indiansinaunang matematika.
  3. Hitsura sa sinaunang greeceisang deductive mathematical system na nagpakita kung paano makakuha ng mga bagong mathematical truths batay sa mga umiiral na. Ang pinakamataas na tagumpay ng sinaunang Griyegong matematika ay"Simula" ng Euclid, na gumanap sa papel ng pamantayan ng mathematical rigor sa loob ng dalawang millennia.
  4. Mathematician ng mga bansa ng Islamhindi lamang napanatili ang mga sinaunang tagumpay, ngunit nagawang i-synthesize ang mga ito sa mga pagtuklas ng mga Indian mathematician, na sa teorya ng numero ay mas sumulong kaysa sa mga Greeks.
  5. Sa mga siglo ng XVI-XVIII, ang European mathematics ay muling isinilang at nauuna. Ang konseptwal na batayan nito sa panahong ito ay ang paniniwala na ang mga modelo ng matematika ay isang uri ng perpektong balangkas ng Uniberso, at samakatuwid ang pagtuklas ng mga katotohanan sa matematika ay kasabay ng pagtuklas ng mga bagong katangian ng totoong mundo. Ang pangunahing tagumpay sa landas na ito ay ang pagbuo ng mga modelo ng matematika ng pag-asa ng mga variable (function) at ang pangkalahatang teorya ng paggalaw (infinitesimal analysis). Ang lahat ng mga natural na agham ay itinayong muli batay sa mga bagong tuklas na modelo ng matematika, at ito ay humantong sa isang napakalakingpag-unlad.
  6. Sa ika-19-20 siglo, naging malinaw na ang relasyon sa pagitan ng matematika at realidad ay malayo sa pagiging kasing simple ng tila dati. Walang pangkalahatang tinatanggap na sagot sa uri ng "pangunahing tanong ng pilosopiya ng matematika": upang mahanap ang sanhi ng "hindi maintindihan na bisa ng matematika sa mga natural na agham." Sa bagay na ito, at hindi lamang sa paggalang na ito, ang mga mathematician ay nahahati sa maraming mga debating paaralan. Ilang mapanganib na uso ang lumitaw: labis na makitid na espesyalisasyon, paghihiwalay sa mga praktikal na problema, atbp. Kasabay nito, ang kapangyarihan ng matematika at ang prestihiyo nito, na suportado ng pagiging epektibo ng aplikasyon nito, ay mataas kaysa dati.

Bilang karagdagan sa mahusay na interes sa kasaysayan, ang pagsusuri ng ebolusyon ng matematika ay may malaking kahalagahan para sa pag-unladpilosopiya at pamamaraanmatematika. Kadalasan, ang kaalaman sa kasaysayan ay nag-aambag din sa pag-unlad ng mga tiyak na disiplina sa matematika; halimbawa, sinaunangProblema ng Tsino (teorama) tungkol sa mga natitiragumawa ng isang buong seksyonteorya ng numero.

Katuwiran ng matematika

Sa simula ng ika-19 na siglo, ang Euclidean geometry lamang ang may relatibong mahigpit na lohikal (deductive) na pagbibigay-katwiran, bagama't noon pa man ang higpit nito ay wastong itinuturing na hindi sapat. Mga katangian ng mga bagong bagay (halimbawa,kumplikadong mga numero, infinitesimalatbp.) ay itinuturing na kapareho ng mga bagay na kilala na; kung ang naturang extrapolation ay imposible, ang mga katangian ay pinili sa empirically.

Augustin Louis Cauchy

Ang pagbuo ng pundasyon ng matematika ay nagsimula sa pagsusuri. AT1821Cauchyinilathala ang "Algebraic Analysis", kung saan malinaw niyang tinukoy ang mga pangunahing konsepto batay sa konsepto ng limitasyon. Gayunpaman, nakagawa siya ng ilang mga pagkakamali, halimbawa, isinama niya at pinag-iba ang mga termino ng serye ayon sa termino, nang hindi pinatutunayan ang pagiging katanggap-tanggap ng mga naturang operasyon. Nakumpleto ang pundasyon ng pagsusuriWeierstrass, na nilinaw ang papel ng isang mahalagang konseptopare-parehong pagpapatuloy. Sabay-sabay Weierstrass (1860s) atDedekind(1870s) ay nagbigay ng katwiran para sa teoryatunay na mga numero.


Mga slide caption:

Mga May-akda ng Mathematical Linguistics: Anastasia Anufrieva, Mikhail Ivlev, Vsevolod Miroshnikov, Ekaterina Artyukh MBOUSOSH#26, 5th grade Kalininsky district ng Novosibirsk Project consultant: Maya Dmitrievna Yasyurenko, guro ng matematika at informatics, Tatyana I Sergeevna qualification teacher ng English category

Ang layunin ng proyekto: maghanap para sa karaniwang batayan sa pagitan ng matematika at linggwistika.

Mga layunin ng proyekto: Upang maging pamilyar sa kasaysayan ng pag-unlad ng matematika at pagbuo ng linggwistika. Maghanap ng mga indibidwal na halimbawa ng aplikasyon ng matematika sa linggwistika. Upang pag-aralan ang mga prospect para sa aplikasyon ng mga pamamaraan ng matematika sa linggwistika. Gumawa ng mga konklusyon.

Sa ikadalawampu siglo, nagkaroon ng takbo patungo sa interaksyon at interpenetration ng iba't ibang larangan ng kaalaman. Ang mga hangganan sa pagitan ng mga indibidwal na agham ay unti-unting lumalabo; parami nang parami ang mga sangay ng mental na aktibidad na "nasa junction" ng kaalaman sa humanitarian, teknikal at natural na agham.

Mga yugto ng pag-unlad ng kaalaman sa matematika: Pagbuo ng konsepto ng isang geometric na pigura at numero bilang isang ideyalisasyon ng mga tunay na bagay at hanay ng mga homogenous na bagay. Ang paglitaw ng pagbibilang at pagsukat, na naging posible upang ihambing ang iba't ibang mga numero, haba, lugar at volume.

Ang pag-imbento ng mga operasyon sa aritmetika. Ang paglitaw ng deductive mathematical system sa sinaunang Greece. Ang mga mathematician ng mga bansa ng Islam ay hindi lamang napanatili ang mga sinaunang tagumpay, ngunit nagawa rin nilang i-synthesize ang mga ito sa mga pagtuklas ng mga Indian mathematician, na mas sumulong kaysa sa mga Greek sa teorya ng numero.

Sa mga siglo ng XVI-XVIII, ang European mathematics ay muling isinilang at nauuna. Sa ika-19-20 siglo, naging malinaw na ang relasyon sa pagitan ng matematika at realidad ay malayo sa pagiging kasing simple ng tila dati.

Augustin Louis Cauchy

Ang kasaysayan ng linggwistika sa pag-unlad nito ay dumaan sa 5 panahon. 1 panahon - 5-4 na siglo. BC. - XVI siglo. 2 panahon - XVII-XVIII na siglo. Ika-3 panahon - ang katapusan ng ika-18 - ang unang kalahati ng ika-19 na siglo. 4 na panahon - ang panahon ng sistematikong pag-aaral ng wika - ang katapusan ng ika-19 - ang unang ikatlong bahagi ng ika-20 siglo. 5 panahon - 30s ng XX siglo. Hanggang ngayon.

Mathematical linguistics: Pinag-aaralan ang mga tampok ng semiotic at mathematical modelling ng natural na wika (at pagsasalita) upang maisalin ang impormasyong nilalaman sa isang impormal na anyo sa isang teksto sa isang pormal na artipisyal na wika (halimbawa, sa ilang wika ng impormasyon) batay sa naturang mathematical apparatus bilang set theory at algebra relations, theory of fuzzy sets at linguistic variable, probability theory at mathematical statistics, gayundin ang mga elemento ng information theory. Malapit na nauugnay sa engineering linguistics. Isang sangay ng linggwistika na nag-aaral ng mga posibilidad ng paglalapat ng mga pamamaraang matematika sa pag-aaral at paglalarawan ng isang wika.

Ang metalanguage ay isang wikang ginagamit upang ipahayag ang mga paghatol tungkol sa ibang wika, ang bagay na wika. Sa tulong ng isang metalanguage, pinag-aaralan nila ang istruktura ng mga kumbinasyon ng character (mga expression) ng object ng wika, nagpapatunay ng mga theorems tungkol sa mga nagpapahayag na katangian nito, tungkol sa kaugnayan nito sa ibang mga wika, atbp.

Ang linggwistika sa modernong mundo ay naging pundasyon para sa pag-unlad ng teknolohiya ng impormasyon. Hangga't ang computer science ay nananatiling isang mabilis na umuunlad na sangay ng aktibidad ng tao, ang unyon ng matematika at linggwistika ay patuloy na gaganap ng papel nito sa pag-unlad ng agham.

Talaan ng nilalaman
Panimula
Kabanata 1. Ang kasaysayan ng aplikasyon ng mga pamamaraang matematikal sa linggwistika
1.1. Ang Pagbuo ng Structural Linguistics sa Pagliko ng ika-19 hanggang ika-20 Siglo
1.2. Paglalapat ng mga pamamaraang matematikal sa linggwistika sa ikalawang kalahati ng ikadalawampu siglo
Kabanata 2. Mga piling halimbawa ng paggamit ng matematika sa linggwistika
2.1. Pagsasalin ng makina
2.2.Mga pamamaraang istatistika sa pag-aaral ng wika
2.3. Pag-aaral ng wika sa pamamagitan ng mga pamamaraan ng pormal na lohika
2.4. Mga prospect para sa aplikasyon ng mga pamamaraan ng matematika sa linggwistika
Konklusyon
Panitikan
Apendise 1. Ronald Schleifer. Ferdinand de Saussure
Appendix 2. Ferdinand de Saussure (pagsasalin)

Panimula
Sa ika-20 siglo, nagkaroon ng patuloy na kalakaran tungo sa interaksyon at interpenetration ng iba't ibang larangan ng kaalaman. Ang mga hangganan sa pagitan ng mga indibidwal na agham ay unti-unting lumalabo; parami nang parami ang mga sangay ng mental na aktibidad na "nasa junction" ng kaalaman sa humanitarian, teknikal at natural na agham.
Ang isa pang halatang tampok ng modernidad ay ang pagnanais na pag-aralan ang mga istruktura at ang mga elemento ng bumubuo nito. Samakatuwid, ang isang pagtaas ng lugar, kapwa sa siyentipikong teorya at sa praktika, ay ibinibigay sa matematika. Ang pakikipag-ugnay, sa isang banda, sa lohika at pilosopiya, sa kabilang banda, sa mga istatistika (at, dahil dito, sa mga agham panlipunan), ang matematika ay tumagos nang mas malalim at mas malalim sa mga lugar na sa loob ng mahabang panahon ay itinuturing na puro. "makatao", pagpapalawak ng kanilang potensyal na heuristic (ang sagot sa tanong na "magkano" ay kadalasang makakatulong sa pagsagot sa mga tanong na "ano" at "paano"). Ang lingguwistika ay walang pagbubukod.
Ang layunin ng aking pamanahong papel ay maikling i-highlight ang koneksyon sa pagitan ng matematika at isang sangay ng linggwistika bilang linggwistika. Mula noong 1950s, ginamit ang matematika sa linggwistika upang lumikha ng isang teoretikal na kagamitan para sa paglalarawan ng istruktura ng mga wika (parehong natural at artipisyal). Gayunpaman, dapat sabihin na hindi ito agad nakahanap ng gayong praktikal na aplikasyon para sa sarili nito. Sa una, ang mga pamamaraan ng matematika sa linggwistika ay nagsimulang gamitin upang linawin ang mga pangunahing konsepto ng linggwistika, gayunpaman, sa pag-unlad ng teknolohiya ng computer, ang gayong teoretikal na premise ay nagsimulang makahanap ng aplikasyon sa pagsasanay. Ang paglutas ng mga gawain tulad ng pagsasalin ng makina, pagkuha ng impormasyon ng makina, awtomatikong pagpoproseso ng teksto ay nangangailangan ng panimula ng bagong diskarte sa wika. Hinarap ng mga linguist ang tanong: kung paano matututong kumatawan sa mga pattern ng linggwistika sa anyo kung saan maaari silang direktang ilapat sa teknolohiya. Ang terminong "mathematical linguistics", na popular sa ating panahon, ay tumutukoy sa anumang linguistic na pananaliksik na gumagamit ng mga eksaktong pamamaraan (at ang konsepto ng eksaktong mga pamamaraan sa agham ay palaging malapit na nauugnay sa matematika). Ang ilang mga siyentipiko sa mga nakaraang taon ay naniniwala na ang expression mismo ay hindi maaaring itaas sa ranggo ng isang termino, dahil hindi ito nangangahulugang anumang espesyal na "linggwistika", ngunit isang bagong direksyon lamang na nakatuon sa pagpapabuti, pagtaas ng katumpakan at pagiging maaasahan ng mga pamamaraan ng pananaliksik sa wika. . Gumagamit ang Linguistics ng parehong quantitative (algebraic) at non-quantitative na mga pamamaraan, na naglalapit dito sa mathematical logic, at, dahil dito, sa pilosopiya, at maging sa sikolohiya. Kahit na binanggit ni Schlegel ang pakikipag-ugnayan ng wika at kamalayan, at si Ferdinand de Saussure, isang kilalang linggwista noong unang bahagi ng ikadalawampu siglo (sasabihin ko ang tungkol sa kanyang impluwensya sa pag-unlad ng mga pamamaraan ng matematika sa linggwistika sa ibang pagkakataon), ikinonekta ang istraktura ng wika sa pag-aari nito. sa mga tao. Ang modernong mananaliksik na si L. Perlovsky ay higit pa, na tinutukoy ang dami ng mga katangian ng wika (halimbawa, ang bilang ng mga kasarian, mga kaso) na may mga kakaibang katangian ng pambansang kaisipan (higit pa tungkol dito sa Seksyon 2.2, "Mga Paraan ng Istatistika sa Linggwistika").
Ang pakikipag-ugnayan ng matematika at lingguwistika ay isang multifaceted na paksa, at sa aking trabaho ay hindi ko tatalakayin ang lahat, ngunit, una sa lahat, sa mga inilapat na aspeto nito.

Kabanata I. Kasaysayan ng Paglalapat ng mga Pamamaraang Matematika sa Linggwistika
1.1 Ang pagbuo ng structural linguistics sa simula ng XIX - XX na siglo
Ang paglalarawan sa matematika ng wika ay batay sa ideya ng wika bilang isang mekanismo, na bumalik sa sikat na Swiss linguist noong unang bahagi ng ikadalawampu siglo, si Ferdinand de Saussure.
Ang unang link ng kanyang konsepto ay ang teorya ng wika bilang isang sistema na binubuo ng tatlong bahagi (ang wika mismo ay wika, pananalita - password, at aktibidad sa pagsasalita - wika), kung saan ang bawat salita (miyembro ng system) ay hindi isinasaalang-alang sa sarili nito, ngunit may kaugnayan sa iba pang mga miyembro. Bilang isa pang kilalang lingguwista, ang Dane Louis Hjelmslev, sa kalaunan ay nabanggit, si Saussure "ang unang humingi ng isang istruktural na diskarte sa wika, iyon ay, isang siyentipikong paglalarawan ng wika sa pamamagitan ng pagtatala ng mga ugnayan sa pagitan ng mga yunit."
Sa pag-unawa sa wika bilang isang hierarchical na istraktura, si Saussure ang unang nagbigay ng problema sa halaga at kahalagahan ng mga yunit ng lingguwistika. Ang mga hiwalay na phenomena at mga kaganapan (sabihin, ang kasaysayan ng pinagmulan ng mga indibidwal na Indo-European na mga salita) ay dapat na pag-aralan hindi sa kanilang sarili, ngunit sa isang sistema kung saan sila ay nauugnay sa mga katulad na bahagi.
Itinuring ng istrukturang yunit ng wika ng Saussure ang salitang, "sign", kung saan pinagsama ang tunog at kahulugan. Wala sa mga elementong ito ang umiiral nang walang isa't isa: samakatuwid, naiintindihan ng katutubong nagsasalita ang iba't ibang lilim ng kahulugan ng polysemantic na salita bilang isang hiwalay na elemento sa kabuuan ng istruktura, sa wika.
Kaya, sa teorya ni F. de Saussure makikita ang interaksyon ng linggwistika, sa isang banda, sa sosyolohiya at sikolohiyang panlipunan (dapat tandaan na sa parehong oras, ang phenomenology ni Husserl, ang psychoanalysis ni Freud, ang teorya ng relativity ni Einstein ay umuunlad, nagaganap ang mga eksperimento sa anyo at nilalaman sa panitikan, musika, at sining), sa kabilang banda, sa matematika (ang konsepto ng pagkakapare-pareho ay tumutugma sa algebraic na konsepto ng wika). Ang ganitong konsepto ay nagbago sa konsepto ng linguistic na interpretasyon tulad ng: Ang mga penomena ay nagsimulang bigyang kahulugan hindi kaugnay sa mga sanhi ng kanilang paglitaw, ngunit may kaugnayan sa kasalukuyan at hinaharap. Ang interpretasyon ay tumigil na maging independyente sa mga intensyon ng isang tao (sa kabila ng katotohanan na ang mga intensyon ay maaaring impersonal, "walang malay" sa kahulugan ng Freudian ng salita).
Ang paggana ng mekanismo ng linggwistika ay ipinakikita sa pamamagitan ng aktibidad ng pagsasalita ng mga katutubong nagsasalita. Ang resulta ng pagsasalita ay ang tinatawag na "mga tamang teksto" - mga pagkakasunud-sunod ng mga yunit ng pagsasalita na sumusunod sa ilang mga pattern, na marami sa mga ito ay nagbibigay-daan sa paglalarawan ng matematika. Ang teorya ng mga paraan upang ilarawan ang syntactic na istraktura ay tumatalakay sa pag-aaral ng mga pamamaraan para sa matematikal na paglalarawan ng mga tamang teksto (pangunahin ang mga pangungusap). Sa ganitong istraktura, ang mga analohiya sa linggwistika ay tinukoy hindi sa tulong ng kanilang mga likas na katangian, ngunit sa tulong ng mga relasyon sa sistema ("structural").
Ang mga ideya ni Saussure ay binuo sa Kanluran ng mga nakababatang kontemporaryo ng dakilang Swiss linguist: sa Denmark - L. Hjelmslev, na nabanggit ko na, na nagbunga ng algebraic theory ng wika sa kanyang akdang "Fundamentals of Linguistic Theory", sa the USA - E. Sapir, L. Bloomfield, C. Harris, sa Czech Republic - Russian scientist-emigrant N. Trubetskoy.
Ang mga regular na istatistika sa pag-aaral ng wika ay nagsimulang harapin ng walang iba kundi ang tagapagtatag ng genetika, si Georg Mendel. Noong 1968 lamang natuklasan ng mga philologist na, sa mga huling taon ng kanyang buhay, siya ay nabighani sa pag-aaral ng linguistic phenomena gamit ang mga pamamaraan ng matematika. Dinala ni Mendel ang pamamaraang ito sa linggwistika mula sa biology; noong dekada 1990, tanging ang pinakamapangahas na linggwista at biologist ang nag-angkin ng pagiging posible ng naturang pagsusuri. Sa mga archive ng monasteryo ng St. Tomasz sa Brno, na ang abbot ay si Mendel, ang mga sheet ay natagpuan na may mga hanay ng mga apelyido na nagtatapos sa "mann", "bauer", "mayer", at may ilang mga fraction at kalkulasyon. Sa pagsisikap na matuklasan ang mga pormal na batas ng pinagmulan ng mga pangalan ng pamilya, gumawa si Mendel ng mga kumplikadong kalkulasyon, kung saan isinasaalang-alang niya ang bilang ng mga patinig at katinig sa wikang Aleman, ang kabuuang bilang ng mga salita na isinasaalang-alang niya, ang bilang ng mga apelyido, atbp.
Sa ating bansa, ang istrukturang lingguwistika ay nagsimulang umunlad sa halos parehong oras tulad ng sa Kanluran - sa pagliko ng ika-19-20 siglo. Kasabay ng F. de Saussure, ang konsepto ng wika bilang isang sistema ay binuo sa kanilang mga gawa ng mga propesor ng Kazan University F.F. Fortunatov at I.A. Baudouin de Courtenay. Ang huli ay nakipag-ugnayan nang mahabang panahon kay de Saussure, ayon sa pagkakabanggit, ang Geneva at Kazan na mga paaralan ng linggwistika ay nakipagtulungan sa isa't isa. Kung si Saussure ay matatawag na ideologist ng "eksaktong" mga pamamaraan sa linggwistika, kung gayon ang Baudouin de Courtenay ay naglatag ng mga praktikal na pundasyon para sa kanilang aplikasyon. Siya ang unang naghiwalay ng linggwistika (bilang tumpak isang agham na gumagamit ng mga istatistikal na pamamaraan at functional dependence) mula sa philology (isang komunidad ng mga humanitarian na disiplina na nag-aaral ng espirituwal na kultura sa pamamagitan ng wika at pananalita). Ang siyentipiko mismo ay naniniwala na "ang linggwistika ay maaaring maging kapaki-pakinabang sa malapit na hinaharap, napalaya lamang mula sa ipinag-uutos na unyon sa philology at kasaysayang pampanitikan" . Ang ponolohiya ay naging "lugar ng pagsubok" para sa pagpapakilala ng mga pamamaraang matematikal sa linggwistika - ang mga tunog bilang "mga atom" ng sistema ng wika, na may limitadong bilang ng mga madaling masusukat na katangian, ay ang pinaka maginhawang materyal para sa pormal at mahigpit na pamamaraan ng paglalarawan. Itinatanggi ng ponolohiya ang pagkakaroon ng kahulugan sa tunog, kaya inalis ang salik na "tao" sa mga pag-aaral. Sa ganitong diwa, ang mga ponema ay parang pisikal o biyolohikal na bagay.
Ang mga ponema, bilang pinakamaliit na elemento ng lingguwistika na katanggap-tanggap para sa persepsyon, ay kumakatawan sa isang hiwalay na globo, isang hiwalay na "phenomenological reality". Halimbawa, sa Ingles, ang tunog na "t" ay maaaring mabigkas nang iba, ngunit sa lahat ng pagkakataon, ang isang taong nagsasalita ng Ingles ay mapapansin ito bilang "t". Ang pangunahing bagay ay ang ponema ay gaganap ng pangunahing - semantiko - function nito. Bukod dito, ang mga pagkakaiba sa pagitan ng mga wika ay tulad na ang mga uri ng isang tunog sa isang wika ay maaaring tumutugma sa iba't ibang mga ponema sa isa pa; halimbawa, ang "l" at "r" sa Ingles ay magkaiba, habang sa iba pang mga wika ang mga ito ay mga uri ng parehong ponema (tulad ng Ingles na "t", binibigkas na mayroon o walang aspirasyon). Ang malawak na bokabularyo ng anumang natural na wika ay isang hanay ng mga kumbinasyon ng mas maliit na bilang ng mga ponema. Sa Ingles, halimbawa, 40 ponema lamang ang ginagamit sa pagbigkas at pagsulat ng halos isang milyong salita.
Ang mga tunog ng isang wika ay isang sistematikong nakaayos na hanay ng mga tampok. Noong 1920s-1930s, kasunod ni Saussure, Jacobson at N.S. Trubetskoy ay pinili ang "mga natatanging tampok" ng mga ponema. Ang mga tampok na ito ay batay sa istraktura ng mga organo ng pagsasalita - dila, ngipin, vocal cord. Halimbawa, sa Ingles ang pagkakaiba sa pagitan ng "t" at "d" ay ang pagkakaroon o kawalan ng isang "boses" (ang pag-igting ng mga vocal cord) at ang antas ng boses na nagpapakilala sa isang ponema mula sa isa pa. Kaya, ang ponolohiya ay maaaring ituring na isang halimbawa ng pangkalahatang tuntunin sa wika na inilarawan ni Saussure: "May mga pagkakaiba lamang sa wika". Kahit na ito ay mas mahalaga: ang pagkakaiba ay karaniwang nagpapahiwatig ng eksaktong mga kondisyon kung saan ito matatagpuan; ngunit sa wika ay mayroon lamang mga pagkakaiba na walang tiyak na kondisyon. Isinasaalang-alang man natin ang "pagtatalaga" o "signified" - sa wika ay walang mga konsepto o tunog na umiiral bago ang pagbuo ng sistema ng wika.
Kaya, sa Saussurean linguistics, ang pinag-aralan na phenomenon ay nauunawaan bilang isang hanay ng mga paghahambing at pagsalungat ng wika. Ang wika ay parehong pagpapahayag ng kahulugan ng mga salita at isang paraan ng komunikasyon, at ang dalawang tungkuling ito ay hindi kailanman nagtutugma. Mapapansin natin ang paghahalili ng anyo at nilalaman: ang mga linguistic contrast ay tumutukoy sa mga istrukturang yunit nito, at ang mga yunit na ito ay nakikipag-ugnayan upang lumikha ng isang tiyak na makabuluhang nilalaman. Dahil random ang mga elemento ng wika, hindi maaaring maging batayan ang contrast o combination. Nangangahulugan ito na sa isang wika, ang mga natatanging tampok ay bumubuo ng isang phonetic contrast sa ibang antas ng pag-unawa, ang mga ponema ay pinagsama sa mga morpema, mga morpema sa mga salita, mga salita sa mga pangungusap, atbp. Sa anumang kaso, isang buong ponema, salita, pangungusap, atbp. ay higit pa sa kabuuan ng mga bahagi nito.
Iminungkahi ni Saussure ang ideya ng isang bagong agham ng ikadalawampu siglo, na hiwalay sa linggwistika, na pinag-aaralan ang papel ng mga palatandaan sa lipunan. Tinawag ni Saussure ang science semiology na ito (mula sa Greek na "semeîon" - isang tanda). Ang "agham" ng semiotics, na umunlad sa Silangang Europa noong 1920s-1930s at sa Paris noong 1950s-1960s, ay nagpalawak ng pag-aaral ng wika at mga istrukturang linggwistika sa mga natuklasang pampanitikan na binubuo (o binabalangkas) sa tulong ng mga istrukturang ito. Bilang karagdagan, sa takip-silim ng kanyang karera, kasabay ng kanyang kurso sa pangkalahatang linggwistika, si Saussure ay nakikibahagi sa isang "semiotic" na pagsusuri ng huling Romanong tula, sinusubukang tumuklas ng sadyang binubuo ng mga anagram ng mga wastong pangalan. Ang pamamaraang ito sa maraming paraan ay kabaligtaran ng rasyonalismo sa pagsusuri sa linggwistika: ito ay isang pagtatangka na pag-aralan sa isang sistema ang problema ng "probability" sa wika. Ang ganitong pananaliksik ay nakakatulong na tumuon sa "tunay na bahagi" ng posibilidad; ang "pangunahing salita" kung saan hinahanap ni Saussure ang isang anagram ay, ayon kay Jean Starobinsky, "isang kasangkapan para sa makata, hindi ang pinagmulan ng buhay ng tula." Ang tula ay nagsisilbing palitan ang mga tunog ng keyword. Ayon kay Starobinsky, sa pagsusuring ito, "Hindi sumasali si Saussure sa paghahanap ng mga nakatagong kahulugan." Sa kabaligtaran, sa kanyang mga gawa, ang pagnanais na maiwasan ang mga tanong na may kaugnayan sa kamalayan ay kapansin-pansin: "dahil ang tula ay ipinahayag hindi lamang sa mga salita, kundi pati na rin sa kung ano ang ibinubunga ng mga salitang ito, ito ay lampas sa kontrol ng kamalayan at nakasalalay lamang sa ang mga batas ng wika” (tingnan ang . Appendix 1).
Ang pagtatangka ni Saussure na pag-aralan ang mga wastong pangalan sa huling Romanong tula ay binibigyang-diin ang isa sa mga bahagi ng kanyang pagsusuri sa linggwistika - ang arbitraryong katangian ng mga palatandaan, gayundin ang pormal na esensya ng linggwistika ni Saussure, na hindi kasama ang posibilidad ng pagsusuri ng kahulugan. Napagpasyahan ni Todorov na ngayon ang mga gawa ni Saussure ay tila lubos na pare-pareho sa kanilang pag-aatubili na pag-aralan ang mga simbolo ng isang kababalaghan na may malinaw na tinukoy na kahulugan [Appendix 1]. Sa paggalugad ng mga anagram, binibigyang-pansin lamang ni Saussure ang pag-uulit, ngunit hindi ang mga nakaraang opsyon. . . . Sa pag-aaral ng Nibelungenlied, tinukoy niya ang mga simbolo upang italaga lamang ang mga ito sa mga maling pagbabasa: kung hindi sinasadya, ang mga simbolo ay hindi umiiral. Pagkatapos ng lahat, sa kanyang mga akda sa pangkalahatang linggwistika, ginawa niya ang pagpapalagay ng pagkakaroon ng isang semiology na naglalarawan hindi lamang ng mga palatandaang pangwika; ngunit ang palagay na ito ay limitado sa pamamagitan ng katotohanan na ang semiology ay maaari lamang maglarawan ng random, arbitrary na mga palatandaan.
Kung ito ay talagang gayon, ito ay dahil lamang sa hindi niya maisip ang "intensiyon" na walang bagay; hindi niya lubusang madugtungan ang agwat sa pagitan ng anyo at nilalaman - sa kanyang mga akda ay naging tanong ito. Sa halip, bumaling siya sa "linguistic legitimacy". Sa pagitan, sa isang banda, ang mga konsepto ng ikalabinsiyam na siglo batay sa kasaysayan at mga subjective na haka-haka, at mga pamamaraan ng random na interpretasyon batay sa mga konseptong ito, at, sa kabilang banda, mga istruktural na konsepto na nagbubura ng oposisyon sa pagitan ng anyo at nilalaman (paksa at bagay) , kahulugan at pinagmulan sa structuralism, psychoanalysis, at maging sa quantum mechanics, ang mga sinulat ni Ferdinand de Saussure sa linguistics at semiotics ay nagmamarka ng pagbabago sa pag-aaral ng mga kahulugan sa wika at kultura.
Ang mga siyentipikong Ruso ay kinatawan din sa Unang Internasyonal na Kongreso ng mga Linguist sa The Hague noong 1928. S. Kartsevsky, R. Yakobson at N. Trubetskoy ay gumawa ng isang ulat na sinuri ang hierarchical na istraktura ng wika - sa diwa ng mga pinaka-modernong ideya para sa simula ng huling siglo. Si Jakobson sa kanyang mga akda ay bumuo ng mga ideya ni Saussure na ang mga pangunahing elemento ng isang wika ay dapat pag-aralan, una sa lahat, na may kaugnayan sa kanilang mga tungkulin, at hindi sa mga dahilan ng kanilang paglitaw.
Sa kasamaang palad, pagkatapos na maluklok si Stalin noong 1924, ang linggwistika ng Russia, tulad ng maraming iba pang mga agham, ay ibinalik. Maraming mga mahuhusay na siyentipiko ang napilitang mangibang-bayan, pinaalis sa bansa o namatay sa mga kampo. Noong kalagitnaan ng dekada 1950, naging posible ang isang tiyak na pluralismo ng mga teorya—higit pa sa Seksyon 1.2.
1.2 Paglalapat ng mga pamamaraang matematikal sa linggwistika sa ikalawang kalahati ng ikadalawampu siglo
Sa kalagitnaan ng ikadalawampu siglo, apat na paaralang pangwika sa daigdig ang nabuo, na ang bawat isa ay naging ninuno ng isang tiyak na "eksaktong" pamamaraan. Leningrad Phonological School(ang ninuno nito ay isang mag-aaral ng Baudouin de Courtenay L.V. Shcherba) ay gumamit ng isang psycholinguistic na eksperimento batay sa pagsusuri sa pagsasalita ng mga katutubong nagsasalita bilang pangunahing pamantayan para sa paglalahat ng tunog sa anyo ng isang ponema.
Mga siyentipiko Prague Linguistic Circle, lalo na, ang tagapagtatag nito na si N.S. Si Trubetskoy, na lumipat mula sa Russia, ay bumuo ng teorya ng mga pagsalungat - ang semantikong istraktura ng wika ay inilarawan nila bilang isang hanay ng mga oppositionally constructed semantic units - Sem. Ang teoryang ito ay inilapat sa pag-aaral hindi lamang sa wika, kundi pati na rin sa kulturang masining.
Mga ideologo Amerikanong deskriptibismo ay mga linggwista na sina L. Bloomfield at E. Sapir. Ang wika ay ipinakita sa mga deskriptibista bilang isang hanay ng mga pahayag sa pagsasalita, na siyang pangunahing layunin ng kanilang pag-aaral. Ang kanilang pokus ay sa mga tuntunin ng siyentipikong paglalarawan (kaya ang pangalan) ng mga teksto: ang pag-aaral ng organisasyon, pag-aayos at pag-uuri ng kanilang mga elemento. Ang pormalisasyon ng mga pamamaraang analitikal sa larangan ng ponolohiya at morpolohiya (pagbuo ng mga prinsipyo para sa pag-aaral ng wika sa iba't ibang antas, pagsusuri sa pamamahagi, pamamaraan ng mga direktang nasasakupan, atbp.) ay humantong sa pagbabalangkas ng mga pangkalahatang katanungan ng pagmomolde ng linggwistika. Ang kawalan ng pansin sa plano ng nilalaman ng wika, gayundin ang paradigmatikong panig ng wika, ay hindi nagbigay-daan sa mga deskriptibista na ganap na bigyang-kahulugan ang wika bilang isang sistema.

Ang Pagbuo ng Structural Linguistics sa Pagliko ng ika-19 – Ika-20 Siglo. Mga pamamaraan ng istatistika sa pag-aaral ng wika. Paglalapat ng mga pamamaraang matematikal sa linggwistika sa ikalawang kalahati ng ikadalawampu siglo. Pag-aaral ng wika sa pamamagitan ng mga pamamaraan ng pormal na lohika. Mga tampok ng pagsasalin ng makina.

PANIMULA

Kabanata 1. Ang kasaysayan ng aplikasyon ng mga pamamaraang matematikal sa linggwistika

1.1. Ang Pagbuo ng Structural Linguistics sa Pagliko ng ika-19 - Ika-20 Siglo

1.2. Paglalapat ng mga pamamaraang matematikal sa linggwistika sa ikalawang kalahati ng ikadalawampu siglo

Kabanata 2. Mga piling halimbawa ng paggamit ng matematika sa linggwistika

2.1. Pagsasalin ng makina

2.2.Mga pamamaraang istatistika sa pag-aaral ng wika

2.3. Pag-aaral ng wika sa pamamagitan ng mga pamamaraan ng pormal na lohika

2.4. Mga prospect para sa aplikasyon ng mga pamamaraan ng matematika sa linggwistika

Konklusyon

Panitikan

Apendise 1. Ronald Schleifer. Ferdinand de Saussure

Appendix 2. Ferdinand de Saussure (pagsasalin)

PANIMULA

Sa ika-20 siglo, nagkaroon ng patuloy na kalakaran tungo sa interaksyon at interpenetration ng iba't ibang larangan ng kaalaman. Ang mga hangganan sa pagitan ng mga indibidwal na agham ay unti-unting lumalabo; parami nang parami ang mga sangay ng mental na aktibidad na "nasa junction" ng kaalaman sa humanitarian, teknikal at natural na agham.

Ang isa pang halatang tampok ng modernidad ay ang pagnanais na pag-aralan ang mga istruktura at ang mga elemento ng bumubuo nito. Samakatuwid, ang isang pagtaas ng lugar, kapwa sa siyentipikong teorya at sa praktika, ay ibinibigay sa matematika. Ang pakikipag-ugnay, sa isang banda, sa lohika at pilosopiya, sa kabilang banda, sa mga istatistika (at, dahil dito, sa mga agham panlipunan), ang matematika ay tumagos nang mas malalim at mas malalim sa mga lugar na sa loob ng mahabang panahon ay itinuturing na puro. "makatao", pagpapalawak ng kanilang potensyal na heuristic (ang sagot sa tanong na "magkano" ay kadalasang makakatulong sa pagsagot sa mga tanong na "ano" at "paano"). Ang lingguwistika ay walang pagbubukod.

Ang layunin ng aking gawain sa kurso ay upang mai-highlight ang koneksyon sa pagitan ng matematika at isang sangay ng linggwistika bilang linggwistika. Mula noong 1950s, ginamit ang matematika sa linggwistika upang lumikha ng isang teoretikal na kagamitan para sa paglalarawan ng istruktura ng mga wika (parehong natural at artipisyal). Kasabay nito, dapat sabihin na hindi ito agad nakahanap ng gayong praktikal na aplikasyon para sa sarili nito. Sa una, ang mga pamamaraan ng matematika sa linggwistika ay nagsimulang gamitin upang linawin ang mga pangunahing konsepto ng linggwistika, gayunpaman, sa pag-unlad ng teknolohiya ng computer, ang gayong teoretikal na premise ay nagsimulang makahanap ng aplikasyon sa pagsasanay. Ang paglutas ng mga gawain tulad ng pagsasalin ng makina, pagkuha ng impormasyon ng makina, awtomatikong pagpoproseso ng teksto ay nangangailangan ng panimula ng bagong diskarte sa wika. Hinarap ng mga linguist ang tanong: kung paano matututong kumatawan sa mga pattern ng linggwistika sa anyo kung saan maaari silang direktang ilapat sa teknolohiya. Ang terminong "mathematical linguistics", na popular sa ating panahon, ay tumutukoy sa anumang linguistic na pananaliksik na gumagamit ng mga eksaktong pamamaraan (at ang konsepto ng eksaktong mga pamamaraan sa agham ay palaging malapit na nauugnay sa matematika). Ang ilang mga siyentipiko sa mga nakaraang taon ay naniniwala na ang expression mismo ay hindi maaaring itaas sa ranggo ng isang termino, dahil hindi ito nangangahulugang anumang espesyal na "linggwistika", ngunit isang bagong direksyon lamang na nakatuon sa pagpapabuti, pagtaas ng katumpakan at pagiging maaasahan ng mga pamamaraan ng pananaliksik sa wika. . Gumagamit ang Linguistics ng parehong quantitative (algebraic) at non-quantitative na mga pamamaraan, na naglalapit dito sa mathematical logic, at, dahil dito, sa pilosopiya, at maging sa sikolohiya. Kahit na binanggit ni Schlegel ang pakikipag-ugnayan ng wika at kamalayan, at si Ferdinand de Saussure, isang kilalang linggwista noong unang bahagi ng ikadalawampu siglo (sasabihin ko ang tungkol sa kanyang impluwensya sa pag-unlad ng mga pamamaraan ng matematika sa linggwistika sa ibang pagkakataon), ikinonekta ang istraktura ng wika sa pag-aari nito. sa mga tao. Ang modernong mananaliksik na si L. Perlovsky ay higit pa, na tinutukoy ang dami ng mga katangian ng wika (halimbawa, ang bilang ng mga kasarian, mga kaso) na may mga kakaibang katangian ng pambansang kaisipan (higit pa tungkol dito sa Seksyon 2.2, "Mga Paraan ng Istatistika sa Linggwistika").

Ang pakikipag-ugnayan ng matematika at lingguwistika ay isang multifaceted na paksa, at sa aking trabaho ay hindi ko tatalakayin ang lahat, ngunit, una sa lahat, sa mga inilapat na aspeto nito.

Kabanata IKasaysayan ng aplikasyon ng mga pamamaraan sa matematika sa linggwistika

1.1 Pagbuo ng structural linguisticssa pagliko ng XIX - XX na siglo

Ang paglalarawan sa matematika ng wika ay batay sa ideya ng wika bilang isang mekanismo, na bumalik sa sikat na Swiss linguist noong unang bahagi ng ikadalawampu siglo, si Ferdinand de Saussure.

Ang unang link ng kanyang konsepto ay ang teorya ng wika bilang isang sistema na binubuo ng tatlong bahagi (ang wika mismo ay wika, pananalita - password, at aktibidad sa pagsasalita - wika), kung saan ang bawat salita (miyembro ng system) ay hindi isinasaalang-alang sa sarili nito, ngunit may kaugnayan sa iba pang mga miyembro. Bilang isa pang kilalang lingguwista, ang Dane Louis Hjelmslev, sa kalaunan ay nabanggit, si Saussure "ang unang humingi ng isang istruktural na diskarte sa wika, iyon ay, isang siyentipikong paglalarawan ng wika sa pamamagitan ng pagtatala ng mga ugnayan sa pagitan ng mga yunit."

Sa pag-unawa sa wika bilang isang hierarchical na istraktura, si Saussure ang unang nagbigay ng problema sa halaga at kahalagahan ng mga yunit ng lingguwistika. Ang mga hiwalay na phenomena at mga kaganapan (sabihin, ang kasaysayan ng pinagmulan ng mga indibidwal na Indo-European na mga salita) ay dapat na pag-aralan hindi sa kanilang sarili, ngunit sa isang sistema kung saan sila ay nauugnay sa mga katulad na bahagi.

Itinuring ng istrukturang yunit ng wika ng Saussure ang salitang, "sign", kung saan pinagsama ang tunog at kahulugan. Wala sa mga elementong ito ang umiiral nang walang isa't isa: samakatuwid, naiintindihan ng katutubong nagsasalita ang iba't ibang lilim ng kahulugan ng polysemantic na salita bilang isang hiwalay na elemento sa kabuuan ng istruktura, sa wika.

Kaya, sa teorya ni F. de Saussure makikita ang interaksyon ng linggwistika, sa isang banda, sa sosyolohiya at sikolohiyang panlipunan (dapat tandaan na sa parehong oras, ang phenomenology ni Husserl, ang psychoanalysis ni Freud, ang teorya ng relativity ni Einstein ay pag-unlad, ang mga eksperimento ay nagaganap sa anyo at nilalaman sa panitikan, musika at sining), sa kabilang banda, sa matematika (ang konsepto ng systemicity ay tumutugma sa algebraic na konsepto ng wika). Ang ganitong konsepto ay nagbago sa konsepto ng linguistic na interpretasyon tulad ng: Ang mga penomena ay nagsimulang bigyang kahulugan hindi kaugnay sa mga sanhi ng kanilang paglitaw, ngunit may kaugnayan sa kasalukuyan at hinaharap. Ang interpretasyon ay tumigil na maging independyente sa mga intensyon ng isang tao (sa kabila ng katotohanan na ang mga intensyon ay maaaring impersonal, "walang malay" sa kahulugan ng Freudian ng salita).

Ang paggana ng mekanismo ng linggwistika ay ipinakikita sa pamamagitan ng aktibidad ng pagsasalita ng mga katutubong nagsasalita. Ang resulta ng pagsasalita ay ang tinatawag na "mga tamang teksto" - mga pagkakasunud-sunod ng mga yunit ng pagsasalita na sumusunod sa ilang mga pattern, na marami sa mga ito ay nagbibigay-daan sa isang paglalarawan ng matematika. Ang teorya ng mga paraan upang ilarawan ang syntactic na istraktura ay tumatalakay sa pag-aaral ng mga pamamaraan para sa matematikal na paglalarawan ng mga tamang teksto (pangunahin ang mga pangungusap). Sa ganitong istraktura, ang mga analohiya sa linggwistika ay tinukoy hindi sa tulong ng kanilang mga likas na katangian, ngunit sa tulong ng mga relasyon sa sistema ("structural").

Sa Kanluran, ang mga ideya ni Saussure ay binuo ng mga nakababatang kontemporaryo ng dakilang Swiss linguist: sa Denmark - L. Hjelmslev, na nabanggit ko na, na nagbunga ng algebraic theory ng wika sa kanyang akdang "Fundamentals of Linguistic Theory", sa ang USA - E. Sapir, L. Bloomfield, C. Harris, sa Czech Republic - ang Russian emigré scientist na si N. Trubetskoy.

Ang mga regular na istatistika sa pag-aaral ng wika ay nagsimulang harapin ng walang iba kundi ang tagapagtatag ng genetika, si Georg Mendel. Noong 1968 lamang natuklasan ng mga philologist na, sa mga huling taon ng kanyang buhay, siya ay nabighani sa pag-aaral ng linguistic phenomena gamit ang mga pamamaraan ng matematika. Dinala ni Mendel ang pamamaraang ito sa linggwistika mula sa biology; noong dekada 1990, tanging ang pinakamapangahas na linggwista at biologist ang nag-angkin ng pagiging posible ng naturang pagsusuri. Sa mga archive ng monasteryo ng St. Tomasz sa Brno, na ang abbot ay si Mendel, ang mga sheet ay natagpuan na may mga hanay ng mga apelyido na nagtatapos sa "mann", "bauer", "mayer", at may ilang mga fraction at kalkulasyon. Sa pagsisikap na matuklasan ang mga pormal na batas ng pinagmulan ng mga pangalan ng pamilya, gumawa si Mendel ng mga kumplikadong kalkulasyon, kung saan isinasaalang-alang niya ang bilang ng mga patinig at katinig sa wikang Aleman, ang kabuuang bilang ng mga salita na isinasaalang-alang niya, ang bilang ng mga apelyido, atbp.

Sa ating bansa, ang istrukturang lingguwistika ay nagsimulang umunlad sa halos parehong oras tulad ng sa Kanluran - sa pagliko ng ika-19-20 siglo. Kasabay ng F. de Saussure, ang konsepto ng wika bilang isang sistema ay binuo sa kanilang mga gawa ng mga propesor ng Kazan University F.F. Fortunatov at I.A. Baudouin de Courtenay. Ang huli ay nakipag-ugnayan nang mahabang panahon kay de Saussure, ayon sa pagkakabanggit, ang Geneva at Kazan na mga paaralan ng linggwistika ay nakipagtulungan sa isa't isa. Kung si Saussure ay matatawag na ideologist ng "eksaktong" mga pamamaraan sa linggwistika, kung gayon ang Baudouin de Courtenay ay naglatag ng mga praktikal na pundasyon para sa kanilang aplikasyon. Siya ang unang naghiwalay ng linggwistika (bilang tumpak isang agham na gumagamit ng mga istatistikal na pamamaraan at functional dependence) mula sa philology (isang komunidad ng mga humanitarian na disiplina na nag-aaral ng espirituwal na kultura sa pamamagitan ng wika at pananalita). Ang siyentipiko mismo ay naniniwala na "ang linggwistika ay maaaring maging kapaki-pakinabang sa malapit na hinaharap, napalaya lamang mula sa ipinag-uutos na unyon sa philology at kasaysayang pampanitikan" . Ang ponolohiya ay naging "lugar ng pagsubok" para sa pagpapakilala ng mga pamamaraang matematikal sa linggwistika - ang mga tunog bilang "mga atom" ng sistema ng wika, na may limitadong bilang ng mga madaling masusukat na katangian, ay ang pinaka maginhawang materyal para sa pormal at mahigpit na pamamaraan ng paglalarawan. Itinatanggi ng ponolohiya ang pagkakaroon ng kahulugan sa tunog, kaya inalis ang salik na "tao" sa mga pag-aaral. Sa ganitong diwa, ang mga ponema ay parang pisikal o biyolohikal na bagay.

Ang mga ponema, bilang pinakamaliit na elemento ng lingguwistika na katanggap-tanggap para sa persepsyon, ay kumakatawan sa isang hiwalay na globo, isang hiwalay na "phenomenological reality". Halimbawa, sa Ingles, ang tunog na "t" ay maaaring mabigkas nang iba, ngunit sa lahat ng pagkakataon, ang isang taong nagsasalita ng Ingles ay mapapansin ito bilang "t". Ang pangunahing bagay ay ang ponema ay gaganap ng kanyang pangunahing - makabuluhang - function. Bukod dito, ang mga pagkakaiba sa pagitan ng mga wika ay tulad na ang mga uri ng isang tunog sa isang wika ay maaaring tumutugma sa iba't ibang mga ponema sa isa pa; halimbawa, ang "l" at "r" sa Ingles ay magkaiba, habang sa iba pang mga wika ang mga ito ay mga uri ng parehong ponema (tulad ng Ingles na "t", binibigkas na mayroon o walang aspirasyon). Ang malawak na bokabularyo ng anumang natural na wika ay isang hanay ng mga kumbinasyon ng mas maliit na bilang ng mga ponema. Sa Ingles, halimbawa, 40 ponema lamang ang ginagamit sa pagbigkas at pagsulat ng halos isang milyong salita.

Ang mga tunog ng isang wika ay isang sistematikong nakaayos na hanay ng mga tampok. Noong 1920s -1930s, kasunod ni Saussure, Jacobson at N.S. Trubetskoy ay pinili ang "mga natatanging tampok" ng mga ponema. Ang mga tampok na ito ay batay sa istraktura ng mga organo ng pagsasalita - dila, ngipin, vocal cord. Halimbawa, sa Ingles ang pagkakaiba sa pagitan ng "t" at "d" ay ang pagkakaroon o kawalan ng isang "boses" (ang pag-igting ng mga vocal cord) at ang antas ng boses na nagpapakilala sa isang ponema mula sa isa pa. Kaya, ang ponolohiya ay maaaring ituring na isang halimbawa ng pangkalahatang tuntunin sa wika na inilarawan ni Saussure: "May mga pagkakaiba lamang sa wika". Kahit na ito ay mas mahalaga: ang pagkakaiba ay karaniwang nagpapahiwatig ng eksaktong mga kondisyon kung saan ito matatagpuan; ngunit sa wika ay mayroon lamang mga pagkakaiba na walang tiyak na kondisyon. Isinasaalang-alang man natin ang "pagtatalaga" o "signified" - sa wika ay walang mga konsepto o tunog na umiiral bago ang pagbuo ng sistema ng wika.

Kaya, sa Saussurean linguistics, ang pinag-aralan na phenomenon ay nauunawaan bilang isang hanay ng mga paghahambing at pagsalungat ng wika. Ang wika ay parehong pagpapahayag ng kahulugan ng mga salita at isang paraan ng komunikasyon, at ang dalawang tungkuling ito ay hindi kailanman nagtutugma. Mapapansin natin ang paghahalili ng anyo at nilalaman: ang mga linguistic contrast ay tumutukoy sa mga istrukturang yunit nito, at ang mga yunit na ito ay nakikipag-ugnayan upang lumikha ng isang tiyak na makabuluhang nilalaman. Dahil random ang mga elemento ng wika, hindi maaaring maging batayan ang contrast o combination. Nangangahulugan ito na sa isang wika, ang mga natatanging tampok ay bumubuo ng isang phonetic contrast sa ibang antas ng pag-unawa, ang mga ponema ay pinagsama sa mga morpema, mga morpema - sa mga salita, mga salita - sa mga pangungusap, atbp. Sa anumang kaso, isang buong ponema, salita, pangungusap, atbp. ay higit pa sa kabuuan ng mga bahagi nito.

Iminungkahi ni Saussure ang ideya ng isang bagong agham ng ikadalawampu siglo, na hiwalay sa linggwistika, na pinag-aaralan ang papel ng mga palatandaan sa lipunan. Tinawag ni Saussure ang science semiology na ito (mula sa Greek na "semeion" - isang tanda). Ang "agham" ng semiotics, na umunlad sa Silangang Europa noong 1920s at 1930s at sa Paris noong 1950s at 1960s, ay nagpalawak ng pag-aaral ng wika at mga istrukturang linggwistika sa mga natuklasang pampanitikan na binubuo (o binabalangkas) sa tulong ng mga istrukturang ito. Bilang karagdagan, sa takip-silim ng kanyang karera, kasabay ng kanyang kurso sa pangkalahatang linggwistika, si Saussure ay nakikibahagi sa isang "semiotic" na pagsusuri ng huling Romanong tula, sinusubukang tumuklas ng sadyang binubuo ng mga anagram ng mga wastong pangalan. Ang pamamaraang ito sa maraming paraan ay kabaligtaran ng rasyonalismo sa pagsusuri sa linggwistika: ito ay isang pagtatangka na pag-aralan sa isang sistema ang problema ng "probability" sa wika. Ang ganitong pananaliksik ay nakakatulong na tumuon sa "tunay na bahagi" ng posibilidad; ang "pangunahing salita" kung saan hinahanap ni Saussure ang isang anagram ay, ayon kay Jean Starobinsky, "isang kasangkapan para sa makata, hindi ang pinagmulan ng buhay ng tula." Ang tula ay nagsisilbing palitan ang mga tunog ng keyword. Ayon kay Starobinsky, sa pagsusuring ito, "Hindi sumasali si Saussure sa paghahanap ng mga nakatagong kahulugan." Sa kabaligtaran, sa kanyang mga gawa, ang pagnanais na maiwasan ang mga tanong na may kaugnayan sa kamalayan ay kapansin-pansin: "dahil ang tula ay ipinahayag hindi lamang sa mga salita, kundi pati na rin sa kung ano ang ibinubunga ng mga salitang ito, ito ay lampas sa kontrol ng kamalayan at nakasalalay lamang sa ang mga batas ng wika” (tingnan ang . Appendix 1).

Ang pagtatangka ni Saussure na pag-aralan ang mga wastong pangalan sa huling Romanong tula ay binibigyang-diin ang isa sa mga bahagi ng kanyang pagsusuri sa linggwistika - ang arbitraryong katangian ng mga palatandaan, gayundin ang pormal na esensya ng linggwistika ni Saussure, na hindi kasama ang posibilidad ng pagsusuri ng kahulugan. Napagpasyahan ni Todorov na ngayon ang mga gawa ni Saussure ay tila lubos na pare-pareho sa kanilang pag-aatubili na pag-aralan ang mga simbolo ng isang kababalaghan na may malinaw na tinukoy na kahulugan [Appendix 1]. Sa paggalugad ng mga anagram, binibigyang-pansin lamang ni Saussure ang pag-uulit, ngunit hindi ang mga nakaraang opsyon. . . . Sa pag-aaral ng Nibelungenlied, tinukoy niya ang mga simbolo upang italaga lamang ang mga ito sa mga maling pagbabasa: kung hindi sinasadya, ang mga simbolo ay hindi umiiral. Pagkatapos ng lahat, sa kanyang mga akda sa pangkalahatang linggwistika, ginawa niya ang pagpapalagay ng pagkakaroon ng isang semiology na naglalarawan hindi lamang ng mga palatandaang pangwika; ngunit ang palagay na ito ay limitado sa pamamagitan ng katotohanan na ang semiology ay maaari lamang maglarawan ng random, arbitrary na mga palatandaan.

Kung ito ay talagang gayon, ito ay dahil lamang sa hindi niya maisip ang "intensiyon" na walang bagay; hindi niya lubusang madugtungan ang agwat sa pagitan ng anyo at nilalaman - sa kanyang mga akda ay naging tanong ito. Sa halip, bumaling siya sa "linguistic legitimacy". Sa pagitan, sa isang banda, ang mga konsepto ng ikalabinsiyam na siglo batay sa kasaysayan at mga subjective na haka-haka, at mga pamamaraan ng random na interpretasyon batay sa mga konseptong ito, at, sa kabilang banda, mga istruktural na konsepto na nagbubura ng oposisyon sa pagitan ng anyo at nilalaman (paksa at bagay) , kahulugan at pinagmulan sa structuralism, psychoanalysis, at maging sa quantum mechanics - ang mga sinulat ni Ferdinand de Saussure sa linguistics at semiotics ay nagmamarka ng pagbabago sa pag-aaral ng mga kahulugan sa wika at kultura.

Ang mga siyentipikong Ruso ay kinatawan din sa Unang Internasyonal na Kongreso ng mga Linguist sa The Hague noong 1928. S. Kartsevsky, R. Yakobson at N. Trubetskoy ay gumawa ng isang ulat na sinuri ang hierarchical na istraktura ng wika - sa diwa ng mga pinaka-modernong ideya para sa simula ng huling siglo. Si Jakobson sa kanyang mga akda ay bumuo ng mga ideya ni Saussure na ang mga pangunahing elemento ng isang wika ay dapat pag-aralan, una sa lahat, na may kaugnayan sa kanilang mga tungkulin, at hindi sa mga dahilan ng kanilang paglitaw.

Sa kasamaang palad, pagkatapos na maluklok si Stalin noong 1924, ang linggwistika ng Russia, tulad ng maraming iba pang mga agham, ay ibinalik. Maraming mga mahuhusay na siyentipiko ang napilitang mangibang-bayan, pinaalis sa bansa o namatay sa mga kampo. Lamang mula noong kalagitnaan ng 1950s nagkaroon ng isang tiyak na pluralismo ng mga teorya na naging posible - higit pa dito sa Seksyon 1.2.

1.2 Paglalapat ng mga pamamaraang matematikal sa linggwistika sa ikalawang kalahati ng ikadalawampu siglo

Sa kalagitnaan ng ikadalawampu siglo, apat na paaralang pangwika sa daigdig ang nabuo, na ang bawat isa ay naging ninuno ng isang tiyak na "eksaktong" pamamaraan. Leningrad Phonological School(ang ninuno nito ay isang mag-aaral ng Baudouin de Courtenay L.V. Shcherba) ay gumamit ng isang psycholinguistic na eksperimento batay sa pagsusuri sa pagsasalita ng mga katutubong nagsasalita bilang pangunahing pamantayan para sa paglalahat ng tunog sa anyo ng isang ponema.

Mga siyentipiko Prague Linguistic Circle, sa partikular - ang tagapagtatag nito na si N.S. Si Trubetskoy, na lumipat mula sa Russia, ay bumuo ng teorya ng mga pagsalungat - ang semantikong istraktura ng wika ay inilarawan nila bilang isang hanay ng mga oppositionally built semantic units - Sem. Ang teoryang ito ay inilapat sa pag-aaral hindi lamang sa wika, kundi pati na rin sa kulturang masining.

Mga ideologo Amerikanong deskriptibismo ay mga linggwista na sina L. Bloomfield at E. Sapir. Ang wika ay ipinakita sa mga deskriptibista bilang isang hanay ng mga pahayag sa pagsasalita, na siyang pangunahing layunin ng kanilang pag-aaral. Ang kanilang pokus ay sa mga tuntunin ng siyentipikong paglalarawan (kaya ang pangalan) ng mga teksto: ang pag-aaral ng organisasyon, pag-aayos at pag-uuri ng kanilang mga elemento. Ang pormalisasyon ng mga pamamaraang analitikal sa larangan ng ponolohiya at morpolohiya (pagbuo ng mga prinsipyo para sa pag-aaral ng wika sa iba't ibang antas, pagsusuri sa pamamahagi, pamamaraan ng mga direktang nasasakupan, atbp.) ay humantong sa pagbabalangkas ng mga pangkalahatang katanungan ng pagmomolde ng linggwistika. Ang kawalan ng pansin sa plano ng nilalaman ng wika, gayundin ang paradigmatikong panig ng wika, ay hindi nagbigay-daan sa mga deskriptibista na ganap na bigyang-kahulugan ang wika bilang isang sistema.

Noong 1960s, nabuo ang teorya ng mga pormal na gramatika, na lumitaw pangunahin dahil sa gawain ng pilosopo at lingguwistang Amerikano na si N. Chomsky. Siya ay nararapat na ituring na isa sa mga pinakatanyag na modernong siyentipiko at pampublikong pigura, maraming mga artikulo, monograp at kahit isang buong dokumentaryo ang nakatuon sa kanya. Sa pangalan ng isang panimula na bagong paraan ng paglalarawan ng syntactic na istraktura na naimbento ni Chomsky - generative (generative) grammar - ang kaukulang kalakaran sa linggwistika ay tinawag generativism.

Si Chomsky, isang inapo ng mga imigrante mula sa Russia, ay nag-aral ng linguistics, matematika at pilosopiya sa Unibersidad ng Pennsylvania mula noong 1945, na malakas na naiimpluwensyahan ng kanyang gurong si Zelig Harris - tulad ni Harris, isinasaalang-alang ni Chomsky at isinasaalang-alang pa rin ang kanyang pampulitikang pananaw na malapit sa anarkismo (siya ay kilala bilang kritiko ng umiiral na sistemang pampulitika ng US at bilang isa sa mga espirituwal na pinuno ng anti-globalismo).

Ang unang pangunahing gawaing pang-agham ni Chomsky, ang master's thesis na "Morpolohiya ng Modernong Hebrew » (1951) ay nanatiling hindi nai-publish. Natanggap ni Chomsky ang kanyang titulo ng doktor mula sa Unibersidad ng Pennsylvania noong 1955, ngunit karamihan sa pananaliksik na pinagbabatayan ng kanyang disertasyon (nai-publish nang buo noong 1975 sa ilalim ng pamagat na The Logical Structure of Linguistic Theory) at ang kanyang unang monograph, Syntactic Structures (1957, Rus. trans . 1962), ay ginanap sa Harvard University noong 1951-1955. Sa parehong 1955, lumipat ang siyentipiko sa Massachusetts Institute of Technology, kung saan siya ay naging propesor noong 1962.

Ang teorya ni Chomsky ay dumaan sa ilang yugto sa pag-unlad nito.

Sa unang monograph na "Syntactic Structures", ipinakita ng siyentipiko ang wika bilang isang mekanismo para sa pagbuo ng isang walang katapusang hanay ng mga pangungusap gamit ang isang may hangganang hanay ng mga paraan ng gramatika. Upang ilarawan ang mga katangian ng lingguwistika, iminungkahi niya ang mga konsepto ng malalim (nakatago mula sa direktang pang-unawa at nabuo ng isang sistema ng recursive, ibig sabihin, maaaring ilapat nang paulit-ulit, mga panuntunan) at ibabaw (direktang pinaghihinalaang) mga istrukturang gramatika, pati na rin ang mga pagbabagong naglalarawan sa paglipat mula sa malalalim na istruktura hanggang sa ibabaw. Ang ilang mga istraktura sa ibabaw ay maaaring tumutugma sa isang malalim na istraktura (halimbawa, isang passive na istraktura Ang kautusan ay nilagdaan ng pangulo nagmula sa parehong Deep Structure bilang aktibong construct Pinirmahan ng Pangulo ang kautusan) at kabaliktaran (kaya, ang kalabuan mahal ng ina ang anak na babae inilarawan bilang resulta ng isang pagkakataon ng mga istruktura sa ibabaw na bumalik sa dalawang magkaibang malalim, kung saan ang ina ay ang nagmamahal sa anak na babae, at sa isa pa, ang minamahal ng anak na babae).

Ang pamantayang teorya ni Chomsky ay itinuturing na "Aspects" na modelo na itinakda sa aklat ni Chomsky na "Aspects of the Theory of Syntax". Sa modelong ito, sa unang pagkakataon, ang mga tuntunin ng semantikong interpretasyon ay ipinakilala sa pormal na teorya, na nag-uugnay ng kahulugan sa malalim na mga istruktura. Sa Aspekto, ang linguistic competence ay laban sa paggamit ng wika (performance), ang tinatawag na Katz-Postal hypothesis tungkol sa pangangalaga ng kahulugan sa panahon ng pagbabago ay pinagtibay, na may kaugnayan kung saan ang konsepto ng opsyonal na pagbabago ay hindi kasama, at isang apparatus ng Ang mga tampok na sintaktik na naglalarawan sa pagkakatugma ng leksikal ay ipinakilala.

Noong 1970s, nagtrabaho si Chomsky sa teorya ng kontrol at pagbubuklod (GB-theory - mula sa mga salita pamahalaan at nagbubuklod) ay mas pangkalahatan kaysa sa nauna. Sa loob nito, tinalikuran ng siyentipiko ang mga tiyak na panuntunan na naglalarawan sa mga istrukturang sintaktik ng mga partikular na wika. Ang lahat ng mga pagbabago ay napalitan ng isang unibersal na paglipat ng pagbabago. Sa loob ng balangkas ng teorya ng GB, mayroon ding mga pribadong module, na ang bawat isa ay may pananagutan para sa sarili nitong bahagi ng grammar.

Kamakailan lamang, noong 1995, naglagay si Chomsky ng isang minimalist na programa, kung saan ang wika ng tao ay inilalarawan tulad ng machine language. Ito ay isang programa lamang - hindi isang modelo o isang teorya. Sa loob nito, kinilala ni Chomsky ang dalawang pangunahing subsystem ng kagamitan ng wika ng tao: ang lexicon at ang computing system, pati na rin ang dalawang interface - phonetic at logical.

Ang mga pormal na gramatika ni Chomsky ay naging klasiko para sa paglalarawan hindi lamang natural kundi pati na rin ang mga artipisyal na wika - sa partikular, mga programming language. Ang pag-unlad ng istrukturang linggwistika sa ikalawang kalahati ng ika-20 siglo ay maaaring ituring na isang "Chomskian revolution".

Moscow Phonological School, na ang mga kinatawan ay sina A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, gumamit ng katulad na teorya sa pag-aaral ng phonetics. Unti-unti, ang mga "eksaktong" pamamaraan ay nagsisimula nang ilapat patungkol hindi lamang sa phonetics, kundi pati na rin sa syntax. Parehong linguist at mathematician, dito at sa ibang bansa, ay nagsisimulang pag-aralan ang istruktura ng wika. Noong 1950s at 60s, nagsimula ang isang bagong yugto sa pakikipag-ugnayan sa pagitan ng matematika at linggwistika sa USSR, na nauugnay sa pag-unlad ng mga sistema ng pagsasalin ng makina.

Ang impetus para sa pagsisimula ng mga gawaing ito sa ating bansa ay ang mga unang pag-unlad sa larangan ng pagsasalin ng makina sa Estados Unidos (bagaman ang unang mekanisadong kagamitan sa pagsasalin ni P.P. Smirnov-Troyansky ay naimbento sa USSR noong 1933, ito, bilang primitive. , ay hindi naging laganap). Noong 1947, gumawa sina A. Butt at D. Britten ng isang code para sa pagsasalin ng salita-sa-salita gamit ang isang computer; makalipas ang isang taon, iminungkahi ni R. Richens ang isang panuntunan para sa paghahati ng mga salita sa mga stems at mga pagtatapos sa pagsasalin ng makina. Ibang-iba ang mga taon na iyon sa ngayon. Ang mga ito ay napakalaki at mamahaling mga makina na umabot sa buong mga silid at nangangailangan ng malaking kawani ng mga inhinyero, operator at programmer upang mapanatili ang mga ito. Karaniwan, ang mga computer na ito ay ginamit upang magsagawa ng mga kalkulasyon sa matematika para sa mga pangangailangan ng mga institusyong militar - ang bago sa matematika, pisika at teknolohiya na pinagsilbihan, una sa lahat, ang mga gawaing militar. Sa mga unang yugto, ang pagbuo ng MP ay aktibong suportado ng militar, kasama ang lahat ng ito (sa mga kondisyon ng Cold War), ang direksyon ng Russian-English na binuo sa USA, at ang direksyon ng Anglo-Russian sa USSR.

Noong Enero 1954, naganap ang "Georgetown Experiment" sa Massachusetts Technical University - ang unang pampublikong demonstrasyon ng pagsasalin mula sa Ruso sa Ingles sa makina ng IBM-701. Abstract ng mensahe tungkol sa matagumpay na pagpasa ng eksperimento, na ginawa ni D.Yu. Panov, ay lumitaw sa RJ "Mathematics", 1954, No. 10: "Pagsasalin mula sa isang wika patungo sa isa pa gamit ang isang makina: isang ulat sa unang matagumpay na pagsubok."

Si D. Yu. Panov (sa oras na iyon ay direktor ng Institute of Scientific Information - INI, kalaunan ay VINITI) ay umakit kay I. K. Belskaya, na kalaunan ay pinamunuan ang machine translation group sa Institute of Precise Mathematics at Computer Engineering ng USSR Academy of Sciences, upang magtrabaho sa pagsasalin ng makina. Sa pagtatapos ng 1955, ang unang karanasan ng pagsasalin mula sa Ingles sa Russian sa tulong ng BESM machine ay nagsimula noon. Ang mga programa para sa BESM ay pinagsama-sama ng N.P. Trifonov at L.N. Korolev, na ang tesis ng Ph.D. ay nakatuon sa mga pamamaraan para sa pagbuo ng mga diksyunaryo para sa pagsasalin ng makina.

Kaayon, ang trabaho sa pagsasalin ng makina ay isinagawa sa Kagawaran ng Applied Mathematics ng Mathematical Institute ng USSR Academy of Sciences (ngayon ay M.V. Keldysh Institute of Applied Mathematics ng Russian Academy of Sciences). Sa inisyatiba ng mathematician na si A.A. Lyapunov. Kasama niya ang O.S. Kulagin at ang kanyang mga mag-aaral na T.D. Sina Wentzel at N.N. Ricco. Ang mga ideya nina Lyapunov at Kulagina tungkol sa posibilidad ng paggamit ng teknolohiya upang magsalin mula sa isang wika patungo sa isa pa ay inilathala sa journal Nature, 1955, No. 8. Mula sa katapusan ng 1955, T.N. Moloshnaya, na pagkatapos ay nagsimulang independiyenteng trabaho sa algorithm ng pagsasalin ng English-Russian.

Naaalala ni R. Frumkina, na sa oras na iyon ay nakikibahagi sa algorithm ng pagsasalin mula sa Espanyol, na sa yugtong ito ng gawain ay mahirap gumawa ng anumang mga pare-parehong hakbang. Mas madalas kailangan kong sundin ang heuristic na karanasan - sarili ko o mga kasamahan.

Kasabay nito, ang unang henerasyon ng mga sistema ng pagsasalin ng makina ay napakadi-perpekto. Ang lahat ng mga ito ay batay sa sunud-sunod na mga algorithm ng pagsasalin "salita sa pamamagitan ng salita", "parirala sa pamamagitan ng parirala" - ang mga koneksyon sa semantiko sa pagitan ng mga salita at pangungusap ay hindi isinasaalang-alang sa anumang paraan. Halimbawa, ang mga pangungusap ay: Hinahanap ni John ang kanyang kahon ng laruan.Sa wakas ay natagpuan niya ito. Ang kahon ay nasa panulat.Tuwang-tuwa si John. (Hinahanap ni John ang kanyang kahon ng laruan. Sa wakas ay natagpuan niya ito. Nasa playpen ang kahon. Tuwang-tuwa si John.).” Ang "Pulat" sa kontekstong ito ay hindi isang "panulat" (kasangkapan sa pagsulat), ngunit isang "playpen" ( play-pen). Ang kaalaman sa mga kasingkahulugan, kasalungat at matalinghagang kahulugan ay mahirap ipasok sa isang computer. Ang isang promising na direksyon ay ang pagbuo ng mga computer system na nakatuon sa paggamit ng isang tao na tagasalin.

Sa paglipas ng panahon, ang mga direktang sistema ng pagsasalin ay pinalitan ng mga T-system (mula sa salitang Ingles na "paglipat" - pagbabagong-anyo), kung saan isinagawa ang pagsasalin sa antas ng mga istrukturang sintaktik. Ang mga algorithm ng mga T-system ay gumamit ng mekanismo na naging posible upang bumuo ng isang syntactic na istraktura ayon sa mga tuntunin ng grammar ng wika ng input na pangungusap (katulad ng kung paano itinuro ang isang banyagang wika sa mataas na paaralan), at pagkatapos ay i-synthesize ang output na pangungusap. sa pamamagitan ng pagbabago sa istrukturang sintaktik at pagpapalit ng mga kinakailangang salita mula sa diksyunaryo.

Nagsalita si Lyapunov tungkol sa pagsasalin sa pamamagitan ng pagkuha ng kahulugan ng isinalin na teksto at paglalahad nito sa ibang wika. Ang diskarte sa pagbuo ng mga machine translation system batay sa pagkuha ng semantic representation ng input sentence sa pamamagitan ng semantic analysis at synthesis ng input sentence ayon sa nakuha na semantic representation ay itinuturing pa rin na pinakaperpekto. Ang ganitong mga sistema ay tinatawag na I-systems (mula sa salitang "interlingua"). Kasabay nito, ang gawain ng paglikha ng mga ito, na ibinalik noong huling bahagi ng 50s at unang bahagi ng 60s, ay hindi pa ganap na nalutas sa ngayon, sa kabila ng mga pagsisikap ng International Federation of IFIP - ang komunidad ng mundo ng mga siyentipiko sa larangan ng pagproseso ng impormasyon .

Naisip ng mga siyentipiko kung paano gawing pormal at bumuo ng mga algorithm para sa pagtatrabaho sa mga teksto, kung anong mga diksyunaryo ang dapat ipasok sa makina, kung anong mga pattern ng linguistic ang dapat gamitin sa pagsasalin ng makina. Ang tradisyunal na lingguwistika ay walang ganoong mga ideya - hindi lamang sa mga tuntunin ng semantika, kundi pati na rin sa mga tuntunin ng syntax. Sa oras na iyon, walang mga listahan ng mga syntactic constructions para sa anumang wika, ang mga kondisyon para sa kanilang compatibility at interchangeability ay hindi pinag-aralan, ang mga patakaran para sa pagbuo ng malalaking yunit ng syntactic structure mula sa mas maliliit na elemento ng constituent ay hindi binuo.

Ang pangangailangan na lumikha ng mga teoretikal na pundasyon ng pagsasalin ng makina ay humantong sa pagbuo at pag-unlad ng matematikal na lingguwistika. Ang nangungunang papel sa bagay na ito sa USSR ay ginampanan ng mga mathematician na si A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, mga linggwista na si V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Ang disertasyon ni Kulagina ay nakatuon sa pag-aaral ng pormal na teorya ng mga gramatika (kasabay ng N. Khomsky sa USA), iniharap ni Kuznetsov ang gawain ng axiomatization ng linguistics, na bumalik sa mga gawa ni F.F. Fortunatov.

Noong Mayo 6, 1960, ang Decree ng Presidium ng USSR Academy of Sciences "Sa pagbuo ng mga istruktura at matematikal na pamamaraan para sa pag-aaral ng wika" ay pinagtibay, at ang mga kaukulang dibisyon ay nilikha sa Institute of Linguistics at Institute of the Institute. Wikang Ruso. Mula noong 1960, ang nangungunang humanitarian universities ng bansa - ang Faculty of Philology ng Moscow State University, Leninrad, Novosibirsk Universities, Moscow State Institute of Foreign Languages ​​​​ay nagsimulang magsanay ng mga tauhan sa larangan ng awtomatikong pagproseso ng teksto.

Kasabay nito, ang mga gawa sa machine translation ng panahong ito, na tinatawag na "classical", ay mas teoretikal kaysa praktikal na interes. Ang mga cost-effective na machine translation system ay nagsimulang malikha lamang noong dekada otsenta ng huling siglo. Pag-uusapan ko ito mamaya sa Seksyon 2.1, Machine Translation.

Kasama sa 1960s - 70s ang malalim na teoretikal na pag-unlad gamit ang mga pamamaraan ng set theory at mathematical logic, tulad ng field theory at fuzzy set theory.

Ang may-akda ng field theory sa linguistics ay ang Sobyet na makata, tagasalin at linguist na si V.G. Admoni. Una niyang binuo ang kanyang teorya batay sa wikang Aleman. Para kay Admoni, ang konsepto ng "patlang" ay tumutukoy sa isang arbitraryong hindi walang laman na hanay ng mga elementong pangwika (halimbawa, "lexical field", "semantic field").

Ang istraktura ng field ay heterogenous: ito ay binubuo ng isang core, ang mga elemento nito ay mayroong kumpletong hanay ng mga feature na tumutukoy sa isang set, at isang periphery, ang mga elemento nito ay maaaring magkaroon ng parehong feature ng isang ibinigay na set (hindi lahat) at mga kapitbahay. Magbibigay ako ng isang halimbawa na naglalarawan sa pahayag na ito: halimbawa, sa Ingles, ang larangan ng mga tambalang salita (“day-dream” - “dream” ay mahirap ihiwalay sa larangan ng mga parirala (“tear gas” - “tear gas”) .

Ang teorya ng fuzzy set na nabanggit na sa itaas ay malapit na nauugnay sa field theory. Sa USSR, ang mga linggwista na si V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, gayunpaman, ang ninuno nito ay ang American mathematician na si L. Zadeh, na noong 1965 ay naglathala ng artikulong "Fuzzy Logic". Sa pagbibigay ng katwiran sa matematika para sa teorya ng fuzzy set, itinuring ni Zade ang mga ito batay sa materyal na lingguwistika.

Sa teoryang ito, hindi gaanong pinag-uusapan ang tungkol sa pag-aari ng mga elemento sa isang naibigay na hanay (Aa), ngunit tungkol sa antas ng pagiging miyembro na ito (Aa), dahil ang mga peripheral na elemento ay maaaring kabilang sa ilang mga larangan sa isang antas o iba pa. Si Zade (Lofti-zade) ay isang katutubong ng Azerbaijan, hanggang sa edad na 12 ay nagkaroon siya ng kasanayan sa pakikipag-usap sa apat na wika - Azerbaijani, Russian, English at Persian - at gumamit ng tatlong magkakaibang mga alpabeto: Cyrillic, Latin, Arabic. Kapag tinanong ang isang siyentipiko kung ano ang karaniwan sa pagitan ng fuzzy set theory at linguistics, hindi niya itinatanggi ang koneksyon na ito, ngunit nilinaw niya: "Hindi ako sigurado na ang pag-aaral ng mga wikang ito ay may malaking epekto sa aking pag-iisip. Kung ito ang kaso, pagkatapos lamang subconsciously. Sa kanyang kabataan, nag-aral si Zadeh sa isang Presbyterian school sa Tehran, at pagkatapos ng Ikalawang Digmaang Pandaigdig ay lumipat siya sa Estados Unidos. "Ang tanong ay hindi kung ako ay isang Amerikano, Ruso, Azerbaijani o ibang tao," sabi niya sa isa sa mga pag-uusap, "Ako ay hinubog ng lahat ng mga kultura at mga tao na ito at medyo komportable sa bawat isa sa kanila." Sa mga salitang ito mayroong isang bagay na katulad sa kung ano ang nagpapakilala sa teorya ng mga malabo na hanay - isang pag-alis mula sa hindi malabo na mga kahulugan at matalim na mga kategorya.

Sa ating bansa, noong dekada 70, isinalin at pinag-aralan ang mga gawa ng mga Kanluraning dalubwika noong ikadalawampu siglo. I.A. Isinalin ni Melchuk ang mga gawa ni N. Chomsky sa Russian. SA. Iniuugnay ni Slyusareva sa kanyang aklat na "The Theory of F. de Saussure in the Light of Modern Linguistics" ang mga postulate ng pagtuturo ni Saussure sa mga aktwal na problema ng linggwistika noong dekada 70. May tendensiya tungo sa karagdagang mathematization ng linggwistika. Ang mga nangungunang domestic unibersidad ay mga tauhan ng pagsasanay sa espesyalidad na "Mathematical (theoretical, applied) linguistics". Kasabay nito sa Kanluran ay mayroong isang matalim na paglukso sa pag-unlad ng teknolohiya ng kompyuter, na nangangailangan ng higit at higit pang mga bagong pundasyong pangwika.

Noong 1980s, Propesor ng Institute of Oriental Studies ng Academy of Sciences Yu.K. Si Lekomtsev, habang sinusuri ang wika ng linggwistika sa pamamagitan ng pagsusuri ng mga iskema, talahanayan at iba pang uri ng notasyon na ginagamit sa mga paglalarawang linggwistika, ay isinasaalang-alang ang mga sistemang pangmatematika na angkop para sa mga layuning ito (pangunahin ang mga sistema ng matrix algebra).

Kaya, sa buong ika-20 siglo nagkaroon ng convergence ng eksaktong at humanities. Ang pakikipag-ugnayan ng matematika sa linggwistika ay lalong nakahanap ng mga praktikal na aplikasyon. Higit pa tungkol dito sa susunod na kabanata.

Kabanata 2. Mga piling halimbawa ng paggamit ng matematika sa linggwistika

2.1 Pagsasalin sa makina

Ang ideya ng pagsasalin mula sa isang wika patungo sa isa pa sa tulong ng isang unibersal na mekanismo ay lumitaw ilang siglo bago nagsimula ang mga unang pag-unlad sa lugar na ito - noong 1649, iminungkahi ni Rene Descartes ang ideya ng isang wika kung saan ang mga katumbas na ideya ng ang iba't ibang wika ay ipahahayag ng isang simbolo. Ang mga unang pagtatangka na ipatupad ang ideyang ito noong 1930s-40s, ang simula ng teoretikal na pag-unlad sa kalagitnaan ng siglo, ang pagpapabuti ng mga sistema ng pagsasalin sa tulong ng teknolohiya noong 1970s-80s, ang mabilis na pag-unlad ng teknolohiya ng pagsasalin sa huling dekada - ito ang mga yugto sa pagbuo ng machine translation bilang isang industriya. Ito ay mula sa mga gawa sa machine translation na ang computer linguistics bilang isang agham ay lumago.

Sa pag-unlad ng teknolohiya ng computer noong huling bahagi ng dekada 70 at unang bahagi ng dekada 80, itinakda ng mga mananaliksik ang kanilang sarili na mas makatotohanan at matipid na mga layunin - ang makina ay hindi naging isang katunggali (tulad ng ipinapalagay dati), ngunit isang katulong sa isang tagasalin ng tao. Ang pagsasalin ng makina ay huminto sa paglilingkod ng eksklusibong mga gawaing militar (lahat ng mga imbensyon at pananaliksik ng Sobyet at Amerikano, na pangunahing nakatuon sa Ruso at Ingles, ay nag-ambag sa Cold War sa isang paraan o iba pa). Noong 1978, ipinadala ang mga natural na salita sa wika sa Arpa interconnected network, at pagkalipas ng anim na taon, lumitaw ang unang microcomputer translation program sa Estados Unidos.

Noong dekada 70, binibili ng Commission of the European Communities ang English-French na bersyon ng Systran computer translator, na nag-order din ng French-English at Italian-English na bersyon, at ang Russian-to-English translation system na ginagamit ng US Armed Forces. Ito ay kung paano inilatag ang mga pundasyon ng proyekto ng EUROTRA.

Tungkol sa muling pagkabuhay ng machine translation noong 70-80s. Ang mga sumusunod na katotohanan ay nagpapatotoo: binibili ng Commission of the European Communities (CEC) ang English-French na bersyon ng Systran, gayundin ang sistema ng pagsasalin mula sa Russian patungo sa English (ang huli ay binuo pagkatapos ng ulat ng ALPAC at patuloy na ginagamit ng US Air Force at NASA); bilang karagdagan, ipinag-uutos ng CEC ang pagbuo ng mga bersyong French-English at Italian-English. Kasabay nito, mayroong mabilis na pagpapalawak ng mga aktibidad sa pagsasalin ng makina sa Japan; sa USA, iniutos ng Pan American Health Organization (PAHO) ang pagbuo ng isang Spanish-English na direksyon (SPANAM system); Pinopondohan ng US Air Force ang pagbuo ng isang machine translation system sa Linguistic Research Center sa University of Texas sa Austin; Ang pangkat ng TAUM sa Canada ay gumagawa ng kapansin-pansing pag-unlad sa pagbuo ng kanilang METEO (meteorological translation) system. Ang ilang mga proyekto ay nagsimula noong 70s at 80s. pagkatapos ay binuo sa ganap na komersyal na mga sistema.

Sa panahon ng 1978-93, 20 milyong dolyar ang ginugol sa pananaliksik sa larangan ng pagsasalin ng makina sa USA, 70 milyon sa Europa, at 200 milyon sa Japan.

Ang isa sa mga bagong pag-unlad ay ang teknolohiya ng TM (translation memory), na gumagana sa prinsipyo ng akumulasyon: sa panahon ng proseso ng pagsasalin, ang orihinal na segment (pangungusap) at ang pagsasalin nito ay nai-save, na nagreresulta sa pagbuo ng isang linguistic database; kung ang isang kapareho o katulad na segment ay matatagpuan sa bagong isinalin na teksto, ito ay ipinapakita kasama ng pagsasalin at isang indikasyon ng porsyento na tugma. Ang tagasalin pagkatapos ay gumawa ng desisyon (upang i-edit, tanggihan o tanggapin ang pagsasalin), ang resulta nito ay iniimbak ng system, kaya hindi na kailangang isalin ang parehong pangungusap nang dalawang beses. Ang isang kilalang komersyal na sistema batay sa teknolohiya ng TM ay kasalukuyang binuo ng TRADOS system (itinatag noong 1984).

Sa kasalukuyan, ilang dosenang kumpanya ang bumubuo ng mga komersyal na sistema ng pagsasalin ng makina, kabilang ang: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata Software; Linguistica b.v. at iba pa. Ngayon ay maaari mong gamitin ang mga serbisyo ng mga awtomatikong tagasalin nang direkta sa Web: alphaWorks; Online na Tagasalin ng PROMT; LogoMedia.net; Serbisyo sa Pagsasalin ng Babel Fish ng AltaVista; InfiniT.com; Pagsasalin ng Internet.

Ang mga komersyal na epektibong sistema ng pagsasalin ay lumitaw din sa ikalawang kalahati ng dekada 80 sa ating bansa. Ang mismong konsepto ng machine translation ay lumawak (nagsimula itong isama ang "paglikha ng isang bilang ng mga awtomatiko at automated na system at device na awtomatiko o semi-awtomatikong nagsasagawa ng buong ikot ng pagsasalin o mga indibidwal na gawain sa isang dialogue sa isang tao"), at tumaas ang laang-gugulin ng pamahalaan para sa pagpapaunlad ng industriyang ito.

Ang Russian, English, German, French at Japanese ay naging pangunahing wika ng mga domestic translation system. Ang All-Union Translation Center (VTsP) ay bumuo ng isang sistema para sa pagsasalin mula sa English at German sa Russian gamit ang EC-1035-ANRAP na computer. Binubuo ito ng tatlong diksyunaryo - input English at German at output Russian - sa ilalim ng isang software. Mayroong ilang mga pinapalitan na dalubhasang diksyunaryo - sa teknolohiya ng computer, programming, radio electronics, mechanical engineering, agrikultura, metalurhiya. Maaaring gumana ang system sa dalawang mode - awtomatiko at interactive, kapag ipinakita ng screen ang pinagmulang teksto at pagsasalin sa bawat parirala, na maaaring i-edit ng isang tao. Ang bilis ng pagsasalin ng teksto sa ANRAP (mula sa simula ng pag-type hanggang sa katapusan ng pag-print) ay humigit-kumulang 100 mga pahina bawat oras.

Noong 1989, nilikha ang isang pamilya ng mga komersyal na tagasalin ng uri ng SPRINT, nagtatrabaho sa Russian, English, German at Japanese. Ang kanilang pangunahing bentahe ay ang kanilang pagiging tugma sa IBM PC - kaya, ang mga domestic machine translation system ay umabot sa internasyonal na antas ng kalidad. Kasabay nito, ang isang sistema ng pagsasalin ng makina mula sa Pranses sa Russian FRAP ay binuo, na kinabibilangan ng 4 na yugto ng pagsusuri ng teksto: graphematic, morphological, syntactic at semantic. Sa LGPI sila. Herzen, ang trabaho ay isinasagawa sa isang apat na wika (Ingles, Pranses, Espanyol, Ruso) na sistemang SILOD-MP (Ingles-Russian at Franco-Russian na mga diksyunaryo ay ginamit sa industriyal na mode.

Para sa espesyal na pagsasalin ng mga teksto sa electrical engineering, umiral ang ETAP-2 system. Ang pagsusuri ng input text dito ay isinagawa sa dalawang antas - morphological at syntactic. Ang diksyunaryo ng ETAP-2 ay naglalaman ng humigit-kumulang 4 na libong mga entry; ang yugto ng pagbabago ng teksto - humigit-kumulang 1000 panuntunan (96 pangkalahatan, 342 pribado, ang iba ay diksyunaryo). Tiniyak ng lahat ng ito ang isang kasiya-siyang kalidad ng pagsasalin (sabihin, ang pamagat ng patent na "Optical phase grid arrangement at coupling device na may ganoong arrangement" ay isinalin bilang "Isang optical phase grid device at isang connecting device na may ganoong device" - sa kabila ng tautolohiya, ang kahulugan ay napanatili).

Sa Minsk Pedagogical Institute of Foreign Languages, sa batayan ng English-Russian na diksyunaryo ng mga form at parirala ng salita, isang sistema para sa pagsasalin ng makina ng mga pamagat ay naimbento, sa Institute of Oriental Studies ng Academy of Sciences - isang sistema para sa pagsasalin. mula sa Hapon tungo sa Ruso. Ang unang awtomatikong serbisyo sa bokabularyo at terminolohiya (SLOTHERM) para sa computing at programming, na nilikha sa Moscow Research Institute of Automation Systems, ay naglalaman ng humigit-kumulang 20,000 termino sa isang paliwanag na diksyunaryo at mga espesyal na diksyunaryo para sa linguistic na pananaliksik.

Ang mga sistema ng pagsasalin ng makina ay unti-unting nagsimulang gamitin hindi lamang para sa kanilang nilalayon na layunin, ngunit bilang isang mahalagang bahagi ng mga awtomatikong sistema ng pag-aaral (para sa pagtuturo ng pagsasalin, pagsuri sa spelling at kaalaman sa gramatika).

Ang dekada 90 ay nagdala ng mabilis na pag-unlad ng merkado ng PC (mula sa desktop hanggang sa bulsa) at teknolohiya ng impormasyon, ang malawakang paggamit ng Internet (na nagiging mas internasyonal at multilinggwal). Ang lahat ng ito ay ginawa ang karagdagang pag-unlad ng mga awtomatikong sistema ng pagsasalin sa demand. Mula noong unang bahagi ng 1990s Ang mga domestic developer ay pumapasok din sa merkado ng mga sistema ng PC.

Noong Hulyo 1990, ang unang komersyal na sistema ng pagsasalin ng makina sa Russia na tinatawag na PROMT (Programmer's Machine Translation) ay ipinakita sa PC Forum sa Moscow. Noong 1991, ZAO [!!! Alinsunod sa Federal Law-99 ng 05.05. 2014, ang form na ito ay pinalitan ng isang non-public joint-stock na kumpanya] "Proekt MT", at noong 1992, ang kumpanya ng PROMT ay nanalo sa kompetisyon ng NASA para sa supply ng mga MP system (PROMT ang tanging hindi Amerikanong kumpanya sa kompetisyong ito). a buong pamilya ng mga system sa ilalim ng bagong pangalan na STYLUS para sa pagsasalin mula sa English, German, French, Italian at Spanish sa Russian at mula sa Russian sa English, at noong 1993, batay sa STYLUS, nilikha ang unang machine translation system para sa Windows. STYLUS 2.0 para sa Windows 3.X/95/NT ay inilabas, at noong 1995-1996 ang ikatlong henerasyon ng mga machine translation system, ganap na 32-bit STYLUS 3.0 para sa Windows 95/NT, ay ipinakilala, kasabay nito, ang pagbuo ng isang ganap na bago, ang unang Russian-German at Russian-French na sistema ng pagsasalin ng makina sa mundo.

Noong 1997, nilagdaan ang isang kasunduan sa kumpanyang Pranses na Softissimo sa paglikha ng mga sistema ng pagsasalin mula sa Pranses sa Aleman at Ingles at sa kabaligtaran, at noong Disyembre ng taong ito, ang unang sistema ng pagsasalin ng Aleman-Pranses sa mundo ay inilabas. Sa parehong taon, ang kumpanya ng PROMT ay naglabas ng isang sistema na ipinatupad gamit ang Giant na teknolohiya, na sumusuporta sa ilang mga direksyon ng wika sa isang shell, pati na rin ang isang espesyal na tagasalin para sa pagtatrabaho sa Internet WebTranSite.

Noong 1998, isang buong konstelasyon ng mga programa ang inilabas sa ilalim ng bagong pangalan na PROMT 98. Pagkalipas ng isang taon, naglabas ang PROMT ng dalawang bagong produkto: isang natatanging software package para sa pagtatrabaho sa Internet - PROMT Internet, at isang tagasalin para sa mga corporate mail system - PROMT Mail Tagasalin. Noong Nobyembre 1999, kinilala ang PROMT bilang ang pinakamahusay na sistema ng pagsasalin ng makina na nasubok ng French magazine na PC Expert, na nalampasan ang mga katunggali nito ng 30 porsiyento. Ang mga espesyal na solusyon sa server ay binuo din para sa mga kliyente ng korporasyon - ang corporate translation server na PROMT Translation Server (PTS) at ang Internet solution na PROMT Internet Translation Server (PITS). Noong 2000, in-update ng PROMT ang buong linya ng mga produkto ng software sa pamamagitan ng pagpapalabas ng bagong henerasyon ng mga MT system: PROMT Translation Office 2000, PROMT Internet 2000 at Magic Gooddy 2000.

Ang online na pagsasalin na may suporta ng sistema ng PROMT ay ginagamit sa isang bilang ng mga domestic at dayuhang site: Online Translator ng PROMT, InfiniT.com, Translate.Ru, Lycos, atbp., pati na rin sa mga institusyon ng iba't ibang mga profile para sa pagsasalin ng mga dokumento ng negosyo, mga artikulo at liham (may mga translation system na direktang binuo sa Outlook Express at iba pang email client).

Sa ngayon, umuusbong ang mga bagong teknolohiya sa pagsasalin ng makina batay sa paggamit ng mga artificial intelligence system at mga istatistikal na pamamaraan. Tungkol sa huli - sa susunod na seksyon.

2.2 Dagdagmga pamamaraan sa pag-aaral ng wika

Malaking atensyon sa modernong linggwistika ang ibinibigay sa pag-aaral ng linguistic phenomena gamit ang mga pamamaraan ng quantitative mathematics. Madalas na nakakatulong ang quantitative data upang mas malalim na maunawaan ang mga phenomena na pinag-aaralan, ang kanilang lugar at papel sa sistema ng mga kaugnay na phenomena. Ang sagot sa tanong na "magkano" ay nakakatulong upang masagot ang mga tanong na "ano", "paano", "bakit" - ganyan ang heuristic na potensyal ng isang quantitative na katangian.

Ang mga pamamaraan ng istatistika ay may mahalagang papel sa pagbuo ng mga sistema ng pagsasalin ng makina (tingnan ang seksyon 2.1). Sa istatistikal na diskarte, ang problema sa pagsasalin ay isinasaalang-alang sa mga tuntunin ng isang maingay na channel. Isipin na kailangan nating isalin ang isang pangungusap mula sa Ingles sa Russian. Ang prinsipyo ng maingay na channel ay nag-aalok sa amin ng sumusunod na paliwanag ng kaugnayan sa pagitan ng isang Ingles at isang Russian na pangungusap: ang isang English na pangungusap ay walang iba kundi isang Russian na pangungusap na binaluktot ng ilang uri ng ingay. Upang mabawi ang orihinal na pangungusap na Ruso, kailangan nating malaman kung ano ang karaniwang sinasabi ng mga tao sa Russian at kung paano binaluktot ang mga pariralang Ruso sa Ingles. Isinasagawa ang pagsasalin sa pamamagitan ng paghahanap para sa gayong pangungusap na Ruso na nagpapalaki sa mga produkto ng walang kondisyong posibilidad ng pangungusap na Ruso at ang posibilidad ng pangungusap sa Ingles (orihinal) na ibinigay sa ibinigay na pangungusap na Ruso. Ayon sa teorama ni Bayes, ang Russian na pangungusap na ito ay ang pinaka-malamang na pagsasalin ng Ingles:

kung saan ang e ay ang pagsasalin ng pangungusap at ang f ay ang orihinal na pangungusap

Kaya kailangan namin ng isang modelo ng pinagmulan at isang modelo ng channel, o isang modelo ng wika at isang modelo ng pagsasalin. Ang modelo ng wika ay dapat magtalaga ng marka ng posibilidad sa anumang pangungusap sa target na wika (sa aming kaso, Russian), at ang modelo ng pagsasalin sa orihinal na pangungusap. (tingnan ang talahanayan 1)

Sa pangkalahatan, gumagana ang isang machine translation system sa dalawang mode:

1. Pagsasanay sa system: isang training corpus ng mga parallel na teksto ay kinuha, at gamit ang linear programming, ang mga naturang value ng translation correspondence table ay hinahanap na nagpapalaki sa posibilidad ng (halimbawa) ang Russian na bahagi ng corpus na may available na English ayon sa sa napiling modelo ng pagsasalin. Ang isang modelo ng wikang Ruso ay itinayo sa bahaging Ruso ng parehong corpus.

2. Pagsasamantala: batay sa nakuhang data para sa isang hindi pamilyar na pangungusap sa Ingles, hinahanap ang isang Ruso na nagpapalaki sa produkto ng mga probabilidad na itinalaga ng modelo ng wika at modelo ng pagsasalin. Ang program na ginagamit para sa naturang paghahanap ay tinatawag na decoder.

Ang pinakasimpleng modelo ng pagsasalin ng istatistika ay ang modelo ng literal na pagsasalin. Sa modelong ito, ipinapalagay na upang isalin ang isang pangungusap mula sa isang wika patungo sa isa pa, sapat na upang isalin ang lahat ng mga salita (lumikha ng isang "bag ng mga salita"), at ibibigay ng modelo ang kanilang pagkakalagay sa tamang pagkakasunud-sunod. Upang mabawasan P(a, f | e) hanggang P(a | e , f), i.e. mga probabilidad ng isang naibigay na pagkakahanay na binigyan ng isang pares ng mga pangungusap, ang bawat probabilidad na P(a, f | e) ay na-normalize ng kabuuan ng mga probabilidad ng lahat ng pagkakahanay ng isang ibinigay na pares ng mga pangungusap:

Ang pagpapatupad ng Viterbi algorithm na ginamit upang sanayin ang Modelo #1 ay ang mga sumusunod:

1. Ang buong talahanayan ng mga probabilidad ng pagsusulatan sa pagsasalin ay puno ng parehong mga halaga.

2. Para sa lahat ng posibleng variant ng magkapares na koneksyon ng mga salita, ang posibilidad na P(a, f | e) ay kinakalkula:

3. Ang mga halaga ng P(a, f | e) ay na-normalize upang makuha ang mga halaga ng P(a | e, f).

4. Ang dalas ng bawat pares ng pagsasalin ay kinakalkula, na tinimbang ayon sa posibilidad ng bawat opsyon sa pagkakahanay.

5. Ang mga resultang weighted frequency ay na-normalize at bumubuo ng isang bagong talahanayan ng mga probabilidad ng pagsusulatan sa pagsasalin

6. Ulitin ang algorithm mula sa hakbang 2.

Isaalang-alang, bilang halimbawa, ang pagsasanay ng isang katulad na modelo sa isang corpus ng dalawang pares ng mga pangungusap (Larawan 2):

puting bahay

Pagkatapos ng isang malaking bilang ng mga pag-ulit, makakakuha tayo ng isang talahanayan (Talahanayan 2), na nagpapakita na ang pagsasalin ay isinasagawa nang may mataas na katumpakan.

Gayundin, malawakang ginagamit ang mga pamamaraang istatistika sa pag-aaral ng bokabularyo, morpolohiya, syntax, at istilo. Ang mga siyentipiko mula sa Perm State University ay nagsagawa ng isang pag-aaral batay sa assertion na ang mga stereotypical na parirala ay isang mahalagang "building material" ng teksto. Binubuo ang mga pariralang ito ng "nuclear" na paulit-ulit na mga salita at mga dependent na salita-specifier at may binibigkas na pang-istilong pangkulay.

Sa istilong pang-agham, ang mga salitang "nuklear" ay maaaring tawaging: pananaliksik, pag-aaral, gawain, suliranin, tanong, kababalaghan, katotohanan, pagmamasid, pagsusuri atbp. Sa pamamahayag, ang ibang mga salita ay magiging "nuklear", na may tumaas na halaga partikular para sa teksto ng pahayagan: oras, tao, kapangyarihan, negosyo, aksyon, batas, buhay, kasaysayan, lugar atbp. (kabuuan 29)

Ang partikular na interes ng mga linguist ay ang propesyonal na pagkakaiba-iba ng pambansang wika, ang kakaibang paggamit ng bokabularyo at gramatika, depende sa uri ng hanapbuhay. Ito ay kilala na ang mga driver sa propesyonal na pagsasalita ay gumagamit ng form w tungkol sa fer, sabi ng mga medics k tungkol sa club sa halip na cocktail Yu sh - maaaring ibigay ang mga ganitong halimbawa. Ang gawain ng mga istatistika ay subaybayan ang pagkakaiba-iba ng pagbigkas at ang pagbabago sa pamantayan ng wika.

Ang mga pagkakaiba sa propesyonal ay humantong sa mga pagkakaiba hindi lamang sa gramatika, kundi pati na rin sa leksikal. Ipinangalan ang Yakut State University M.K. Ammosov, 50 mga talatanungan ay nasuri na may pinakakaraniwang mga reaksyon sa ilang mga salita sa mga manggagamot at tagabuo (Talahanayan 3).

Mga tagabuo

Tao

pasyente (10), personalidad (5)

lalaki (5)

mabuti

tulong (8), tulong (7)

masama (16)

isang buhay

kamatayan (10)

maganda (5)

kamatayan

bangkay (8)

buhay (6)

ang apoy

init (8), paso (6)

apoy (7)

daliri

kamay (14), panaritium (5)

malaki (7), index (6)

mata

paningin (6), mag-aaral, ophthalmologist (5 bawat isa)

kayumanggi (10), malaki (6)

ulo

isip (14), utak (5)

malaki (9), matalino (8), matalino (6)

matalo

kamalayan, buhay (4 bawat isa)

pera (5), hanapin (4)

Mapapansing mas madalas ang mga manggagamot kaysa sa mga tagabuo ay nagbibigay ng mga asosasyon na may kaugnayan sa kanilang mga propesyonal na aktibidad, dahil ang mga salitang pampasigla na ibinigay sa talatanungan ay may higit na kinalaman sa kanilang propesyon kaysa sa propesyon ng isang tagabuo.

Ang mga istatistikal na regularidad sa isang wika ay ginagamit upang lumikha ng mga diksyunaryo ng dalas - mga diksyunaryo na nagbibigay ng mga numerical na katangian ng dalas ng mga salita (mga anyo ng salita, mga parirala) ng anumang wika - ang wika ng manunulat, anumang akda, atbp. Karaniwan, ang dalas ng paglitaw ng ang isang salita ay ginagamit bilang isang katangian ng dalas ng paglitaw ng isang salita sa teksto ng isang tiyak na volume

Ang modelo ng speech perception ay imposible nang walang diksyunaryo bilang mahalagang bahagi nito. Sa pang-unawa ng pagsasalita, ang pangunahing yunit ng pagpapatakbo ay ang salita. Mula rito, sa partikular, ang bawat salita ng pinaghihinalaang teksto ay dapat matukoy sa kaukulang yunit ng panloob na bokabularyo ng tagapakinig (o mambabasa). Natural lang na ipagpalagay na sa simula pa lang ang paghahanap ay limitado sa ilang subdomain ng diksyunaryo. Ayon sa karamihan sa mga modernong teorya ng speech perception, ang aktwal na phonetic analysis ng tunog na teksto sa isang tipikal na kaso ay nagbibigay lamang ng ilang bahagyang impormasyon tungkol sa posibleng phonological na hitsura ng salita, at ang ganitong uri ng impormasyon ay tumutugma sa hindi isa, ngunit isang tiyak na MARAMING salita. ng diksyunaryo; Samakatuwid, dalawang problema ang lumitaw:

(a) piliin ang naaangkop na hanay ayon sa ilang mga parameter;

(b) sa loob ng mga hangganan ng nakabalangkas na hanay (kung ito ay inilalaan nang sapat) upang "tanggalin" ang lahat ng mga salita, maliban sa isa lamang na pinakamahusay na tumutugma sa ibinigay na salita ng kinikilalang teksto. Isa sa mga diskarte sa "pag-dropout" ay ang pagbubukod ng mga salitang mababa ang dalas. Ito ay sumusunod na ang bokabularyo para sa speech perception ay isang frequency dictionary. Ito ay ang paglikha ng isang bersyon ng computer ng dalas ng diksyunaryo ng wikang Ruso na ang unang gawain ng ipinakita na proyekto.

Batay sa materyal ng wikang Ruso, mayroong 5 mga diksyunaryo ng dalas (hindi binibilang ang mga diksyunaryo ng sangay). Pansinin lamang natin ang ilang pangkalahatang pagkukulang ng umiiral na mga diksyunaryo.

Ang lahat ng kilalang diksyonaryo ng dalas ng wikang Ruso ay batay sa pagproseso ng mga arrays ng nakasulat (naka-print) na mga teksto. Bahagyang para sa kadahilanang ito, kapag ang pagkakakilanlan ng isang salita ay higit na nakabatay sa pormal, graphical na pagkakataon, ang semantika ay hindi sapat na isinasaalang-alang. Bilang isang resulta, ang mga katangian ng dalas ay inilipat din, nabaluktot; halimbawa, kung ang compiler ng frequency dictionary ay nagsasama ng mga salita mula sa kumbinasyong "isa't isa" sa pangkalahatang istatistika ng paggamit ng salitang "kaibigan", kung gayon ito ay halos hindi makatwiran: dahil sa mga semantika, dapat nating aminin na ang mga ito ay na ibang mga salita, o sa halip, na ang isang independiyenteng yunit ng diksyunaryo ay kumbinasyon lamang sa kabuuan.

Gayundin, sa lahat ng umiiral na mga diksyunaryo, ang mga salita ay inilalagay lamang sa kanilang mga pangunahing anyo: mga pangngalan sa isahan na anyo, nominative case, mga pandiwa sa infinitive na anyo, atbp. Ang ilan sa mga diksyunaryo ay nagbibigay ng impormasyon tungkol sa dalas ng mga anyo ng salita, ngunit kadalasan ay hindi nila ito ginagawa nang pare-pareho nang sapat, hindi sa isang kumpletong paraan. Ang mga frequency ng iba't ibang anyo ng salita ng parehong salita ay halatang hindi tugma. Dapat isaalang-alang ng developer ng isang speech perception model na sa isang tunay na proseso ng perceptual, ito ay tiyak na isang tiyak na anyo ng salita na "nalulubog" sa teksto na napapailalim sa pagkilala: batay sa pagsusuri ng paunang seksyon ng exponent ng anyo ng salita, nabuo ang isang hanay ng mga salita na may magkaparehong simula, at ang paunang seksyon ng anyo ng salita ay hindi kinakailangang magkapareho sa paunang seksyon ng anyo ng diksyunaryo . Ito ay ang anyo ng salita na may isang tiyak na ritmikong istraktura, na isa ring napakahalagang parameter para sa perceptual na pagpili ng mga salita. Sa wakas, sa huling representasyon ng kinikilalang pagbigkas, muli, ang mga salita ay kinakatawan ng kaukulang mga anyo ng salita.

Maraming mga gawa na nagpapakita ng kahalagahan ng dalas sa proseso ng pagdama sa pagsasalita. Ngunit hindi namin alam ang mga gawa kung saan gagamitin ang dalas ng mga anyo ng salita - sa kabaligtaran, halos hindi binabalewala ng lahat ng may-akda ang dalas ng mga indibidwal na anyo ng salita, na eksklusibong tumutukoy sa mga lexemes. Kung ang mga resultang nakuha ng mga ito ay hindi itinuturing na artifact, kailangang ipagpalagay na ang katutubong nagsasalita sa anumang paraan ay may access sa impormasyon tungkol sa ratio ng mga frequency ng mga anyo ng salita at mga anyo ng diksyunaryo, ibig sabihin, sa katunayan, mga lexemes. Bukod dito, ang gayong paglipat mula sa isang anyo ng salita patungo sa isang lexeme, siyempre, ay hindi maipaliwanag ng natural na kaalaman sa kaukulang paradigm, dahil ang impormasyon ng dalas ay dapat gamitin bago ang pangwakas na pagkakakilanlan ng salita, kung hindi man ay nawawalan lamang ito ng kahulugan.

Ayon sa pangunahing istatistikal na katangian, posibleng matukoy gamit ang isang naibigay na kamag-anak na error na bahagi ng bokabularyo, na kinabibilangan ng mga salitang may mataas na dalas ng paglitaw, anuman ang uri ng teksto. Posible rin, sa pamamagitan ng pagpapasok ng sunud-sunod na pag-order sa diksyunaryo, upang makakuha ng isang serye ng mga diksyunaryo na sumasaklaw sa unang 100, 1000, 5000, atbp. ng mga madalas na salita. Ang mga istatistikal na katangian ng diksyunaryo ay interesado na may kaugnayan sa semantikong pagsusuri ng bokabularyo. Ang pag-aaral ng mga paksa-ideolohikal na grupo at mga larangang semantiko ay nagpapakita na ang mga lexical na asosasyon ay sinusuportahan ng mga semantikong link na nakatutok sa mga lexemes na may pinakakaraniwang kahulugan. Ang paglalarawan ng mga kahulugan sa loob ng patlang ng lexico-semantic ay maaaring isagawa sa pamamagitan ng pagtukoy ng mga salitang may pinakamaraming abstract na lexemes sa kahulugan. Tila, ang mga yunit ng diksyunaryo na "walang laman" (mula sa punto ng view ng mga nominative potencies) ay bumubuo ng isang homogenous na layer na ayon sa istatistika.

Ang mga bokabularyo para sa mga indibidwal na genre ay hindi gaanong mahalaga. Ang pag-aaral sa sukat ng kanilang pagkakapareho at ang likas na katangian ng mga distribusyon ng istatistika ay magbibigay ng kawili-wiling impormasyon tungkol sa qualitative stratification ng bokabularyo depende sa saklaw ng paggamit ng pagsasalita.

Ang pagsasama-sama ng malalaking dalas ng mga diksyunaryo ay nangangailangan ng paggamit ng teknolohiya ng computer. Ang pagpapakilala ng bahagyang mekanisasyon at automation sa proseso ng paggawa sa isang diksyunaryo ay kawili-wili bilang isang eksperimento sa machine processing ng mga diksyunaryo para sa iba't ibang mga teksto. Ang ganitong diksyunaryo ay nangangailangan ng mas mahigpit na sistema para sa pagproseso at pag-iipon ng materyal sa bokabularyo. Sa miniature, ito ay isang information retrieval system na nakapagbibigay ng impormasyon tungkol sa iba't ibang aspeto ng teksto at bokabularyo. Ang ilang mga pangunahing kahilingan sa system na ito ay pinaplano mula pa sa simula: ang kabuuang bilang ng mga salita sa imbentaryo, ang mga istatistikal na katangian ng isang salita at buong mga diksyunaryo, ang pag-order ng madalas at bihirang mga zone ng diksyunaryo, atbp. Ang machine card file ay nagbibigay-daan sa iyo upang awtomatikong bumuo ng mga reverse na diksyunaryo para sa mga indibidwal na genre at pinagmulan. Maraming iba pang kapaki-pakinabang na istatistikal na impormasyon tungkol sa wika ang kukunin mula sa naipon na hanay ng impormasyon. Ang diksyunaryo ng dalas ng computer ay lumilikha ng isang pang-eksperimentong batayan para sa paglipat sa isang mas malawak na automation ng gawaing bokabularyo.

Ang istatistikal na data ng mga diksyonaryo ng dalas ay maaari ding malawakang magamit sa paglutas ng iba pang mga problema sa wika - halimbawa, sa pagsusuri at pagtukoy ng aktibong paraan ng pagbuo ng salita ng modernong wikang Ruso, paglutas ng mga isyu ng pagpapabuti ng mga graphics at spelling, na nauugnay sa pagkuha sa impormasyon sa istatistika ng account tungkol sa bokabularyo (kasama ang lahat ng ito, mahalagang isaalang-alang ang mga probabilistikong katangian ng mga kumbinasyon ng grapheme, mga uri ng mga kumbinasyon ng titik na natanto sa mga salita), praktikal na transkripsyon at transliterasyon. Ang mga istatistikal na parameter ng diksyunaryo ay magiging kapaki-pakinabang din sa paglutas ng mga problema sa pag-automate ng pag-type, pagkilala at awtomatikong pagbabasa ng literal na teksto.

Ang mga modernong paliwanag na diksyonaryo at gramatika ng wikang Ruso ay pangunahing itinayo batay sa panitikan at masining na mga teksto. May mga frequency na diksyunaryo ng wika ng A.S. Pushkin, A.S. Griboedova, F.M. Dostoevsky, V.V. Vysotsky at marami pang ibang may-akda. Sa Kagawaran ng Kasaysayan at Teorya ng Panitikan ng Estado ng Smolensk. Ang Pedagogical University ay nagtatrabaho sa loob ng ilang taon upang mag-compile ng mga frequency na diksyunaryo ng mga tekstong patula at prosa. Para sa pag-aaral na ito, napili ang mga diksyunaryo ng dalas ng lahat ng mga liriko ng Pushkin at dalawa pang makata ng ginintuang panahon - "Woe from Wit" ni Griboyedov at lahat ng tula ni Lermontov; Pasternak at limang iba pang makata ng Panahon ng Pilak - Balmont 1894-1903, "Mga Tula tungkol sa Magagandang Babae" ni Blok, "Bato" ni Mandelstam, "Haligi ng Apoy" ni Gumilyov, "Anno Domini MCMXXI" ni Akhmatova at "Mga Sister ng Ang Aking Buhay" ni Pasternak at apat pang makata ng Panahon ng Bakal - "Mga Tula ni Yuri Zhivago", "When it clears up", ang buong corpus ng lyrics ni M. Petrovs, "Malayo ang kalsada", "Windscreen", "Paalam sa snow" at "Horseshoes" ni Mezhirov, "Antimirov" ni Voznesensky at "Snowballs » Rylenkova.

Dapat pansinin na ang mga diksyunaryo na ito ay naiiba sa likas na katangian: ang ilan ay kumakatawan sa bokabularyo ng isang dramatikong gawain, ang iba - mga libro ng lyrics, o ilang mga libro, o ang buong corpus ng mga tula ng makata. Ang mga resulta ng pagsusuri na ipinakita sa papel na ito ay dapat gawin nang may pag-iingat, hindi sila maaaring kunin bilang isang ganap. Kasabay nito, sa tulong ng mga espesyal na hakbang, ang pagkakaiba sa ontological na kalikasan ng mga teksto ay maaaring mabawasan sa isang tiyak na lawak.

Sa mga nagdaang taon, ang pagsalungat sa pagitan ng kolokyal at pagsasalita sa libro ay naging mas malinaw na natanto. Ang isyung ito ay lalong matalas na tinalakay sa mga metodologo na humihingi ng turn sa pagtuturo patungo sa sinasalitang wika. Kasabay nito, ang pagiging tiyak ng kolokyal na pananalita ay nananatiling hindi maipaliwanag.

Ang mga diksyunaryo ay naproseso sa pamamagitan ng paglikha ng isang user application sa kapaligiran ng EXCEL97 office program. Kasama sa application ang apat na worksheet ng EXCEL book - "Title Sheet", "Dictionaries" sheet na may paunang data, "Proximity" at "Distansya" na may mga resulta, pati na rin ang isang set ng mga macro.

Ang paunang impormasyon ay ipinasok sa sheet na "Mga Diksyunaryo". Ang mga diksyunaryo ng mga pinag-aralan na teksto ay isinusulat sa mga selulang EXCEL, ang huling hanay na S ay nabuo mula sa mga resultang nakuha at katumbas ng bilang ng mga salita na matatagpuan sa ibang mga diksyunaryo. Ang mga talahanayan na "Proximity" at "Mga Distansya" ay naglalaman ng mga kalkuladong sukat ng proximity M, correlation R at distansya D.

Ang application macros ay mga event-based programming procedures na nakasulat sa Visual Basic for Application (VBA). Ang mga pamamaraan ay batay sa mga bagay sa library ng VBA at ang kanilang mga pamamaraan sa pagproseso. Kaya, para sa mga pagpapatakbo na may mga worksheet ng application, ang pangunahing bagay na Worksheet (worksheet) at ang kaukulang paraan ng pag-activate ng sheet na Activate (activate) ay ginagamit. Ang pagtatakda ng hanay ng nasuri na source data sa Dictionary sheet ay isinasagawa sa pamamagitan ng Select method ng Range object (range), at ang paglilipat ng mga salita bilang mga value sa mga variable ay ginagawa bilang Value property (value) ng parehong Range bagay.

Sa kabila ng katotohanan na ang pagsusuri ng ugnayan ng ranggo ay nagpapaingat sa atin tungkol sa pag-asa ng mga paksa sa pagitan ng iba't ibang mga teksto, karamihan sa mga pinakamadalas na salita sa bawat teksto ay may mga tugma sa isa o higit pang mga teksto. Ipinapakita ng Column S ang bilang ng mga naturang salita sa 15 pinakamadalas na salita para sa bawat may-akda. Ang mga salitang naka-bold ay makikita lamang sa isang salita ng makata sa aming talahanayan. Ang Blok, Akhmatova at Petrovs ay walang mga naka-highlight na salita, mayroon silang S = 15. Ang tatlong makata na ito ay may parehong 15 na pinakamadalas na salita, naiiba lamang sila sa lugar sa listahan. Ngunit kahit na si Pushkin, na ang bokabularyo ay ang pinaka orihinal, ay may S = 8, at mayroong 7 naka-highlight na salita.

Ang mga resulta ay nagpapakita na mayroong isang tiyak na layer ng bokabularyo na tumutok sa mga pangunahing tema ng tula. Bilang isang tuntunin, ang mga salitang ito ay maikli: mula sa kabuuang bilang (225) ng solong pantig na paggamit ng salita 88, dalawang pantig 127, tatlong pantig 10. Kadalasan ang mga salitang ito ay kumakatawan sa mga pangunahing mitolohiya at maaaring magkapares: gabi - araw, lupa - langit (araw), Diyos - tao (tao), buhay - kamatayan, katawan - kaluluwa, Roma - mundo(sa Mandelstam); maaaring pagsamahin sa mga mythologem ng mas mataas na antas: langit, bituin, araw, lupa; sa isang tao, bilang panuntunan, ang katawan, puso, dugo, braso, binti, pisngi, mata ay namumukod-tangi. Sa mga estado ng tao, ang kagustuhan ay ibinibigay sa pagtulog at pag-ibig. Ang bahay at lungsod ay nabibilang sa mundo ng tao - Moscow, Roma, Paris. Ang pagkamalikhain ay kinakatawan ng mga lexemes salita at kanta.

Sina Griboedov at Lermontov ay halos walang mga salita na nagsasaad ng kalikasan sa mga madalas na salita. Mayroon silang tatlong beses na mas maraming mga salita na nagsasaad ng isang tao, mga bahagi ng kanyang katawan, mga elemento ng kanyang espirituwal na mundo. Pushkin at mga makata ng ikadalawampu siglo. ang mga pagtatalaga ng tao at kalikasan ay humigit-kumulang pantay. Sa mahalagang aspetong ito ng paksa, masasabi nating ang ikadalawampu siglo. sumunod kay Pushkin.

Minimal na Tema kaso kabilang sa mga pinaka-madalas na salita, ito ay matatagpuan lamang sa Griboyedov at Pushkin. Lermontov at mga makata ng ikadalawampu siglo. nagbibigay daan ito sa isang minimal na tema salita. Ang salita ay hindi ibinubukod ang mga gawa (ang biblikal na interpretasyon ng paksa: sa Bagong Tipan, ang lahat ng mga turo ni Jesucristo ay itinuturing na salita ng Diyos o salita ni Jesus, at kung minsan ay tinatawag ng mga apostol ang kanilang sarili na mga ministro ng Salita). Ang sagradong kahulugan ng salitang lexeme ay nakakumbinsi na ipinakita, halimbawa, sa taludtod ni Pasternak na "At ang imahe ng mundo, na inihayag sa Salita." Ang sagradong kahulugan ng lexeme salita kasabay ng at kaibahan sa mga gawain ng tao, ito ay nakakumbinsi na ipinakita sa tula ng parehong pangalan ni Gumilyov.

Ang mga token na matatagpuan lamang sa isang teksto ay nagpapakilala sa pagka-orihinal ng isang partikular na aklat o isang koleksyon ng mga aklat. Halimbawa, ang salitang "isip" ang pinakamadalas sa komedya ni Griboedov na "Woe from Wit" - ngunit hindi ito nangyayari sa mga frequency na salita ng ibang mga teksto. Ang tema ng isip ang pinakamahalaga sa komedya. Ang lexeme na ito ay kasama ng imahe ng Chatsky, at ang pangalan ng Chatsky ay ang pinakamadalas sa komedya. Kaya, ang gawain ay organikong pinagsama ang pinakamadalas na karaniwang pangngalan na may pinakamadalas na pangngalang pantangi.

Ang pinakamataas na koepisyent ng ugnayan ay nag-uugnay sa mga tema ng mga trahedya na aklat na "The Pillar of Fire" ni Gumilyov at "Anno Domini MCMXXI" ni Akhmatova. Sa 15 pinakamadalas na pangngalan, mayroong 10 pangkaraniwan, kabilang ang dugo, puso, kaluluwa, pag-ibig, salita, langit. Alalahanin na ang aklat ni Akhmatova ay may kasamang isang miniature na "Hindi ka mabubuhay ...", na isinulat sa pagitan ng pag-aresto kay Gumilyov at ng kanyang pagpatay.

Ang mga tema ng kandila at ang karamihan ng tao sa pinag-aralan na materyal ay matatagpuan lamang sa "Mga Tula ni Yuri Zhivago". Ang tema ng kandila sa mga talata mula sa nobela ay may maraming kontekstwal na kahulugan: nauugnay ito sa imahe ni Jesucristo, na may mga tema ng pananampalataya, kawalang-kamatayan, pagkamalikhain, petsa ng pag-ibig. Ang kandila ang pinakamahalagang pinagmumulan ng liwanag sa mga sentral na eksena ng nobela. Ang tema ng karamihan ay bubuo na may kaugnayan sa pangunahing ideya ng nobela, kung saan ang pribadong buhay ng isang tao na may hindi matitinag na mga halaga ay salungat sa imoralidad ng bagong estado, na binuo sa mga prinsipyo ng pagpapasaya sa karamihan. .

Kasama rin sa gawain ang ikatlong yugto, na makikita rin sa programa - ito ang pagkalkula ng pagkakaiba sa mga ordinal na bilang ng mga salita na karaniwan sa dalawang diksyunaryo at ang average na distansya sa pagitan ng parehong mga salita ng dalawang diksyunaryo. Ang yugtong ito ay nagbibigay-daan sa paglipat mula sa mga pangkalahatang uso sa pakikipag-ugnayan ng mga diksyunaryo na natukoy sa tulong ng mga istatistika tungo sa isang antas na papalapit sa teksto. Halimbawa, ang mga libro ng Gumilyov at Akhmatova ay makabuluhang nauugnay sa istatistika. Tinitingnan namin kung aling mga salita ang naging karaniwan para sa kanilang mga diksyonaryo, at, una sa lahat, pipiliin namin ang mga serial number na kaunti lang ang pagkakaiba o katumbas ng zero. Ang mga salitang ito ay may parehong bilang ng ranggo at, dahil dito, ang mga minimal na tema sa isipan ng dalawang makata ang parehong mahalaga. Susunod, dapat kang lumipat sa antas ng mga teksto at konteksto.

Nakakatulong din ang quantitative na pamamaraan upang pag-aralan ang mga katangian ng mga tao - mga katutubong nagsasalita. Sabihin, mayroong 6 na kaso sa Russian, walang mga kaso sa Ingles, at sa ilang mga wika ng mga mamamayan ng Dagestan, ang bilang ng mga kaso ay umabot sa 40. L. Perlovsky sa kanyang artikulong "Consciousness, Language and Culture" ay iniuugnay ang mga ito mga katangian na may ugali ng mga tao sa indibidwalismo o kolektibismo, na may pag-unawa sa mga bagay at phenomena nang hiwalay o may kaugnayan sa iba. Pagkatapos ng lahat, ito ay sa mundo na nagsasalita ng Ingles (walang mga kaso - ang bagay ay nakikita "sa pamamagitan ng kanyang sarili") na ang mga konsepto tulad ng indibidwal na kalayaan, liberalismo at demokrasya ay lumitaw (tandaan ko na ginagamit ko lamang ang mga konseptong ito na may kaugnayan sa wika, nang walang anumang mga katangian ng pagsusuri). Sa kabila ng katotohanan na ang gayong mga hula ay nananatili lamang sa antas ng mga matapang na pang-agham na hypotheses, nakakatulong silang tingnan ang mga pamilyar na phenomena sa isang bagong paraan.

Tulad ng nakikita natin, ang mga quantitative na katangian ay maaaring ilapat sa ganap na magkakaibang mga lugar ng linggwistika, na lalong lumalabo ang mga hangganan sa pagitan ng "eksakto" at "makatao" na mga pamamaraan. Ang linggwistika ay lalong gumagamit ng tulong hindi lamang sa matematika, kundi pati na rin sa teknolohiya ng kompyuter upang malutas ang mga problema nito.

2.3 Pag-aaral Iwika sa pamamagitan ng mga pamamaraan ng pormal na lohika

Sa mga di-quantitative na pamamaraan ng matematika, sa partikular, na may lohika, ang modernong teoretikal na lingguwistika ay nakikipag-ugnayan nang hindi gaanong mabunga kaysa sa dami. Ang mabilis na pag-unlad ng mga teknolohiya ng computer at ang paglago ng kanilang papel sa modernong mundo ay nangangailangan ng rebisyon ng diskarte sa pakikipag-ugnayan ng wika at lohika sa pangkalahatan.

Ang mga pamamaraan ng lohika ay malawakang ginagamit sa pagbuo ng mga pormal na wika, sa partikular, mga programming language, ang mga elemento nito ay ilang mga simbolo (katulad ng matematika), pinili (o binuo mula sa mga dating napiling simbolo) at binibigyang kahulugan sa isang tiyak na paraan, nauugnay. sa anumang "tradisyonal" na paggamit, pag-unawa at pag-unawa. mga function ng parehong mga simbolo sa ibang mga konteksto. Ang isang programmer ay patuloy na nakikitungo sa lohika sa kanyang trabaho. Ang kahulugan ng programming ay para lang turuan ang computer na mangatuwiran (sa pinakamalawak na kahulugan ng salita). Kasabay nito, ang mga pamamaraan ng "pangangatwiran" ay nagiging ibang-iba. Ang bawat programmer ay gumugugol ng ilang oras sa paghahanap ng mga bug sa kanilang sarili at sa mga programa ng ibang tao. Iyon ay, upang maghanap ng mga pagkakamali sa pangangatwiran, sa lohika. At nag-iiwan din ito ng marka. Mas madaling makakita ng mga lohikal na pagkakamali sa ordinaryong pagsasalita. Ang kamag-anak na pagiging simple ng mga wikang pinag-aralan ng mga logician ay nagbibigay-daan sa kanila na ipaliwanag ang mga istruktura ng mga wikang ito nang mas malinaw kaysa sa maabot ng mga linguist na nagsusuri ng eksklusibong kumplikadong mga natural na wika. Sa pagtingin sa katotohanan na ang mga wikang pinag-aralan ng mga logician ay gumagamit ng mga ugnayang kinopya mula sa mga natural na wika, ang mga logician ay nakakagawa ng makabuluhang kontribusyon sa pangkalahatang teorya ng wika. Ang sitwasyon dito ay katulad ng nangyayari sa pisika: ang physicist ay bumubuo rin ng mga theorems para sa perpektong pinasimple na mga kaso na hindi nangyayari sa kalikasan sa lahat - siya ay bumubuo ng mga batas para sa mga ideal na gas, perpektong likido, nagsasalita tungkol sa paggalaw sa kawalan ng friction, atbp. Para sa mga idealized na kaso na ito, maaaring magtatag ng mga simpleng batas na makatutulong nang malaki sa pag-unawa sa kung ano talaga ang nangyayari at kung ano ang malamang na mananatiling hindi alam sa physics kung sinubukan nitong isaalang-alang ang katotohanan nang direkta, sa lahat ng pagiging kumplikado nito.

Sa pag-aaral ng mga likas na wika, ang mga lohikal na pamamaraan ay ginagamit upang ang mga nag-aaral ng wika ay hindi "kabisaduhin" ng maraming salita hangga't maaari, ngunit mas maunawaan ang istraktura nito. Gumamit din si L. Shcherba sa kanyang mga lektura ng isang halimbawa ng pangungusap na binuo alinsunod sa mga batas ng wikang Ruso: "Ang glitched kuzdra shteko ay nagboke ng bokra at nagkulot ng bokra," at pagkatapos ay tinanong ang mga estudyante kung ano ang ibig sabihin nito. Sa kabila ng katotohanan na ang kahulugan ng mga salita sa pangungusap ay nanatiling hindi malinaw (wala lang sila sa Russian), posible na malinaw na sagutin: "kuzdra" ang paksa, isang pambabae na pangngalan, sa isahan, nominative na kaso, " bokr” ay animated, at iba pa. Ang pagsasalin ng parirala ay naging ganito: "May isang bagay na pambabae nang sabay-sabay na gumawa ng isang bagay sa isang uri ng lalaking nilalang, at pagkatapos ay nagsimulang gumawa ng isang bagay na mahaba, unti-unting kasama ang kanyang anak." Ang isang katulad na halimbawa ng isang teksto (artistic) mula sa mga hindi umiiral na salita, na ganap na binuo ayon sa mga batas ng wika, ay ang Jabberwock ni Lewis Carroll (sa Alice in Wonderland, ipinaliwanag ni Carroll, sa pamamagitan ng bibig ng kanyang karakter na si Humpty Dumpty, ang kahulugan ng ang mga salitang inimbento niya: "luto" - alas-otso ng gabi, kapag oras na para magluto ng hapunan, "chlivky" - manipis at matalino, "shorek" - isang krus sa pagitan ng ferret, badger at corkscrew, "dive "- tumalon, sumisid, paikutin, "nava" - damo sa ilalim ng sundial (lumalawak nang kaunti sa kanan , medyo pakaliwa at isang maliit na likod), "ungol" - ungol at tumawa, "zelyuk" - a berdeng pabo, "myumzik" - isang ibon; ang kanyang mga balahibo ay magulo at lumalabas sa lahat ng direksyon, tulad ng isang walis, "mova" - malayo sa bahay) .

Isa sa mga pangunahing konsepto ng modernong lohika at teoretikal na lingguwistika, na ginagamit sa pag-aaral ng mga wika ng iba't ibang logico-mathematical calculus, natural na mga wika, upang ilarawan ang ugnayan sa pagitan ng mga wika ng iba't ibang "antas" at upang makilala ang relasyon sa pagitan ng Ang mga wikang isinasaalang-alang at ang mga paksa na inilarawan sa kanilang tulong, ay ang konsepto ng metalanguage. Ang metalanguage ay isang wikang ginagamit upang ipahayag ang mga paghatol tungkol sa ibang wika, ang bagay na wika. Sa tulong ng isang metalanguage, pinag-aaralan nila ang istruktura ng mga kumbinasyon ng karakter (ekspresyon) ng object ng wika, nagpapatunay ng mga teorema tungkol sa mga katangiang nagpapahayag nito, tungkol sa kaugnayan nito sa ibang mga wika, atbp. Ang wikang pinag-aaralan ay tinatawag ding paksang wika sa kaugnayan sa metalanguage na ito. Ang paksang wika at ang metalanguage ay maaaring ordinaryong (natural) na mga wika. Maaaring iba ang metalanguage sa object language (halimbawa, sa English textbook para sa mga Russian, ang Russian ay metalanguage, at ang English ay object language), ngunit maaari rin itong magkasabay o bahagyang naiiba, halimbawa, sa mga espesyal na terminolohiya. (Ang terminolohiya sa wikang Ruso ay isang elemento ng metalanguage upang ilarawan ang wikang Ruso, ang tinatawag na semantic factor ay bahagi ng metalanguage para sa paglalarawan ng mga semantika ng natural na mga wika).

Ang konsepto ng "metalinguage" ay naging napakabunga na may kaugnayan sa pag-aaral ng mga pormal na wika na binuo sa loob ng balangkas ng matematikal na lohika. Hindi tulad ng mga pormal na paksang wika, sa kasong ito, ang metalanguage, kung saan nabuo ang metateorya (pag-aaral ng mga katangian ng teorya ng paksa na nabuo sa paksang wika), ay, bilang panuntunan, isang ordinaryong natural na wika, sa ilang espesyal na paraan limitadong fragment ng isang natural na wika na hindi naglalaman ng anumang uri ng kalabuan. , metapora, "metapisiko" na konsepto, atbp. mga elemento ng ordinaryong wika na pumipigil sa paggamit nito bilang isang kasangkapan para sa tumpak na siyentipikong pananaliksik. Kasabay nito, ang metalanguage mismo ay maaaring gawing pormal at (anuman ito) maging paksa ng pananaliksik na isinagawa sa pamamagitan ng metametalanguage, at ang naturang serye ay maaaring "isipin" na lumalaki nang walang katiyakan.

Itinuturo sa atin ng lohika ang isang mabungang pagkakaiba sa pagitan ng object ng wika at ng metalanguage. Ang object ng wika ay ang pinaka paksa ng lohikal na pananaliksik, at ang metalanguage ay ang hindi maiiwasang artipisyal na wika kung saan isinasagawa ang naturang pananaliksik. Ang lohikal na pag-iisip ay binubuo lamang sa pagbabalangkas ng mga relasyon at istruktura ng isang tunay na wika (object language) sa wika ng mga simbolo (metalanguage).

Ang metalanguage sa anumang kaso ay dapat na "hindi mas mahirap" kaysa sa layunin ng wika nito (iyon ay, para sa bawat pagpapahayag ng huli sa metalanguage ay dapat mayroong pangalan nito, "pagsasalin") - kung hindi man, kung ang mga kinakailangang ito ay hindi natutugunan (na tiyak nagaganap sa natural na mga wika, kung ang mga espesyal na kasunduan ay hindi nagbibigay kung hindi man, ang mga semantic na kabalintunaan (antinomy) ay lumitaw.

Habang parami nang parami ang mga bagong programming language na nilikha, na may kaugnayan sa problema ng mga tagasalin ng programming, nagkaroon ng isang kagyat na pangangailangan upang lumikha ng mga metalanguage. Sa kasalukuyan, ang Backus-Naur form metalanguage (dinaglat bilang BNF) ay ang pinakakaraniwang ginagamit para sa paglalarawan ng syntax ng mga programming language. Ito ay isang compact form sa anyo ng ilang mga formula na katulad ng mga mathematical. Para sa bawat konsepto ng wika ay may kakaibang metaformula (normal na pormula). Binubuo ito ng kaliwa at kanang bahagi. Ang kaliwang bahagi ay tumutukoy sa konsepto na tinutukoy, at ang kanang bahagi ay tumutukoy sa hanay ng mga tinatanggap na mga konstruksyon ng wika na pinagsama sa konseptong ito. Gumagamit ang formula ng mga espesyal na metacharacter sa anyo ng mga angle bracket, na naglalaman ng tinukoy na konsepto (sa kaliwang bahagi ng formula) o isang dating tinukoy na konsepto (sa kanang bahagi nito), at ang paghihiwalay ng kaliwa at kanang bahagi ay ipinahiwatig ng ang "::=" metacharacter, ang kahulugan nito ay katumbas ng mga salitang "by definition there is". Ang mga metalinguistic na formula ay naka-embed sa mga tagapagsalin sa ilang anyo; sa kanilang tulong, ang mga construct na ginamit ng programmer ay sinusuri para sa pormal na pagsunod sa alinman sa mga construct na syntactically valid sa wikang ito. Mayroon ding mga hiwalay na metalanguage ng iba't ibang agham - sa gayon, ang kaalaman ay umiiral sa anyo ng iba't ibang metalanguage.

Ang mga lohikal na pamamaraan ay nagsilbing batayan para sa paglikha ng mga artificial intelligence system batay sa konsepto ng connectionism. Ang koneksyonismo ay isang espesyal na kalakaran sa pilosopikal na agham, na ang paksa ay mga katanungan ng kaalaman. Sa loob ng balangkas ng trend na ito, ang mga pagtatangka ay ginagawa upang ipaliwanag ang mga intelektwal na kakayahan ng isang tao gamit ang mga artipisyal na neural network. Binubuo ng isang malaking bilang ng mga structural unit na katulad ng mga neuron, na may bigat na itinalaga sa bawat elemento na tumutukoy sa lakas ng koneksyon sa iba pang mga elemento, ang mga neural network ay pinasimple na mga modelo ng utak ng tao. Ang mga eksperimento sa mga neural network ng ganitong uri ay nagpakita ng kanilang kakayahang matutong magsagawa ng mga gawain tulad ng pagkilala ng pattern, pagbabasa, at pagtukoy ng mga simpleng istrukturang gramatika.

Ang mga pilosopo ay nagsimulang magkaroon ng interes sa koneksyonismo, dahil ang diskarte sa koneksyonista ay nangako na magbibigay ng alternatibo sa klasikal na teorya ng isip at ang ideya na malawakang pinanghahawakan sa loob ng teoryang ito na ang mga gawain ng isip ay katulad ng pagproseso ng simbolikong wika sa pamamagitan ng digital. kompyuter. Ang konseptong ito ay napakakontrobersyal, ngunit sa mga nakaraang taon ay nakahanap ito ng higit pang mga tagasuporta.

Ang lohikal na pag-aaral ng wika ay nagpatuloy sa konsepto ni Saussure ng wika bilang isang sistema. Ang katotohanan na ito ay patuloy na nagpapatuloy ay nagpapatunay muli sa katapangan ng siyentipikong haka-haka sa simula ng huling siglo. Ilalaan ko ang huling seksyon ng aking trabaho sa mga prospect para sa pagbuo ng mga pamamaraan ng matematika sa linggwistika ngayon.

2.4 Mga prospect para sa aplikasyon ng mga pamamaraan ng matematika sa linggwistika

Sa panahon ng teknolohiya ng kompyuter, ang mga pamamaraan ng matematikal na lingguwistika ay nakatanggap ng bagong pananaw sa pag-unlad. Ang paghahanap para sa mga solusyon sa mga problema ng linguistic analysis ay lalong ipinapatupad sa antas ng mga sistema ng impormasyon. Kasabay nito, ang automation ng proseso ng pagproseso ng materyal na lingguwistika, na nagbibigay sa mananaliksik ng mga makabuluhang pagkakataon at pakinabang, ay hindi maiiwasang maglagay ng mga bagong kinakailangan at gawain para sa kanya.

Ang kumbinasyon ng "eksakto" at "makatao" na kaalaman ay naging matabang lupa para sa mga bagong tuklas sa larangan ng linggwistika, computer science at pilosopiya.

Ang pagsasalin ng makina mula sa isang wika patungo sa isa pa ay nananatiling isang mabilis na lumalagong sangay ng teknolohiya ng impormasyon. Sa kabila ng katotohanan na ang pagsasalin na tinulungan ng computer ay hindi kailanman maihahambing sa kalidad sa pagsasalin ng tao (lalo na para sa mga tekstong pampanitikan), ang makina ay naging isang kailangang-kailangan na katulong sa isang tao sa pagsasalin ng malalaking volume ng teksto. Ito ay pinaniniwalaan na sa malapit na hinaharap ay malilikha ang higit pang mga advanced na sistema ng pagsasalin, batay sa pangunahing pagsusuri sa semantiko ng teksto.

Ang isang pantay na pangakong direksyon ay ang interaksyon ng linggwistika at lohika, na nagsisilbing pilosopikal na pundasyon para sa pag-unawa sa teknolohiya ng impormasyon at ang tinatawag na "virtual reality". Sa malapit na hinaharap, ang trabaho ay magpapatuloy sa paglikha ng mga artificial intelligence system - bagaman, muli, hindi ito magiging katumbas ng tao sa mga kakayahan nito. Ang ganitong kumpetisyon ay walang kabuluhan: sa ating panahon, ang makina ay dapat maging (at maging) hindi isang karibal, ngunit isang katulong sa tao, hindi isang bagay mula sa larangan ng pantasya, ngunit bahagi ng totoong mundo.

Ang pag-aaral ng wika sa pamamagitan ng mga istatistikal na pamamaraan ay nagpapatuloy, na ginagawang posible upang mas tumpak na matukoy ang mga katangian ng husay nito. Mahalagang mahanap ng pinakamatapang na hypotheses tungkol sa wika ang kanilang matematikal, at samakatuwid ay lohikal, patunay.

Ang pinakamahalagang bagay ay ang iba't ibang sangay ng aplikasyon ng matematika sa linggwistika, na dati ay medyo nakahiwalay, sa mga nagdaang taon ay naiugnay sa isa't isa, na nagkokonekta sa isang magkakaugnay na sistema, sa pamamagitan ng pagkakatulad sa sistema ng wika na natuklasan noong isang siglo ni Ferdinand de Saussure at Yvan Baudouin de Courtenay. Ito ang pagpapatuloy ng kaalamang siyentipiko.

Ang linggwistika sa modernong mundo ay naging pundasyon para sa pag-unlad ng teknolohiya ng impormasyon. Hangga't ang computer science ay nananatiling isang mabilis na umuunlad na sangay ng aktibidad ng tao, ang unyon ng matematika at linggwistika ay patuloy na gaganap ng papel nito sa pag-unlad ng agham.

Konklusyon

Sa paglipas ng ika-20 siglo, malayo na ang narating ng mga teknolohiya sa kompyuter - mula sa militar hanggang sa mapayapang paggamit, mula sa isang makitid na hanay ng mga layunin hanggang sa pagtagos sa lahat ng sangay ng buhay ng tao. Ang matematika bilang isang agham ay nakakita ng bagong praktikal na kahalagahan sa pag-unlad ng teknolohiya ng kompyuter. Ang prosesong ito ay nagpapatuloy ngayon.

Ang dati nang hindi akalain na "tandem" ng "physicists" at "lyricists" ay naging realidad. Para sa buong pakikipag-ugnayan ng matematika at computer science sa humanities, kinakailangan ang mga kwalipikadong espesyalista mula sa magkabilang panig. Habang ang mga computer scientist ay lalong nangangailangan ng sistematikong makataong kaalaman (linguistic, cultural, philosophical) upang maunawaan ang mga pagbabago sa realidad sa kanilang paligid, sa interaksyon ng tao at teknolohiya, para makabuo ng parami nang paraming bagong linguistic at mental na konsepto, para magsulat mga programa, kung gayon ang anumang "Humanities" sa ating panahon para sa kanilang propesyonal na paglago ay dapat na makabisado ng hindi bababa sa mga pangunahing kaalaman sa pagtatrabaho sa isang computer.

Ang matematika, na malapit na magkakaugnay sa informatics, ay patuloy na umuunlad at nakikipag-ugnayan sa mga natural na agham at humanidades. Sa bagong siglo, ang trend patungo sa mathematization ng agham ay hindi humihina, ngunit, sa kabaligtaran, ay tumataas. Sa batayan ng dami ng data, ang mga batas ng pag-unlad ng wika, ang makasaysayang at pilosopikal na mga katangian ay naiintindihan.

Ang mathematical formalism ay pinakaangkop para sa paglalarawan ng mga pattern sa linguistics (tulad ng, sa katunayan, sa ibang mga agham - parehong humanidades at natural). Ang sitwasyon kung minsan ay umuunlad sa agham sa paraang walang paggamit ng angkop na wikang matematikal, imposibleng maunawaan ang likas na katangian ng pisikal, kemikal, atbp. hindi posible ang proseso. Paglikha ng isang planetary model ng atom, ang sikat na English physicist ng XX century. Si E. Rutherford ay nakaranas ng mga kahirapan sa matematika. Noong una, hindi tinanggap ang kanyang teorya: hindi ito nakakumbinsi, at ang dahilan nito ay ang kamangmangan ni Rutherford sa teorya ng probabilidad, batay sa mekanismo kung saan posible lamang na maunawaan ang representasyon ng modelo ng mga pakikipag-ugnayan ng atomic. Napagtanto ito, na sa oras na iyon ang isang natitirang siyentipiko, ang may-ari ng Nobel Prize, ay naka-enrol sa seminar ng mathematician Professor Lamb at sa loob ng dalawang taon, kasama ang mga mag-aaral, ay dumalo sa isang kurso at nagtrabaho sa isang workshop sa teorya ng posibilidad. . Batay dito, nagawang ilarawan ni Rutherford ang pag-uugali ng elektron, na nagbibigay sa kanyang modelo ng istruktura na nakakumbinsi na katumpakan at nakakakuha ng pagkilala. Ganoon din sa linggwistika.

Nagtatanong ito, ano ang napaka-matematika sa layunin na mga phenomena, salamat sa kung saan maaari silang ilarawan sa wika ng matematika, sa wika ng mga katangian ng dami? Ito ay mga homogenous na yunit ng bagay na ipinamahagi sa espasyo at oras. Yaong mga agham na mas malayo kaysa sa iba patungo sa paghihiwalay ng homogeneity, at lumabas na mas angkop para sa paggamit ng matematika sa kanila.

Ang Internet, na mabilis na umunlad noong dekada 1990, ay nagsama-sama ng mga kinatawan ng iba't ibang bansa, mamamayan at kultura. Sa kabila ng katotohanan na ang Ingles ay patuloy na pangunahing wika ng internasyonal na komunikasyon, ang Internet ay naging multilinggwal sa ating panahon. Ito ay humantong sa pagbuo ng matagumpay na komersyal na mga sistema ng pagsasalin ng makina na malawakang ginagamit sa iba't ibang larangan ng aktibidad ng tao.

Ang mga network ng computer ay naging isang bagay ng pilosopikal na pagmuni-muni - parami nang parami ang mga bagong linguistic, lohikal, mga konsepto ng pananaw sa mundo ay nilikha na makakatulong upang maunawaan ang "virtual reality". Sa maraming mga gawa ng sining, nilikha ang mga senaryo - mas madalas na pesimistiko - tungkol sa pangingibabaw ng mga makina sa mga tao, at virtual reality - sa labas ng mundo. Malayo sa palaging ang gayong mga pagtataya ay naging walang kabuluhan. Ang teknolohiya ng impormasyon ay hindi lamang isang promising na industriya para sa pamumuhunan ng kaalaman ng tao, ito rin ay isang paraan upang kontrolin ang impormasyon, at, dahil dito, sa pag-iisip ng tao.

Ang hindi pangkaraniwang bagay na ito ay may parehong negatibo at positibong panig. Negatibo - dahil ang kontrol sa impormasyon ay salungat sa hindi maiaalis na karapatang pantao sa libreng pag-access dito. Positibo - dahil ang kawalan ng kontrol na ito ay maaaring humantong sa mga sakuna na kahihinatnan para sa sangkatauhan. Sapat na upang alalahanin ang isa sa pinakamatalinong pelikula ng huling dekada - "When the World Ends" ni Wim Wenders, na ang mga karakter ay ganap na nahuhulog sa "virtual reality" ng kanilang sariling mga pangarap na naitala sa isang computer. Kasabay nito, hindi isang solong siyentipiko at hindi isang artista ang maaaring magbigay ng isang hindi malabo na sagot sa tanong: kung ano ang naghihintay sa agham at teknolohiya sa hinaharap.

Ang pagtutok sa "hinaharap", kung minsan ay tila kamangha-manghang, ay isang natatanging katangian ng agham noong kalagitnaan ng ikadalawampu siglo, nang ang mga imbentor ay naghangad na lumikha ng mga perpektong modelo ng teknolohiya na maaaring gumana nang walang interbensyon ng tao. Ipinakita ng panahon ang utopiang katangian ng naturang pananaliksik. Kasabay nito, hindi kailangan na hatulan ang mga siyentipiko para dito - kung wala ang kanilang sigasig noong 1950s - 60s, hindi sana gumawa ng ganoong kalakas na paglukso ang teknolohiya ng impormasyon noong dekada 90, at wala tayo sa kung ano ang mayroon tayo ngayon.

Binago ng mga huling dekada ng ikadalawampu siglo ang mga priyoridad ng agham - ang pananaliksik, ang mga mapag-imbentong pathos ay nagbigay daan sa komersyal na interes. Muli, ito ay hindi mabuti o masama. Ito ay isang katotohanan kung saan ang agham ay lalong isinama sa pang-araw-araw na buhay.

Ang ika-21 siglo ay nagpatuloy sa kalakaran na ito, at sa ating panahon sa likod ng mga imbensyon ay hindi lamang katanyagan at pagkilala, ngunit, una sa lahat, pera. Ito rin ang dahilan kung bakit mahalagang tiyakin na ang pinakabagong mga nagawa ng agham at teknolohiya ay hindi mahuhulog sa mga kamay ng mga teroristang grupo o diktatoryal na rehimen. Ang gawain ay mahirap hanggang sa punto ng imposible; upang mapagtanto ito hangga't maaari ay ang gawain ng buong komunidad ng mundo.

Ang impormasyon ay isang sandata, at ang mga sandata ay hindi gaanong mapanganib kaysa sa mga sandatang nuklear o kemikal - hindi lamang ito kumikilos sa pisikal, ngunit sa halip ay sikolohikal. Kailangang isipin ng sangkatauhan kung ano ang mas mahalaga para dito sa kasong ito - kalayaan o kontrol.

Ang pinakabagong mga pilosopikal na konsepto na may kaugnayan sa pag-unlad ng mga teknolohiya ng impormasyon at isang pagtatangka na maunawaan ang mga ito ay nagpakita ng mga limitasyon ng parehong natural-science materialism, na nangingibabaw noong ika-19 at unang bahagi ng ika-20 siglo, at matinding idealismo, na tumatanggi sa kahalagahan ng materyal na mundo. . Mahalaga para sa modernong kaisipan, lalo na ang kaisipan ng Kanluran, na mapagtagumpayan ang dualismong ito sa pag-iisip, kapag ang nakapaligid na mundo ay malinaw na nahahati sa materyal at ideal. Ang landas patungo dito ay isang diyalogo ng mga kultura, isang paghahambing ng iba't ibang mga punto ng pananaw sa mga nakapalibot na phenomena.

Paradoxically, ang teknolohiya ng impormasyon ay maaaring gumanap ng isang mahalagang papel sa prosesong ito. Ang mga network ng kompyuter, at lalo na ang Internet, ay hindi lamang isang mapagkukunan para sa libangan at masiglang aktibidad sa komersyo, ito rin ay isang paraan ng makabuluhan, kontrobersyal na komunikasyon sa pagitan ng mga kinatawan ng iba't ibang sibilisasyon sa modernong mundo, gayundin para sa isang diyalogo sa pagitan ng nakaraan at ang kasalukuyan. Masasabi nating itinutulak ng Internet ang spatial at temporal na mga hangganan.

At sa diyalogo ng mga kultura sa pamamagitan ng information technology, mahalaga pa rin ang papel ng wika bilang pinakamatandang unibersal na paraan ng komunikasyon. Kaya naman ang linggwistika, sa pakikipag-ugnayan sa matematika, pilosopiya at computer science, ay nakaranas ng pangalawang kapanganakan at patuloy na umuunlad ngayon. Ang takbo ng kasalukuyan ay magpapatuloy sa hinaharap - "hanggang sa katapusan ng mundo", tulad ng 15 taon na ang nakalilipas, ang parehong hinulaang V. Wenders. Totoo, hindi alam kung kailan mangyayari ang wakas na ito - ngunit mahalaga ba ito ngayon, dahil ang hinaharap ay magiging kasalukuyan pa rin.

Appendix 1

Ferdinand de Saussure

Ang Swiss linguist na si Ferdinand de Saussure (1857-1913) ay malawak na itinuturing na tagapagtatag ng modernong linggwistika sa mga pagtatangka nitong ilarawan ang istruktura ng wika sa halip na ang kasaysayan ng mga partikular na wika at mga anyo ng wika. Sa katunayan, ang pamamaraan ng Structuralism sa linguistics at literary studies at isang makabuluhang sangay ng Semiotics ay natagpuan ang kanilang pangunahing panimulang punto sa kanyang trabaho sa pagpasok ng ikadalawampu siglo. Pinagtatalunan pa nga na ang kumplikado ng mga estratehiya at konsepto na tinawag na "poststructuralism" - ang akda nina Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes, at iba pa - ay iminungkahi ng gawa ni Saussure. sa linguistics at anagrammatic readings ng late Latin poetry.panitikan modernismo hanggang sa psychoanalysis at pilosopiya noong unang bahagi ng ikadalawampu siglo. Tulad ng pagtatalo nina Algirdas Julien Greimas at Joseph Courtes sa Semiotics and Language: An Analytic Dictionary, sa ilalim ng heading na "Interpretation," isang bagong paraan ng interpretasyon ang lumitaw noong unang bahagi ng ikadalawampu siglo na kinilala nila sa Saussurean linguistics, Husserlian Phenomenology, at Freudian psychoanalysis. Sa mode na ito, "ang interpretasyon ay hindi na isang bagay ng pag-uugnay ng isang naibigay na nilalaman sa isang form na kung hindi man ay kulang ng isa; sa halip, ito ay isang paraphrase na bumubuo sa ibang paraan ng katumbas na nilalaman ng isang elementong nagpapakahulugan sa loob ng isang partikular na semiotic system" ( 159). sa ganitong pag-unawa sa "interpretasyon," ang anyo at nilalaman ay hindi naiiba; sa halip, ang bawat "form" ay, bilang kahalili, isang semantikong "nilalaman" din, isang "nagbibigay-kahulugan na anyo," upang ang interpretasyon ay nag-aalok ng isang analogical na paraphrase ng isang bagay na nagsasaad na sa loob ng ibang sistema ng kahulugan.

Ang ganitong reinterpretasyon ng anyo at pag-unawa - na inilalarawan ni Claude Levi-Strauss sa isa sa kanyang pinaka-programmatic na mga artikulasyon ng konsepto ng structuralism, sa "Istruktura at Anyo: Mga Pagninilay sa isang Trabaho ni Vladimir Propp" - ay implicit sa Posthumous Course ni Saussure. sa General Linguistics (1916, trans., 1959, 1983).Sa kanyang buhay, medyo kaunti ang inilathala ni Saussure, at ang kanyang pangunahing gawain, ang Course, ay ang transkripsyon ng kanyang mga mag-aaral ng ilang mga kurso sa pangkalahatang linggwistika na kanyang inaalok noong 1907-11. Sa Kurso ay tinawag ni Saussure ang "pang-agham" na pag-aaral ng wika na taliwas sa gawain sa makasaysayang linggwistika na ginawa noong ikalabinsiyam na siglo. wika, makasaysayang (o "diachronic") linguistics ay sumubaybay sa pinagmulan at pag-unlad ng mga wikang Kanluranin mula sa isang pinagmumulan ng karaniwang wika, una ay isang "Indo-European" na wika at pagkatapos ay isang mas naunang "p roto-Indo-European" na wika.

Eksakto ang pag-aaral na ito ng mga natatanging paglitaw ng mga salita, na may kaakibat na palagay na ang pangunahing "yunit" ng wika ay, sa katunayan, ang positibong pag-iral ng mga "mga elemento ng salita," na kinuwestiyon ni Saussure. Ang kanyang gawain ay isang pagtatangka na bawasan ang masa ng mga katotohanan tungkol sa wika, na pinag-aralan nang napakaliit ng makasaysayang linggwistika, sa isang napapamahalaang bilang ng mga panukala. Ang "comparative school" ng ika-labing-siyam na siglo na Philology, sabi ni Saussure sa Course, "ay hindi nagtagumpay sa pag-set up ng tunay na agham ng linguistics" dahil "bigo itong hanapin ang kalikasan ng bagay ng pag-aaral nito" (3). Ang "kalikasan," sabi niya, ay matatagpuan hindi lamang sa "elemental" na mga salita na binubuo ng isang wika - ang tila "positibong" katotohanan (o "mga sangkap") ng wika - ngunit sa mga pormal na relasyon na nagdudulot ng mga iyon. "mga sangkap."

Ang sistematikong muling pagsusuri ni Saussure sa wika ay batay sa tatlong pagpapalagay. Ang una ay ang siyentipikong pag-aaral ng wika ay kailangang paunlarin at pag-aralan ang sistema sa halip na ang kasaysayan ng linguistic phenomena. Dahil dito, nakikilala niya ang mga partikular na pangyayari ng wika - ang partikular nito "speech-events," na itinalaga niya bilang parole - at ang wastong object ng linguistics, ang sistema (o "code") na namamahala sa mga kaganapang iyon, na itinalaga niya bilang langue. Ang ganitong sistematikong pag-aaral, bukod dito, ay nangangailangan ng "synchronic" konsepto ng ugnayan ng mga elemento ng wika sa isang partikular na sandali kaysa sa "diachronic" na pag-aaral ng pag-unlad ng wika sa pamamagitan ng kasaysayan.

Ang palagay na ito ay nagbunga ng kung ano ang itinalaga ni Roman Jakobson noong 1929 bilang "istrukturalismo," kung saan "anumang hanay ng mga phenomena na sinusuri ng kontemporaryong agham ay itinuturing hindi bilang isang mekanikal na pagsasama-sama ngunit bilang isang istrukturang kabuuan ang mekanikal na konsepto ng mga proseso ay nagbubunga sa tanong. ng kanilang tungkulin" ("Romantic" 711). Sa siping ito, ipinapahayag ni Jakobson ang intensyon ni Saussure na tukuyin ang linggwistika bilang isang sistemang siyentipiko kumpara sa isang simple, "mekanikal" na pagtutuos ng mga makasaysayang aksidente. Bukod dito, inilalarawan din ni Jakobson ang pangalawang batayan na palagay sa Saussurean - maaari nating ngayon ay tinatawag itong "istruktura" - linggwistika: na ang mga pangunahing elemento ng wika ay maaari lamang pag-aralan kaugnay ng kanilang mga tungkulin sa halip na kaugnay ng kanilang mga sanhi. European "mga salita"), ang mga pangyayari at entidad na iyon ay kailangang ilagay sa loob ng isang sistematikong balangkas kung saan nauugnay ang mga ito sa iba pang tinatawag na mga kaganapan at entidad. Ito ay isang radikal na reorientasyon sa pag-iisip ng karanasan at mga penomena, isa na ang kahalagahan ng pilosopo na si Ernst Cassirer ay inihambing sa "bagong agham ng Galileo na noong ikalabing pitong siglo ay nagbago sa ating kabuuan. konsepto ng pisikal na mundo" (sinipi sa Culler, Pursuit 2 4). Ang pagbabagong ito, gaya ng tala nina Greimas at Courtes, ay muling nag-iisip ng "interpretasyon" at sa gayon ay muling nagkakaroon ng paliwanag at pag-unawa sa kanilang mga sarili. Sa halip na ang paliwanag ay "sa mga tuntunin ng isang kababalaghan" ng mga sanhi, upang, bilang isang "epekto," ito ay sa ilang mga paraan subordinate sa mga sanhi nito, ang paliwanag dito ay binubuo sa pagpapailalim ng isang kababalaghan sa nito na nakatuon sa hinaharap na "function" o "layunin." Ang paliwanag ay hindi na independyente sa mga intensyon o layunin ng tao (kahit na ang mga intensyon na iyon ay maaaring impersonal, communal, o, sa mga terminong Freudian, "walang malay").

Sa kanyang linguistics, tinupad ni Saussure ang pagbabagong ito partikular sa redefinition ng linguistic "word," na inilalarawan niya bilang linguistic "sign" at binibigyang-kahulugan sa functionalist terms. Ang tanda, sabi niya, ay ang unyon ng "isang konsepto at isang tunog na imahe," na tinawag niyang "signified at signifier " (66-67; ang pagsasalin ni Roy Harris noong 1983 ay nag-aalok ng mga terminong "signification" at "signal" ). Ang likas na katangian ng kanilang "kombinasyon" ay "functional" na hindi ang signified o ang signifier ay ang "sanhi" ng iba; sa halip, "bawat isa ang mga halaga nito mula sa isa" (8). elemento ng wika, ang sign , na may kaugnayan at ginagawa ang pangunahing pagpapalagay ng makasaysayang linggwistika, ibig sabihin, ang pagkakakilanlan ng mga elementong yunit ng wika at kahulugan (i.e., "mga salita"), napapailalim sa mahigpit na pagsusuri. ang salitang "puno" bilang ang "parehong" salita ay hindi dahil ang salita ay binibigyang kahulugan ng mga likas na katangian - ito ay hindi isang "mekanikal na pagsasama-sama" ng gayong mga katangian - ngunit dahil ito ay tinukoy bilang isang elemento sa isang sistema, ang "kabuuan ng istruktura" , ng wika.

Ang ganitong relational (o "diacritical") na kahulugan ng isang entity ay namamahala sa konsepto ng lahat ng elemento ng wika sa structural linguistics. Ito ay pinakamalinaw sa pinakakahanga-hangang tagumpay ng Saussurean linguistics, ang pagbuo ng mga konsepto ng "ponema" at "mga natatanging katangian" ng wika. Ang mga ponema ay ang pinakamaliit na articulated at signifying unit ng isang wika. Ang mga ito ay hindi ang mga tunog na nangyayari sa wika ngunit ang mga "tunog na imahe" na binanggit ni Saussure, na nahuhuli ng mga nagsasalita - kahanga-hangang nahuhuli - bilang nagbibigay ng kahulugan. (Kaya, inilalarawan ni Elmar Holenstein ang linguistics ni Jakobson, na sumusunod kay Saussure sa mahahalagang paraan, bilang "phenomenological structuralism.") Ito ay para sa kadahilanang ito na ang nangungunang tagapagsalita para sa Prague School Structuralism, Jan Mukarovsky, ay nabanggit noong 1937 na "istruktura . . . ay isang phenomenological at hindi isang empirical reality; ito ay hindi ang gawain mismo, ngunit isang hanay ng mga functional na relasyon na matatagpuan sa kamalayan ng isang kolektibo (henerasyon, milieu, atbp.)" (sinipi sa Galan 35). Katulad nito, si Levi-Strauss, ang nangungunang tagapagsalita para sa istrukturalismong Pranses , binanggit noong 1960 na "ang istraktura ay walang natatanging nilalaman; ito ay kuntento mismo, at ang lohikal na organisasyon kung saan ito inaresto ay inaakalang pag-aari ng tunay" (167; tingnan din ang Jakobson, Fundamentals 27-28).

Ang mga ponema, kung gayon, ang pinakamaliit na nakikitang elemento ng wika, ay hindi mga positibong bagay kundi isang "phenomenological reality." Sa Ingles, halimbawa, ang ponema /t/ ay maaaring bigkasin sa maraming iba't ibang paraan, ngunit sa lahat ng pagkakataon ay makikilala ito ng isang nagsasalita ng Ingles bilang gumagana bilang isang /t/. Ang isang aspirated t (i.e., a t binibigkas na may parang h na hininga pagkatapos nito), isang mataas na tunog o mababang tunog na t, isang pinahabang tunog na t, at iba pa, ay lahat ay gagana sa parehong paraan sa pagkilala sa kahulugan ng "to" at "do" sa Ingles. Bukod dito, ang mga pagkakaiba sa pagitan ng mga wika ay tulad na ang phonological variation sa isang wika ay maaaring bumuo ng mga natatanging phonemes sa isa pa; kaya, ang Ingles ay nakikilala sa pagitan ng /l/ at /r/, samantalang ang ibang mga wika ay napakaayos na ang mga artikulasyong ito ay itinuturing na mga pagkakaiba-iba ng parehong ponema (tulad ng aspirated at unaspirated t sa Ingles). Sa bawat natural na wika, ang napakaraming posibleng salita ay kumbinasyon ng maliit na bilang ng mga ponema. Ang Ingles, halimbawa, ay nagtataglay ng wala pang 40 ponema na nagsasama-sama upang bumuo ng higit sa isang milyong iba't ibang salita.

Ang mga ponema ng wika ay mismong sistematikong nakaayos na mga istruktura ng mga tampok. Noong 1920s at 1930s, kasunod ng pangunguna ni Saussure ", ibinukod nina Jakobson at N. S. Trubetzkoy ang "mga natatanging katangian" ng mga ponema. Ang mga tampok na ito ay nakabatay sa istrukturang pisyolohikal ng mga organ ng pagsasalita - dila, ngipin, vocal chords, at iba pa - na Binanggit ni Saussure sa Kurso at inilalarawan ni Harris bilang "pisyolohikal na ponetika" ( 39; Ang naunang pagsasalin ni Baskin ay gumagamit ng terminong "ponolohiya" [(1959) 38]) - at sila ay pinagsama sa "mga bundle" ng binary opposition upang bumuo ng mga ponema. Halimbawa, sa Ingles ang pagkakaiba sa pagitan ng /t/ at /d/ ay ang pagkakaroon o kawalan ng "boses" (ang pakikipag-ugnayan ng mga vocal chords), at sa antas ng pagbigkas ng mga ponemang ito ay katumbas ng pagtukoy sa isa't isa. Sa ganitong paraan, ang ponolohiya ay isang tiyak na halimbawa ng isang pangkalahatang tuntunin ng wika na inilarawan ni Saussure: Sa wika ay may mga pagkakaiba lamang. mas mahalaga pa: ang pagkakaiba ay karaniwang nagpapahiwatig ng mga positibong termino kung saan naka-set up ang pagkakaiba; ngunit sa wika ay may mga pagkakaiba lamang na walang positibong termino. Kunin man natin ang signified o ang signifier, ang wika ay walang mga ideya o tunog na umiral bago ang linguistic system. ( 120)

Sa balangkas na ito, ang mga pagkakakilanlang pangwika ay tinutukoy hindi sa pamamagitan ng mga likas na katangian ngunit sa pamamagitan ng sistematikong ("istruktura") na mga relasyon.

Sinabi ko na ang phonology ay "sumusunod sa pangunguna" ni Saussure, dahil kahit na ang kanyang pagsusuri sa pisyolohiya ng produksyon ng wika ay "sa kasalukuyan," gaya ng sabi ni Harris, "tatawaging "pisikal," kumpara sa alinman sa "sikolohikal" o "functional." "" (Pagbasa 49), dahil dito sa Kurso ay ipinahayag niya ang direksyon at mga balangkas ng isang functional analysis ng wika. Katulad nito, ang kanyang tanging pinalawig na nai-publish na akda, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Memoir on the primitive system of vowels in Indo-European languages), na lumabas noong 1878, ay ganap na nakalagay sa loob ng proyekto ng ikalabinsiyam na- siglo makasaysayang linggwistika. Gayunpaman, sa loob ng gawaing ito, tulad ng ipinagtalo ni Jonathan Culler, ipinakita ni Saussure ang "kabuuan ng pag-iisip ng wika bilang isang sistema ng mga bagay na puro relasyon, kahit na nagtatrabaho sa gawain ng muling pagtatayo ng kasaysayan" (Saussure 66). Sa pamamagitan ng pagsusuri sa mga sistematikong istruktural na relasyon sa mga ponema upang isaalang-alang ang mga pattern ng paghahalili ng patinig sa umiiral na mga wikang Indo-European, iminungkahi ni Saussure na bilang karagdagan sa ilang iba't ibang ponema /a/, tiyak na mayroong isa pang ponema na maaaring pormal na ilarawan. "Ang dahilan kung bakit napaka-kahanga-hanga ang gawa ni Saussure," pagtatapos ni Culler, "ay ang katotohanan na makalipas ang halos limampung taon, nang matuklasan at ma-decipher ang cuneiform Hittite, ito ay natagpuang naglalaman ng isang ponema, nakasulat na h, na kumikilos tulad ng hula ni Saussure. . Natuklasan niya, sa pamamagitan ng isang pormal na pagsusuri, kung ano ang kilala ngayon bilang mga laryngeal ng Indo-European" (66).

Ang konseptong ito ng relational o diacritical na pagpapasiya ng mga elemento ng signification, na parehong implicit at tahasang sa Course, ay nagmumungkahi ng ikatlong palagay na namamahala sa structural linguistics, na tinatawag ni Saussure na "ang arbitrary na katangian ng sign." Sa pamamagitan nito, nangangahulugan siya na ang relasyon sa pagitan ng signifier at signified sa wika ay hindi kinakailangan (o "motivated"): ang isa ay madaling mahanap ang sound signifier arbre bilang signifier tree upang makiisa sa konseptong "puno". Ngunit higit pa rito, nangangahulugan ito na ang ipinahiwatig ay arbitrary din: ang isa ay madaling tukuyin ang konseptong "puno" sa pamamagitan ng makahoy na kalidad nito (na hindi kasama ang mga puno ng palma) gaya ng laki nito (na hindi kasama ang "mababang makahoy na halaman" na ating tumawag sa mga bushes). Dapat nitong linawin na ang pag-numero ng mga pagpapalagay na aking inilalahad ay hindi kumakatawan sa isang pagkakasunud-sunod ng priyoridad: ang bawat palagay - ang sistematikong katangian ng kahulugan (pinakamahusay na nahuhuli sa pamamagitan ng pag-aaral ng wika "sabay-sabay"), ang relasyonal o "diakritikal" na katangian ng mga elemento ng signification, ang arbitrary na katangian ng mga palatandaan - nakukuha ang halaga nito mula sa iba.

Ibig sabihin, Saussurean linguistics ang mga phenomena na pinag-aaralan nito sa mga pangkalahatang relasyon ng kumbinasyon at contrast sa wika. Sa konseptong ito, ang wika ay parehong proseso ng pagpapahayag ng kahulugan (signification) at ang produkto nito (komunikasyon), at ang dalawang tungkuling ito ng wika ay hindi magkapareho o ganap na magkatugma (tingnan ang Schleifer, "Deconstruction"). Dito, makikita natin ang paghahalili sa pagitan ng anyo at nilalaman na inilalarawan nina Greimas at Courtes sa modernistang interpretasyon: ang wika ay nagpapakita ng mga kaibahan na pormal na tumutukoy sa mga yunit nito, at ang mga yunit na ito ay nagsasama-sama sa mga susunod na antas upang lumikha ng makabuluhang nilalaman. Dahil arbitraryo ang mga elemento ng wika, bukod dito, hindi masasabing basic ang contrast o combination. Kaya, sa wika ay nagsasama-sama ang mga natatanging katangian upang makabuo ng magkasalungat na ponema sa ibang antas ng pangamba, ang mga ponema ay nagsasama-sama upang makabuo ng mga magkasalungat na morpema, ang mga morpema ay nagsasama-sama upang makabuo ng mga salita, ang mga salita ay nagsasama-sama upang makabuo ng mga pangungusap, at iba pa. Sa bawat pagkakataon, ang buong ponema, o salita, o pangungusap, at iba pa, ay mas malaki kaysa sa kabuuan ng mga bahagi nito (tulad ng tubig, H2O, sa halimbawa ni Saussure [(1959) 103] ay higit pa sa mekanikal na pagsasama-sama. ng hydrogen at oxygen).

Ang tatlong pagpapalagay ng Kurso sa Pangkalahatang Linggwistika ay humantong kay Saussure na tumawag para sa isang bagong agham ng ikadalawampu siglo na lalampas sa agham pangwika upang pag-aralan ang "buhay ng mga palatandaan sa loob ng lipunan." Pinangalanan ni Saussure ang agham na ito na "semiology (mula sa Greek semeion "sign")" (16). Ang "agham" ng semiotics, tulad ng ginawa sa Silangang Europa noong 1920s at 1930s at Paris noong 1950s at 1960s, ay nagpalawak ng pag-aaral ng wika at mga istrukturang linggwistika sa mga artifact na pampanitikan na binuo (o articulated) ng mga istrukturang iyon. Sa buong huling bahagi ng kanyang karera, bukod pa rito, kahit na siya ay nag-aalok ng mga kurso sa pangkalahatang linggwistika, itinuloy ni Saussure ang kanyang sariling "semiotic" na pagsusuri ng huli na tula ng Latin sa pagtatangkang tuklasin ang sadyang itinatagong mga anagram ng mga wastong pangalan. Ang paraan ng pag-aaral sa maraming paraan ay kabaligtaran ng functional rationalism ng kanyang linguistic analysis: sinubukan nito, gaya ng binanggit ni Saussure sa isa sa 99 na kuwaderno kung saan niya itinuloy ang pag-aaral na ito, na sistematikong suriin ang problema ng "pagkakataon," na " nagiging hindi maiiwasang pundasyon ng lahat" (sinipi sa Starobinski 101). Ang nasabing pag-aaral, gaya ng sinabi mismo ni Saussure, ay nakatuon sa "materyal na katotohanan" ng pagkakataon at kahulugan (binanggit 101), upang ang "theme-word" na ang anagram ay hinahanap ni Saussure, gaya ng sinabi ni Jean Starobinski, "ay, para sa makata. , isang instrumento, at hindi isang mahalagang mikrobyo ng tula. Ang tula ay kinakailangan upang muling gamitin ang phonic na materyales ng tema-salita" (45). Sa pagsusuring ito, sinabi ni Starobinski, "Hindi nawala si Saussure sa kanyang sarili sa paghahanap ng mga nakatagong kahulugan." Sa halip, ang kanyang akda ay tila nagpapakita ng pagnanais na iwasan ang lahat ng mga problema na nagmumula sa kamalayan: "Dahil ang tula ay hindi lamang natanto sa mga salita ngunit ito ay isang bagay na ipinanganak mula sa mga salita, ito ay nakatakas sa arbitraryong kontrol ng kamalayan upang umasa lamang sa isang uri ng lingguwistika legalidad. "(121).

Iyon ay, ang pagtatangka ni Saussure na tumuklas ng mga wastong pangalan sa huling mga tula ng Latin - ang tinatawag ni Tzvetan Todorov na pagbabawas ng isang "salita . . . to its signifier" (266) - binibigyang-diin ang isa sa mga elementong namamahala sa kanyang linguistic analysis, ang arbitrary na katangian ng sign. (Idiniin din nito ang pormal na katangian ng Saussurean linguistics - "Ang wika," aniya, "ay isang anyo at hindi isang sangkap" - na mabisang nag-aalis ng mga semantika bilang isang pangunahing bagay ng pagsusuri.) Bilang pagtatapos ni Todorov, ang gawa ni Saussure ay lumilitaw na kapansin-pansing homogenous ngayon sa pagtanggi nitong tanggapin ang mga simbolikong penomena. . . . Sa kanyang pananaliksik sa anagrams, binibigyang-pansin lamang niya ang mga phenomena ng pag-uulit, hindi sa mga evocation. . . . Sa kanyang mga pag-aaral sa Nibelungen, kinikilala niya ang mga simbolo lamang upang maiugnay ang mga ito sa mga maling pagbabasa: dahil hindi ito sinasadya, ang mga simbolo ay hindi umiiral. Sa wakas sa kanyang mga kurso sa pangkalahatang linggwistika, pinag-isipan niya ang pagkakaroon ng semiology, at sa gayon ay ng mga palatandaan maliban sa mga linggwistika; ngunit ang paninindigang ito ay sabay-sabay na nililimitahan ng katotohanan na ang semiology ay nakatuon sa isang solong uri ng tanda: yaong mga arbitraryo. (269-70)

Kung ito ay totoo, ito ay dahil hindi maisip ni Saussure ang "intensiyon" nang walang paksa; hindi niya lubos na makatakas sa pagsalungat sa pagitan ng anyo at nilalaman na ang kanyang trabaho ay napakaraming nagawa upang itanong. Sa halip, ginamit niya ang "liguistic legality." Matatagpuan sa pagitan, sa isang banda, mga konsepto ng kasaysayan ng ikalabinsiyam na siglo, subjectivity, at ang paraan ng sanhi ng interpretasyon na pinamamahalaan ng mga konseptong ito at, sa kabilang banda, ang ikadalawampung siglo na "structuralist" na mga konsepto ng tinatawag ni Levi-Strauss na "Kantianism without isang transendental na paksa" (na binanggit sa Connerton 23) - mga konsepto na nagbubura sa pagsalungat sa pagitan ng anyo at nilalaman (o paksa at bagay) at ang hierarchy ng foreground at background sa ganap na structuralism, psychoanalysis, at kahit na quantum mechanics - ang gawa ni Ferdinand Si de Saussure sa linggwistika at semiotika ay sumasaklaw sa isang hudyat na sandali sa pag-aaral ng kahulugan at kultura.

Ronald Schleifer

Appendix 2

Ferdinand de Saussure (pagsasalin)

Ang Swiss linguist na si Ferdinand de Saussure (1857-1913) ay itinuturing na tagapagtatag ng modernong linggwistika - salamat sa kanyang mga pagtatangka na ilarawan ang istraktura ng wika, at hindi ang kasaysayan ng mga indibidwal na wika at mga anyo ng salita. Sa pangkalahatan, ang mga pundasyon ng mga pamamaraang istruktural sa linggwistika at kritisismong pampanitikan at, sa malaking lawak, ang semiotika ay inilatag sa kanyang mga gawa sa pinakadulo simula ng ikadalawampu siglo. Napatunayan na ang mga pamamaraan at konsepto ng tinatawag na "post-structuralism", na nabuo sa mga akda nina Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes at iba pa, ay bumalik sa mga linggwistikong gawa ni Saussure at anagrammatic readings ng huling Romanong tula. Dapat pansinin na ang gawain ni Saussure sa linguistics at linguistic na interpretasyon ay nakakatulong upang ikonekta ang isang malawak na hanay ng mga intelektwal na disiplina - mula sa pisika hanggang sa mga inobasyong pampanitikan, psychoanalysis at pilosopiya ng unang bahagi ng ikadalawampu siglo. Sumulat sina A. J. Greimas at J. Kurte sa Semiotics and Language: "Ang isang analytical dictionary na may pamagat na "Interpretation" bilang isang bagong uri ng interpretasyon ay lumitaw sa simula ng ika-20 siglo kasama ang linguistics ng Saussure, ang phenomenology ni Husserl at ang psychoanalysis ni Freud. Sa ganoong kaso, "ang interpretasyon ay hindi ang pagpapatungkol ng isang ibinigay na nilalaman sa isang form na kung hindi man ay kulang ng isa; sa halip, ito ay isang paraphrase na bumubuo sa ibang paraan ng parehong nilalaman ng isang makabuluhang elemento sa loob ng isang partikular na semiotic system" (159 ). Sa ganitong pag-unawa sa "interpretasyon", ang anyo at nilalaman ay hindi mapaghihiwalay; sa kabaligtaran, ang bawat anyo ay puno ng semantikong kahulugan (“makabuluhang anyo”), kaya ang interpretasyon ay nag-aalok ng bago, katulad na muling pagsasalaysay ng isang bagay na makabuluhan sa ibang sistema ng pag-sign.

Ang isang katulad na pag-unawa sa anyo at nilalaman, na ipinakita ni Claude Lévi-Strauss sa isa sa mga pangunahing akda ng estrukturalismo, ("Istruktura at Anyo: Mga Pagninilay sa mga Gawa ni Vladimir Propp"), ay makikita sa posthumously-publish na libro ni Saussure na "Course in Pangkalahatang Linggwistika" (1916, trans., 1959, 1983). Sa panahon ng kanyang buhay, si Saussure ay naglathala ng kaunti, "Course" - ang kanyang pangunahing gawain - ay nakolekta mula sa mga tala ng mga mag-aaral na dumalo sa kanyang mga lektura sa pangkalahatang lingguwistika noong 1907-11. Sa Kurso, nanawagan si Saussure ng "pang-agham" na pag-aaral ng wika, na inihambing ito sa comparative-historical linguistics ng ikalabinsiyam na siglo. Ang gawaing ito ay maaaring ituring na isa sa mga pinakadakilang tagumpay ng pag-iisip ng Kanluranin: ang pagkuha ng mga indibidwal na salita bilang mga istruktural na elemento ng wika bilang batayan, ang historikal (o "diachronic") linguistics ay pinatunayan ang pinagmulan at pag-unlad ng mga wikang Kanlurang Europeo mula sa isang karaniwan, Indo-European na wika - at isang naunang Proto-Indo-European.

Ito ay tiyak na pag-aaral ng mga natatanging paglitaw ng mga salita, na may kaakibat na palagay na ang pangunahing "yunit" ng wika ay, sa katunayan, ang positibong pag-iral ng mga "mga elemento ng salita" na ito na kinuwestiyon ni Saussure. Ang kanyang trabaho ay isang pagtatangka na bawasan ang maraming mga katotohanan tungkol sa wikang kaswal na pinag-aralan ng comparative linguistics sa isang maliit na bilang ng mga theorems. Ang comparative philological school ng ika-19 na siglo, isinulat ni Saussure, "ay hindi nagtagumpay sa paglikha ng isang tunay na paaralan ng linggwistika" dahil "hindi nito naunawaan ang kakanyahan ng bagay ng pag-aaral" (3). Ang "esensya" na ito, sabi niya, ay namamalagi hindi lamang sa mga indibidwal na salita - ang "mga positibong sangkap" ng wika - kundi pati na rin sa mga pormal na koneksyon na tumutulong sa mga sangkap na ito na umiral.

Ang "pagsubok" ng wika ni Saussure ay batay sa tatlong pagpapalagay. Una, ang pang-agham na pag-unawa sa wika ay nakabatay hindi sa isang historikal, ngunit sa isang istruktural na kababalaghan. Samakatuwid, nakilala niya ang pagitan ng mga indibidwal na phenomena ng wika - "mga kaganapan sa pananalita", na tinukoy niya bilang "parole" - at ang nararapat, sa kanyang opinyon, bagay ng pag-aaral ng linggwistika, ang sistema (code, istraktura) na kumokontrol sa mga kaganapang ito. ("wika"). Ang ganitong sistematikong pag-aaral, bukod dito, ay nangangailangan ng "kasabay" na konsepto ng ugnayan sa pagitan ng mga elemento ng wika sa isang takdang sandali, sa halip na isang "diachronic" na pag-aaral ng pag-unlad ng isang wika sa pamamagitan ng kasaysayan nito.

Ang hypothesis na ito ang nangunguna sa kung ano ang tatawagin ni Roman Jakobson noong 1929 na "structuralism" - isang teorya kung saan "anumang hanay ng mga phenomena na sinisiyasat ng modernong agham ay itinuturing na hindi bilang isang mekanikal na akumulasyon, ngunit bilang isang istrukturang kabuuan kung saan ang nakabubuo na bahagi ay nauugnay sa ang function" ("Romantikong "711). Sa siping ito, binalangkas ni Jakobson ang ideya ni Saussure na tukuyin ang wika bilang isang istraktura, bilang kabaligtaran sa "mekanikal" na enumeration ng mga makasaysayang kaganapan. Bilang karagdagan, si Jakobson ay bumuo ng isa pang Saussurean assumption, na naging tagapagpauna ng structural linguistics: ang mga pangunahing elemento ng wika ay dapat pag-aralan na may kaugnayan hindi sa kanilang mga sanhi, ngunit sa kanilang mga tungkulin. Ang mga hiwalay na phenomena at mga kaganapan (sabihin, ang kasaysayan ng pinagmulan ng mga indibidwal na Indo-European na mga salita) ay dapat na pag-aralan hindi sa kanilang sarili, ngunit sa isang sistema kung saan sila ay nauugnay sa mga katulad na bahagi. Ito ay isang radikal na pagliko sa paghahambing ng mga phenomena sa nakapaligid na katotohanan, ang kahalagahan nito ay inihambing ng pilosopo na si Ernst Cassirer sa "agham ni Galileo, na nagpapalit ng mga ideya tungkol sa materyal na mundo noong ikalabing pitong siglo." , gaya ng tala nina Greimas at Kurthe, binabago ang ideya ng "interpretasyon", dahil dito, ang mga paliwanag mismo. Nagsimulang bigyang-kahulugan ang mga kababalaghan hindi kaugnay sa mga sanhi ng kanilang paglitaw, ngunit kaugnay ng epekto na maaari nilang magkaroon sa kasalukuyan at hinaharap. Ang interpretasyon ay tumigil na maging independiyente sa mga intensyon ng isang tao (sa kabila ng katotohanan na ang mga intensyon ay maaaring maging impersonal, "walang malay" sa kahulugan ng Freudian ng salita).

Sa kanyang linggwistika, lalo na ipinakita ni Saussure ang pagbabagong ito sa pagbabago ng konsepto ng salita sa linggwistika, na tinukoy niya bilang isang tanda at inilalarawan sa mga tuntunin ng mga tungkulin nito. Ang isang tanda para sa kanya ay isang kumbinasyon ng tunog at kahulugan, "signified at designation" (66-67; sa English translation ng 1983 ni Roy Harris - "signification" at "signal"). Ang likas na katangian ng tambalang ito ay "functional" (ni isa o ang iba pang elemento ay maaaring umiral nang wala ang isa't isa); bukod pa rito, "ang isa ay humihiram ng mga katangian mula sa iba" (8). Kaya, tinukoy ni Saussure ang pangunahing istrukturang elemento ng wika - ang tanda - at ginagawang batayan ng historikal na linggwistika ang pagkakakilanlan ng mga palatandaan sa mga salita, na nangangailangan ng partikular na mahigpit na pagsusuri. Samakatuwid, mauunawaan natin ang iba't ibang kahulugan ng, sabihin nating, ang parehong salitang "puno" - hindi dahil ang salita ay isang hanay lamang ng ilang mga katangian, ngunit dahil ito ay tinukoy bilang isang elemento sa sistema ng tanda, sa "kabuuan ng istruktura", sa wika.

Ang ganitong kamag-anak ("diacritical") na konsepto ng pagkakaisa ay sumasailalim sa konsepto ng lahat ng elemento ng wika sa istrukturang linggwistika. Ito ay lalong malinaw sa pinaka orihinal na pagtuklas ng Saussurean linguistics, sa pagbuo ng konsepto ng "ponema" at "mga natatanging katangian" ng wika. Ang mga ponema ay ang pinakamaliit sa sinasalita at makabuluhang mga yunit ng wika. Ang mga ito ay hindi lamang mga tunog na nangyayari sa wika, ngunit "mga tunog na imahe", sabi ni Saussure, na itinuturing ng mga katutubong nagsasalita bilang may kahulugan. (Dapat tandaan na tinawag ni Elmar Holenstein ang linggwistika ni Jakobson, na nagpapatuloy sa mga ideya at konsepto ng Saussure sa mga pangunahing probisyon nito, "phenomenological structuralism"). Iyon ang dahilan kung bakit ang nangungunang tagapagsalita ng Prague School of Structuralism, si Jan Mukarowski, ay naobserbahan noong 1937 na "istruktura. . . hindi isang empirical, ngunit isang phenomenological na konsepto; hindi ito ang resulta mismo, ngunit isang hanay ng mga makabuluhang ugnayan ng kolektibong kamalayan (henerasyon, iba pa, atbp.)”. Ang katulad na kaisipan ay ipinahayag noong 1960 ni Lévi-Strauss, ang pinuno ng estrukturalismong Pranses: “Ang istruktura ay walang tiyak na nilalaman; ito ay makabuluhan sa kanyang sarili, at ang lohikal na konstruksyon kung saan ito nakapaloob ay ang imprint ng realidad.

Sa turn, ang mga ponema, bilang ang pinakamaliit na elemento ng linguistic na katanggap-tanggap para sa persepsyon, ay kumakatawan sa isang hiwalay na integral na "phenomenological reality". Halimbawa, sa Ingles, ang tunog na "t" ay maaaring mabigkas nang iba, ngunit sa lahat ng pagkakataon, ang isang taong nagsasalita ng Ingles ay mapapansin ito bilang "t". Ang aspirated, itinaas o ibinaba, isang mahabang "t" na tunog, atbp. ay pantay na makikilala ang kahulugan ng mga salitang "to" at "do". Bukod dito, ang mga pagkakaiba sa pagitan ng mga wika ay tulad na ang mga uri ng isang tunog sa isang wika ay maaaring tumutugma sa iba't ibang mga ponema sa isa pa; halimbawa, ang "l" at "r" sa Ingles ay magkaiba, habang sa iba pang mga wika ang mga ito ay mga uri ng parehong ponema (tulad ng Ingles na "t", binibigkas nang may at walang aspirasyon). Ang malawak na bokabularyo ng anumang natural na wika ay isang hanay ng mga kumbinasyon ng mas maliit na bilang ng mga ponema. Sa Ingles, halimbawa, 40 ponema lamang ang ginagamit sa pagbigkas at pagsulat ng halos isang milyong salita.

Ang mga tunog ng isang wika ay isang sistematikong nakaayos na hanay ng mga tampok. Noong 1920s -1930s, kasunod ni Saussure, Jacobson at N.S. Trubetskoy ay pinili ang "mga natatanging tampok" ng mga ponema. Ang mga tampok na ito ay batay sa istruktura ng mga organo ng pagsasalita - dila, ngipin, vocal cords - Napansin ito ni Saussure sa "Course of General Linguistics", at tinawag ito ni Harris na "physiological phonetics" (sa naunang pagsasalin ni Baskin, ang terminong "phonology " ay ginagamit) - sila ay konektado sa "knots » durg laban sa isang kaibigan upang gumawa ng mga tunog. Halimbawa, sa Ingles, ang pagkakaiba sa pagitan ng "t" at "d" ay ang pagkakaroon o kawalan ng isang "boses" (ang pag-igting ng mga vocal cord), at ang antas ng boses na nagpapakilala sa isang ponema mula sa isa pa. Kaya, ang ponolohiya ay maaaring ituring na isang halimbawa ng pangkalahatang tuntunin sa wika na inilarawan ni Saussure: "May mga pagkakaiba lamang sa wika." Kahit na ito ay mas mahalaga: ang pagkakaiba ay karaniwang nagpapahiwatig ng eksaktong mga kondisyon kung saan ito matatagpuan; ngunit sa wika ay mayroon lamang mga pagkakaiba na walang tiyak na kondisyon. Isinasaalang-alang man natin ang "pagtatalaga" o "signified" - sa wika ay walang mga konsepto o tunog na umiiral bago ang pagbuo ng sistema ng wika.

Sa ganitong istraktura, ang mga analohiya sa linggwistika ay tinukoy hindi sa tulong ng kanilang mga likas na katangian, ngunit sa tulong ng mga relasyon sa sistema ("structural").

Nabanggit ko na na ang ponolohiya sa pagbuo nito ay umasa sa mga ideya ni Saussure. Bagama't ang kanyang pagsusuri sa linguistic physiology sa modernong panahon, sabi ni Harris, "ay tatawaging 'pisikal', kumpara sa 'psychological' o 'functional', sa The Course ay malinaw niyang ipinahayag ang direksyon at mga pangunahing prinsipyo ng functional analysis ng wika. Ang kanyang tanging akda na inilathala noong nabubuhay pa siya, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Mga Tala sa orihinal na sistema ng patinig sa mga wikang Indo-European), na inilathala noong 1878, ay ganap na naaayon sa paghahambing ng historikal na lingguwistika ng ika-19 na siglo. Gayunpaman, sa gawaing ito, sabi ni Jonathan Culler, ipinakita ni Saussure "ang pagiging mabunga ng ideya ng wika bilang isang sistema ng magkakaugnay na phenomena, kahit na sa muling pagtatayo nito sa kasaysayan." Sinusuri ang ugnayan sa pagitan ng mga ponema, na nagpapaliwanag ng paghalili ng mga patinig sa mga modernong wika ng grupong Indo-European, iminungkahi ni Saussure na bilang karagdagan sa maraming iba't ibang mga tunog na "a", dapat mayroong iba pang mga ponema na pormal na inilarawan. "Ang dahilan kung bakit ang gawa ni Saussure ay partikular na kahanga-hanga," pagtatapos ni Kaller, "ay halos 50 taon na ang lumipas, nang matuklasan at ma-decipher ang Hittite cuneiform, isang ponema ang natagpuan, sa pagsulat na tinutukoy ng "h", na kumilos tulad ng hinulaang ni Saussure. Sa pamamagitan ng pormal na pagsusuri, natuklasan niya ang kilala ngayon bilang guttural sound sa mga wikang Indo-European.

Sa konsepto ng isang kamag-anak (diacritical) na kahulugan ng mga palatandaan, parehong tahasan at ipinahiwatig sa Kurso, mayroong isang ikatlong pangunahing pagpapalagay ng istrukturang linggwistika, na tinawag ni Saussure na "arbitraryong katangian ng tanda." Sa pamamagitan nito ay nangangahulugan na ang ugnayan sa pagitan ng tunog at kahulugan sa wika ay hindi motibasyon ng anumang bagay: ang isang tao ay madaling ikonekta ang salitang "arbre" at ang salitang "puno" sa konsepto ng "puno". Bukod dito, nangangahulugan ito na ang tunog ay arbitrary din: maaari mong tukuyin ang konsepto ng "puno" sa pamamagitan ng pagkakaroon ng bark nito (maliban sa mga puno ng palma) at sa laki (maliban sa "mababang makahoy na halaman" - shrubs). Mula dito dapat na malinaw na ang lahat ng mga pagpapalagay na ipinakita ko ay hindi nahahati sa higit pa at hindi gaanong mahalaga: bawat isa sa kanila - ang sistematikong katangian ng mga palatandaan (pinaka naiintindihan sa "kasabay" na pag-aaral ng wika), ang kanilang kamag-anak (diacritical) kakanyahan, ang di-makatwirang kalikasan ng mga palatandaan - nagmula sa iba.

Kaya, sa Saussurean linguistics, ang pinag-aralan na phenomenon ay nauunawaan bilang isang hanay ng mga paghahambing at pagsalungat ng wika. Ang wika ay parehong pagpapahayag ng kahulugan ng mga salita (pagtatalaga) at ang kanilang resulta (komunikasyon) - at ang dalawang tungkuling ito ay hindi kailanman nag-tutugma (tingnan ang "Deconstruction of Language" ni Shleifer). Makikita natin ang paghahalili ng anyo at nilalaman na inilalarawan nina Greimas at Kurte sa pinakabagong bersyon ng interpretasyon: ang mga linguistic contrast ay tumutukoy sa mga istrukturang yunit nito, at ang mga unit na ito ay nakikipag-ugnayan sa sunud-sunod na mga antas upang lumikha ng isang tiyak na makabuluhang nilalaman. Dahil random ang mga elemento ng wika, hindi maaaring maging batayan ang contrast o combination. Nangangahulugan ito na sa isang wika, ang mga natatanging tampok ay bumubuo ng isang phonetic contrast sa ibang antas ng pag-unawa, ang mga ponema ay pinagsama sa contrasting morphemes, morphemes - sa mga salita, mga salita - sa mga pangungusap, atbp. Sa anumang kaso, isang buong ponema, salita, pangungusap, atbp. ay higit pa sa kabuuan ng mga bahagi nito (tulad ng tubig, sa halimbawa ni Saussure, ay higit pa sa kumbinasyon ng hydrogen at oxygen).

Tatlong pagpapalagay ng "Course of General Linguistics" ang humantong kay Saussure sa ideya ng isang bagong agham ng ikadalawampu siglo, na hiwalay sa linguistics, na pinag-aaralan ang "buhay ng mga palatandaan sa lipunan." Tinawag ni Saussure ang science semiology na ito (mula sa Greek na "semeion" - isang tanda). Ang "agham" ng semiotics, na umunlad sa Silangang Europa noong 1920s at 1930s at sa Paris noong 1950s at 1960s, ay nagpalawak ng pag-aaral ng wika at mga istrukturang linggwistika sa mga natuklasang pampanitikan na binubuo (o nabuo) ayon sa mga istrukturang ito. Bilang karagdagan, sa takip-silim ng kanyang karera, na kahanay sa kanyang kurso sa pangkalahatang linggwistika, si Saussure ay nakikibahagi sa isang "semiotic" na pagsusuri ng huling Romanong tula, sinusubukang tumuklas ng sadyang binubuo ng mga anagram ng mga wastong pangalan. Ang pamamaraang ito sa maraming paraan ay kabaligtaran ng rasyonalismo sa pagsusuri sa wika nito: ito ay isang pagtatangka, gaya ng isinulat ni Saussure sa isa sa 99 na kuwaderno, na pag-aralan sa sistema ang problema ng "probability", na "naging batayan ng lahat. " Ang ganitong pagsisiyasat, ang sabi mismo ni Saussure, ay nakakatulong na tumuon sa "tunay na panig" ng posibilidad; Ang "pangunahing salita" kung saan hinahanap ni Saussure ang isang anagram ay, ayon kay Jean Starobinsky, "isang kasangkapan para sa makata, at hindi ang mapagkukunan ng buhay para sa tula. Ang tula ay nagsisilbing baligtarin ang mga tunog ng susing salita. Ayon kay Starobinsky, sa pagsusuring ito, "Hindi sumasali si Saussure sa paghahanap ng mga nakatagong kahulugan." Sa kabaligtaran, sa kanyang mga gawa, ang pagnanais na maiwasan ang mga tanong na may kaugnayan sa kamalayan ay kapansin-pansin: "dahil ang tula ay ipinahayag hindi lamang sa mga salita, kundi pati na rin sa kung ano ang ibinubunga ng mga salitang ito, ito ay lampas sa kontrol ng kamalayan at nakasalalay lamang sa mga batas ng wika.”

Ang pagtatangka ni Saussure na pag-aralan ang mga wastong pangalan sa huling Romanong tula (tinawag ito ni Tsvetan Todorov na isang pagdadaglat ng "isang salita ... bago ito isulat") ay binibigyang-diin ang isa sa mga bahagi ng kanyang pagsusuri sa linggwistika - ang arbitraryong katangian ng mga palatandaan, gayundin ang ang pormal na kakanyahan ng Saussurean linguistics ("Wika," inaangkin niya, "ang kakanyahan ng anyo, hindi ang kababalaghan"), na hindi kasama ang posibilidad ng pagsusuri sa kahulugan. Tinapos ni Todorov na ngayon ang mga sinulat ni Saussure ay tila kapansin-pansing pare-pareho sa kanilang pag-aatubili na pag-aralan ang mga simbolo [phenomena na may mahusay na tinukoy na kahulugan]. . . . Sa paggalugad ng mga anagram, binibigyang-pansin lamang ni Saussure ang pag-uulit, ngunit hindi ang mga nakaraang opsyon. . . . Sa pag-aaral ng Nibelungenlied, tinukoy niya ang mga simbolo upang italaga lamang ang mga ito sa mga maling pagbabasa: kung hindi sinasadya, ang mga simbolo ay hindi umiiral. Pagkatapos ng lahat, sa kanyang mga akda sa pangkalahatang linggwistika, ginawa niya ang pagpapalagay ng pagkakaroon ng isang semiology na naglalarawan hindi lamang ng mga palatandaang pangwika; ngunit ang palagay na ito ay limitado sa pamamagitan ng katotohanan na ang semilogy ay maaari lamang maglarawan ng mga random, arbitrary na mga palatandaan.

Kung ito ay talagang gayon, ito ay dahil lamang sa hindi niya maisip ang "intensiyon" na walang bagay; hindi niya lubusang madugtungan ang agwat sa pagitan ng anyo at nilalaman - sa kanyang mga akda ay naging tanong ito. Sa halip, bumaling siya sa "linguistic legitimacy". Nakatayo sa pagitan, sa isang banda, ng mga konsepto ng ikalabinsiyam na siglo batay sa kasaysayan at mga pansariling haka-haka, at mga pamamaraan ng hindi sinasadyang interpretasyon batay sa mga konseptong ito, at, sa kabilang banda, mga konseptong istruktural, na tinawag ni Lévi-Strauss na "Kantianism na walang transendente na aktor. " - binubura ang oposisyon sa pagitan ng anyo at nilalaman (paksa at bagay), kahulugan at pinagmulan sa estrukturalismo, psychoanalysis at maging quantum mechanics, ang mga sinulat ni Ferlinand de Saussure sa linguistics at semiotics ay nagmamarka ng pagbabago sa pag-aaral ng mga kahulugan sa wika at kultura.

Ronald Shleifer

Panitikan

1. Admoni V.G. Mga Batayan ng teorya ng gramatika / V.G. Admoni; USSR Academy of Sciences.-M.: Nauka, 1964.-104p.

3. Arapov, M.V., Herts, M.M. Mga pamamaraan sa matematika sa linggwistika. M., 1974.

4. Arnold I.V. Ang semantikong istruktura ng salita sa modernong Ingles at ang pamamaraan para sa pag-aaral nito. /I.V. Arnold-L .: Edukasyon, 1966. - 187 p.

6.Bashlykov A.M. Awtomatikong sistema ng pagsasalin. / A.M. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 p.

7.Baudouin de Courtenay: Theoretical heritage and modernity: Abstracts of the reports of the international scientific conference / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 p.

8. A. V. Gladkiy, Mga Elemento ng Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 p.

9. Golovin, B.N. Wika at istatistika. /B.N. Golovin - M., 1971. - 210 p.

10. Zvegintsev, V.A. Teoretikal at inilapat na lingguwistika. / V.A. Zvegintsev - M., 1969. - 143 p.

11. Kasevich, V.B. Semantika. Syntax. Morpolohiya. // V.B. Kasevich - M., 1988. - 292 p.

12. Lekomtsev Yu.K. PANIMULA sa pormal na wika ng linggwistika / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 p., may sakit.

13. The Linguistic Heritage of Baudouin de Courtenay at the End of the 20th Century: Abstracts of the International Scientific and Practical Conference March 15-18, 2000. - Krasnoyarsk, 2000. - 125 p.

Matveeva G.G. Mga nakatagong kahulugan sa gramatika at pagkakakilanlan ng taong panlipunan (“portrait”) ng tagapagsalita / G.G. Matveev. - Rostov, 1999. - 174 p.

14. Melchuk, I.A. Karanasan sa pagbuo ng mga modelong pangwika "Ibig sabihin<-->Teksto". / I.A. Melchuk. - M., 1974. - 145 p.

15. Nelyubin L.L. Pagsasalin at inilapat na lingguwistika / L.L. Nelyubin. - M.: Higher School, 1983. - 207 p.

16. Sa eksaktong paraan ng pananaliksik sa wika: sa tinatawag na "mathematical linguistics" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva at iba pa - M., 1961. - 162 p.

17. Piotrovsky L.G. Mathematical Linguistics: Textbook / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Higher School, 1977. - 160 p.

18. Siya ay. Teksto, makina, tao. - L., 1975. - 213 p.

19. Siya ay. Applied Linguistics / Ed. A.S. Gerda. - L., 1986. - 176 p.

20. Revzin, I.I. mga modelo ng wika. M., 1963. Revzin, I.I. Modernong istruktural na lingguwistika. Mga problema at pamamaraan. M., 1977. - 239 p.

21. Revzin, I.I., Rozentsveig, V.Yu. Mga Batayan ng pangkalahatan at pagsasalin ng makina / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 p.

22. Slyusareva N.A. Ang teorya ni F. de Saussure sa liwanag ng modernong linggwistika / N.A. Slyusareva. - M.: Nauka, 1975. - 156 p.

23. Kuwago, L.Z. Analytical linguistics / L.Z. Kuwago - M., 1970. - 192 p.

24. Saussure F. de. Mga Tala sa Pangkalahatang Linggwistika / F. de Saussure; Per. mula kay fr. - M.: Pag-unlad, 2000. - 187 p.

25. Siya ay. Kurso ng Pangkalahatang Linggwistika / Per. mula kay fr. - Yekaterinburg, 1999. -426 p.

26. Mga istatistika ng pagsasalita at awtomatikong pagsusuri ng teksto / Ed. ed. R.G. Piotrovsky. L., 1980. - 223 p.

27. Stoll, P. Sets. Lohika. Axiomatic theories / R. Stoll; Per. mula sa Ingles. - M., 1968. - 180 p.

28. Tenier, L. Mga Batayan ng istrukturang syntax. M., 1988.

29. Ubin I.I. Automation ng mga aktibidad sa pagsasalin sa USSR / I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 p.

30. Faure, R., Kofman, A., Denis-Papin, M. Modern Mathematics. M., 1966.

31. Shenk, R. Pagproseso ng konseptong impormasyon. M., 1980.

32. Shikhanovich, Yu.A. PANIMULA sa modernong matematika (mga paunang konsepto). M., 1965

33. Shcherba L.V. Mga patinig na Ruso sa mga termino ng husay at dami / L.V. Shcherba - L.: Nauka, 1983. - 159 p.

34. Abdullah-zade F. Mamamayan ng mundo // Spark - 1996. - No. 5. - p.13

35. V.A. Uspensky. Preliminary para sa mga mambabasa ng "New Literary Review" sa mga semiotic na mensahe ni Andrei Nikolaevich Kolmogorov. - Bagong Pagsusuri sa Panitikan. -1997. - Hindi. 24. - S. 18-23

36. Perlovsky L. Kamalayan, wika at kultura. - Kaalaman ay kapangyarihan. -2000. №4 - S. 20-33

Panimula? Teorya sa Pagsasalin ng Lektura