linguistic encyclopedic dictionary. Mga Paraang Matematika sa Comparative Linguistics

Ang Pagbuo ng Structural Linguistics sa Pagliko ng ika-19 – Ika-20 Siglo. Mga pamamaraan ng istatistika sa pag-aaral ng wika. Paglalapat ng mga pamamaraang matematikal sa linggwistika sa ikalawang kalahati ng ikadalawampu siglo. Pag-aaral ng wika sa pamamagitan ng mga pamamaraan ng pormal na lohika. Mga tampok ng pagsasalin ng makina.

PANIMULA

Kabanata 1. Ang kasaysayan ng aplikasyon ng mga pamamaraang matematikal sa linggwistika

1.1. Ang Pagbuo ng Structural Linguistics sa Pagliko ng ika-19 - Ika-20 Siglo

1.2. Paglalapat ng mga pamamaraang matematikal sa linggwistika sa ikalawang kalahati ng ikadalawampu siglo

Kabanata 2. Mga piling halimbawa ng paggamit ng matematika sa linggwistika

2.1. Pagsasalin ng makina

2.2.Mga pamamaraang istatistika sa pag-aaral ng wika

2.3. Pag-aaral ng wika sa pamamagitan ng mga pamamaraan ng pormal na lohika

2.4. Mga prospect para sa aplikasyon ng mga pamamaraan ng matematika sa linggwistika

Konklusyon

Panitikan

Apendise 1. Ronald Schleifer. Ferdinand de Saussure

Appendix 2. Ferdinand de Saussure (pagsasalin)

PANIMULA

Sa ika-20 siglo, nagkaroon ng patuloy na kalakaran tungo sa interaksyon at interpenetration ng iba't ibang larangan ng kaalaman. Ang mga hangganan sa pagitan ng mga indibidwal na agham ay unti-unting lumalabo; parami nang parami ang mga sangay ng mental na aktibidad na "nasa junction" ng kaalaman sa humanitarian, teknikal at natural na agham.

Ang isa pang halatang tampok ng modernidad ay ang pagnanais na pag-aralan ang mga istruktura at ang mga elemento ng bumubuo nito. Samakatuwid, ang isang pagtaas ng lugar, kapwa sa siyentipikong teorya at sa praktika, ay ibinibigay sa matematika. Ang pakikipag-ugnay, sa isang banda, sa lohika at pilosopiya, sa kabilang banda, sa mga istatistika (at, dahil dito, sa mga agham panlipunan), ang matematika ay tumagos nang mas malalim at mas malalim sa mga lugar na sa loob ng mahabang panahon ay itinuturing na puro. "makatao", pagpapalawak ng kanilang potensyal na heuristic (ang sagot sa tanong na "magkano" ay kadalasang makakatulong sa pagsagot sa mga tanong na "ano" at "paano"). Ang lingguwistika ay walang pagbubukod.

Ang layunin ng aking gawaing kurso ay maikli na i-highlight ang koneksyon sa pagitan ng matematika at isang sangay ng linggwistika bilang linggwistika. Mula noong 1950s, ang matematika ay ginamit sa linggwistika upang lumikha ng isang teoretikal na kagamitan para sa paglalarawan ng istruktura ng mga wika (parehong natural at artipisyal). Kasabay nito, dapat sabihin na hindi ito agad nakahanap ng gayong praktikal na aplikasyon para sa sarili nito. Sa una, ang mga pamamaraan ng matematika sa linggwistika ay nagsimulang gamitin upang linawin ang mga pangunahing konsepto ng linggwistika, gayunpaman, sa pag-unlad ng teknolohiya ng computer, ang gayong teoretikal na premise ay nagsimulang makahanap ng aplikasyon sa pagsasanay. Ang paglutas ng mga gawain tulad ng pagsasalin ng makina, pagkuha ng impormasyon ng makina, awtomatikong pagpoproseso ng teksto ay nangangailangan ng panimula ng bagong diskarte sa wika. Isang tanong ang bumangon sa harap ng mga linggwista: kung paano matututong kumatawan sa mga pattern ng linggwistika sa anyo kung saan direktang mailalapat ang mga ito sa teknolohiya. Ang terminong "mathematical linguistics", na popular sa ating panahon, ay tumutukoy sa anumang linguistic na pananaliksik na gumagamit ng mga eksaktong pamamaraan (at ang konsepto ng eksaktong mga pamamaraan sa agham ay palaging malapit na nauugnay sa matematika). Ang ilang mga siyentipiko sa mga nakaraang taon ay naniniwala na ang expression mismo ay hindi maaaring itaas sa ranggo ng isang termino, dahil hindi ito nangangahulugang anumang espesyal na "linggwistika", ngunit isang bagong direksyon lamang na nakatuon sa pagpapabuti, pagtaas ng katumpakan at pagiging maaasahan ng mga pamamaraan ng pananaliksik sa wika. . Gumagamit ang Linguistics ng parehong quantitative (algebraic) at non-quantitative na mga pamamaraan, na naglalapit dito sa mathematical logic, at, dahil dito, sa pilosopiya, at maging sa sikolohiya. Kahit na binanggit ni Schlegel ang pakikipag-ugnayan ng wika at kamalayan, at si Ferdinand de Saussure, isang kilalang linggwista noong unang bahagi ng ikadalawampu siglo (sasabihin ko ang tungkol sa kanyang impluwensya sa pag-unlad ng mga pamamaraan ng matematika sa linggwistika sa ibang pagkakataon), ikinonekta ang istraktura ng wika sa pag-aari nito. sa mga tao. Ang modernong mananaliksik na si L. Perlovsky ay higit pa, na tinutukoy ang dami ng mga katangian ng wika (halimbawa, ang bilang ng mga kasarian, mga kaso) na may mga kakaibang katangian ng pambansang kaisipan (higit pa tungkol dito sa Seksyon 2.2, "Mga Paraan ng Istatistika sa Linggwistika").

Ang pakikipag-ugnayan ng matematika at linggwistika ay isang multifaceted na paksa, at sa aking trabaho ay hindi ko tatalakayin ang lahat, ngunit, una sa lahat, sa mga inilapat na aspeto nito.

Kabanata IKasaysayan ng aplikasyon ng mga pamamaraan sa matematika sa linggwistika

1.1 Pagbuo ng structural linguisticssa pagliko ng XIX - XX na siglo

Ang paglalarawan sa matematika ng wika ay batay sa ideya ng wika bilang isang mekanismo, na bumalik sa sikat na Swiss linguist noong unang bahagi ng ikadalawampu siglo, si Ferdinand de Saussure.

Ang unang link ng kanyang konsepto ay ang teorya ng wika bilang isang sistema na binubuo ng tatlong bahagi (ang wika mismo ay wika, pananalita - password, at aktibidad sa pagsasalita - wika), kung saan ang bawat salita (miyembro ng system) ay hindi isinasaalang-alang sa sarili nito, ngunit may kaugnayan sa iba pang mga miyembro. Bilang isa pang kilalang lingguwista, ang Dane Louis Hjelmslev, sa kalaunan ay nabanggit, si Saussure "ang unang humingi ng isang istruktural na diskarte sa wika, iyon ay, isang siyentipikong paglalarawan ng wika sa pamamagitan ng pagtatala ng mga ugnayan sa pagitan ng mga yunit."

Sa pag-unawa sa wika bilang isang hierarchical na istraktura, si Saussure ang unang nagbigay ng problema sa halaga at kahalagahan ng mga yunit ng lingguwistika. Ang mga hiwalay na phenomena at mga kaganapan (sabihin, ang kasaysayan ng pinagmulan ng mga indibidwal na Indo-European na mga salita) ay dapat na pag-aralan hindi sa kanilang sarili, ngunit sa isang sistema kung saan sila ay nauugnay sa mga katulad na bahagi.

Itinuring ng istrukturang yunit ng wika ng Saussure ang salitang, "sign", kung saan pinagsama ang tunog at kahulugan. Wala sa mga elementong ito ang umiiral nang wala ang isa't isa: samakatuwid, naiintindihan ng katutubong nagsasalita ang iba't ibang lilim ng kahulugan ng polysemantic na salita bilang isang hiwalay na elemento sa kabuuan ng istruktura, sa wika.

Kaya, sa teorya ni F. de Saussure makikita ang interaksyon ng linggwistika, sa isang banda, sa sosyolohiya at sikolohiyang panlipunan (dapat tandaan na sa parehong oras, ang phenomenology ni Husserl, ang psychoanalysis ni Freud, ang teorya ng relativity ni Einstein ay pag-unlad, ang mga eksperimento ay nagaganap sa anyo at nilalaman sa panitikan, musika at sining), sa kabilang banda, sa matematika (ang konsepto ng systemicity ay tumutugma sa algebraic na konsepto ng wika). Ang ganitong konsepto ay nagbago sa konsepto ng linguistic na interpretasyon tulad ng: Ang mga penomena ay nagsimulang bigyang kahulugan hindi kaugnay sa mga sanhi ng kanilang paglitaw, ngunit may kaugnayan sa kasalukuyan at hinaharap. Ang interpretasyon ay tumigil na maging independyente sa mga intensyon ng isang tao (sa kabila ng katotohanan na ang mga intensyon ay maaaring impersonal, "walang malay" sa kahulugan ng Freudian ng salita).

Ang paggana ng mekanismo ng linggwistika ay ipinakikita sa pamamagitan ng aktibidad ng pagsasalita ng mga katutubong nagsasalita. Ang resulta ng pagsasalita ay ang tinatawag na "mga tamang teksto" - mga pagkakasunud-sunod ng mga yunit ng pagsasalita na sumusunod sa ilang mga pattern, na marami sa mga ito ay nagbibigay-daan sa isang paglalarawan ng matematika. Ang teorya ng mga paraan upang ilarawan ang syntactic na istraktura ay tumatalakay sa pag-aaral ng mga pamamaraan para sa matematikal na paglalarawan ng mga tamang teksto (pangunahin ang mga pangungusap). Sa ganitong istraktura, ang mga analohiya sa linggwistika ay tinukoy hindi sa tulong ng kanilang mga likas na katangian, ngunit sa tulong ng mga relasyon sa sistema ("structural").

Sa Kanluran, ang mga ideya ni Saussure ay binuo ng mga nakababatang kontemporaryo ng dakilang Swiss linguist: sa Denmark - L. Hjelmslev, na nabanggit ko na, na nagbunga ng algebraic theory ng wika sa kanyang akdang "Fundamentals of Linguistic Theory", sa ang USA - E. Sapir, L. Bloomfield, C. Harris, sa Czech Republic - ang Russian emigré scientist na si N. Trubetskoy.

Ang mga regular na istatistika sa pag-aaral ng wika ay nagsimulang harapin ng walang iba kundi ang tagapagtatag ng genetika, si Georg Mendel. Noong 1968 lamang natuklasan ng mga philologist na, sa mga huling taon ng kanyang buhay, siya ay nabighani sa pag-aaral ng linguistic phenomena gamit ang mga pamamaraan ng matematika. Dinala ni Mendel ang pamamaraang ito sa linggwistika mula sa biology; noong dekada 1990, tanging ang pinakamapangahas na linggwista at biologist ang nag-angkin ng pagiging posible ng naturang pagsusuri. Sa mga archive ng monasteryo ng St. Tomasz sa Brno, na ang abbot ay si Mendel, ang mga sheet ay natagpuan na may mga hanay ng mga apelyido na nagtatapos sa "mann", "bauer", "mayer", at may ilang mga fraction at kalkulasyon. Sa pagsisikap na matuklasan ang mga pormal na batas ng pinagmulan ng mga pangalan ng pamilya, gumawa si Mendel ng mga kumplikadong kalkulasyon, kung saan isinasaalang-alang niya ang bilang ng mga patinig at katinig sa wikang Aleman, ang kabuuang bilang ng mga salita na isinasaalang-alang niya, ang bilang ng mga apelyido, atbp.

Sa ating bansa, ang istrukturang lingguwistika ay nagsimulang umunlad sa halos parehong oras tulad ng sa Kanluran - sa pagliko ng ika-19-20 siglo. Kasabay ng F. de Saussure, ang konsepto ng wika bilang isang sistema ay binuo sa kanilang mga gawa ng mga propesor ng Kazan University F.F. Fortunatov at I.A. Baudouin de Courtenay. Ang huli ay nakipag-ugnayan nang mahabang panahon kay de Saussure, ayon sa pagkakabanggit, ang Geneva at Kazan na mga paaralan ng linggwistika ay nakipagtulungan sa isa't isa. Kung si Saussure ay matatawag na ideologist ng "eksaktong" mga pamamaraan sa linggwistika, kung gayon ang Baudouin de Courtenay ay naglatag ng mga praktikal na pundasyon para sa kanilang aplikasyon. Siya ang unang naghiwalay ng linggwistika (bilang tumpak isang agham na gumagamit ng mga istatistikal na pamamaraan at functional dependence) mula sa philology (isang komunidad ng mga humanitarian na disiplina na nag-aaral ng espirituwal na kultura sa pamamagitan ng wika at pananalita). Ang siyentipiko mismo ay naniniwala na "ang linggwistika ay maaaring maging kapaki-pakinabang sa malapit na hinaharap, napalaya lamang mula sa ipinag-uutos na unyon sa philology at kasaysayang pampanitikan" . Ang ponolohiya ay naging "lugar ng pagsubok" para sa pagpapakilala ng mga pamamaraang matematikal sa linggwistika - ang mga tunog bilang "mga atom" ng sistema ng wika, na may limitadong bilang ng mga madaling masusukat na katangian, ay ang pinaka maginhawang materyal para sa pormal at mahigpit na pamamaraan ng paglalarawan. Itinatanggi ng ponolohiya ang pagkakaroon ng kahulugan sa tunog, kaya inalis ang salik na "tao" sa mga pag-aaral. Sa ganitong diwa, ang mga ponema ay parang pisikal o biyolohikal na bagay.

Ang mga ponema, bilang pinakamaliit na elemento ng lingguwistika na katanggap-tanggap para sa persepsyon, ay kumakatawan sa isang hiwalay na globo, isang hiwalay na "phenomenological reality". Halimbawa, sa Ingles, ang tunog na "t" ay maaaring mabigkas nang iba, ngunit sa lahat ng pagkakataon, ang isang taong nagsasalita ng Ingles ay mapapansin ito bilang "t". Ang pangunahing bagay ay ang ponema ay gaganap ng kanyang pangunahing - makabuluhang - function. Bukod dito, ang mga pagkakaiba sa pagitan ng mga wika ay tulad na ang mga uri ng isang tunog sa isang wika ay maaaring tumutugma sa iba't ibang mga ponema sa isa pa; halimbawa, ang "l" at "r" sa Ingles ay magkaiba, habang sa iba pang mga wika ang mga ito ay mga uri ng parehong ponema (tulad ng Ingles na "t", binibigkas na mayroon o walang aspirasyon). Ang malawak na bokabularyo ng anumang natural na wika ay isang hanay ng mga kumbinasyon ng mas maliit na bilang ng mga ponema. Sa Ingles, halimbawa, 40 ponema lamang ang ginagamit sa pagbigkas at pagsulat ng humigit-kumulang isang milyong salita.

Ang mga tunog ng isang wika ay isang sistematikong nakaayos na hanay ng mga tampok. Noong 1920s -1930s, kasunod ni Saussure, Jacobson at N.S. Trubetskoy ay pinili ang "mga natatanging tampok" ng mga ponema. Ang mga tampok na ito ay batay sa istraktura ng mga organo ng pagsasalita - dila, ngipin, vocal cord. Halimbawa, sa Ingles ang pagkakaiba sa pagitan ng "t" at "d" ay ang pagkakaroon o kawalan ng isang "boses" (ang pag-igting ng mga vocal cord) at ang antas ng boses na nagpapakilala sa isang ponema mula sa isa pa. Kaya, ang ponolohiya ay maaaring ituring na isang halimbawa ng pangkalahatang tuntunin sa wika na inilarawan ni Saussure: "May mga pagkakaiba lamang sa wika". Ang mas mahalaga ay hindi ito: ang pagkakaiba ay kadalasang nagpapahiwatig ng eksaktong mga kondisyon kung saan ito matatagpuan; ngunit sa wika ay mayroon lamang mga pagkakaiba na walang tiyak na kondisyon. Isinasaalang-alang man natin ang "pagtatalaga" o "signified" - sa wika ay walang mga konsepto o tunog na umiiral bago ang pagbuo ng sistema ng wika.

Kaya, sa Saussurean linguistics, ang pinag-aralan na phenomenon ay nauunawaan bilang isang hanay ng mga paghahambing at pagsalungat ng wika. Ang wika ay parehong pagpapahayag ng kahulugan ng mga salita at isang paraan ng komunikasyon, at ang dalawang tungkuling ito ay hindi kailanman nagtutugma. Mapapansin natin ang paghahalili ng anyo at nilalaman: ang mga linguistic contrast ay tumutukoy sa mga istrukturang yunit nito, at ang mga yunit na ito ay nakikipag-ugnayan upang lumikha ng isang tiyak na makabuluhang nilalaman. Dahil random ang mga elemento ng wika, hindi maaaring maging batayan ang contrast o combination. Nangangahulugan ito na sa isang wika, ang mga natatanging tampok ay bumubuo ng isang phonetic contrast sa ibang antas ng pag-unawa, ang mga ponema ay pinagsama sa mga morpema, mga morpema - sa mga salita, mga salita - sa mga pangungusap, atbp. Sa anumang kaso, isang buong ponema, salita, pangungusap, atbp. ay higit pa sa kabuuan ng mga bahagi nito.

Iminungkahi ni Saussure ang ideya ng isang bagong agham ng ikadalawampu siglo, na hiwalay sa linggwistika, na pinag-aaralan ang papel ng mga palatandaan sa lipunan. Tinawag ni Saussure ang science semiology na ito (mula sa Greek na "semeion" - isang tanda). Ang "agham" ng semiotics, na umunlad sa Silangang Europa noong 1920s at 1930s at sa Paris noong 1950s at 1960s, ay nagpalawak ng pag-aaral ng wika at mga istrukturang linggwistika sa mga natuklasang pampanitikan na binubuo (o nabuo) sa tulong ng mga istrukturang ito. Bilang karagdagan, sa takip-silim ng kanyang karera, kasabay ng kanyang kurso sa pangkalahatang linggwistika, si Saussure ay nakikibahagi sa isang "semiotic" na pagsusuri ng huling Romanong tula, sinusubukang tumuklas ng sadyang binubuo ng mga anagram ng mga wastong pangalan. Ang pamamaraang ito sa maraming paraan ay kabaligtaran ng rasyonalismo sa pagsusuri nito sa linggwistika: ito ay isang pagtatangka na pag-aralan sa isang sistema ang problema ng "probability" sa wika. Ang ganitong pananaliksik ay nakakatulong na tumuon sa "tunay na bahagi" ng posibilidad; ang "pangunahing salita" kung saan hinahanap ni Saussure ang isang anagram ay, ayon kay Jean Starobinsky, "isang kasangkapan para sa makata, hindi ang pinagmulan ng buhay ng tula." Ang tula ay nagsisilbing palitan ang mga tunog ng keyword. Ayon kay Starobinsky, sa pagsusuring ito, "Hindi sumasali si Saussure sa paghahanap ng mga nakatagong kahulugan." Sa kabaligtaran, sa kanyang mga gawa, ang pagnanais na maiwasan ang mga tanong na may kaugnayan sa kamalayan ay kapansin-pansin: "dahil ang tula ay ipinahayag hindi lamang sa mga salita, kundi pati na rin sa kung ano ang ibinubunga ng mga salitang ito, ito ay lampas sa kontrol ng kamalayan at nakasalalay lamang sa ang mga batas ng wika” (tingnan ang . Appendix 1).

Ang pagtatangka ni Saussure na pag-aralan ang mga wastong pangalan sa huling Romanong tula ay binibigyang-diin ang isa sa mga bahagi ng kanyang pagsusuri sa linggwistika - ang arbitraryong katangian ng mga palatandaan, gayundin ang pormal na esensya ng linggwistika ni Saussure, na hindi kasama ang posibilidad ng pagsusuri ng kahulugan. Napagpasyahan ni Todorov na ngayon ang mga gawa ni Saussure ay tila lubos na pare-pareho sa kanilang pag-aatubili na pag-aralan ang mga simbolo ng isang kababalaghan na may malinaw na tinukoy na kahulugan [Appendix 1]. Sa paggalugad ng mga anagram, binibigyang-pansin lamang ni Saussure ang pag-uulit, ngunit hindi ang mga nakaraang opsyon. . . . Sa pag-aaral ng Nibelungenlied, tinukoy niya ang mga simbolo upang italaga lamang ang mga ito sa mga maling pagbabasa: kung hindi sinasadya, ang mga simbolo ay hindi umiiral. Pagkatapos ng lahat, sa kanyang mga akda sa pangkalahatang linggwistika, ginagawa niya ang pagpapalagay ng pagkakaroon ng isang semiolohiya na naglalarawan hindi lamang ng mga palatandaang pangwika; ngunit ang palagay na ito ay limitado sa pamamagitan ng katotohanan na ang semiology ay maaari lamang maglarawan ng random, arbitrary na mga palatandaan.

Kung ito ay talagang gayon, ito ay dahil lamang sa hindi niya maisip ang "intensiyon" na walang bagay; hindi niya lubusang madugtungan ang agwat sa pagitan ng anyo at nilalaman - sa kanyang mga akda ay naging tanong ito. Sa halip, bumaling siya sa "linguistic legitimacy". Sa pagitan, sa isang banda, ang mga konsepto ng ikalabinsiyam na siglo batay sa kasaysayan at mga subjective na haka-haka, at mga pamamaraan ng random na interpretasyon batay sa mga konseptong ito, at, sa kabilang banda, mga istruktural na konsepto na nagbubura ng oposisyon sa pagitan ng anyo at nilalaman (paksa at bagay) , kahulugan at pinagmulan sa structuralism, psychoanalysis, at maging sa quantum mechanics - ang mga sinulat ni Ferdinand de Saussure sa linguistics at semiotics ay nagmamarka ng pagbabago sa pag-aaral ng mga kahulugan sa wika at kultura.

Ang mga siyentipikong Ruso ay kinatawan din sa Unang Internasyonal na Kongreso ng mga Linguist sa The Hague noong 1928. S. Kartsevsky, R. Yakobson at N. Trubetskoy ay gumawa ng isang ulat na sinuri ang hierarchical na istraktura ng wika - sa diwa ng mga pinaka-modernong ideya para sa simula ng huling siglo. Si Jakobson sa kanyang mga akda ay bumuo ng mga ideya ni Saussure na ang mga pangunahing elemento ng isang wika ay dapat pag-aralan, una sa lahat, na may kaugnayan sa kanilang mga tungkulin, at hindi sa mga dahilan ng kanilang paglitaw.

Sa kasamaang palad, pagkatapos na maluklok si Stalin noong 1924, ang linggwistika ng Russia, tulad ng maraming iba pang mga agham, ay ibinalik. Maraming mga mahuhusay na siyentipiko ang napilitang mangibang-bayan, pinaalis sa bansa o namatay sa mga kampo. Lamang mula noong kalagitnaan ng 1950s nagkaroon ng isang tiyak na pluralismo ng mga teorya na naging posible - higit pa dito sa Seksyon 1.2.

1.2 Paglalapat ng mga pamamaraang matematikal sa linggwistika sa ikalawang kalahati ng ikadalawampu siglo

Sa kalagitnaan ng ikadalawampu siglo, apat na paaralang pangwika sa daigdig ang nabuo, na ang bawat isa ay naging ninuno ng isang tiyak na "eksaktong" pamamaraan. Leningrad Phonological School(ang ninuno nito ay isang mag-aaral ng Baudouin de Courtenay L.V. Shcherba) ay gumamit ng isang psycholinguistic na eksperimento batay sa pagsusuri sa pagsasalita ng mga katutubong nagsasalita bilang pangunahing pamantayan para sa paglalahat ng tunog sa anyo ng isang ponema.

Mga siyentipiko Prague Linguistic Circle, sa partikular - ang tagapagtatag nito na si N.S. Si Trubetskoy, na lumipat mula sa Russia, ay bumuo ng teorya ng mga pagsalungat - ang semantikong istraktura ng wika ay inilarawan nila bilang isang hanay ng mga oppositionally constructed semantic units - Sem. Ang teoryang ito ay inilapat sa pag-aaral hindi lamang sa wika, kundi pati na rin sa kulturang masining.

Mga ideologo Amerikanong deskriptibismo ay mga linggwista na sina L. Bloomfield at E. Sapir. Ang wika ay ipinakita sa mga deskriptibista bilang isang hanay ng mga pahayag sa pagsasalita, na siyang pangunahing layunin ng kanilang pag-aaral. Ang kanilang pokus ay sa mga tuntunin ng siyentipikong paglalarawan (kaya ang pangalan) ng mga teksto: ang pag-aaral ng organisasyon, pag-aayos at pag-uuri ng kanilang mga elemento. Ang pormalisasyon ng mga pamamaraang analitikal sa larangan ng ponolohiya at morpolohiya (pagbuo ng mga prinsipyo para sa pag-aaral ng wika sa iba't ibang antas, pagsusuri sa pamamahagi, pamamaraan ng mga direktang nasasakupan, atbp.) ay humantong sa pagbabalangkas ng mga pangkalahatang katanungan ng pagmomolde ng linggwistika. Ang kawalan ng pansin sa plano ng nilalaman ng wika, gayundin ang paradigmatikong panig ng wika, ay hindi nagbigay-daan sa mga deskriptibista na ganap na bigyang-kahulugan ang wika bilang isang sistema.

Noong 1960s, nabuo ang teorya ng mga pormal na gramatika, na lumitaw pangunahin dahil sa gawain ng pilosopo at lingguwistang Amerikano na si N. Chomsky. Siya ay nararapat na ituring na isa sa mga pinakatanyag na modernong siyentipiko at pampublikong pigura, maraming mga artikulo, monograp at kahit isang buong dokumentaryo ang nakatuon sa kanya. Sa pangalan ng isang panimula na bagong paraan ng paglalarawan ng syntactic na istraktura na naimbento ni Chomsky - generative (generative) grammar - ang kaukulang kalakaran sa linggwistika ay tinawag generativism.

Si Chomsky, isang inapo ng mga imigrante mula sa Russia, ay nag-aral ng linguistics, matematika at pilosopiya sa Unibersidad ng Pennsylvania mula noong 1945, na malakas na naiimpluwensyahan ng kanyang gurong si Zelig Harris - tulad ni Harris, isinasaalang-alang ni Chomsky at isinasaalang-alang pa rin ang kanyang pampulitikang pananaw na malapit sa anarkismo (siya ay kilala bilang kritiko ng umiiral na sistemang pampulitika ng US at bilang isa sa mga espirituwal na pinuno ng anti-globalismo).

Ang unang pangunahing gawaing pang-agham ni Chomsky, ang master's thesis na "Morpolohiya ng Modernong Hebrew » (1951) ay nanatiling hindi nai-publish. Natanggap ni Chomsky ang kanyang titulo ng doktor mula sa Unibersidad ng Pennsylvania noong 1955, ngunit karamihan sa pananaliksik na pinagbabatayan ng kanyang disertasyon (nai-publish nang buo noong 1975 sa ilalim ng pamagat na The Logical Structure of Linguistic Theory) at ang kanyang unang monograph, Syntactic Structures (1957, Rus. trans . 1962), ay ginanap sa Harvard University noong 1951-1955. Sa parehong 1955, lumipat ang siyentipiko sa Massachusetts Institute of Technology, kung saan siya ay naging propesor noong 1962.

Ang teorya ni Chomsky ay dumaan sa ilang yugto sa pag-unlad nito.

Sa unang monograph na "Syntactic Structures", ipinakita ng siyentipiko ang wika bilang isang mekanismo para sa pagbuo ng isang walang katapusang hanay ng mga pangungusap gamit ang isang may hangganang hanay ng mga paraan ng gramatika. Upang ilarawan ang mga katangian ng lingguwistika, iminungkahi niya ang mga konsepto ng malalim (nakatago mula sa direktang pang-unawa at nabuo ng isang sistema ng recursive, ibig sabihin, maaaring ilapat nang paulit-ulit, mga panuntunan) at ibabaw (direktang pinaghihinalaang) mga istrukturang gramatika, pati na rin ang mga pagbabagong naglalarawan sa paglipat mula sa malalalim na istruktura hanggang sa ibabaw. Ang ilang mga istraktura sa ibabaw ay maaaring tumutugma sa isang malalim na istraktura (halimbawa, isang passive na istraktura Ang kautusan ay nilagdaan ng pangulo nagmula sa parehong Deep Structure bilang aktibong construct Pinirmahan ng Pangulo ang kautusan) at kabaliktaran (kaya, ang kalabuan mahal ng ina ang anak na babae inilarawan bilang resulta ng isang pagkakataon ng mga istruktura sa ibabaw na bumalik sa dalawang magkaibang malalim, kung saan ang ina ay ang nagmamahal sa anak na babae, at sa isa pa, ang minamahal ng anak na babae).

Ang pamantayang teorya ni Chomsky ay itinuturing na "Aspects" na modelo na itinakda sa aklat ni Chomsky na "Aspects of the Theory of Syntax". Sa modelong ito, sa unang pagkakataon, ang mga tuntunin ng semantikong interpretasyon ay ipinakilala sa pormal na teorya, na nag-uugnay ng kahulugan sa malalim na mga istruktura. Sa Aspekto, ang linguistic competence ay laban sa paggamit ng wika (performance), ang tinatawag na Katz-Postal hypothesis tungkol sa pangangalaga ng kahulugan sa panahon ng pagbabago ay pinagtibay, na may kaugnayan kung saan ang konsepto ng opsyonal na pagbabago ay hindi kasama, at isang apparatus ng Ang mga tampok na sintaktik na naglalarawan sa pagkakatugma ng leksikal ay ipinakilala.

Noong 1970s, nagtrabaho si Chomsky sa teorya ng kontrol at pagbubuklod (GB-theory - mula sa mga salita pamahalaan at nagbubuklod) ay mas pangkalahatan kaysa sa nauna. Sa loob nito, tinalikuran ng siyentipiko ang mga tiyak na panuntunan na naglalarawan sa mga istrukturang sintaktik ng mga partikular na wika. Ang lahat ng mga pagbabago ay napalitan ng isang unibersal na paglipat ng pagbabago. Sa loob ng balangkas ng teorya ng GB, mayroon ding mga pribadong module, na ang bawat isa ay may pananagutan para sa sarili nitong bahagi ng grammar.

Kamakailan lamang, noong 1995, naglagay si Chomsky ng isang minimalist na programa, kung saan ang wika ng tao ay inilalarawan tulad ng machine language. Ito ay isang programa lamang - hindi isang modelo o isang teorya. Sa loob nito, kinilala ni Chomsky ang dalawang pangunahing subsystem ng kagamitan ng wika ng tao: ang lexicon at ang computing system, pati na rin ang dalawang interface - phonetic at logical.

Ang mga pormal na grammar ni Chomsky ay naging klasiko para sa paglalarawan hindi lamang natural kundi pati na rin ang mga artipisyal na wika - sa partikular, mga programming language. Ang pag-unlad ng structural linguistics sa ikalawang kalahati ng ika-20 siglo ay nararapat na ituring na isang "Chomskian revolution".

Moscow Phonological School, na ang mga kinatawan ay sina A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, gumamit ng katulad na teorya sa pag-aaral ng phonetics. Unti-unti, ang mga "eksaktong" mga pamamaraan ay nagsisimulang ilapat patungkol hindi lamang sa phonetics, kundi pati na rin sa syntax. Parehong linguist at mathematician, dito at sa ibang bansa, ay nagsisimulang pag-aralan ang istruktura ng wika. Noong 1950s at 60s, nagsimula ang isang bagong yugto sa pakikipag-ugnayan sa pagitan ng matematika at linggwistika sa USSR, na nauugnay sa pag-unlad ng mga sistema ng pagsasalin ng makina.

Ang impetus para sa pagsisimula ng mga gawaing ito sa ating bansa ay ang mga unang pag-unlad sa larangan ng pagsasalin ng makina sa Estados Unidos (bagaman ang unang mekanisadong kagamitan sa pagsasalin ni P.P. Smirnov-Troyansky ay naimbento sa USSR noong 1933, ito, bilang primitive. , ay hindi naging laganap). Noong 1947, gumawa sina A. Butt at D. Britten ng isang code para sa pagsasalin ng salita-sa-salita gamit ang isang computer; makalipas ang isang taon, iminungkahi ni R. Richens ang isang panuntunan para sa paghahati ng mga salita sa mga stems at mga pagtatapos sa pagsasalin ng makina. Ibang-iba ang mga taon na iyon sa ngayon. Ang mga ito ay napakalaki at mamahaling mga makina na kumukuha ng buong mga silid at nangangailangan ng malaking kawani ng mga inhinyero, operator at programmer upang mapanatili ang mga ito. Karaniwan, ang mga computer na ito ay ginamit upang magsagawa ng mga kalkulasyon sa matematika para sa mga pangangailangan ng mga institusyong militar - ang bago sa matematika, pisika at teknolohiya na pinagsilbihan, una sa lahat, ang mga gawaing militar. Sa mga unang yugto, ang pagbuo ng MP ay aktibong suportado ng militar, kasama ang lahat ng ito (sa mga kondisyon ng Cold War), ang direksyon ng Russian-English na binuo sa USA, at ang direksyon ng Anglo-Russian sa USSR.

Noong Enero 1954, naganap ang "Georgetown Experiment" sa Massachusetts Technical University - ang unang pampublikong demonstrasyon ng pagsasalin mula sa Ruso sa Ingles sa makina ng IBM-701. Abstract ng mensahe tungkol sa matagumpay na pagpasa ng eksperimento, na ginawa ni D.Yu. Panov, ay lumitaw sa RJ "Mathematics", 1954, No. 10: "Pagsasalin mula sa isang wika patungo sa isa pa gamit ang isang makina: isang ulat sa unang matagumpay na pagsubok."

Si D. Yu. Panov (sa oras na iyon ay direktor ng Institute of Scientific Information - INI, kalaunan ay VINITI) ay umakit kay I. K. Belskaya, na kalaunan ay pinamunuan ang machine translation group sa Institute of Precise Mathematics at Computer Engineering ng USSR Academy of Sciences, upang magtrabaho sa pagsasalin ng makina. Sa pagtatapos ng 1955, ang unang karanasan ng pagsasalin mula sa Ingles sa Russian sa tulong ng BESM machine ay nagsimula noon. Ang mga programa para sa BESM ay pinagsama-sama ng N.P. Trifonov at L.N. Korolev, na ang tesis ng Ph.D. ay nakatuon sa mga pamamaraan para sa pagbuo ng mga diksyunaryo para sa pagsasalin ng makina.

Kaayon, ang trabaho sa pagsasalin ng makina ay isinagawa sa Kagawaran ng Applied Mathematics ng Mathematical Institute ng USSR Academy of Sciences (ngayon ay M.V. Keldysh Institute of Applied Mathematics ng Russian Academy of Sciences). Sa inisyatiba ng mathematician na si A.A. Lyapunov. Kasama niya ang O.S. Kulagin at ang kanyang mga mag-aaral na T.D. Sina Wentzel at N.N. Ricco. Ang mga ideya nina Lyapunov at Kulagina tungkol sa posibilidad ng paggamit ng teknolohiya upang magsalin mula sa isang wika patungo sa isa pa ay inilathala sa journal Nature, 1955, No. 8. Mula sa katapusan ng 1955, T.N. Moloshnaya, na pagkatapos ay nagsimulang independiyenteng gawain sa algorithm ng pagsasalin ng English-Russian.

Naaalala ni R. Frumkina, na sa oras na iyon ay nakikibahagi sa algorithm ng pagsasalin mula sa Espanyol, na sa yugtong ito ng gawain ay mahirap gumawa ng anumang mga pare-parehong hakbang. Mas madalas kailangan kong sundin ang heuristic na karanasan - sarili ko o mga kasamahan.

Kasabay nito, ang unang henerasyon ng mga sistema ng pagsasalin ng makina ay napakadi-perpekto. Ang lahat ng mga ito ay batay sa sunud-sunod na mga algorithm ng pagsasalin "salita sa pamamagitan ng salita", "parirala sa pamamagitan ng parirala" - ang mga koneksyon sa semantiko sa pagitan ng mga salita at pangungusap ay hindi isinasaalang-alang sa anumang paraan. Halimbawa, ang mga pangungusap ay: Hinahanap ni John ang kanyang kahon ng laruan.Sa wakas ay natagpuan niya ito. Ang kahon ay nasa panulat.Tuwang-tuwa si John. (Hinahanap ni John ang kanyang kahon ng laruan. Sa wakas ay nakita niya ito. Nasa playpen ang kahon. Tuwang-tuwa si John.).” Ang "Pulat" sa kontekstong ito ay hindi isang "panulat" (kasangkapan sa pagsulat), ngunit isang "playpen" ( play-pen). Ang kaalaman sa mga kasingkahulugan, kasalungat at matalinghagang kahulugan ay mahirap ipasok sa isang computer. Ang isang promising na direksyon ay ang pagbuo ng mga computer system na nakatuon sa paggamit ng isang tao na tagasalin.

Sa paglipas ng panahon, ang mga direktang sistema ng pagsasalin ay pinalitan ng mga T-system (mula sa salitang Ingles na "paglipat" - pagbabagong-anyo), kung saan isinagawa ang pagsasalin sa antas ng mga istrukturang sintaktik. Ang mga algorithm ng mga T-system ay gumamit ng mekanismo na naging posible upang bumuo ng isang syntactic na istraktura ayon sa mga tuntunin ng grammar ng wika ng input na pangungusap (katulad ng kung paano itinuro ang isang banyagang wika sa mataas na paaralan), at pagkatapos ay i-synthesize ang output na pangungusap. sa pamamagitan ng pagbabago sa istrukturang sintaktik at pagpapalit ng mga kinakailangang salita mula sa diksyunaryo.

Si Lyapunov ay nagsalita tungkol sa pagsasalin sa pamamagitan ng pagkuha ng kahulugan ng isinalin na teksto at paglalahad nito sa ibang wika. Ang diskarte sa pagbuo ng mga machine translation system batay sa pagkuha ng semantic representation ng input sentence sa pamamagitan ng semantic analysis at synthesis ng input sentence ayon sa nakuha na semantic representation ay itinuturing pa rin na pinakaperpekto. Ang ganitong mga sistema ay tinatawag na I-systems (mula sa salitang "interlingua"). Kasabay nito, ang gawain ng paglikha ng mga ito, na ibinalik noong huling bahagi ng 50s at unang bahagi ng 60s, ay hindi pa ganap na nalutas sa ngayon, sa kabila ng mga pagsisikap ng International Federation of IFIP - ang komunidad ng mundo ng mga siyentipiko sa larangan ng pagproseso ng impormasyon .

Naisip ng mga siyentipiko kung paano gawing pormal at bumuo ng mga algorithm para sa pagtatrabaho sa mga teksto, kung anong mga diksyunaryo ang dapat ipasok sa makina, kung anong mga pattern ng linguistic ang dapat gamitin sa pagsasalin ng makina. Ang tradisyunal na lingguwistika ay walang ganoong mga ideya - hindi lamang sa mga tuntunin ng semantika, kundi pati na rin sa mga tuntunin ng syntax. Sa oras na iyon, walang mga listahan ng mga syntactic constructions para sa anumang wika, ang mga kondisyon para sa kanilang compatibility at interchangeability ay hindi pinag-aralan, ang mga patakaran para sa pagbuo ng malalaking yunit ng syntactic structure mula sa mas maliliit na elemento ng constituent ay hindi binuo.

Ang pangangailangan na lumikha ng mga teoretikal na pundasyon ng pagsasalin ng makina ay humantong sa pagbuo at pag-unlad ng matematikal na lingguwistika. Ang nangungunang papel sa bagay na ito sa USSR ay ginampanan ng mga mathematician na si A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, mga linggwista na si V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Ang disertasyon ni Kulagina ay nakatuon sa pag-aaral ng pormal na teorya ng mga gramatika (kasabay ng N. Khomsky sa USA), iniharap ni Kuznetsov ang gawain ng axiomatization ng linguistics, na bumalik sa mga gawa ni F.F. Fortunatov.

Noong Mayo 6, 1960, ang Decree ng Presidium ng USSR Academy of Sciences "Sa pagbuo ng mga istruktura at matematikal na pamamaraan para sa pag-aaral ng wika" ay pinagtibay, at ang kaukulang mga dibisyon ay nilikha sa Institute of Linguistics at Institute of ang Wikang Ruso. Mula noong 1960, ang nangungunang humanitarian universities ng bansa - ang Faculty of Philology ng Moscow State University, Leninrad, Novosibirsk Universities, Moscow State Institute of Foreign Languages ​​​​ay nagsimulang magsanay ng mga tauhan sa larangan ng awtomatikong pagproseso ng teksto.

Kasabay nito, ang mga gawa sa machine translation ng panahong ito, na tinatawag na "classical", ay mas teoretikal kaysa praktikal na interes. Ang mga cost-effective na machine translation system ay nagsimulang malikha lamang noong dekada otsenta ng huling siglo. Pag-uusapan ko ito mamaya sa Seksyon 2.1, Machine Translation.

Kasama sa 1960s - 70s ang malalim na teoretikal na pag-unlad gamit ang mga pamamaraan ng set theory at mathematical logic, tulad ng field theory at fuzzy set theory.

Ang may-akda ng field theory sa linguistics ay ang Sobyet na makata, tagasalin at linguist na si V.G. Admoni. Una niyang binuo ang kanyang teorya batay sa wikang Aleman. Para kay Admoni, ang konsepto ng "patlang" ay tumutukoy sa isang arbitraryong hindi walang laman na hanay ng mga elementong pangwika (halimbawa, "lexical field", "semantic field").

Ang istraktura ng field ay heterogenous: ito ay binubuo ng isang core, ang mga elemento nito ay mayroong kumpletong hanay ng mga feature na tumutukoy sa isang set, at isang periphery, ang mga elemento nito ay maaaring magkaroon ng parehong feature ng isang ibinigay na set (hindi lahat) at mga kapitbahay. Magbibigay ako ng isang halimbawa na naglalarawan sa pahayag na ito: halimbawa, sa Ingles, ang larangan ng mga tambalang salita (“day-dream” - “dream” ay mahirap ihiwalay sa larangan ng mga parirala (“tear gas” - “tear gas”) .

Ang teorya ng fuzzy set na nabanggit na sa itaas ay malapit na nauugnay sa field theory. Sa USSR, ang mga linggwista na si V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, gayunpaman, ang ninuno nito ay ang American mathematician na si L. Zadeh, na noong 1965 ay naglathala ng artikulong "Fuzzy Logic". Sa pagbibigay ng katwiran sa matematika para sa teorya ng fuzzy set, itinuring ni Zade ang mga ito batay sa materyal na lingguwistika.

Sa teoryang ito, hindi gaanong pinag-uusapan ang tungkol sa pag-aari ng mga elemento sa isang naibigay na hanay (Aa), ngunit tungkol sa antas ng pagiging miyembro na ito (Aa), dahil ang mga peripheral na elemento ay maaaring kabilang sa ilang mga larangan sa isang antas o iba pa. Si Zade (Lofti-zade) ay isang katutubong ng Azerbaijan, hanggang sa edad na 12 ay nagkaroon siya ng kasanayan sa pakikipag-usap sa apat na wika - Azerbaijani, Russian, English at Persian - at gumamit ng tatlong magkakaibang mga alpabeto: Cyrillic, Latin, Arabic. Kapag tinanong ang isang siyentipiko kung ano ang karaniwan sa pagitan ng fuzzy set theory at linguistics, hindi niya itinatanggi ang koneksyon na ito, ngunit nilinaw niya: "Hindi ako sigurado na ang pag-aaral ng mga wikang ito ay may malaking epekto sa aking pag-iisip. Kung ito ang kaso, pagkatapos lamang subconsciously. Sa kanyang kabataan, nag-aral si Zadeh sa isang Presbyterian school sa Tehran, at pagkatapos ng Ikalawang Digmaang Pandaigdig ay lumipat siya sa Estados Unidos. "Ang tanong ay hindi kung ako ay isang Amerikano, Ruso, Azerbaijani o ibang tao," sabi niya sa isa sa mga pag-uusap, "Ako ay hinubog ng lahat ng mga kultura at mga tao na ito at medyo komportable sa bawat isa sa kanila." Sa mga salitang ito mayroong isang bagay na katulad sa kung ano ang nagpapakilala sa teorya ng mga malabo na hanay - isang pag-alis mula sa hindi malabo na mga kahulugan at matalim na mga kategorya.

Sa ating bansa, noong dekada 70, isinalin at pinag-aralan ang mga gawa ng mga Kanluraning linggwista noong ikadalawampu siglo. I.A. Isinalin ni Melchuk ang mga gawa ni N. Chomsky sa Russian. SA. Iniuugnay ni Slyusareva sa kanyang aklat na "The Theory of F. de Saussure in the Light of Modern Linguistics" ang mga postulate ng pagtuturo ni Saussure sa mga aktwal na problema ng linguistics noong dekada 70. May tendensiya sa karagdagang mathematization ng linggwistika. Ang mga nangungunang domestic unibersidad ay mga tauhan ng pagsasanay sa espesyalidad na "Mathematical (theoretical, applied) linguistics". Kasabay nito sa Kanluran ay mayroong isang matalim na paglukso sa pag-unlad ng teknolohiya ng kompyuter, na nangangailangan ng higit at higit pang mga bagong pundasyong pangwika.

Noong 1980s, Propesor ng Institute of Oriental Studies ng Academy of Sciences Yu.K. Si Lekomtsev, habang sinusuri ang wika ng linggwistika sa pamamagitan ng pagsusuri ng mga iskema, talahanayan at iba pang uri ng notasyon na ginagamit sa mga paglalarawang linggwistika, ay isinasaalang-alang ang mga sistemang pangmatematika na angkop para sa mga layuning ito (pangunahin ang mga sistema ng matrix algebra).

Kaya, sa buong ikadalawampu siglo, nagkaroon ng convergence ng eksaktong at humanities. Ang pakikipag-ugnayan ng matematika sa linggwistika ay lalong nakahanap ng mga praktikal na aplikasyon. Higit pa tungkol dito sa susunod na kabanata.

Kabanata 2. Mga piling halimbawa ng paggamit ng matematika sa linggwistika

2.1 Pagsasalin sa makina

Ang ideya ng pagsasalin mula sa isang wika patungo sa isa pa sa tulong ng isang unibersal na mekanismo ay lumitaw ilang siglo bago nagsimula ang mga unang pag-unlad sa lugar na ito - noong 1649, iminungkahi ni Rene Descartes ang ideya ng isang wika kung saan ang mga katumbas na ideya ng ang iba't ibang wika ay ipahahayag ng isang simbolo. Ang mga unang pagtatangka na ipatupad ang ideyang ito noong 1930s-40s, ang simula ng teoretikal na pag-unlad sa kalagitnaan ng siglo, ang pagpapabuti ng mga sistema ng pagsasalin sa tulong ng teknolohiya noong 1970s-80s, ang mabilis na pag-unlad ng teknolohiya ng pagsasalin sa huling dekada - ito ang mga yugto sa pagbuo ng machine translation bilang isang industriya. Ito ay mula sa mga gawa sa machine translation na ang computer linguistics bilang isang agham ay lumago.

Sa pag-unlad ng teknolohiya ng computer noong huling bahagi ng dekada 70 at unang bahagi ng dekada 80, itinakda ng mga mananaliksik ang kanilang sarili na mas makatotohanan at matipid na mga layunin - ang makina ay hindi naging isang katunggali (tulad ng ipinapalagay dati), ngunit isang katulong sa isang tagasalin ng tao. Ang pagsasalin ng makina ay huminto sa paglilingkod ng eksklusibong mga gawaing militar (lahat ng mga imbensyon at pananaliksik ng Sobyet at Amerikano, na pangunahing nakatuon sa Ruso at Ingles, ay nag-ambag sa Cold War sa isang paraan o iba pa). Noong 1978, ang mga natural na salita sa wika ay ipinadala sa pamamagitan ng Arpa interconnected network, at pagkaraan ng anim na taon, ang unang microcomputer translation program ay lumitaw sa Estados Unidos.

Noong dekada 70, binibili ng Commission of the European Communities ang English-French na bersyon ng Systran computer translator, na nag-order din ng French-English at Italian-English na bersyon, at ang Russian-to-English translation system na ginagamit ng US Armed Forces. Ito ay kung paano inilatag ang mga pundasyon ng proyekto ng EUROTRA.

Tungkol sa muling pagkabuhay ng machine translation noong 70-80s. Ang mga sumusunod na katotohanan ay nagpapatotoo: binibili ng Commission of the European Communities (CEC) ang English-French na bersyon ng Systran, gayundin ang sistema ng pagsasalin mula sa Russian patungo sa English (ang huli ay binuo pagkatapos ng ulat ng ALPAC at patuloy na ginagamit ng US Air Force at NASA); bilang karagdagan, ipinag-uutos ng CEC ang pagbuo ng mga bersyong French-English at Italian-English. Kasabay nito, mayroong mabilis na pagpapalawak ng mga aktibidad sa pagsasalin ng makina sa Japan; sa USA, iniutos ng Pan American Health Organization (PAHO) ang pagbuo ng isang Spanish-English na direksyon (SPANAM system); Pinopondohan ng US Air Force ang pagbuo ng isang machine translation system sa Linguistic Research Center sa University of Texas sa Austin; Ang pangkat ng TAUM sa Canada ay gumagawa ng kapansin-pansing pag-unlad sa pagbuo ng kanilang METEO (meteorological translation) system. Ang ilang mga proyekto ay nagsimula noong 70s at 80s. pagkatapos ay binuo sa ganap na komersyal na mga sistema.

Sa panahon ng 1978-93, 20 milyong dolyar ang ginugol sa pananaliksik sa larangan ng pagsasalin ng makina sa USA, 70 milyon sa Europa, at 200 milyon sa Japan.

Ang isa sa mga bagong pag-unlad ay ang teknolohiya ng TM (translation memory), na gumagana sa prinsipyo ng akumulasyon: sa panahon ng proseso ng pagsasalin, ang orihinal na segment (pangungusap) at ang pagsasalin nito ay nai-save, na nagreresulta sa pagbuo ng isang linguistic database; kung ang isang kapareho o katulad na segment ay matatagpuan sa bagong isinalin na teksto, ito ay ipinapakita kasama ng pagsasalin at isang indikasyon ng porsyento na tugma. Ang tagasalin pagkatapos ay gumawa ng desisyon (upang i-edit, tanggihan o tanggapin ang pagsasalin), ang resulta nito ay iniimbak ng system, kaya hindi na kailangang isalin ang parehong pangungusap nang dalawang beses. Ang isang kilalang komersyal na sistema batay sa teknolohiya ng TM ay kasalukuyang binuo ng TRADOS system (itinatag noong 1984).

Sa kasalukuyan, ilang dosenang kumpanya ang bumubuo ng mga komersyal na sistema ng pagsasalin ng makina, kabilang ang: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata Software; Linguistica b.v. at iba pa. Ngayon ay maaari mong gamitin ang mga serbisyo ng mga awtomatikong tagapagsalin nang direkta sa Web: alphaWorks; Online na Tagasalin ng PROMT; LogoMedia.net; Serbisyo sa Pagsasalin ng Babel Fish ng AltaVista; InfiniT.com; Pagsasalin ng Internet.

Ang mga komersyal na epektibong sistema ng pagsasalin ay lumitaw din sa ikalawang kalahati ng dekada 80 sa ating bansa. Ang mismong konsepto ng machine translation ay lumawak (nagsimula itong isama ang "paglikha ng isang bilang ng mga awtomatiko at automated na system at device na awtomatiko o semi-awtomatikong gumaganap sa buong ikot ng pagsasalin o mga indibidwal na gawain sa isang dialogue sa isang tao"), at tumaas ang laang-gugulin ng pamahalaan para sa pagpapaunlad ng industriyang ito.

Ang Russian, English, German, French at Japanese ay naging pangunahing wika ng mga domestic translation system. Ang All-Union Translation Center (VTsP) ay bumuo ng isang sistema para sa pagsasalin mula sa English at German sa Russian gamit ang EC-1035-ANRAP na computer. Binubuo ito ng tatlong diksyunaryo - input English at German at output Russian - sa ilalim ng isang software. Mayroong ilang mga pinapalitan na dalubhasang diksyunaryo - sa teknolohiya ng computer, programming, radio electronics, mechanical engineering, agrikultura, metalurhiya. Maaaring gumana ang system sa dalawang mode - awtomatiko at interactive, kapag ipinakita ng screen ang pinagmulang teksto at pagsasalin sa bawat parirala, na maaaring i-edit ng isang tao. Ang bilis ng pagsasalin ng teksto sa ANRAP (mula sa simula ng pag-type hanggang sa katapusan ng pag-print) ay humigit-kumulang 100 mga pahina bawat oras.

Noong 1989, nilikha ang isang pamilya ng mga komersyal na tagasalin ng uri ng SPRINT, nagtatrabaho sa Russian, English, German at Japanese. Ang kanilang pangunahing bentahe ay ang kanilang pagiging tugma sa IBM PC - kaya, ang mga domestic machine translation system ay umabot sa internasyonal na antas ng kalidad. Kasabay nito, ang isang sistema ng pagsasalin ng makina mula sa Pranses sa Russian FRAP ay binuo, na kinabibilangan ng 4 na yugto ng pagsusuri ng teksto: graphematic, morphological, syntactic at semantic. Sa LGPI sila. Herzen, ang trabaho ay isinasagawa sa isang apat na wika (Ingles, Pranses, Espanyol, Ruso) na sistemang SILOD-MP (Ingles-Russian at Franco-Russian na mga diksyunaryo ay ginamit sa industriyal na mode.

Para sa espesyal na pagsasalin ng mga teksto sa electrical engineering, umiral ang ETAP-2 system. Ang pagsusuri ng input text dito ay isinagawa sa dalawang antas - morphological at syntactic. Ang diksyunaryo ng ETAP-2 ay naglalaman ng humigit-kumulang 4 na libong mga entry; ang yugto ng pagbabago ng teksto - humigit-kumulang 1000 panuntunan (96 pangkalahatan, 342 pribado, ang iba ay diksyunaryo). Tiniyak ng lahat ng ito ang isang kasiya-siyang kalidad ng pagsasalin (sabihin, ang pamagat ng patent na "Optical phase grid arrangement at coupling device na may ganoong arrangement" ay isinalin bilang "Isang optical phase grid device at isang connecting device na may ganoong device" - sa kabila ng tautolohiya, ang kahulugan ay napanatili).

Sa Minsk Pedagogical Institute of Foreign Languages, batay sa English-Russian na diksyunaryo ng mga form at parirala ng salita, isang sistema para sa pagsasalin ng makina ng mga pamagat ay naimbento, sa Institute of Oriental Studies ng Academy of Sciences - isang sistema para sa pagsasalin. mula sa Hapon tungo sa Ruso. Ang unang awtomatikong serbisyo sa bokabularyo at terminology (SLOTHERM) para sa computing at programming, na nilikha sa Moscow Research Institute of Automation Systems, ay naglalaman ng humigit-kumulang 20,000 termino sa isang paliwanag na diksyunaryo at mga espesyal na diksyunaryo para sa linguistic na pananaliksik.

Ang mga sistema ng pagsasalin ng makina ay unti-unting nagsimulang gamitin hindi lamang para sa kanilang nilalayon na layunin, ngunit bilang isang mahalagang bahagi ng mga awtomatikong sistema ng pag-aaral (para sa pagtuturo ng pagsasalin, pagsuri sa spelling at kaalaman sa gramatika).

Ang dekada 90 ay nagdala ng mabilis na pag-unlad ng merkado ng PC (mula sa desktop hanggang sa bulsa) at teknolohiya ng impormasyon, ang malawakang paggamit ng Internet (na nagiging mas internasyonal at multilinggwal). Ang lahat ng ito ay ginawa ang karagdagang pag-unlad ng mga awtomatikong sistema ng pagsasalin sa demand. Mula noong unang bahagi ng 1990s Ang mga domestic developer ay pumapasok din sa merkado ng mga sistema ng PC.

Noong Hulyo 1990, ang unang komersyal na sistema ng pagsasalin ng makina sa Russia na tinatawag na PROMT (Programmer's Machine Translation) ay ipinakita sa PC Forum sa Moscow. Noong 1991, ZAO [!!! Alinsunod sa Federal Law-99 ng 05.05. 2014, ang form na ito ay pinalitan ng isang hindi pampublikong joint-stock na kumpanya] "Project MT", at noong 1992, ang kumpanya ng PROMT ay nanalo sa kompetisyon ng NASA para sa supply ng mga MP system (PROMT ang tanging hindi Amerikanong kumpanya sa kompetisyong ito). a buong pamilya ng mga system sa ilalim ng bagong pangalan na STYLUS para sa pagsasalin mula sa English, German, French, Italian at Spanish sa Russian at mula sa Russian tungo sa English, at noong 1993, batay sa STYLUS, nilikha ang unang machine translation system para sa Windows. STYLUS 2.0 para sa Windows 3.X/95/NT ay inilabas, at noong 1995-1996 ang ikatlong henerasyon ng mga machine translation system, ganap na 32-bit STYLUS 3.0 para sa Windows 95/NT, ay ipinakilala, kasabay nito, ang pagbuo ng isang ganap na bago, ang unang Russian-German at Russian-French na sistema ng pagsasalin ng makina sa mundo.

Noong 1997, nilagdaan ang isang kasunduan sa kumpanyang Pranses na Softissimo sa paglikha ng mga sistema ng pagsasalin mula sa Pranses sa Aleman at Ingles at sa kabaligtaran, at noong Disyembre ng taong ito, inilabas ang unang sistema ng pagsasalin ng Aleman-Pranses sa mundo. Sa parehong taon, ang kumpanya ng PROMT ay naglabas ng isang sistema na ipinatupad gamit ang Gigant na teknolohiya, na sumusuporta sa ilang mga direksyon ng wika sa isang shell, pati na rin ang isang espesyal na tagasalin para sa pagtatrabaho sa Internet WebTranSite.

Noong 1998, isang buong konstelasyon ng mga programa ang inilabas sa ilalim ng bagong pangalang PROMT 98. Pagkalipas ng isang taon, naglabas ang PROMT ng dalawang bagong produkto: isang natatanging software package para sa pagtatrabaho sa Internet - PROMT Internet, at isang tagasalin para sa mga corporate mail system - PROMT Mail Tagasalin. Noong Nobyembre 1999, kinilala ang PROMT bilang ang pinakamahusay na sistema ng pagsasalin ng makina na sinubok ng French magazine na PC Expert, na nalampasan ang mga katunggali nito ng 30 porsiyento. Ang mga espesyal na solusyon sa server ay binuo din para sa mga kliyente ng korporasyon - ang corporate translation server na PROMT Translation Server (PTS) at ang Internet solution na PROMT Internet Translation Server (PITS). Noong 2000, in-update ng PROMT ang buong linya ng mga produkto ng software sa pamamagitan ng pagpapalabas ng bagong henerasyon ng mga MT system: PROMT Translation Office 2000, PROMT Internet 2000 at Magic Gooddy 2000.

Ang online na pagsasalin na may suporta ng sistema ng PROMT ay ginagamit sa isang bilang ng mga domestic at dayuhang site: Online Translator ng PROMT, InfiniT.com, Translate.Ru, Lycos, atbp., pati na rin sa mga institusyon ng iba't ibang mga profile para sa pagsasalin ng mga dokumento ng negosyo, mga artikulo at liham (may mga translation system na direktang binuo sa Outlook Express at iba pang email client).

Sa ngayon, umuusbong ang mga bagong teknolohiya sa pagsasalin ng makina batay sa paggamit ng mga artificial intelligence system at mga istatistikal na pamamaraan. Tungkol sa huli - sa susunod na seksyon.

2.2 Dagdagmga pamamaraan sa pag-aaral ng wika

Malaking atensyon sa modernong linggwistika ang ibinibigay sa pag-aaral ng linguistic phenomena gamit ang mga pamamaraan ng quantitative mathematics. Madalas na nakakatulong ang quantitative data upang mas malalim na maunawaan ang mga phenomena na pinag-aaralan, ang kanilang lugar at papel sa sistema ng mga kaugnay na phenomena. Ang sagot sa tanong na "magkano" ay nakakatulong upang masagot ang mga tanong na "ano", "paano", "bakit" - ganyan ang heuristic na potensyal ng isang quantitative na katangian.

Malaki ang papel na ginagampanan ng mga pamamaraan ng istatistika sa pagbuo ng mga sistema ng pagsasalin ng makina (tingnan ang Seksyon 2.1). Sa istatistikal na diskarte, ang problema sa pagsasalin ay isinasaalang-alang sa mga tuntunin ng isang maingay na channel. Isipin na kailangan nating isalin ang isang pangungusap mula sa Ingles sa Russian. Ang prinsipyo ng maingay na channel ay nag-aalok sa amin ng sumusunod na paliwanag ng kaugnayan sa pagitan ng isang Ingles at isang Russian na pangungusap: ang isang English na pangungusap ay walang iba kundi isang Russian na pangungusap na binaluktot ng ilang uri ng ingay. Upang mabawi ang orihinal na pangungusap na Ruso, kailangan nating malaman kung ano ang karaniwang sinasabi ng mga tao sa Russian at kung paano binaluktot ang mga pariralang Ruso sa Ingles. Isinasagawa ang pagsasalin sa pamamagitan ng paghahanap para sa gayong pangungusap na Ruso na nagpapalaki sa mga produkto ng walang kondisyong posibilidad ng pangungusap na Ruso at ang posibilidad ng pangungusap sa Ingles (orihinal) na ibinigay sa ibinigay na pangungusap na Ruso. Ayon sa teorama ni Bayes, ang Russian na pangungusap na ito ay ang pinaka-malamang na pagsasalin ng Ingles:

kung saan e ang pagsasalin na pangungusap at f ang orihinal na pangungusap

Kaya kailangan namin ng isang modelo ng pinagmulan at isang modelo ng channel, o isang modelo ng wika at isang modelo ng pagsasalin. Ang modelo ng wika ay dapat magtalaga ng marka ng posibilidad sa anumang pangungusap sa target na wika (sa aming kaso, Russian), at ang modelo ng pagsasalin sa orihinal na pangungusap. (tingnan ang talahanayan 1)

Sa pangkalahatan, gumagana ang isang machine translation system sa dalawang mode:

1. Pagsasanay sa system: isang training corpus ng mga parallel na teksto ay kinuha, at gamit ang linear programming, ang mga naturang value ng translation correspondence table ay hinahanap na nagpapalaki sa posibilidad ng (halimbawa) ang Russian na bahagi ng corpus na may available na English ayon sa sa napiling modelo ng pagsasalin. Ang isang modelo ng wikang Ruso ay itinayo sa bahaging Ruso ng parehong corpus.

2. Pagsasamantala: batay sa nakuhang data para sa isang hindi pamilyar na pangungusap sa Ingles, hinahanap ang isang Ruso na nagpapalaki sa produkto ng mga probabilidad na itinalaga ng modelo ng wika at modelo ng pagsasalin. Ang program na ginagamit para sa naturang paghahanap ay tinatawag na decoder.

Ang pinakasimpleng modelo ng pagsasalin ng istatistika ay ang modelo ng literal na pagsasalin. Ipinapalagay ng modelong ito na upang maisalin ang isang pangungusap mula sa isang wika patungo sa isa pa, sapat na upang isalin ang lahat ng mga salita (lumikha ng isang "bag ng mga salita"), at ibibigay ng modelo ang kanilang pagkakalagay sa tamang pagkakasunud-sunod. Upang bawasan ang P( a, f | e) hanggang P(a | e , f), i.e. mga probabilidad ng isang naibigay na pagkakahanay na binigyan ng isang pares ng mga pangungusap, ang bawat probabilidad na P(a, f | e) ay na-normalize ng kabuuan ng mga probabilidad ng lahat ng pagkakahanay ng isang ibinigay na pares ng mga pangungusap:

Ang pagpapatupad ng Viterbi algorithm na ginamit upang sanayin ang Modelo #1 ay ang mga sumusunod:

1. Ang buong talahanayan ng mga probabilidad ng pagsusulatan sa pagsasalin ay puno ng parehong mga halaga.

2. Para sa lahat ng posibleng variant ng magkapares na koneksyon ng mga salita, ang posibilidad na P(a, f | e) ay kinakalkula:

3. Ang mga halaga ng P(a, f | e) ay na-normalize upang makuha ang mga halaga ng P(a | e, f).

4. Ang dalas ng bawat pares ng pagsasalin ay kinakalkula, na natimbang ayon sa posibilidad ng bawat opsyon sa pagkakahanay.

5. Ang mga resultang weighted frequency ay na-normalize at bumubuo ng isang bagong talahanayan ng mga probabilidad ng pagsusulatan sa pagsasalin

6. Ulitin ang algorithm mula sa hakbang 2.

Isaalang-alang, bilang halimbawa, ang pagsasanay ng isang katulad na modelo sa isang corpus ng dalawang pares ng mga pangungusap (Larawan 2):

puting bahay

Pagkatapos ng isang malaking bilang ng mga pag-ulit, makakakuha tayo ng isang talahanayan (Talahanayan 2), na nagpapakita na ang pagsasalin ay isinasagawa nang may mataas na katumpakan.

Gayundin, malawakang ginagamit ang mga pamamaraang istatistika sa pag-aaral ng bokabularyo, morpolohiya, syntax, at istilo. Ang mga siyentipiko mula sa Perm State University ay nagsagawa ng isang pag-aaral batay sa assertion na ang mga stereotypical na parirala ay isang mahalagang "building material" ng teksto. Ang mga pariralang ito ay binubuo ng "nuklear" na paulit-ulit na mga salita at mga dependent na salita-specifier at may binibigkas na pang-istilong pangkulay.

Sa istilong pang-agham, ang mga salitang "nuklear" ay maaaring tawaging: pananaliksik, pag-aaral, gawain, suliranin, tanong, kababalaghan, katotohanan, pagmamasid, pagsusuri atbp. Sa pamamahayag, ang ibang mga salita ay magiging "nuklear", na may tumaas na halaga partikular para sa teksto ng pahayagan: oras, tao, kapangyarihan, negosyo, aksyon, batas, buhay, kasaysayan, lugar atbp. (kabuuan 29)

Ang partikular na interes ng mga linguist ay ang propesyonal na pagkakaiba-iba ng pambansang wika, ang orihinalidad ng paggamit ng bokabularyo at gramatika, depende sa uri ng hanapbuhay. Ito ay kilala na ang mga driver sa propesyonal na pagsasalita ay gumagamit ng form w tungkol sa fer, sabi ng mga medics k tungkol sa club sa halip na cocktail Yu sh - maaaring ibigay ang mga ganitong halimbawa. Ang gawain ng mga istatistika ay subaybayan ang pagkakaiba-iba ng pagbigkas at ang pagbabago sa pamantayan ng wika.

Ang mga pagkakaiba sa propesyonal ay humantong sa mga pagkakaiba hindi lamang sa gramatika, kundi pati na rin sa leksikal. Ipinangalan ang Yakut State University M.K. Ammosov, 50 mga talatanungan ay nasuri na may pinakakaraniwang mga reaksyon sa ilang mga salita sa mga manggagamot at tagabuo (Talahanayan 3).

Mga tagabuo

Tao

pasyente (10), personalidad (5)

lalaki (5)

mabuti

tulong (8), tulong (7)

masama (16)

isang buhay

kamatayan (10)

maganda (5)

kamatayan

bangkay (8)

buhay (6)

ang apoy

init (8), paso (6)

apoy (7)

daliri

kamay (14), panaritium (5)

malaki (7), index (6)

mata

paningin (6), mag-aaral, ophthalmologist (5 bawat isa)

kayumanggi (10), malaki (6)

ulo

isip (14), utak (5)

malaki (9), matalino (8), matalino (6)

matalo

kamalayan, buhay (4 bawat isa)

pera (5), hanapin (4)

Mapapansin na ang mga manggagamot ay mas madalas kaysa sa mga tagapagtayo ay nagbibigay ng mga asosasyon na may kaugnayan sa kanilang mga propesyonal na aktibidad, dahil ang salitang-stimuli na ibinigay sa talatanungan ay may higit na kinalaman sa kanilang propesyon kaysa sa propesyon ng isang tagabuo.

Ang mga istatistikal na regularidad sa isang wika ay ginagamit upang lumikha ng mga diksyunaryo ng dalas - mga diksyunaryo na nagbibigay ng mga numerical na katangian ng dalas ng mga salita (mga anyo ng salita, mga parirala) ng anumang wika - ang wika ng manunulat, anumang akda, atbp. Karaniwan, ang dalas ng paglitaw ng ang isang salita ay ginagamit bilang isang katangian ng dalas ng paglitaw ng isang salita sa teksto ng isang tiyak na volume

Ang modelo ng speech perception ay imposible nang walang diksyunaryo bilang mahalagang bahagi nito. Sa pang-unawa ng pagsasalita, ang pangunahing yunit ng pagpapatakbo ay ang salita. Mula rito, sa partikular, ang bawat salita ng pinaghihinalaang teksto ay dapat matukoy sa kaukulang yunit ng panloob na bokabularyo ng tagapakinig (o mambabasa). Natural lang na ipagpalagay na sa simula pa lang ang paghahanap ay limitado sa ilang subdomain ng diksyunaryo. Ayon sa karamihan sa mga modernong teorya ng speech perception, ang aktwal na phonetic analysis ng tunog na teksto sa isang tipikal na kaso ay nagbibigay lamang ng ilang bahagyang impormasyon tungkol sa posibleng phonological na hitsura ng salita, at ang ganitong uri ng impormasyon ay tumutugma sa hindi isa, ngunit isang tiyak na MARAMING salita. ng diksyunaryo; Samakatuwid, dalawang problema ang lumitaw:

(a) piliin ang naaangkop na hanay ayon sa ilang mga parameter;

(b) sa loob ng mga hangganan ng nakabalangkas na hanay (kung ito ay inilalaan nang sapat) upang "tanggalin" ang lahat ng mga salita, maliban sa isa lamang na pinakamahusay na tumutugma sa ibinigay na salita ng kinikilalang teksto. Isa sa mga diskarte sa "pag-dropout" ay ang pagbubukod ng mga salitang mababa ang dalas. Ito ay sumusunod na ang bokabularyo para sa speech perception ay isang frequency dictionary. Ito ay ang paglikha ng isang computer na bersyon ng dalas ng diksyunaryo ng wikang Ruso na ang unang gawain ng ipinakita na proyekto.

Batay sa materyal ng wikang Ruso, mayroong 5 mga diksyunaryo ng dalas (hindi binibilang ang mga diksyunaryo ng sangay). Pansinin lamang natin ang ilang pangkalahatang pagkukulang ng umiiral na mga diksyunaryo.

Ang lahat ng kilalang diksyonaryo ng dalas ng wikang Ruso ay batay sa pagproseso ng mga arrays ng nakasulat (naka-print) na mga teksto. Bahagyang para sa kadahilanang ito, kapag ang pagkakakilanlan ng isang salita ay higit na nakabatay sa pormal, graphic na pagkakataon, ang semantika ay hindi sapat na isinasaalang-alang. Bilang isang resulta, ang mga katangian ng dalas ay inilipat din, nabaluktot; halimbawa, kung ang compiler ng frequency dictionary ay nagsasama ng mga salita mula sa kumbinasyong "isa't isa" sa pangkalahatang istatistika ng paggamit ng salitang "kaibigan", kung gayon ito ay halos hindi makatwiran: dahil sa mga semantika, dapat nating aminin na ang mga ito ay na ibang mga salita, o sa halip, na ang isang independiyenteng yunit ng diksyunaryo ay kumbinasyon lamang sa kabuuan.

Gayundin, sa lahat ng umiiral na mga diksyunaryo, ang mga salita ay inilalagay lamang sa kanilang mga pangunahing anyo: mga pangngalan sa isahan na anyo, nominative case, mga pandiwa sa infinitive na anyo, atbp. Ang ilan sa mga diksyunaryo ay nagbibigay ng impormasyon tungkol sa dalas ng mga anyo ng salita, ngunit kadalasan ay hindi nila ito ginagawa nang pare-pareho nang sapat, hindi sa isang kumpletong paraan. Ang mga frequency ng iba't ibang anyo ng salita ng parehong salita ay halatang hindi tugma. Dapat isaalang-alang ng developer ng isang speech perception model na sa isang tunay na proseso ng perceptual, ito ay tiyak na isang tiyak na anyo ng salita na "nalulubog" sa teksto na napapailalim sa pagkilala: batay sa pagsusuri ng paunang seksyon ng exponent ng anyo ng salita, nabuo ang isang hanay ng mga salita na may magkaparehong simula, at ang paunang seksyon ng anyo ng salita ay hindi kinakailangang magkapareho sa paunang seksyon ng anyo ng diksyunaryo . Ito ay ang anyo ng salita na may isang tiyak na ritmikong istraktura, na isa ring napakahalagang parameter para sa perceptual na pagpili ng mga salita. Sa wakas, sa huling representasyon ng kinikilalang pagbigkas, muli, ang mga salita ay kinakatawan ng kaukulang mga anyo ng salita.

Maraming mga gawa na nagpapakita ng kahalagahan ng dalas sa proseso ng pang-unawa sa pagsasalita. Ngunit hindi namin alam ang mga gawa kung saan gagamitin ang dalas ng mga anyo ng salita - sa kabaligtaran, halos hindi binabalewala ng lahat ng may-akda ang dalas ng mga indibidwal na anyo ng salita, na eksklusibong tumutukoy sa mga lexemes. Kung ang mga resultang nakuha ng mga ito ay hindi itinuturing na artifact, kailangang ipagpalagay na ang katutubong nagsasalita sa anumang paraan ay may access sa impormasyon tungkol sa ratio ng mga frequency ng mga anyo ng salita at mga anyo ng diksyunaryo, ibig sabihin, sa katunayan, mga lexemes. Bukod dito, ang gayong paglipat mula sa isang anyo ng salita patungo sa isang lexeme, siyempre, ay hindi maipaliwanag ng natural na kaalaman sa kaukulang paradigm, dahil ang impormasyon ng dalas ay dapat gamitin bago ang pangwakas na pagkakakilanlan ng salita, kung hindi man ay nawawalan lamang ito ng kahulugan.

Ayon sa pangunahing istatistikal na katangian, posibleng matukoy gamit ang isang naibigay na kamag-anak na error na bahagi ng bokabularyo, na kinabibilangan ng mga salitang may mataas na dalas ng paglitaw, anuman ang uri ng teksto. Posible rin, sa pamamagitan ng pagpapasok ng sunud-sunod na pag-order sa diksyunaryo, upang makakuha ng isang serye ng mga diksyunaryo na sumasaklaw sa unang 100, 1000, 5000, atbp. ng mga madalas na salita. Ang mga istatistikal na katangian ng diksyunaryo ay interesado na may kaugnayan sa semantikong pagsusuri ng bokabularyo. Ang pag-aaral ng mga paksa-ideolohikal na grupo at mga larangang semantiko ay nagpapakita na ang mga leksikal na asosasyon ay sinusuportahan ng mga semantikong link na nakatuon sa paligid ng mga lexeme na may pinakakaraniwang kahulugan. Ang paglalarawan ng mga kahulugan sa loob ng patlang ng lexico-semantic ay maaaring isagawa sa pamamagitan ng pagtukoy ng mga salitang may pinakamaraming abstract na lexemes sa kahulugan. Tila, ang mga yunit ng diksyunaryo na "walang laman" (mula sa punto ng view ng mga nominative potencies) ay bumubuo ng isang homogenous na layer na ayon sa istatistika.

Ang mga bokabularyo para sa mga indibidwal na genre ay hindi gaanong mahalaga. Ang pag-aaral sa sukat ng kanilang pagkakapareho at ang likas na katangian ng mga distribusyon ng istatistika ay magbibigay ng kawili-wiling impormasyon tungkol sa qualitative stratification ng bokabularyo depende sa saklaw ng paggamit ng pagsasalita.

Ang pagsasama-sama ng malalaking dalas ng mga diksyunaryo ay nangangailangan ng paggamit ng teknolohiya ng computer. Ang pagpapakilala ng bahagyang mekanisasyon at automation sa proseso ng paggawa sa isang diksyunaryo ay kawili-wili bilang isang eksperimento sa machine processing ng mga diksyunaryo para sa iba't ibang mga teksto. Ang ganitong diksyunaryo ay nangangailangan ng mas mahigpit na sistema para sa pagproseso at pag-iipon ng materyal sa bokabularyo. Sa miniature, ito ay isang information retrieval system na nakapagbibigay ng impormasyon tungkol sa iba't ibang aspeto ng teksto at bokabularyo. Ang ilang mga pangunahing kahilingan sa system na ito ay pinlano mula pa sa simula: ang kabuuang bilang ng mga salita sa imbentaryo, ang mga istatistikal na katangian ng isang salita at buong mga diksyunaryo, ang pag-order ng madalas at bihirang mga zone ng diksyunaryo, atbp. Ang machine card file ay nagbibigay-daan sa iyo upang awtomatikong bumuo ng mga reverse na diksyunaryo para sa mga indibidwal na genre at pinagmulan. Maraming iba pang kapaki-pakinabang na istatistikal na impormasyon tungkol sa wika ang kukunin mula sa naipon na hanay ng impormasyon. Ang diksyunaryo ng dalas ng computer ay lumilikha ng isang pang-eksperimentong batayan para sa paglipat sa isang mas malawak na automation ng gawaing bokabularyo.

Ang istatistikal na data ng mga diksyonaryo ng dalas ay maaari ding malawakang magamit sa paglutas ng iba pang mga problema sa wika - halimbawa, sa pagsusuri at pagtukoy ng aktibong paraan ng pagbuo ng salita ng modernong wikang Ruso, paglutas ng mga isyu ng pagpapabuti ng mga graphics at spelling, na nauugnay sa pagkuha sa impormasyon sa istatistika ng account tungkol sa bokabularyo (kasama ang lahat ng ito, mahalagang isaalang-alang ang mga probabilistikong katangian ng mga kumbinasyon ng grapheme, mga uri ng mga kumbinasyon ng titik na natanto sa mga salita), praktikal na transkripsyon at transliterasyon. Ang mga istatistikal na parameter ng diksyunaryo ay magiging kapaki-pakinabang din sa paglutas ng mga problema sa pag-automate ng pag-type, pagkilala at awtomatikong pagbabasa ng literal na teksto.

Ang mga modernong paliwanag na diksyonaryo at gramatika ng wikang Ruso ay pangunahing itinayo batay sa panitikan at masining na mga teksto. May mga frequency na diksyunaryo ng wika ng A.S. Pushkin, A.S. Griboedova, F.M. Dostoevsky, V.V. Vysotsky at marami pang ibang may-akda. Sa Kagawaran ng Kasaysayan at Teorya ng Panitikan ng Estado ng Smolensk. Ang Pedagogical University ay nagtatrabaho sa loob ng ilang taon upang mag-compile ng mga frequency na diksyunaryo ng mga tekstong patula at prosa. Para sa pag-aaral na ito, napili ang mga diksyunaryo ng dalas ng lahat ng mga liriko ng Pushkin at dalawa pang makata ng ginintuang panahon - "Woe from Wit" ni Griboyedov at lahat ng tula ni Lermontov; Pasternak at limang iba pang makata ng Panahon ng Pilak - Balmont 1894-1903, "Mga Tula tungkol sa Magagandang Babae" ni Blok, "Bato" ni Mandelstam, "Haligi ng Apoy" ni Gumilyov, "Anno Domini MCMXXI" ni Akhmatova at "Mga Sister ng Ang Aking Buhay" ni Pasternak at apat pang makata ng Panahon ng Bakal - "Mga Tula ni Yuri Zhivago", "When it clears up", ang buong corpus ng lyrics ni M. Petrovs, "Malayo ang kalsada", "Windscreen", "Paalam sa snow" at "Horseshoes" ni Mezhirov, "Antimirov" ni Voznesensky at "Snowballs » Rylenkova.

Dapat pansinin na ang mga diksyunaryo na ito ay naiiba sa likas na katangian: ang ilan ay kumakatawan sa bokabularyo ng isang dramatikong gawain, ang iba - mga libro ng lyrics, o ilang mga libro, o ang buong corpus ng mga tula ng makata. Ang mga resulta ng pagsusuri na ipinakita sa papel na ito ay dapat gawin nang may pag-iingat, hindi sila maaaring kunin bilang isang ganap. Kasabay nito, sa tulong ng mga espesyal na hakbang, ang pagkakaiba sa ontological na kalikasan ng mga teksto ay maaaring mabawasan sa isang tiyak na lawak.

Sa mga nagdaang taon, ang pagsalungat sa pagitan ng kolokyal at pagsasalita sa libro ay naging mas malinaw na natanto. Ang isyung ito ay lalong matalas na tinalakay sa mga metodologo na humihingi ng turn sa pagtuturo patungo sa sinasalitang wika. Kasabay nito, ang pagiging tiyak ng kolokyal na pananalita ay nananatiling hindi maipaliwanag.

Ang mga diksyunaryo ay naproseso sa pamamagitan ng paglikha ng isang user application sa kapaligiran ng EXCEL97 office program. Kasama sa application ang apat na worksheet ng EXCEL book - "Title Sheet", "Dictionaries" sheet na may paunang data, "Proximity" at "Distansya" na may mga resulta, pati na rin ang isang set ng mga macro.

Ang paunang impormasyon ay ipinasok sa sheet na "Mga Diksyunaryo". Ang mga diksyunaryo ng mga pinag-aralan na teksto ay isinusulat sa mga selulang EXCEL, ang huling hanay na S ay nabuo mula sa mga resultang nakuha at katumbas ng bilang ng mga salita na matatagpuan sa ibang mga diksyunaryo. Ang mga talahanayan na "Proximity" at "Mga Distansya" ay naglalaman ng mga kalkuladong sukat ng proximity M, correlation R at distansya D.

Ang application macros ay mga event-based programming procedures na nakasulat sa Visual Basic for Application (VBA). Ang mga pamamaraan ay batay sa mga bagay sa library ng VBA at ang kanilang mga pamamaraan sa pagproseso. Kaya, para sa mga pagpapatakbo na may mga worksheet ng application, ang pangunahing bagay na Worksheet (worksheet) at ang kaukulang paraan ng pag-activate ng sheet na Activate (activate) ay ginagamit. Ang pagtatakda ng hanay ng nasuri na source data sa Dictionary sheet ay isinasagawa sa pamamagitan ng Select method ng Range object (range), at ang paglilipat ng mga salita bilang mga value sa mga variable ay ginagawa bilang Value property (value) ng parehong Range bagay.

Sa kabila ng katotohanan na ang pagsusuri ng ugnayan ng ranggo ay nagpapaingat sa atin tungkol sa pagdepende ng mga paksa sa pagitan ng iba't ibang mga teksto, karamihan sa mga pinakamadalas na salita sa bawat teksto ay may mga tugma sa isa o higit pang mga teksto. Ipinapakita ng Column S ang bilang ng mga naturang salita sa 15 pinakamadalas na salita para sa bawat may-akda. Ang mga salitang naka-bold ay lumilitaw lamang sa isang salita ng makata sa aming talahanayan. Ang Blok, Akhmatova at Petrovs ay walang mga naka-highlight na salita, mayroon silang S = 15. Ang tatlong makata na ito ay may parehong 15 pinaka-madalas na salita, naiiba lamang sila sa lugar sa listahan. Ngunit kahit na si Pushkin, na ang bokabularyo ay ang pinaka orihinal, ay may S = 8, at mayroong 7 naka-highlight na salita.

Ang mga resulta ay nagpapakita na mayroong isang tiyak na layer ng bokabularyo na tumutok sa mga pangunahing tema ng tula. Bilang isang tuntunin, ang mga salitang ito ay maikli: mula sa kabuuang bilang (225) ng iisang pantig na paggamit ng salita 88, dalawang pantig 127, tatlong pantig 10. Kadalasan ang mga salitang ito ay kumakatawan sa mga pangunahing mitolohiya at maaaring magkapares: gabi - araw, lupa - langit (araw), Diyos - tao (tao), buhay - kamatayan, katawan - kaluluwa, Roma - mundo(sa Mandelstam); maaaring pagsamahin sa mga mythologem ng mas mataas na antas: langit, bituin, araw, lupa; sa isang tao, bilang panuntunan, ang katawan, puso, dugo, braso, binti, pisngi, mata ay namumukod-tangi. Sa mga estado ng tao, ang kagustuhan ay ibinibigay sa pagtulog at pag-ibig. Ang bahay at lungsod ay nabibilang sa mundo ng tao - Moscow, Roma, Paris. Ang pagkamalikhain ay kinakatawan ng mga lexemes salita at kanta.

Sina Griboedov at Lermontov ay halos walang mga salita na nagsasaad ng kalikasan sa mga madalas na salita. Mayroon silang tatlong beses na mas maraming mga salita na nagsasaad ng isang tao, mga bahagi ng kanyang katawan, mga elemento ng kanyang espirituwal na mundo. Pushkin at mga makata ng ikadalawampu siglo. ang mga pagtatalaga ng tao at kalikasan ay humigit-kumulang pantay. Sa mahalagang aspetong ito ng paksa, masasabi nating ang ikadalawampu siglo. sumunod kay Pushkin.

Minimal na Tema kaso kabilang sa mga pinaka-madalas na salita, ito ay matatagpuan lamang sa Griboyedov at Pushkin. Lermontov at mga makata ng ikadalawampu siglo. nagbibigay daan ito sa isang minimal na tema salita. Ang salita ay hindi ibinubukod ang mga gawa (ang biblikal na interpretasyon ng paksa: sa Bagong Tipan, ang lahat ng mga turo ni Jesucristo ay itinuturing na salita ng Diyos o salita ni Jesus, at kung minsan ay tinatawag ng mga apostol ang kanilang sarili na mga ministro ng Salita). Ang sagradong kahulugan ng salitang lexeme ay nakakumbinsi na ipinakita, halimbawa, sa taludtod ni Pasternak na "At ang imahe ng mundo, na inihayag sa Salita." Ang sagradong kahulugan ng lexeme salita kasabay ng at kaibahan sa mga gawain ng tao, ito ay nakakumbinsi na ipinakita sa tula ng parehong pangalan ni Gumilyov.

Ang mga token na matatagpuan lamang sa isang teksto ay nagpapakilala sa pagka-orihinal ng isang partikular na aklat o isang koleksyon ng mga aklat. Halimbawa, ang salitang "isip" ang pinakamadalas sa komedya ni Griboedov na "Woe from Wit" - ngunit hindi ito nangyayari sa mga frequency na salita ng iba pang mga teksto. Ang tema ng isip ang pinakamahalaga sa komedya. Ang lexeme na ito ay kasama ng imahe ng Chatsky, at ang pangalan ng Chatsky ay ang pinakamadalas sa komedya. Kaya, ang gawain ay organikong pinagsama ang pinakamadalas na karaniwang pangngalan na may pinakamadalas na pangngalang pantangi.

Ang pinakamataas na koepisyent ng ugnayan ay nag-uugnay sa mga tema ng mga trahedya na aklat na "The Pillar of Fire" ni Gumilyov at "Anno Domini MCMXXI" ni Akhmatova. Sa 15 pinakamadalas na pangngalan, mayroong 10 pangkaraniwan, kabilang ang dugo, puso, kaluluwa, pag-ibig, salita, langit. Alalahanin na ang aklat ni Akhmatova ay may kasamang isang miniature na "Hindi ka mabubuhay ...", na isinulat sa pagitan ng pag-aresto kay Gumilyov at ng kanyang pagpatay.

Ang mga tema ng kandila at ang karamihan ng tao sa pinag-aralan na materyal ay matatagpuan lamang sa "Mga Tula ni Yuri Zhivago". Ang tema ng kandila sa mga talata mula sa nobela ay may maraming kontekstwal na kahulugan: nauugnay ito sa imahe ni Jesucristo, na may mga tema ng pananampalataya, kawalang-kamatayan, pagkamalikhain, petsa ng pag-ibig. Ang kandila ang pinakamahalagang pinagmumulan ng liwanag sa mga sentral na eksena ng nobela. Ang tema ng karamihan ay bubuo na may kaugnayan sa pangunahing ideya ng nobela, kung saan ang pribadong buhay ng isang tao na may hindi matitinag na mga halaga ay salungat sa imoralidad ng bagong estado, na binuo sa mga prinsipyo ng pagpapasaya sa karamihan. .

Kasama rin sa gawain ang ikatlong yugto, na makikita rin sa programa, - ito ang pagkalkula ng pagkakaiba sa mga ordinal na bilang ng mga salita na karaniwan sa dalawang diksyunaryo at ang average na distansya sa pagitan ng parehong mga salita ng dalawang diksyunaryo. Ang yugtong ito ay nagbibigay-daan sa paglipat mula sa mga pangkalahatang uso sa pakikipag-ugnayan ng mga diksyunaryo na natukoy sa tulong ng mga istatistika tungo sa isang antas na papalapit sa teksto. Halimbawa, ang mga libro ng Gumilyov at Akhmatova ay makabuluhang nauugnay sa istatistika. Tinitingnan namin kung aling mga salita ang naging karaniwan para sa kanilang mga diksyonaryo, at, una sa lahat, pipiliin namin ang mga serial number na kaunti lang ang pagkakaiba o katumbas ng zero. Ang mga salitang ito ay may parehong bilang ng ranggo at, dahil dito, ang mga minimal na tema sa isipan ng dalawang makata ang parehong mahalaga. Susunod, dapat kang lumipat sa antas ng mga teksto at konteksto.

Nakakatulong din ang quantitative na pamamaraan upang pag-aralan ang mga katangian ng mga tao - mga katutubong nagsasalita. Sabihin, mayroong 6 na kaso sa Russian, walang mga kaso sa Ingles, at sa ilang mga wika ng mga mamamayan ng Dagestan, ang bilang ng mga kaso ay umabot sa 40. L. Perlovsky sa kanyang artikulong "Consciousness, Language and Culture" ay iniuugnay ang mga ito mga katangian na may ugali ng mga tao sa indibidwalismo o kolektibismo, na may pang-unawa sa mga bagay at phenomena nang hiwalay o may kaugnayan sa iba. Pagkatapos ng lahat, ito ay sa mundo na nagsasalita ng Ingles (walang mga kaso - ang bagay ay nakikita "sa pamamagitan ng kanyang sarili") na ang mga konsepto tulad ng indibidwal na kalayaan, liberalismo at demokrasya ay lumitaw (tandaan ko na ginagamit ko lamang ang mga konseptong ito na may kaugnayan sa wika, nang walang anumang mga katangian ng pagsusuri). Sa kabila ng katotohanan na ang gayong mga hula ay nananatili lamang sa antas ng mga matapang na pang-agham na hypotheses, nakakatulong silang tingnan ang mga pamilyar na phenomena sa isang bagong paraan.

Tulad ng nakikita natin, ang mga quantitative na katangian ay maaaring ilapat sa ganap na magkakaibang mga lugar ng linggwistika, na lalong lumalabo ang mga hangganan sa pagitan ng "eksakto" at "makatao" na mga pamamaraan. Ang linggwistika ay lalong gumagamit ng tulong hindi lamang sa matematika, kundi pati na rin sa teknolohiya ng kompyuter upang malutas ang mga problema nito.

2.3 Pag-aaral Iwika sa pamamagitan ng mga pamamaraan ng pormal na lohika

Sa mga di-quantitative na pamamaraan ng matematika, sa partikular, na may lohika, ang modernong teoretikal na lingguwistika ay nakikipag-ugnayan nang hindi gaanong mabunga kaysa sa dami. Ang mabilis na pag-unlad ng mga teknolohiya ng computer at ang paglago ng kanilang papel sa modernong mundo ay nangangailangan ng rebisyon ng diskarte sa pakikipag-ugnayan ng wika at lohika sa pangkalahatan.

Ang mga pamamaraan ng lohika ay malawakang ginagamit sa pagbuo ng mga pormal na wika, sa partikular, mga programming language, ang mga elemento nito ay ilang mga simbolo (katulad ng matematika), pinili (o binuo mula sa mga dating napiling simbolo) at binibigyang kahulugan sa isang tiyak na paraan, nauugnay. sa anumang "tradisyonal" na paggamit, pag-unawa at pag-unawa. mga function ng parehong mga simbolo sa ibang mga konteksto. Ang isang programmer ay patuloy na nakikitungo sa lohika sa kanyang trabaho. Ang punto ng programming ay tiyak na turuan ang computer na mangatuwiran (sa pinakamalawak na kahulugan ng salita). Kasabay nito, ang mga pamamaraan ng "pangangatwiran" ay nagiging ibang-iba. Ang bawat programmer ay gumugugol ng ilang oras sa paghahanap ng mga bug sa kanilang sarili at sa mga programa ng ibang tao. Iyon ay, upang maghanap ng mga pagkakamali sa pangangatwiran, sa lohika. At nag-iiwan din ito ng marka. Mas madaling makakita ng mga lohikal na pagkakamali sa ordinaryong pagsasalita. Ang kamag-anak na pagiging simple ng mga wikang pinag-aralan ng mga logician ay nagbibigay-daan sa kanila na ipaliwanag ang mga istruktura ng mga wikang ito nang mas malinaw kaysa sa maabot ng mga linguist na nagsusuri ng eksklusibong kumplikadong mga natural na wika. Sa pagtingin sa katotohanan na ang mga wikang pinag-aralan ng mga logician ay gumagamit ng mga ugnayang kinopya mula sa mga natural na wika, ang mga logician ay nakakagawa ng makabuluhang kontribusyon sa pangkalahatang teorya ng wika. Ang sitwasyon dito ay katulad ng nangyayari sa pisika: ang physicist ay bumubuo rin ng mga theorems para sa perpektong pinasimple na mga kaso na hindi nangyayari sa kalikasan sa lahat - siya ay bumubuo ng mga batas para sa mga ideal na gas, perpektong likido, nagsasalita tungkol sa paggalaw sa kawalan ng friction, atbp. Para sa mga idealized na kaso na ito, maaaring magtatag ng mga simpleng batas na makatutulong nang malaki sa pag-unawa sa kung ano talaga ang nangyayari at kung ano ang malamang na mananatiling hindi alam sa physics kung sinubukan nitong isaalang-alang ang katotohanan nang direkta, sa lahat ng pagiging kumplikado nito.

Sa pag-aaral ng mga natural na wika, ang mga lohikal na pamamaraan ay ginagamit upang ang mga nag-aaral ng wika ay hindi "kabisaduhin" ng maraming salita hangga't maaari, ngunit mas maunawaan ang istraktura nito. Gumamit din si L. Shcherba sa kanyang mga lektura ng isang halimbawa ng pangungusap na binuo alinsunod sa mga batas ng wikang Ruso: "Ang glitched kuzdra shteko ay nagboke ng bokra at nagkulot ng bokra," at pagkatapos ay tinanong ang mga estudyante kung ano ang ibig sabihin nito. Sa kabila ng katotohanan na ang kahulugan ng mga salita sa pangungusap ay nanatiling hindi malinaw (wala lang sila sa Russian), posible na malinaw na sagutin: "kuzdra" ang paksa, isang pambabae na pangngalan, sa isahan, nominative na kaso, " bokr” ay animated, at iba pa. Ang pagsasalin ng parirala ay naging ganito: "May isang bagay na pambabae nang sabay-sabay na gumawa ng isang bagay sa isang uri ng lalaking nilalang, at pagkatapos ay nagsimulang gumawa ng isang bagay na mahaba, unti-unting kasama ang kanyang anak." Ang isang katulad na halimbawa ng isang teksto (artistic) mula sa mga hindi umiiral na salita, na ganap na binuo ayon sa mga batas ng wika, ay ang Jabberwock ni Lewis Carroll (sa Alice in Wonderland, ipinaliwanag ni Carroll, sa pamamagitan ng bibig ng kanyang karakter na si Humpty Dumpty, ang kahulugan ng ang mga salitang inimbento niya: "luto" - alas-otso ng gabi, kapag oras na para magluto ng hapunan, "chlivky" - manipis at matalino, "shorek" - isang krus sa pagitan ng ferret, badger at corkscrew, "dive "- tumalon, sumisid, paikutin, "nava" - damo sa ilalim ng sundial (lumalawak nang kaunti sa kanan , medyo pakaliwa at isang maliit na likod), "ungol" - ungol at tumawa, "zelyuk" - a berdeng pabo, "myumzik" - isang ibon; ang kanyang mga balahibo ay magulo at lumalabas sa lahat ng direksyon, tulad ng isang walis, "mova" - malayo sa bahay) .

Isa sa mga pangunahing konsepto ng modernong lohika at teoretikal na lingguwistika, na ginagamit sa pag-aaral ng mga wika ng iba't ibang logico-mathematical calculus, natural na mga wika, upang ilarawan ang ugnayan sa pagitan ng mga wika ng iba't ibang "antas" at upang makilala ang relasyon sa pagitan ng Ang mga wikang isinasaalang-alang at ang mga paksa na inilarawan sa kanilang tulong, ay ang konsepto ng metalanguage. Ang metalanguage ay isang wikang ginagamit upang ipahayag ang mga paghatol tungkol sa ibang wika, ang bagay na wika. Sa tulong ng isang metalanguage, pinag-aaralan nila ang istruktura ng mga kumbinasyon ng karakter (ekspresyon) ng object ng wika, nagpapatunay ng mga teorema tungkol sa mga katangiang nagpapahayag nito, tungkol sa kaugnayan nito sa ibang mga wika, atbp. Ang wikang pinag-aaralan ay tinatawag ding paksang wika sa kaugnayan sa metalanguage na ito. Ang paksang wika at ang metalanguage ay maaaring ordinaryong (natural) na mga wika. Maaaring iba ang metalanguage sa object language (halimbawa, sa English textbook para sa mga Russian, ang Russian ay metalanguage, at ang English ay object language), ngunit maaari rin itong magkasabay o bahagyang naiiba, halimbawa, sa mga espesyal na terminolohiya. (Ang terminolohiya sa wikang Ruso ay isang elemento ng metalanguage upang ilarawan ang wikang Ruso, ang tinatawag na semantic factor ay bahagi ng metalanguage para sa paglalarawan ng mga semantika ng natural na mga wika).

Ang konsepto ng "metalinguage" ay naging napakabunga na may kaugnayan sa pag-aaral ng mga pormal na wika na binuo sa loob ng balangkas ng matematikal na lohika. Hindi tulad ng mga pormal na paksang wika, sa kasong ito, ang metalanguage, kung saan nabuo ang metateorya (pag-aaral ng mga katangian ng teorya ng paksa na nabuo sa paksang wika), ay, bilang panuntunan, isang ordinaryong natural na wika, sa ilang espesyal na paraan limitadong fragment ng isang natural na wika na hindi naglalaman ng anumang uri ng kalabuan. , metapora, "metapisiko" na konsepto, atbp. mga elemento ng ordinaryong wika na pumipigil sa paggamit nito bilang isang kasangkapan para sa tumpak na siyentipikong pananaliksik. Kasabay nito, ang metalanguage mismo ay maaaring gawing pormal at (anuman ito) maging paksa ng pananaliksik na isinagawa sa pamamagitan ng metametalanguage, at ang naturang serye ay maaaring "isipin" na lumalaki nang walang katiyakan.

Itinuturo sa atin ng lohika ang isang mabungang pagkakaiba sa pagitan ng object ng wika at ng metalanguage. Ang object ng wika ay ang pinaka paksa ng lohikal na pananaliksik, at ang metalanguage ay ang hindi maiiwasang artipisyal na wika kung saan isinasagawa ang naturang pananaliksik. Ang lohikal na pag-iisip ay binubuo lamang sa pagbabalangkas ng mga relasyon at istruktura ng isang tunay na wika (object language) sa wika ng mga simbolo (metalanguage).

Ang metalanguage sa anumang kaso ay dapat na "hindi mas mahirap" kaysa sa layunin nitong wika (iyon ay, para sa bawat pagpapahayag ng huli sa metalanguage ay dapat mayroong pangalan nito - "pagsasalin") - kung hindi man, kung ang mga kinakailangan na ito ay hindi natutugunan (na kung saan ay tiyak na ang kaso sa natural na mga wika, kung ang mga espesyal na kasunduan ay hindi nagbibigay ng iba pa, ang mga semantic na kabalintunaan (antinomy) ay lumitaw.

Habang parami nang parami ang mga bagong programming language ay nilikha, na may kaugnayan sa problema ng mga tagasalin ng programming, nagkaroon ng isang kagyat na pangangailangan upang lumikha ng mga metalanguage. Sa kasalukuyan, ang Backus-Naur form na metalanguage (pinaikling BNF) ang pinakakaraniwang ginagamit para sa paglalarawan ng syntax ng mga programming language. Ito ay isang compact form sa anyo ng ilang mga formula na katulad ng mga mathematical. Para sa bawat konsepto ng wika ay may kakaibang metaformula (normal na pormula). Binubuo ito ng kaliwa at kanang bahagi. Ang kaliwang bahagi ay tumutukoy sa konsepto na tinutukoy, at ang kanang bahagi ay tumutukoy sa hanay ng mga tinatanggap na mga konstruksyon ng wika na pinagsama sa konseptong ito. Gumagamit ang formula ng mga espesyal na metacharacter sa anyo ng mga angle bracket, na naglalaman ng tinukoy na konsepto (sa kaliwang bahagi ng formula) o isang dating tinukoy na konsepto (sa kanang bahagi nito), at ang paghihiwalay ng kaliwa at kanang bahagi ay ipinahiwatig ng ang "::=" metacharacter, ang kahulugan nito ay katumbas ng mga salitang "by definition there is". Ang mga metalinguistic na formula ay naka-embed sa mga tagapagsalin sa ilang anyo; sa kanilang tulong, ang mga construct na ginamit ng programmer ay sinusuri para sa pormal na pagsunod sa alinman sa mga construct na syntactically valid sa wikang ito. Mayroon ding mga hiwalay na metalanguage ng iba't ibang agham - kaya, ang kaalaman ay umiiral sa anyo ng iba't ibang metalanguage.

Ang mga lohikal na pamamaraan ay nagsilbing batayan para sa paglikha ng mga artificial intelligence system batay sa konsepto ng connectionism. Ang koneksyonismo ay isang espesyal na kalakaran sa pilosopikal na agham, na ang paksa ay mga katanungan ng kaalaman. Sa loob ng balangkas ng trend na ito, ang mga pagtatangka ay ginagawa upang ipaliwanag ang mga intelektwal na kakayahan ng isang tao gamit ang mga artipisyal na neural network. Binubuo ng malaking bilang ng mga istrukturang yunit na katulad ng mga neuron, na may bigat na itinalaga sa bawat elemento na tumutukoy sa lakas ng koneksyon sa iba pang mga elemento, ang mga neural network ay pinasimpleng mga modelo ng utak ng tao. Ang mga eksperimento sa mga neural network ng ganitong uri ay nagpakita ng kanilang kakayahang matutong magsagawa ng mga gawain tulad ng pagkilala ng pattern, pagbabasa, at pagtukoy ng mga simpleng istrukturang gramatika.

Ang mga pilosopo ay nagsimulang magkaroon ng interes sa koneksyonismo, dahil ang diskarte sa koneksyonista ay nangako na magbibigay ng alternatibo sa klasikal na teorya ng isip at ang ideya na malawakang pinanghahawakan sa loob ng teoryang ito na ang mga gawain ng isip ay katulad ng pagproseso ng simbolikong wika sa pamamagitan ng digital. kompyuter. Ang konseptong ito ay napakakontrobersyal, ngunit sa mga nakaraang taon ay nakahanap ito ng higit pang mga tagasuporta.

Ang lohikal na pag-aaral ng wika ay nagpatuloy sa konsepto ni Saussure ng wika bilang isang sistema. Ang katotohanan na ito ay patuloy na nagpapatuloy ay nagpapatunay muli sa katapangan ng siyentipikong haka-haka sa simula ng huling siglo. Ilalaan ko ang huling seksyon ng aking trabaho sa mga prospect para sa pagbuo ng mga pamamaraan ng matematika sa linggwistika ngayon.

2.4 Mga prospect para sa aplikasyon ng mga pamamaraan ng matematika sa linggwistika

Sa panahon ng teknolohiya ng kompyuter, ang mga pamamaraan ng matematikal na lingguwistika ay nakatanggap ng bagong pananaw sa pag-unlad. Ang paghahanap ng mga solusyon sa mga problema ng linguistic analysis ay lalong ipinapatupad sa antas ng mga sistema ng impormasyon. Kasabay nito, ang automation ng proseso ng pagproseso ng materyal na lingguwistika, na nagbibigay sa mananaliksik ng mga makabuluhang pagkakataon at pakinabang, ay hindi maiiwasang maglagay ng mga bagong kinakailangan at gawain para sa kanya.

Ang kumbinasyon ng "eksaktong" at "makatao" na kaalaman ay naging matabang lupa para sa mga bagong tuklas sa larangan ng linggwistika, computer science at pilosopiya.

Ang pagsasalin ng makina mula sa isang wika patungo sa isa pa ay nananatiling isang mabilis na lumalagong sangay ng teknolohiya ng impormasyon. Sa kabila ng katotohanan na ang pagsasalin na tinulungan ng computer ay hindi kailanman maihahambing sa kalidad sa pagsasalin ng tao (lalo na para sa mga tekstong pampanitikan), ang makina ay naging isang kailangang-kailangan na katulong sa isang tao sa pagsasalin ng malalaking volume ng teksto. Ito ay pinaniniwalaan na sa malapit na hinaharap ay malilikha ang higit pang mga advanced na sistema ng pagsasalin, batay sa pangunahing pagsusuri sa semantiko ng teksto.

Ang isang pantay na pangakong direksyon ay ang interaksyon ng linggwistika at lohika, na nagsisilbing pilosopikal na pundasyon para sa pag-unawa sa teknolohiya ng impormasyon at ang tinatawag na "virtual reality". Sa malapit na hinaharap, ang trabaho ay magpapatuloy sa paglikha ng mga artificial intelligence system - bagaman, muli, hindi ito magiging katumbas ng tao sa mga kakayahan nito. Ang ganitong kumpetisyon ay walang kabuluhan: sa ating panahon, ang makina ay dapat maging (at maging) hindi isang karibal, ngunit isang katulong sa tao, hindi isang bagay mula sa larangan ng pantasya, ngunit bahagi ng totoong mundo.

Ang pag-aaral ng wika sa pamamagitan ng mga istatistikal na pamamaraan ay nagpapatuloy, na ginagawang posible upang mas tumpak na matukoy ang mga katangian ng husay nito. Mahalagang mahanap ng pinakamatapang na hypotheses tungkol sa wika ang kanilang matematikal, at samakatuwid ay lohikal, patunay.

Ang pinakamahalagang bagay ay ang iba't ibang sangay ng aplikasyon ng matematika sa linggwistika, na dati ay medyo nakahiwalay, sa mga nagdaang taon ay naiugnay sa isa't isa, na nagkokonekta sa isang magkakaugnay na sistema, sa pamamagitan ng pagkakatulad sa sistema ng wika na natuklasan noong isang siglo ni Ferdinand de Saussure at Yvan Baudouin de Courtenay. Ito ang pagpapatuloy ng kaalamang siyentipiko.

Ang linggwistika sa modernong mundo ay naging pundasyon para sa pag-unlad ng teknolohiya ng impormasyon. Hangga't ang computer science ay nananatiling isang mabilis na umuunlad na sangay ng aktibidad ng tao, ang unyon ng matematika at linggwistika ay patuloy na gaganap ng papel nito sa pag-unlad ng agham.

Konklusyon

Sa paglipas ng ika-20 siglo, malayo na ang narating ng mga teknolohiya sa kompyuter - mula sa militar hanggang sa mapayapang paggamit, mula sa isang makitid na hanay ng mga layunin hanggang sa pagtagos sa lahat ng sangay ng buhay ng tao. Ang matematika bilang isang agham ay nakakita ng bagong praktikal na kahalagahan sa pag-unlad ng teknolohiya ng kompyuter. Ang prosesong ito ay nagpapatuloy ngayon.

Ang dati nang hindi akalain na "tandem" ng "physicist" at "lyricists" ay naging realidad. Para sa buong pakikipag-ugnayan ng matematika at computer science sa humanities, kinakailangan ang mga kwalipikadong espesyalista mula sa magkabilang panig. Habang ang mga computer scientist ay lalong nangangailangan ng sistematikong makataong kaalaman (linguistic, cultural, philosophical) upang maunawaan ang mga pagbabago sa realidad sa kanilang paligid, sa interaksyon ng tao at teknolohiya, para makabuo ng parami nang paraming bagong linguistic at mental na konsepto, para magsulat mga programa, kung gayon ang anumang "Humanities" sa ating panahon para sa kanilang propesyonal na paglago ay dapat na makabisado ng hindi bababa sa mga pangunahing kaalaman sa pagtatrabaho sa isang computer.

Ang matematika, na malapit na magkakaugnay sa informatics, ay patuloy na umuunlad at nakikipag-ugnayan sa mga natural na agham at humanidades. Sa bagong siglo, ang trend patungo sa mathematization ng agham ay hindi humihina, ngunit, sa kabaligtaran, ay tumataas. Sa batayan ng dami ng data, ang mga batas ng pag-unlad ng wika, ang makasaysayang at pilosopikal na mga katangian ay naiintindihan.

Ang mathematical formalism ay pinakaangkop para sa paglalarawan ng mga pattern sa linguistics (tulad ng, sa katunayan, sa ibang mga agham - parehong humanidades at natural). Ang sitwasyon kung minsan ay umuunlad sa agham sa paraang walang paggamit ng angkop na wikang matematikal, imposibleng maunawaan ang kalikasan ng pisikal, kemikal, atbp. hindi posible ang proseso. Paglikha ng isang planetary model ng atom, ang sikat na English physicist ng XX century. Si E. Rutherford ay nakaranas ng mga kahirapan sa matematika. Noong una, hindi tinanggap ang kanyang teorya: hindi ito nakakumbinsi, at ang dahilan nito ay ang kamangmangan ni Rutherford sa teorya ng probabilidad, batay sa mekanismo kung saan posible lamang na maunawaan ang representasyon ng modelo ng mga pakikipag-ugnayan ng atomic. Napagtanto ito, na sa oras na iyon ang isang natitirang siyentipiko, ang may-ari ng Nobel Prize, ay naka-enrol sa seminar ng mathematician Professor Lamb at sa loob ng dalawang taon, kasama ang mga mag-aaral, ay dumalo sa isang kurso at nagtrabaho sa isang workshop sa teorya ng posibilidad. . Batay dito, nagawang ilarawan ni Rutherford ang pag-uugali ng elektron, na nagbibigay sa kanyang modelo ng istruktura na nakakumbinsi na katumpakan at nakakakuha ng pagkilala. Ganoon din sa linggwistika.

Nagtatanong ito, ano ang napaka-matematika sa layunin na mga phenomena, salamat sa kung saan maaari silang ilarawan sa wika ng matematika, sa wika ng dami ng mga katangian? Ito ay mga homogenous na yunit ng bagay na ipinamahagi sa espasyo at oras. Yaong mga agham na mas malayo kaysa sa iba patungo sa paghihiwalay ng homogeneity, at lumabas na mas angkop para sa paggamit ng matematika sa kanila.

Ang Internet, na mabilis na umunlad noong dekada 1990, ay nagsama-sama ng mga kinatawan ng iba't ibang bansa, mamamayan at kultura. Sa kabila ng katotohanan na ang Ingles ay patuloy na pangunahing wika ng internasyonal na komunikasyon, ang Internet ay naging multilinggwal sa ating panahon. Ito ay humantong sa pagbuo ng matagumpay na komersyal na mga sistema ng pagsasalin ng makina na malawakang ginagamit sa iba't ibang larangan ng aktibidad ng tao.

Ang mga network ng computer ay naging isang bagay ng pilosopikal na pagmuni-muni - parami nang parami ang mga bagong linguistic, lohikal, mga konsepto ng pananaw sa mundo na nalikha na makakatulong upang maunawaan ang "virtual reality". Sa maraming mga gawa ng sining, nilikha ang mga senaryo - mas madalas na pesimistiko - tungkol sa pangingibabaw ng mga makina sa mga tao, at virtual reality - sa labas ng mundo. Malayo sa palaging ang gayong mga pagtataya ay naging walang kabuluhan. Ang teknolohiya ng impormasyon ay hindi lamang isang promising na industriya para sa pamumuhunan ng kaalaman ng tao, ito rin ay isang paraan upang kontrolin ang impormasyon, at, dahil dito, sa pag-iisip ng tao.

Ang hindi pangkaraniwang bagay na ito ay may parehong negatibo at positibong panig. Negatibo - dahil ang kontrol sa impormasyon ay salungat sa hindi maiaalis na karapatang pantao sa libreng pag-access dito. Positibo - dahil ang kawalan ng kontrol na ito ay maaaring humantong sa mga sakuna na kahihinatnan para sa sangkatauhan. Sapat na upang alalahanin ang isa sa pinakamatalinong pelikula ng huling dekada - "When the World Ends" ni Wim Wenders, na ang mga karakter ay ganap na nahuhulog sa "virtual reality" ng kanilang sariling mga pangarap na naitala sa isang computer. Kasabay nito, hindi isang solong siyentipiko at hindi isang solong artista ang maaaring magbigay ng isang hindi malabo na sagot sa tanong: kung ano ang naghihintay sa agham at teknolohiya sa hinaharap.

Ang pagtutok sa "hinaharap", kung minsan ay tila kamangha-manghang, ay isang natatanging katangian ng agham noong kalagitnaan ng ikadalawampu siglo, nang ang mga imbentor ay naghangad na lumikha ng mga perpektong modelo ng teknolohiya na maaaring gumana nang walang interbensyon ng tao. Ipinakita ng panahon ang utopiang katangian ng naturang pananaliksik. Kasabay nito, hindi kailangan na hatulan ang mga siyentipiko para dito - kung wala ang kanilang sigasig noong 1950s - 60s, hindi sana gumawa ng ganoong kalakas na paglukso ang teknolohiya ng impormasyon noong dekada 90, at wala tayo sa kung ano ang mayroon tayo ngayon.

Binago ng mga huling dekada ng ikadalawampu siglo ang mga priyoridad ng agham - ang pananaliksik, ang mga mapag-imbentong pathos ay nagbigay daan sa komersyal na interes. Muli, ito ay hindi mabuti o masama. Ito ay isang katotohanan kung saan ang agham ay lalong isinama sa pang-araw-araw na buhay.

Ang ika-21 siglo ay nagpatuloy sa kalakaran na ito, at sa ating panahon sa likod ng mga imbensyon ay hindi lamang katanyagan at pagkilala, ngunit, una sa lahat, pera. Ito rin ang dahilan kung bakit mahalagang tiyakin na ang pinakabagong mga nagawa ng agham at teknolohiya ay hindi mahuhulog sa mga kamay ng mga teroristang grupo o diktatoryal na rehimen. Ang gawain ay mahirap sa punto ng imposible; upang mapagtanto ito hangga't maaari ay ang gawain ng buong komunidad ng mundo.

Ang impormasyon ay isang sandata, at ang mga sandata ay hindi gaanong mapanganib kaysa sa mga sandatang nuklear o kemikal - hindi lamang ito kumikilos sa pisikal, ngunit sa halip ay sikolohikal. Kailangang isipin ng sangkatauhan kung ano ang mas mahalaga para dito sa kasong ito - kalayaan o kontrol.

Ang pinakabagong mga pilosopikal na konsepto na may kaugnayan sa pag-unlad ng mga teknolohiya ng impormasyon at isang pagtatangka na maunawaan ang mga ito ay nagpakita ng mga limitasyon ng parehong natural-science materialism, na nangingibabaw noong ika-19 at unang bahagi ng ika-20 siglo, at matinding idealismo, na tumatanggi sa kahalagahan ng materyal na mundo. . Mahalaga para sa modernong kaisipan, lalo na ang kaisipan ng Kanluran, na mapagtagumpayan ang dualismong ito sa pag-iisip, kapag ang nakapaligid na mundo ay malinaw na nahahati sa materyal at ideal. Ang landas patungo dito ay isang diyalogo ng mga kultura, isang paghahambing ng iba't ibang mga punto ng pananaw sa mga nakapalibot na phenomena.

Paradoxically, ang teknolohiya ng impormasyon ay maaaring gumanap ng isang mahalagang papel sa prosesong ito. Ang mga network ng kompyuter, at lalo na ang Internet, ay hindi lamang isang mapagkukunan para sa libangan at masiglang aktibidad sa komersyo, ito rin ay isang paraan ng makabuluhan, kontrobersyal na komunikasyon sa pagitan ng mga kinatawan ng iba't ibang sibilisasyon sa modernong mundo, gayundin para sa isang diyalogo sa pagitan ng nakaraan at ang kasalukuyan. Masasabi nating itinutulak ng Internet ang spatial at temporal na mga hangganan.

At sa diyalogo ng mga kultura sa pamamagitan ng information technology, mahalaga pa rin ang papel ng wika bilang pinakamatandang unibersal na paraan ng komunikasyon. Kaya naman ang linggwistika, sa pakikipag-ugnayan sa matematika, pilosopiya at computer science, ay nakaranas ng pangalawang kapanganakan at patuloy na umuunlad ngayon. Ang takbo ng kasalukuyan ay magpapatuloy sa hinaharap - "hanggang sa katapusan ng mundo", tulad ng 15 taon na ang nakalilipas, ang parehong hinulaang V. Wenders. Totoo, hindi alam kung kailan mangyayari ang wakas na ito - ngunit mahalaga ba ito ngayon, dahil ang hinaharap ay magiging kasalukuyan pa rin.

Appendix 1

Ferdinand de Saussure

Ang Swiss linguist na si Ferdinand de Saussure (1857-1913) ay malawak na itinuturing na tagapagtatag ng modernong linggwistika sa mga pagtatangka nitong ilarawan ang istruktura ng wika sa halip na ang kasaysayan ng mga partikular na wika at mga anyo ng wika. Sa katunayan, ang pamamaraan ng Structuralism sa linguistics at literary studies at isang makabuluhang sangay ng Semiotics ay natagpuan ang kanilang pangunahing panimulang punto sa kanyang trabaho sa pagpasok ng ikadalawampu siglo. Pinagtatalunan pa nga na ang masalimuot ng mga estratehiya at konsepto na tinawag na "poststructuralism" - ang akda nina Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes, at iba pa - ay iminungkahi ng gawa ni Saussure. sa linguistics at anagrammatic readings ng late Latin poetry.panitikan modernismo hanggang sa psychoanalysis at pilosopiya noong unang bahagi ng ikadalawampu siglo. Tulad ng pagtatalo nina Algirdas Julien Greimas at Joseph Courtes sa Semiotics and Language: An Analytic Dictionary, sa ilalim ng heading na "Interpretation," lumitaw ang isang bagong paraan ng interpretasyon noong unang bahagi ng ikadalawampu siglo na kinilala nila sa Saussurean linguistics, Husserlian Phenomenology, at Freudian psychoanalysis. Sa mode na ito, "ang interpretasyon ay hindi na isang bagay ng pag-uugnay ng isang naibigay na nilalaman sa isang form na kung hindi man ay kulang ng isa; sa halip, ito ay isang paraphrase na bumubuo sa ibang paraan ng katumbas na nilalaman ng isang elementong nagpapakahulugan sa loob ng isang partikular na semiotic system" ( 159). sa ganitong pag-unawa ng "interpretasyon," ang anyo at nilalaman ay hindi naiiba; sa halip, ang bawat "form" ay, bilang kahalili, isang semantikong "nilalaman" din, isang "nagbibigay-kahulugan na anyo," upang ang interpretasyon ay nag-aalok ng isang analogical na paraphrase ng isang bagay na nagsasaad na sa loob ng ibang sistema ng kahulugan.

Ang ganitong reinterpretasyon ng anyo at pag-unawa - na inilalarawan ni Claude Levi-Strauss sa isa sa kanyang pinaka-programmatic na mga artikulasyon ng konsepto ng structuralism, sa "Istruktura at Anyo: Mga Pagninilay sa isang Trabaho ni Vladimir Propp" - ay implicit sa Posthumous Course ni Saussure. sa General Linguistics (1916, trans., 1959, 1983).Sa kanyang buhay, medyo kaunti ang inilathala ni Saussure, at ang kanyang pangunahing gawain, ang Course, ay ang transkripsyon ng kanyang mga mag-aaral ng ilang mga kurso sa pangkalahatang linggwistika na kanyang inaalok noong 1907-11. Sa Kurso ay tinawag ni Saussure ang "pang-agham" na pag-aaral ng wika na taliwas sa gawain sa makasaysayang linggwistika na ginawa noong ikalabinsiyam na siglo. wika, makasaysayang (o "diachronic") linguistics ay sumubaybay sa pinagmulan at pag-unlad ng mga wikang Kanluranin mula sa isang pinagmumulan ng karaniwang wika, una ay isang "Indo-European" na wika at pagkatapos ay isang mas naunang "p roto-Indo-European" na wika.

Eksakto ang pag-aaral na ito ng mga natatanging paglitaw ng mga salita, na may kaakibat na palagay na ang pangunahing "yunit" ng wika ay, sa katunayan, ang positibong pag-iral ng mga "mga elemento ng salita," na kinuwestiyon ni Saussure. Ang kanyang gawain ay isang pagtatangka na bawasan ang masa ng mga katotohanan tungkol sa wika, na pinag-aralan nang napakaliit ng makasaysayang linggwistika, sa isang napapamahalaang bilang ng mga panukala. Ang "comparative school" ng ika-labing-siyam na siglo na Philology, sabi ni Saussure sa Course, "ay hindi nagtagumpay sa pag-set up ng tunay na agham ng linguistics" dahil "bigo itong hanapin ang kalikasan ng bagay ng pag-aaral nito" (3). Ang "kalikasan," sabi niya, ay matatagpuan hindi lamang sa "elemental" na mga salita na binubuo ng isang wika - ang tila "positibong" katotohanan (o "mga sangkap") ng wika - ngunit sa mga pormal na relasyon na nagdudulot ng mga iyon. "mga sangkap."

Ang sistematikong muling pagsusuri ni Saussure sa wika ay batay sa tatlong pagpapalagay. Ang una ay ang siyentipikong pag-aaral ng wika ay kailangang paunlarin at pag-aralan ang sistema sa halip na ang kasaysayan ng linguistic phenomena. Dahil dito, nakikilala niya ang mga partikular na pangyayari ng wika - ang partikular na "mga kaganapan sa pagsasalita," na itinalaga niya bilang parol - at ang wastong layunin ng linggwistika, ang sistema (o "kodigo") na namamahala sa mga kaganapang iyon, na itinalaga niya bilang langue. Ang ganitong sistematikong pag-aaral, bukod pa rito, ay nangangailangan ng isang " synchronic" na konsepto ng ugnayan ng mga elemento ng wika sa isang partikular na sandali kaysa sa "diachronic" na pag-aaral ng pag-unlad ng wika sa pamamagitan ng kasaysayan.

Ang palagay na ito ay nagbunga ng kung ano ang itinalaga ni Roman Jakobson noong 1929 bilang "istrukturalismo," kung saan "anumang hanay ng mga phenomena na sinusuri ng kontemporaryong agham ay itinuturing hindi bilang isang mekanikal na pagsasama-sama ngunit bilang isang istrukturang kabuuan ang mekanikal na konsepto ng mga proseso ay nagbubunga sa tanong. ng kanilang tungkulin" ("Romantic" 711). Sa siping ito, ipinapahayag ni Jakobson ang intensyon ni Saussure na tukuyin ang linggwistika bilang isang sistemang siyentipiko kumpara sa isang simple, "mekanikal" na pagtutuos ng mga makasaysayang aksidente. Bukod dito, inilalarawan din ni Jakobson ang pangalawang batayan na palagay sa Saussurean - maaari nating ngayon ay tinatawag itong "istruktura" - linggwistika: na ang mga pangunahing elemento ng wika ay maaari lamang pag-aralan kaugnay ng kanilang mga tungkulin sa halip na kaugnay ng kanilang mga sanhi. European "mga salita"), ang mga pangyayari at entidad na iyon ay kailangang ilagay sa loob ng isang sistematikong balangkas kung saan nauugnay ang mga ito sa iba pang tinatawag na mga kaganapan at entidad. Ito ay isang radikal na reorientasyon sa pag-iisip ng karanasan at mga penomena, isa na ang kahalagahan ng pilosopo na si Ernst Cassirer ay inihambing sa "bagong agham ng Galileo na noong ikalabing pitong siglo ay nagbago sa ating kabuuan. konsepto ng pisikal na mundo" (sinipi sa Culler, Pursuit 2 4). Ang pagbabagong ito, gaya ng tala nina Greimas at Courtes, ay muling nag-iisip ng "interpretasyon" at sa gayon ay muling nagkakaroon ng paliwanag at pag-unawa sa kanilang mga sarili. Sa halip na ang paliwanag ay "sa mga tuntunin ng isang kababalaghan" ng mga sanhi, upang, bilang isang "epekto," ito ay sa ilang mga paraan subordinate sa mga sanhi nito, ang paliwanag dito ay binubuo sa pagpapailalim ng isang kababalaghan sa nito na nakatuon sa hinaharap na "function" o "layunin." Ang paliwanag ay hindi na independyente sa mga intensyon o layunin ng tao (kahit na ang mga intensyon na iyon ay maaaring impersonal, communal, o, sa mga terminong Freudian, "walang malay").

Sa kanyang linguistics, tinupad ni Saussure ang pagbabagong ito partikular sa redefinition ng linguistic "word," na inilalarawan niya bilang linguistic "sign" at binibigyang-kahulugan sa functionalist terms. Ang tanda, sabi niya, ay ang unyon ng "isang konsepto at isang tunog na imahe," na tinawag niyang "signified at signifier " (66-67; ang pagsasalin ni Roy Harris noong 1983 ay nag-aalok ng mga terminong "signification" at "signal" ). Ang likas na katangian ng kanilang "kombinasyon" ay "functional" na hindi ang signified o ang signifier ay ang "sanhi" ng iba; sa halip, "bawat isa ay ang mga halaga nito mula sa isa" (8). elemento ng wika, ang sign , na may kaugnayan at ginagawa ang pangunahing pagpapalagay ng makasaysayang linggwistika, ibig sabihin, ang pagkakakilanlan ng mga elementong yunit ng wika at kahulugan (i.e., "mga salita"), napapailalim sa mahigpit na pagsusuri. ang salitang "puno" bilang ang "parehong" salita ay hindi dahil ang salita ay binibigyang kahulugan ng mga likas na katangian - ito ay hindi isang "mekanikal na pagsasama-sama" ng gayong mga katangian - ngunit dahil ito ay tinukoy bilang isang elemento sa isang sistema, ang "kabuuan ng istruktura" , ng wika.

Ang ganitong relational (o "diacritical") na kahulugan ng isang entity ay namamahala sa konsepto ng lahat ng elemento ng wika sa structural linguistics. Ito ay pinakamalinaw sa pinakakahanga-hangang tagumpay ng Saussurean linguistics, ang pagbuo ng mga konsepto ng "ponema" at "mga natatanging katangian" ng wika. Ang mga ponema ay ang pinakamaliit na articulated at signifying unit ng isang wika. Ang mga ito ay hindi ang mga tunog na nangyayari sa wika ngunit ang mga "tunog na imahe" na binanggit ni Saussure, na nahuhuli ng mga nagsasalita - kahanga-hangang nahuhuli - bilang nagbibigay ng kahulugan. (Kaya, inilalarawan ni Elmar Holenstein ang linguistics ni Jakobson, na sumusunod kay Saussure sa mahahalagang paraan, bilang "phenomenological structuralism.") Ito ay para sa kadahilanang ito na ang nangungunang tagapagsalita para sa Prague School Structuralism, Jan Mukarovsky, ay nabanggit noong 1937 na "istruktura . . . ay isang phenomenological at hindi isang empirical reality; ito ay hindi ang gawain mismo, ngunit isang hanay ng mga functional na relasyon na matatagpuan sa kamalayan ng isang kolektibo (henerasyon, milieu, atbp.)" (sinipi sa Galan 35). Katulad nito, si Levi-Strauss, ang nangungunang tagapagsalita para sa istrukturalismong Pranses , binanggit noong 1960 na "ang istraktura ay walang natatanging nilalaman; ito ay kuntento mismo, at ang lohikal na organisasyon kung saan ito inaresto ay inaakalang pag-aari ng tunay" (167; tingnan din ang Jakobson, Fundamentals 27-28).

Ang mga ponema, kung gayon, ang pinakamaliit na nakikitang elemento ng wika, ay hindi mga positibong bagay kundi isang "phenomenological reality." Sa Ingles, halimbawa, ang ponema /t/ ay maaaring bigkasin sa maraming iba't ibang paraan, ngunit sa lahat ng pagkakataon ay makikilala ito ng isang nagsasalita ng Ingles bilang gumagana bilang isang /t/. Ang isang aspirated t (i.e., a t binibigkas na may parang h na hininga pagkatapos nito), isang mataas na tunog o mababang tunog na t, isang pinahabang tunog na t, at iba pa, ay lahat ay gagana sa parehong paraan sa pagkilala sa kahulugan ng "to" at "do" sa Ingles. Bukod dito, ang mga pagkakaiba sa pagitan ng mga wika ay tulad na ang phonological variation sa isang wika ay maaaring bumuo ng mga natatanging phonemes sa isa pa; kaya, ang Ingles ay nakikilala sa pagitan ng /l/ at /r/, samantalang ang ibang mga wika ay napakaayos na ang mga artikulasyong ito ay itinuturing na mga pagkakaiba-iba ng parehong ponema (tulad ng aspirated at unaspirated t sa Ingles). Sa bawat natural na wika, ang napakaraming posibleng salita ay kumbinasyon ng maliit na bilang ng mga ponema. Ang Ingles, halimbawa, ay nagtataglay ng wala pang 40 ponema na nagsasama-sama upang bumuo ng higit sa isang milyong iba't ibang salita.

Ang mga ponema ng wika ay mismong sistematikong nakaayos na mga istruktura ng mga tampok. Noong 1920s at 1930s, kasunod ng pangunguna ni Saussure ", ibinukod nina Jakobson at N. S. Trubetzkoy ang "mga natatanging katangian" ng mga ponema. Ang mga tampok na ito ay nakabatay sa istrukturang pisyolohikal ng mga organ ng pagsasalita - dila, ngipin, vocal chords, at iba pa - na Binanggit ni Saussure sa Kurso at inilalarawan ni Harris bilang "pisyolohikal na ponetika" ( 39; Ang naunang pagsasalin ni Baskin ay gumagamit ng terminong "ponolohiya" [(1959) 38]) - at sila ay pinagsama sa "mga bundle" ng binary opposition upang bumuo ng mga ponema. Halimbawa, sa Ingles ang pagkakaiba sa pagitan ng /t/ at /d/ ay ang pagkakaroon o kawalan ng "boses" (ang pakikipag-ugnayan ng mga vocal chords), at sa antas ng pagbigkas ng mga ponemang ito ay katumbas ng pagtukoy sa isa't isa. Sa ganitong paraan, ang ponolohiya ay isang tiyak na halimbawa ng isang pangkalahatang tuntunin ng wika na inilarawan ni Saussure: Sa wika ay may mga pagkakaiba lamang. mas mahalaga pa: ang pagkakaiba ay karaniwang nagpapahiwatig ng mga positibong termino kung saan naka-set up ang pagkakaiba; ngunit sa wika ay may mga pagkakaiba lamang na walang positibong termino. Kunin man natin ang signified o ang signifier, ang wika ay walang mga ideya o tunog na umiral bago ang linguistic system. ( 120)

Sa balangkas na ito, ang mga pagkakakilanlang pangwika ay tinutukoy hindi sa pamamagitan ng mga likas na katangian ngunit sa pamamagitan ng sistematikong ("istruktura") na mga relasyon.

Sinabi ko na ang phonology ay "sumusunod sa pangunguna" ni Saussure, dahil kahit na ang kanyang pagsusuri sa pisyolohiya ng produksyon ng wika ay "sa kasalukuyan," gaya ng sabi ni Harris, "matatawag na "pisikal," kumpara sa alinman sa "psychological" o "functional." "" (Pagbasa 49), dahil dito sa Kurso ay ipinahayag niya ang direksyon at mga balangkas ng isang functional analysis ng wika. Katulad nito, ang kanyang tanging pinalawig na nai-publish na akda, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Memoir on the primitive system of vowels in Indo-European languages), na lumabas noong 1878, ay ganap na nakalagay sa loob ng proyekto ng ikalabinsiyam na- siglo makasaysayang linggwistika. Gayunpaman, sa loob ng gawaing ito, tulad ng ipinagtalo ni Jonathan Culler, ipinakita ni Saussure ang "kabuuan ng pag-iisip ng wika bilang isang sistema ng mga bagay na puro relasyon, kahit na nagtatrabaho sa gawain ng muling pagtatayo ng kasaysayan" (Saussure 66). Sa pamamagitan ng pagsusuri sa mga sistematikong istruktural na relasyon sa mga ponema upang isaalang-alang ang mga pattern ng paghahalili ng patinig sa umiiral na mga wikang Indo-European, iminungkahi ni Saussure na bilang karagdagan sa ilang iba't ibang ponema /a/, tiyak na mayroong isa pang ponema na maaaring pormal na ilarawan. "Ang dahilan kung bakit napaka-kahanga-hanga ang gawa ni Saussure," pagtatapos ni Culler, "ay ang katotohanan na makalipas ang halos limampung taon, nang matuklasan at ma-decipher ang cuneiform Hittite, ito ay natagpuang naglalaman ng isang ponema, nakasulat na h, na kumikilos tulad ng hula ni Saussure. . Natuklasan niya, sa pamamagitan ng isang pormal na pagsusuri, kung ano ang kilala ngayon bilang mga laryngeal ng Indo-European" (66).

Ang konseptong ito ng relational o diacritical na pagpapasiya ng mga elemento ng signification, na parehong implicit at tahasang sa Course, ay nagmumungkahi ng ikatlong palagay na namamahala sa structural linguistics, na tinatawag ni Saussure na "ang arbitrary na katangian ng sign." Sa pamamagitan nito, nangangahulugan siya na ang relasyon sa pagitan ng signifier at signified sa wika ay hindi kinakailangan (o "motivated"): ang isa ay madaling mahanap ang sound signifier arbre bilang signifier tree upang makiisa sa konseptong "puno". Ngunit higit pa rito, nangangahulugan ito na ang ipinahiwatig ay arbitrary din: ang isa ay madaling tukuyin ang konseptong "puno" sa pamamagitan ng makahoy na kalidad nito (na hindi kasama ang mga puno ng palma) gaya ng laki nito (na hindi kasama ang "mababang makahoy na halaman" na ating tumawag sa mga bushes). Dapat nitong linawin na ang pag-numero ng mga pagpapalagay na aking inilalahad ay hindi kumakatawan sa isang pagkakasunud-sunod ng priyoridad: ang bawat palagay - ang sistematikong katangian ng kahulugan (pinakamahusay na nahuhuli sa pamamagitan ng pag-aaral ng wika "sabay-sabay"), ang relasyonal o "diakritikal" na katangian ng mga elemento ng signification, ang arbitrary na katangian ng mga palatandaan - nakukuha ang halaga nito mula sa iba.

Ibig sabihin, Saussurean linguistics ang mga phenomena na pinag-aaralan nito sa mga pangkalahatang relasyon ng kumbinasyon at contrast sa wika. Sa konseptong ito, ang wika ay parehong proseso ng pagpapahayag ng kahulugan (signification) at ang produkto nito (komunikasyon), at ang dalawang tungkuling ito ng wika ay hindi magkapareho o ganap na magkatugma (tingnan ang Schleifer, "Deconstruction"). Dito, makikita natin ang paghahalili sa pagitan ng anyo at nilalaman na inilalarawan nina Greimas at Courtes sa modernistang interpretasyon: ang wika ay nagpapakita ng mga kaibahan na pormal na tumutukoy sa mga yunit nito, at ang mga yunit na ito ay nagsasama-sama sa mga susunod na antas upang lumikha ng makabuluhang nilalaman. Dahil arbitraryo ang mga elemento ng wika, bukod dito, hindi masasabing basic ang contrast o combination. Kaya, sa wika ay nagsasama-sama ang mga natatanging katangian upang makabuo ng magkasalungat na ponema sa ibang antas ng pangamba, ang mga ponema ay nagsasama-sama upang makabuo ng mga magkasalungat na morpema, ang mga morpema ay nagsasama-sama upang makabuo ng mga salita, ang mga salita ay nagsasama-sama upang makabuo ng mga pangungusap, at iba pa. Sa bawat pagkakataon, ang buong ponema, o salita, o pangungusap, at iba pa, ay mas malaki kaysa sa kabuuan ng mga bahagi nito (tulad ng tubig, H2O, sa halimbawa ni Saussure [(1959) 103] ay higit pa sa mekanikal na pagsasama-sama. ng hydrogen at oxygen).

Ang tatlong pagpapalagay ng Kurso sa Pangkalahatang Linggwistika ay humantong kay Saussure na tumawag para sa isang bagong agham ng ikadalawampu siglo na lalampas sa agham pangwika upang pag-aralan ang "buhay ng mga palatandaan sa loob ng lipunan." Pinangalanan ni Saussure ang agham na ito na "semiology (mula sa Greek semeion "sign")" (16). Ang "agham" ng semiotics, tulad ng ginawa sa Silangang Europa noong 1920s at 1930s at Paris noong 1950s at 1960s, ay nagpalawak ng pag-aaral ng wika at mga istrukturang linggwistika sa mga artifact na pampanitikan na binuo (o articulated) ng mga istrukturang iyon. Sa buong huling bahagi ng kanyang karera, bukod pa rito, kahit na siya ay nag-aalok ng mga kurso sa pangkalahatang linggwistika, itinuloy ni Saussure ang kanyang sariling "semiotic" na pagsusuri ng huli na tula ng Latin sa pagtatangkang tuklasin ang sadyang itinatagong mga anagram ng mga wastong pangalan. Ang paraan ng pag-aaral sa maraming paraan ay kabaligtaran ng functional rationalism ng kanyang linguistic analysis: sinubukan nito, gaya ng binanggit ni Saussure sa isa sa 99 na kuwaderno kung saan niya itinuloy ang pag-aaral na ito, na sistematikong suriin ang problema ng "pagkakataon," na " nagiging hindi maiiwasang pundasyon ng lahat" (sinipi sa Starobinski 101). Ang nasabing pag-aaral, gaya ng sinabi mismo ni Saussure, ay nakatuon sa "materyal na katotohanan" ng pagkakataon at kahulugan (binanggit 101), upang ang "theme-word" na ang anagram ay hinahanap ni Saussure, gaya ng sinabi ni Jean Starobinski, "ay, para sa makata. , isang instrumento, at hindi isang mahalagang mikrobyo ng tula. Ang tula ay kinakailangan upang muling gamitin ang phonic na materyales ng tema-salita" (45). Sa pagsusuring ito, sinabi ni Starobinski, "Hindi nawala si Saussure sa kanyang sarili sa paghahanap ng mga nakatagong kahulugan." Sa halip, ang kanyang akda ay tila nagpapakita ng pagnanais na iwasan ang lahat ng mga problema na nagmumula sa kamalayan: "Dahil ang tula ay hindi lamang natanto sa mga salita ngunit ito ay isang bagay na ipinanganak mula sa mga salita, ito ay nakatakas sa arbitraryong kontrol ng kamalayan upang umasa lamang sa isang uri ng lingguwistika legalidad. "(121).

Iyon ay, ang pagtatangka ni Saussure na tumuklas ng mga wastong pangalan sa huling mga tula ng Latin - ang tinatawag ni Tzvetan Todorov na pagbabawas ng isang "salita . . . to its signifier" (266) - binibigyang-diin ang isa sa mga elementong namamahala sa kanyang linguistic analysis, ang arbitrary na katangian ng sign. (Idiniin din nito ang pormal na katangian ng Saussurean linguistics - "Ang wika," aniya, "ay isang anyo at hindi isang sangkap" - na mabisang nag-aalis ng mga semantika bilang isang pangunahing bagay ng pagsusuri.) Bilang pagtatapos ni Todorov, ang gawa ni Saussure ay lumilitaw na kapansin-pansing homogenous ngayon sa pagtanggi nitong tanggapin ang mga simbolikong penomena. . . . Sa kanyang pananaliksik sa anagrams, binibigyang-pansin lamang niya ang mga phenomena ng pag-uulit, hindi sa mga evocation. . . . Sa kanyang mga pag-aaral sa Nibelungen, kinikilala niya ang mga simbolo lamang upang maiugnay ang mga ito sa mga maling pagbabasa: dahil hindi ito sinasadya, ang mga simbolo ay hindi umiiral. Sa wakas sa kanyang mga kurso sa pangkalahatang linggwistika, pinag-isipan niya ang pagkakaroon ng semiology, at sa gayon ay ng mga palatandaan maliban sa mga linggwistika; ngunit ang paninindigang ito ay sabay-sabay na nililimitahan ng katotohanan na ang semiology ay nakatuon sa isang solong uri ng tanda: yaong mga arbitraryo. (269-70)

Kung ito ay totoo, ito ay dahil hindi maisip ni Saussure ang "intensiyon" nang walang paksa; hindi niya lubos na makatakas sa pagsalungat sa pagitan ng anyo at nilalaman na ang kanyang trabaho ay napakaraming nagawa upang itanong. Sa halip, ginamit niya ang "liguistic legality." Matatagpuan sa pagitan, sa isang banda, mga konsepto ng kasaysayan ng ikalabinsiyam na siglo, subjectivity, at ang paraan ng sanhi ng interpretasyon na pinamamahalaan ng mga konseptong ito at, sa kabilang banda, ang ikadalawampung siglo na "structuralist" na mga konsepto ng tinatawag ni Levi-Strauss na "Kantianism without isang transendental na paksa" (na binanggit sa Connerton 23) - mga konsepto na nagbubura sa pagsalungat sa pagitan ng anyo at nilalaman (o paksa at bagay) at ang hierarchy ng foreground at background sa ganap na structuralism, psychoanalysis, at kahit na quantum mechanics - ang gawa ni Ferdinand Si de Saussure sa linggwistika at semiotika ay sumasaklaw sa isang hudyat na sandali sa pag-aaral ng kahulugan at kultura.

Ronald Schleifer

Appendix 2

Ferdinand de Saussure (pagsasalin)

Ang Swiss linguist na si Ferdinand de Saussure (1857-1913) ay itinuturing na tagapagtatag ng modernong linggwistika - salamat sa kanyang mga pagtatangka na ilarawan ang istraktura ng wika, at hindi ang kasaysayan ng mga indibidwal na wika at mga anyo ng salita. Sa pangkalahatan, ang mga pundasyon ng mga pamamaraang istruktural sa linggwistika at kritisismong pampanitikan at, sa malaking lawak, ang semiotika ay inilatag sa kanyang mga gawa sa pinakadulo simula ng ikadalawampu siglo. Napatunayan na ang mga pamamaraan at konsepto ng tinatawag na "post-structuralism", na binuo sa mga akda nina Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes at iba pa, ay bumalik sa mga linggwistikong gawa ni Saussure at anagrammatic readings ng huling Romanong tula. Dapat pansinin na ang gawain ni Saussure sa linguistics at linguistic na interpretasyon ay nakakatulong upang ikonekta ang isang malawak na hanay ng mga intelektwal na disiplina - mula sa pisika hanggang sa mga inobasyong pampanitikan, psychoanalysis at pilosopiya ng unang bahagi ng ikadalawampu siglo. Sumulat sina A. J. Greimas at J. Kurte sa Semiotics and Language: "Ang isang analytical dictionary na may pamagat na "Interpretation" bilang isang bagong uri ng interpretasyon ay lumitaw sa simula ng ika-20 siglo kasama ang linguistics ng Saussure, ang phenomenology ni Husserl at ang psychoanalysis ni Freud. Sa ganoong kaso, "ang interpretasyon ay hindi ang pagpapatungkol ng isang ibinigay na nilalaman sa isang form na kung hindi man ay kulang ng isa; sa halip, ito ay isang paraphrase na bumubuo sa ibang paraan ng parehong nilalaman ng isang makabuluhang elemento sa loob ng isang ibinigay na semiotic system" (159) ). Sa ganitong pag-unawa sa "interpretasyon", ang anyo at nilalaman ay hindi mapaghihiwalay; sa kabaligtaran, ang bawat anyo ay puno ng semantikong kahulugan (“makabuluhang anyo”), kaya ang interpretasyon ay nag-aalok ng bago, katulad na muling pagsasalaysay ng isang bagay na makabuluhan sa ibang sistema ng pag-sign.

Ang isang katulad na pag-unawa sa anyo at nilalaman, na ipinakita ni Claude Lévi-Strauss sa isa sa mga pangunahing akda ng estrukturalismo, ("Istruktura at Anyo: Mga Pagninilay sa mga Gawa ni Vladimir Propp"), ay makikita sa posthumously-publish na libro ni Saussure na "Course in Pangkalahatang Linggwistika" (1916, trans., 1959, 1983). Sa panahon ng kanyang buhay, si Saussure ay naglathala ng kaunti, "Course" - ang kanyang pangunahing gawain - ay nakolekta mula sa mga tala ng mga mag-aaral na dumalo sa kanyang mga lektura sa pangkalahatang lingguwistika noong 1907-11. Sa Kurso, nanawagan si Saussure ng "pang-agham" na pag-aaral ng wika, na inihambing ito sa comparative-historical linguistics ng ikalabinsiyam na siglo. Ang gawaing ito ay maaaring ituring na isa sa mga pinakadakilang tagumpay ng pag-iisip ng Kanluranin: ang pagkuha ng mga indibidwal na salita bilang mga istruktural na elemento ng wika bilang batayan, ang historikal (o "diachronic") linguistics ay pinatunayan ang pinagmulan at pag-unlad ng mga wikang Kanlurang Europeo mula sa isang karaniwan, Indo-European na wika - at isang naunang Proto-Indo-European.

Eksaktong pag-aaral na ito ng mga kakaibang paglitaw ng mga salita, na may kaakibat na palagay na ang pangunahing "yunit" ng wika ay, sa katunayan, ang positibong pag-iral ng mga "elemento ng salita" na ito na kinuwestiyon ni Saussure. Ang kanyang trabaho ay isang pagtatangka na bawasan ang maraming mga katotohanan tungkol sa wikang kaswal na pinag-aralan ng comparative linguistics sa isang maliit na bilang ng mga theorems. Ang comparative philological school ng ika-19 na siglo, isinulat ni Saussure, "ay hindi nagtagumpay sa paglikha ng isang tunay na paaralan ng linggwistika" dahil "hindi nito naunawaan ang kakanyahan ng bagay ng pag-aaral" (3). Ang "esensya" na ito, sabi niya, ay namamalagi hindi lamang sa mga indibidwal na salita - ang "mga positibong sangkap" ng wika - kundi pati na rin sa mga pormal na koneksyon na tumutulong sa mga sangkap na ito na umiral.

Ang "pagsubok" ng wika ni Saussure ay batay sa tatlong pagpapalagay. Una, ang pang-agham na pag-unawa sa wika ay nakabatay hindi sa isang historikal, ngunit sa isang istruktural na kababalaghan. Samakatuwid, nakilala niya ang pagitan ng mga indibidwal na phenomena ng wika - "mga kaganapan sa pananalita", na tinukoy niya bilang "parole" - at ang nararapat, sa kanyang opinyon, bagay ng pag-aaral ng linggwistika, ang sistema (code, istraktura) na kumokontrol sa mga kaganapang ito. ("wika"). Ang ganitong sistematikong pag-aaral, bukod dito, ay nangangailangan ng "kasabay" na konsepto ng ugnayan sa pagitan ng mga elemento ng wika sa isang takdang sandali, sa halip na isang "diachronic" na pag-aaral ng pag-unlad ng wika sa pamamagitan ng kasaysayan nito.

Ang hypothesis na ito ang nangunguna sa kung ano ang tatawagin ni Roman Jakobson noong 1929 na "structuralism" - isang teorya kung saan "anumang hanay ng mga phenomena na sinisiyasat ng modernong agham ay itinuturing na hindi bilang isang mekanikal na akumulasyon, ngunit bilang isang istrukturang kabuuan kung saan ang nakabubuo na bahagi ay nauugnay sa ang function" ("Romantikong "711). Sa siping ito, binalangkas ni Jakobson ang ideya ni Saussure na tukuyin ang wika bilang isang istraktura, kumpara sa "mekanikal" na enumeration ng mga makasaysayang kaganapan. Bilang karagdagan, si Jakobson ay bumuo ng isa pang Saussurean assumption, na naging tagapagpauna ng structural linguistics: ang mga pangunahing elemento ng wika ay dapat pag-aralan na may kaugnayan hindi sa kanilang mga sanhi, ngunit sa kanilang mga tungkulin. Ang mga hiwalay na phenomena at mga kaganapan (sabihin, ang kasaysayan ng pinagmulan ng mga indibidwal na Indo-European na mga salita) ay dapat na pag-aralan hindi sa kanilang sarili, ngunit sa isang sistema kung saan sila ay nauugnay sa mga katulad na bahagi. Ito ay isang radikal na pagliko sa paghahambing ng mga phenomena sa nakapaligid na katotohanan, ang kahalagahan kung saan ang pilosopo na si Ernst Cassirer ay inihambing sa "agham ni Galileo, na noong ikalabing pitong siglo ay binawi ang mga ideya tungkol sa materyal na mundo." dahil dito, ang mga paliwanag mismo. Ang mga penomena ay nagsimulang bigyang-kahulugan hindi kaugnay sa mga sanhi ng kanilang paglitaw, ngunit kaugnay sa epekto na maaari nilang magkaroon sa kasalukuyan at sa hinaharap. Ang interpretasyon ay tumigil na maging independyente sa mga intensyon ng isang tao (sa kabila ng katotohanan na ang mga intensyon ay maaaring maging impersonal, "walang malay" sa kahulugan ng Freudian ng salita).

Sa kanyang linggwistika, partikular na ipinakita ni Saussure ang pagbabagong ito sa pagbabago ng konsepto ng salita sa linggwistika, na tinukoy niya bilang isang tanda at inilalarawan sa mga tuntunin ng mga tungkulin nito. Ang isang tanda para sa kanya ay isang kumbinasyon ng tunog at kahulugan, "signified at designation" (66-67; sa pagsasalin sa Ingles ng 1983 ni Roy Harris - "signification" at "signal"). Ang likas na katangian ng tambalang ito ay "functional" (ni isa o ang iba pang elemento ay maaaring umiral nang wala ang isa't isa); bukod pa rito, "ang isa ay humihiram ng mga katangian mula sa iba" (8). Kaya, tinukoy ni Saussure ang pangunahing elemento ng istruktura ng wika - ang tanda - at ginagawang batayan ng historikal na linggwistika ang pagkakakilanlan ng mga palatandaan sa mga salita, na nangangailangan ng partikular na mahigpit na pagsusuri. Samakatuwid, mauunawaan natin ang iba't ibang kahulugan ng, sabihin nating, ang parehong salitang "puno" - hindi dahil ang salita ay isang hanay lamang ng ilang mga katangian, ngunit dahil ito ay tinukoy bilang isang elemento sa sistema ng tanda, sa "kabuuan ng istruktura", sa wika.

Ang ganitong kamag-anak ("diacritical") na konsepto ng pagkakaisa ay sumasailalim sa konsepto ng lahat ng elemento ng wika sa istrukturang linggwistika. Ito ay lalong malinaw sa pinaka orihinal na pagtuklas ng Saussurean linguistics, sa pagbuo ng konsepto ng "ponema" at "mga natatanging katangian" ng wika. Ang mga ponema ay ang pinakamaliit sa sinasalita at makabuluhang mga yunit ng wika. Ang mga ito ay hindi lamang mga tunog na nangyayari sa wika, ngunit "mga tunog na imahe", sabi ni Saussure, na itinuturing ng mga katutubong nagsasalita bilang may kahulugan. (Dapat tandaan na tinawag ni Elmar Holenstein ang linguistics ni Jakobson, na nagpapatuloy sa mga ideya at konsepto ng Saussure sa mga pangunahing probisyon nito, "phenomenological structuralism"). Iyon ang dahilan kung bakit ang nangungunang tagapagsalita ng Prague School of Structuralism, si Jan Mukarowski, ay naobserbahan noong 1937 na "istruktura. . . hindi isang empirical, ngunit isang phenomenological na konsepto; hindi ito ang resulta mismo, ngunit isang hanay ng mga makabuluhang relasyon ng kolektibong kamalayan (henerasyon, iba pa, atbp.)”. Isang katulad na kaisipan ang ipinahayag noong 1960 ni Lévi-Strauss, ang pinuno ng estrukturalismong Pranses: “Ang istruktura ay walang tiyak na nilalaman; ito ay sa sarili nitong makabuluhan, at ang lohikal na konstruksyon kung saan ito nakapaloob ay ang imprint ng realidad.

Sa turn, ang mga ponema, bilang ang pinakamaliit na elemento ng lingguwistika na katanggap-tanggap para sa persepsyon, ay kumakatawan sa isang hiwalay na integral na "phenomenological reality". Halimbawa, sa Ingles, ang tunog na "t" ay maaaring mabigkas nang iba, ngunit sa lahat ng pagkakataon, ang isang taong nagsasalita ng Ingles ay mapapansin ito bilang "t". Ang aspirated, itinaas o ibinaba, isang mahabang "t" na tunog, atbp. ay pantay na makikilala ang kahulugan ng mga salitang "to" at "do". Bukod dito, ang mga pagkakaiba sa pagitan ng mga wika ay tulad na ang mga uri ng isang tunog sa isang wika ay maaaring tumutugma sa iba't ibang mga ponema sa isa pa; halimbawa, ang "l" at "r" sa Ingles ay magkaiba, habang sa ibang mga wika ang mga ito ay mga uri ng parehong ponema (tulad ng Ingles na "t", binibigkas nang may at walang aspirasyon). Ang malawak na bokabularyo ng anumang natural na wika ay isang hanay ng mga kumbinasyon ng mas maliit na bilang ng mga ponema. Sa Ingles, halimbawa, 40 ponema lamang ang ginagamit sa pagbigkas at pagsulat ng humigit-kumulang isang milyong salita.

Ang mga tunog ng isang wika ay isang sistematikong nakaayos na hanay ng mga tampok. Noong 1920s -1930s, kasunod ni Saussure, Jacobson at N.S. Trubetskoy ay pinili ang "mga natatanging tampok" ng mga ponema. Ang mga tampok na ito ay batay sa istruktura ng mga organo ng pagsasalita - dila, ngipin, vocal cords - Napansin ito ni Saussure sa "Course of General Linguistics", at tinawag ito ni Harris na "physiological phonetics" (sa naunang pagsasalin ni Baskin, ang terminong "phonology " ay ginagamit) - sila ay konektado sa "knots » durg laban sa isang kaibigan upang gumawa ng mga tunog. Halimbawa, sa Ingles, ang pagkakaiba sa pagitan ng "t" at "d" ay ang pagkakaroon o kawalan ng "boses" (ang tensyon ng mga vocal cords), at ang antas ng boses na nagpapakilala sa isang ponema mula sa isa pa. Kaya, ang ponolohiya ay maaaring ituring na isang halimbawa ng pangkalahatang tuntunin sa wika na inilarawan ni Saussure: "May mga pagkakaiba lamang sa wika." Ang mas mahalaga ay hindi ito: ang pagkakaiba ay kadalasang nagpapahiwatig ng eksaktong mga kondisyon kung saan ito matatagpuan; ngunit sa wika ay mayroon lamang mga pagkakaiba na walang tiyak na kondisyon. Isinasaalang-alang man natin ang "pagtatalaga" o "signified" - sa wika ay walang mga konsepto o tunog na umiiral bago ang pagbuo ng sistema ng wika.

Sa ganitong istraktura, ang mga analohiya sa linggwistika ay tinukoy hindi sa tulong ng kanilang mga likas na katangian, ngunit sa tulong ng mga relasyon sa sistema ("structural").

Nabanggit ko na na ang ponolohiya sa pagbuo nito ay umasa sa mga ideya ni Saussure. Bagama't ang kanyang pagsusuri sa linguistic physiology sa modernong panahon, sabi ni Harris, "ay tatawaging 'pisikal', bilang kabaligtaran sa 'psychological' o 'functional', sa The Course ay malinaw niyang ipinahayag ang direksyon at mga pangunahing prinsipyo ng functional analysis ng wika. Ang kanyang tanging akda na inilathala noong siya ay nabubuhay, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Mga Tala sa orihinal na sistema ng patinig sa mga wikang Indo-European), na inilathala noong 1878, ay ganap na naaayon sa paghahambing na pangkasaysayang lingguwistika ng ika-19 na siglo. Gayunpaman, sa gawaing ito, sabi ni Jonathan Culler, ipinakita ni Saussure "ang pagiging mabunga ng ideya ng wika bilang isang sistema ng magkakaugnay na phenomena, kahit na sa muling pagtatayo nito sa kasaysayan." Sinusuri ang ugnayan sa pagitan ng mga ponema, na nagpapaliwanag ng paghalili ng mga patinig sa mga modernong wika ng grupong Indo-European, iminungkahi ni Saussure na bilang karagdagan sa maraming iba't ibang mga tunog na "a", dapat mayroong iba pang mga ponema na inilarawan nang pormal. "Ang dahilan kung bakit ang gawain ni Saussure ay partikular na kahanga-hanga," pagtatapos ni Kaller, "ay halos 50 taon na ang lumipas, nang matuklasan at ma-decipher ang Hittite cuneiform, isang ponema ang natagpuan, sa pagsulat na tinutukoy ng "h", na kumikilos tulad ng hinulaang ni Saussure. Sa pamamagitan ng pormal na pagsusuri, natuklasan niya ang kilala ngayon bilang guttural sound sa mga wikang Indo-European.

Sa konsepto ng isang kamag-anak (diacritical) na kahulugan ng mga palatandaan, parehong tahasan at ipinahiwatig sa Kurso, mayroong isang ikatlong pangunahing pagpapalagay ng istrukturang linggwistika, na tinawag ni Saussure na "arbitraryong katangian ng tanda." Sa pamamagitan nito ay sinadya na ang ugnayan sa pagitan ng tunog at kahulugan sa wika ay hindi motibasyon ng anupaman: ang isang tao ay madaling ikonekta ang salitang "arbre" at ang salitang "puno" sa konsepto ng "puno". Bukod dito, nangangahulugan ito na ang tunog ay arbitrary din: maaaring tukuyin ng isa ang konsepto ng "puno" sa pamamagitan ng pagkakaroon ng bark (maliban sa mga puno ng palma) at sa laki (maliban sa "mababang makahoy na halaman" - mga palumpong). Mula dito dapat na malinaw na ang lahat ng mga pagpapalagay na ipinakita ko ay hindi nahahati sa higit pa at hindi gaanong mahalaga: bawat isa sa kanila - ang sistematikong katangian ng mga palatandaan (pinaka naiintindihan sa "kasabay" na pag-aaral ng wika), ang kanilang kamag-anak (diacritical) kakanyahan, ang di-makatwirang kalikasan ng mga palatandaan - nagmula sa iba.

Kaya, sa Saussurean linguistics, ang pinag-aralan na phenomenon ay nauunawaan bilang isang hanay ng mga paghahambing at pagsalungat ng wika. Ang wika ay parehong pagpapahayag ng kahulugan ng mga salita (pagtatalaga) at ang kanilang resulta (komunikasyon) - at ang dalawang tungkuling ito ay hindi kailanman nag-tutugma (tingnan ang "Deconstruction of Language" ni Shleifer). Makikita natin ang paghahalili ng anyo at nilalaman na inilalarawan nina Greimas at Kurte sa pinakabagong bersyon ng interpretasyon: ang mga linguistic contrast ay tumutukoy sa mga istrukturang unit nito, at ang mga unit na ito ay nakikipag-ugnayan sa sunud-sunod na mga antas upang lumikha ng isang tiyak na makabuluhang nilalaman. Dahil random ang mga elemento ng wika, hindi maaaring maging batayan ang contrast o combination. Nangangahulugan ito na sa isang wika, ang mga natatanging tampok ay bumubuo ng isang phonetic contrast sa ibang antas ng pag-unawa, ang mga ponema ay pinagsama sa contrasting morphemes, morphemes - sa mga salita, mga salita - sa mga pangungusap, atbp. Sa anumang kaso, isang buong ponema, salita, pangungusap, atbp. ay higit pa sa kabuuan ng mga bahagi nito (tulad ng tubig, sa halimbawa ni Saussure, higit pa sa kumbinasyon ng hydrogen at oxygen).

Tatlong pagpapalagay ng "Course of General Linguistics" ang humantong kay Saussure sa ideya ng isang bagong agham ng ikadalawampu siglo, na hiwalay sa linguistics, na nag-aaral ng "buhay ng mga palatandaan sa lipunan." Tinawag ni Saussure ang science semiology na ito (mula sa Greek na "semeion" - isang tanda). Ang "agham" ng semiotics, na umunlad sa Silangang Europa noong 1920s at 1930s at sa Paris noong 1950s at 1960s, ay nagpalawak ng pag-aaral ng wika at mga istrukturang linggwistika sa mga natuklasang pampanitikan na binubuo (o nabuo) ayon sa mga istrukturang ito. Bilang karagdagan, sa takip-silim ng kanyang karera, na kahanay sa kanyang kurso sa pangkalahatang linggwistika, si Saussure ay nakikibahagi sa isang "semiotic" na pagsusuri ng huling Romanong tula, sinusubukang tumuklas ng sadyang binubuo ng mga anagram ng mga wastong pangalan. Ang pamamaraang ito sa maraming paraan ay kabaligtaran ng rasyonalismo sa pagsusuri sa wika nito: ito ay isang pagtatangka, gaya ng isinulat ni Saussure sa isa sa 99 na kuwaderno, na pag-aralan sa sistema ang problema ng "probability", na "naging batayan ng lahat. " Ang nasabing pagsisiyasat, ang sabi mismo ni Saussure, ay nakakatulong na tumuon sa "tunay na panig" ng posibilidad; Ang "pangunahing salita" kung saan hinahanap ni Saussure ang isang anagram ay, ayon kay Jean Starobinsky, "isang kasangkapan para sa makata, at hindi ang mapagkukunan ng buhay para sa tula. Ang tula ay nagsisilbing baligtarin ang mga tunog ng susing salita. Ayon kay Starobinsky, sa pagsusuring ito, "Hindi sumasali si Saussure sa paghahanap ng mga nakatagong kahulugan." Sa kabaligtaran, sa kanyang mga gawa, ang pagnanais na maiwasan ang mga tanong na may kaugnayan sa kamalayan ay kapansin-pansin: "dahil ang tula ay ipinahayag hindi lamang sa mga salita, kundi pati na rin sa kung ano ang ibinubunga ng mga salitang ito, ito ay lampas sa kontrol ng kamalayan at nakasalalay lamang sa mga batas ng wika.”

Ang pagtatangka ni Saussure na pag-aralan ang mga wastong pangalan sa huling Romanong tula (tinawag ito ni Tsvetan Todorov na isang pagdadaglat ng "isang salita ... bago ito isulat") ay nagbibigay-diin sa isa sa mga bahagi ng kanyang linguistic analysis - ang arbitrary na katangian ng mga palatandaan, pati na rin ang ang pormal na kakanyahan ng Saussurean linguistics ("Wika," inaangkin niya, "ang kakanyahan ng anyo, hindi ang kababalaghan"), na hindi kasama ang posibilidad ng pagsusuri sa kahulugan. Tinapos ni Todorov na ngayon ang mga sinulat ni Saussure ay tila kapansin-pansing pare-pareho sa kanilang pag-aatubili na pag-aralan ang mga simbolo [phenomena na may mahusay na tinukoy na kahulugan]. . . . Sa paggalugad ng mga anagram, binibigyang-pansin lamang ni Saussure ang pag-uulit, ngunit hindi ang mga nakaraang opsyon. . . . Sa pag-aaral ng Nibelungenlied, tinukoy niya ang mga simbolo upang italaga lamang ang mga ito sa mga maling pagbabasa: kung hindi sinasadya, ang mga simbolo ay hindi umiiral. Pagkatapos ng lahat, sa kanyang mga akda sa pangkalahatang linggwistika, ginagawa niya ang pagpapalagay ng pagkakaroon ng isang semiolohiya na naglalarawan hindi lamang ng mga palatandaang pangwika; ngunit ang palagay na ito ay limitado sa pamamagitan ng katotohanan na ang semilogy ay maaari lamang maglarawan ng mga random, arbitrary na mga palatandaan.

Kung ito ay talagang gayon, ito ay dahil lamang sa hindi niya maisip ang "intensiyon" na walang bagay; hindi niya lubusang madugtungan ang agwat sa pagitan ng anyo at nilalaman - sa kanyang mga akda ay naging tanong ito. Sa halip, bumaling siya sa "linguistic legitimacy". Nakatayo sa pagitan, sa isang banda, ng mga konsepto ng ikalabinsiyam na siglo batay sa kasaysayan at mga pansariling haka-haka, at mga pamamaraan ng hindi sinasadyang interpretasyon batay sa mga konseptong ito, at, sa kabilang banda, mga konseptong istruktural, na tinawag ni Lévi-Strauss na "Kantianism na walang transendente na aktor. " - binubura ang oposisyon sa pagitan ng anyo at nilalaman (paksa at bagay), kahulugan at pinagmulan sa estrukturalismo, psychoanalysis at maging quantum mechanics, ang mga sinulat ni Ferlinand de Saussure sa linguistics at semiotics ay nagmamarka ng pagbabago sa pag-aaral ng mga kahulugan sa wika at kultura.

Ronald Shleifer

Panitikan

1. Admoni V.G. Mga Batayan ng teorya ng gramatika / V.G. Admoni; USSR Academy of Sciences.-M.: Nauka, 1964.-104p.

3. Arapov, M.V., Herts, M.M. Mga pamamaraan sa matematika sa linggwistika. M., 1974.

4. Arnold I.V. Ang semantikong istruktura ng salita sa modernong Ingles at ang pamamaraan para sa pag-aaral nito. /I.V. Arnold-L .: Edukasyon, 1966. - 187 p.

6.Bashlykov A.M. Awtomatikong sistema ng pagsasalin. / A.M. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 p.

7.Baudouin de Courtenay: Theoretical heritage and modernity: Abstracts of the reports of the international scientific conference / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 p.

8. A. V. Gladkiy, Mga Elemento ng Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 p.

9. Golovin, B.N. Wika at istatistika. /B.N. Golovin - M., 1971. - 210 p.

10. Zvegintsev, V.A. Teoretikal at inilapat na lingguwistika. / V.A. Zvegintsev - M., 1969. - 143 p.

11. Kasevich, V.B. Semantika. Syntax. Morpolohiya. // V.B. Kasevich - M., 1988. - 292 p.

12. Lekomtsev Yu.K. PANIMULA sa pormal na wika ng linggwistika / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 p., may sakit.

13. Linguistic legacy ng Baudouin de Courtenay sa pagtatapos ng ikadalawampu siglo: Abstracts of the reports of the international scientific and practical conference March 15-18, 2000. - Krasnoyarsk, 2000. - 125 p.

Matveeva G.G. Mga nakatagong kahulugan sa gramatika at pagkakakilanlan ng taong panlipunan (“portrait”) ng tagapagsalita / G.G. Matveev. - Rostov, 1999. - 174 p.

14. Melchuk, I.A. Karanasan sa pagbuo ng mga modelong pangwika "Ibig sabihin<-->Teksto". / I.A. Melchuk. - M., 1974. - 145 p.

15. Nelyubin L.L. Pagsasalin at inilapat na lingguwistika / L.L. Nelyubin. - M.: Higher School, 1983. - 207 p.

16. Sa eksaktong paraan ng pananaliksik sa wika: sa tinatawag na "mathematical linguistics" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva at iba pa - M., 1961. - 162 p.

17. Piotrovsky L.G. Mathematical Linguistics: Textbook / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Higher School, 1977. - 160 p.

18. Siya ay. Teksto, makina, tao. - L., 1975. - 213 p.

19. Siya ay. Applied Linguistics / Ed. A.S. Gerda. - L., 1986. - 176 p.

20. Revzin, I.I. mga modelo ng wika. M., 1963. Revzin, I.I. Modernong istruktural na lingguwistika. Mga problema at pamamaraan. M., 1977. - 239 p.

21. Revzin, I.I., Rozentsveig, V.Yu. Mga Batayan ng pangkalahatan at pagsasalin ng makina / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 p.

22. Slyusareva N.A. Ang teorya ni F. de Saussure sa liwanag ng modernong linggwistika / N.A. Slyusareva. - M.: Nauka, 1975. - 156 p.

23. Kuwago, L.Z. Analytical linguistics / L.Z. Kuwago - M., 1970. - 192 p.

24. Saussure F. de. Mga Tala sa Pangkalahatang Linggwistika / F. de Saussure; Per. mula kay fr. - M.: Pag-unlad, 2000. - 187 p.

25. Siya ay. Kurso ng Pangkalahatang Linggwistika / Per. mula kay fr. - Yekaterinburg, 1999. -426 p.

26. Mga istatistika ng pagsasalita at awtomatikong pagsusuri ng teksto / Ed. ed. R.G. Piotrovsky. L., 1980. - 223 p.

27. Stoll, P. Sets. Lohika. Axiomatic theories / R. Stoll; Per. mula sa Ingles. - M., 1968. - 180 p.

28. Tenier, L. Mga Batayan ng istrukturang syntax. M., 1988.

29. Ubin I.I. Automation ng mga aktibidad sa pagsasalin sa USSR / I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 p.

30. Faure, R., Kofman, A., Denis-Papin, M. Modern Mathematics. M., 1966.

31. Shenk, R. Pagproseso ng konseptong impormasyon. M., 1980.

32. Shikhanovich, Yu.A. PANIMULA sa modernong matematika (mga paunang konsepto). M., 1965

33. Shcherba L.V. Mga patinig na Ruso sa mga termino ng husay at dami / L.V. Shcherba - L.: Nauka, 1983. - 159 p.

34. Abdullah-zade F. Mamamayan ng mundo // Spark - 1996. - No. 5. - p.13

35. V.A. Uspensky. Preliminary para sa mga mambabasa ng "New Literary Review" sa mga semiotic na mensahe ni Andrei Nikolaevich Kolmogorov. - Bagong Pagsusuri sa Panitikan. -1997. - Hindi. 24. - S. 18-23

36. Perlovsky L. Kamalayan, wika at kultura. - Kaalaman ay kapangyarihan. -2000. №4 - S. 20-33

Panimula? Teorya sa Pagsasalin ng Lektura

Noong nakaraang siglo, ang linggwistika ay palaging binabanggit bilang isang halimbawa ng isang agham na mabilis na umunlad at napakabilis na umabot sa metodolohikal na kapanahunan. Nasa kalagitnaan na ng huling siglo, ang batang agham ay may kumpiyansa na kinuha ang lugar nito sa bilog ng mga agham na may isang libong taon na tradisyon, at isa sa mga pinakakilalang kinatawan nito - si A. Schleicher - ay nagkaroon ng lakas ng loob na maniwala na sa kanyang mga gawa siya ay nagbubuod na ng huling linya.<113>Ang kasaysayan ng linggwistika, gayunpaman, ay nagpakita na ang gayong opinyon ay masyadong padalos-dalos at hindi makatwiran. Sa pagtatapos ng siglo, ang linggwistika ay sumailalim sa unang malaking pagkabigla na nauugnay sa pagpuna sa mga neo-grammatical na prinsipyo, na sinundan ng iba. Dapat pansinin na ang lahat ng mga krisis na maaari nating matuklasan sa kasaysayan ng agham ng wika, bilang isang patakaran, ay hindi nayanig ang mga pundasyon nito, ngunit, sa kabaligtaran, ay nag-ambag sa pagpapalakas at sa huli ay nagdala sa kanila ng isang pagpipino at pagpapabuti. ng mga pamamaraan ng linguistic na pananaliksik, pagpapalawak kasama ng mga tema at mga isyung pang-agham.

Ngunit kasunod ng linggwistika, nabuhay at umunlad din ang iba pang mga agham, kabilang ang isang malaking bilang ng mga bago. Ang pisikal, kemikal at teknikal (tinatawag na "eksakto") na mga agham ay tumanggap lalo na ng mabilis na pag-unlad sa ating panahon, at ang kanilang teoretikal na batayan, ang matematika, ay naghari sa kanilang lahat. Ang eksaktong mga agham ay hindi lamang lubos na nagdiin sa lahat ng sangkatauhan, ngunit sa kasalukuyan ay nagsusumikap silang "dalhin sila sa kanilang pananampalataya", upang ipailalim sila sa kanilang mga kaugalian, upang ipataw ang kanilang mga pamamaraan ng pananaliksik sa kanila. Sa kasalukuyang sitwasyon, gamit ang pananalitang Hapones, masasabi na ngayon ay dinungisan ng mga linggwista-philologist ang pinakadulo ng banig, kung saan ang mga eksaktong agham, na pinamumunuan ng matematika, ay matagumpay at malayang matatagpuan.

Hindi ba't higit na kapaki-pakinabang, mula sa pananaw ng mga pangkalahatang interes sa siyensya, na sumuko sa matematika, na ganap na sumuko sa kapangyarihan ng mga pamamaraan nito, kung saan ang ilang mga tinig ay hayagang tumatawag 59 , at sa gayon, marahil, ay makakuha ng bagong lakas. ? Upang masagot ang mga tanong na ito, kailangan muna nating tingnan kung ano ang inaangkin ng matematika sa kasong ito, sa anong lugar ng linggwistika na mga pamamaraan sa matematika ang kanilang aplikasyon, hanggang saan sila naaayon sa mga detalye ng materyal ng wika at kung nagagawa nilang magbigay. o kahit magmungkahi lamang ng mga sagot sa mga tanong na iyon.na itinakda ng agham ng wika.

Sa simula pa lang, dapat tandaan na kabilang sa mga mahilig sa bagong, mathematical trend sa linguistics<114>Walang pagkakaisa ng mga opinyon tungkol sa mga layunin at layunin nito sa static na pananaliksik. Acad. A. A. Markov, na unang naglapat ng mga pamamaraang matematikal sa wika, tinuturing ni Boldrini, Yul, Mariotti ang mga elemento ng wika bilang angkop na materyal sa paglalarawan para sa pagbuo ng mga pamamaraan ng dami, o para sa mga teorema ng istatistika, nang hindi nagtataka kung ang mga resulta ng naturang pag-aaral ay interesado. sa mga linggwista 6 0 . Naniniwala si Ross na ang probability theory at mathematical statistics ay nagbibigay ng tool o, gaya ng mas gusto nilang sabihin ngayon, isang mathematical model para sa pagsubok at pagkumpirma sa mga linguistic na konklusyon na nagbibigay-daan para sa numerical interpretation. Kaya, ang mga pamamaraan sa matematika ay iniisip lamang bilang pantulong na paraan ng pananaliksik sa linggwistika 6 1 . Higit pa ang inaangkin ni Herdan, na sa kanyang aklat ay hindi lamang summed up at nag-systematize ng lahat ng mga pagtatangka sa matematikal na pag-aaral ng mga problema sa wika, ngunit sinubukan din na bigyan sila ng isang malinaw na oryentasyon na may kaugnayan sa karagdagang trabaho. Itinuon niya ang pagtatanghal ng buong materyal ng kanyang aklat sa "pag-unawa sa mga istatistikang pampanitikan (tulad ng tawag niya sa pag-aaral ng mga teksto sa pamamagitan ng mga pamamaraan ng mga istatistika ng matematika. - SA 3.) bilang mahalagang bahagi ng linggwistika” 6 2 , at binabalangkas ang kakanyahan at mga gawain ng bagong seksyong ito sa linggwistika sa mga sumusunod na salita: “Ang mga istatistikang pampanitikan bilang isang quantitative philosophy ng wika ay naaangkop sa lahat ng sangay ng linggwistika. Sa aming opinyon, ang literary statistics ay structural linguistics na itinaas sa antas ng quantitative science o quantitative philosophy. Kaya, mali rin na tukuyin ang mga resulta nito bilang nasa labas ng domain<115>linggwistika o ituring ito bilang pantulong na kasangkapan sa pagsasaliksik” 6 3 .

Halos hindi maipapayo na pumasok sa teorya kung ito ay lehitimo sa kasong ito na magsalita tungkol sa paglitaw ng isang bagong sangay ng linggwistika at upang malutas ang isyu ng mga pag-aangkin nito, nang hindi muna sumangguni sa pagsasaalang-alang sa kung ano ang aktwal na ginawa sa lugar na ito, at sa paglilinaw sa kung anong direksyon ang aplikasyon ng mga bagong pamamaraan 6 4 . Makakatulong ito sa atin na maunawaan ang mga pagkakaiba ng opinyon.

Ang paggamit ng mathematical (o, mas tiyak, istatistika) na pamantayan para sa paglutas ng mga problemang pangwika ay hindi na bago sa agham ng wika at, sa isang antas o iba pa, ay matagal nang ginagamit ng mga linguist. Pagkatapos ng lahat, sa katunayan, ang mga tradisyunal na konsepto ng linggwistika bilang phonetic law (at nauugnay<116>nee kasama nito - isang pagbubukod sa batas), ang pagiging produktibo ng mga elemento ng gramatika (halimbawa, mga derivational suffix), o kahit na ang pamantayan para sa mga kaugnay na relasyon sa pagitan ng mga wika, sa isang tiyak na lawak, ay batay sa mga relatibong tampok na istatistika. Pagkatapos ng lahat, mas matalas at malinaw ang istatistikal na pagsalungat ng mga naobserbahang kaso, mas maraming dahilan ang pag-uusapan natin tungkol sa produktibo at hindi produktibong mga suffix, tungkol sa phonetic na batas at mga eksepsiyon dito, tungkol sa pagkakaroon o kawalan ng pagkakamag-anak sa pagitan ng mga wika. Ngunit kung sa ganitong mga kaso ang istatistikal na prinsipyo ay ginamit nang higit pa o hindi gaanong kusang, pagkatapos ay sa hinaharap ay nagsimula itong mailapat nang sinasadya at mayroon nang isang tiyak na setting ng layunin. Kaya, sa ating panahon, ang tinatawag na mga diksyonaryo ng dalas ng bokabularyo at pagpapahayag ng mga indibidwal na wika 6 5 o kahit na ang mga kahulugan ng mga salitang multilinggwal na may "pangkalahatang pagtuon sa katotohanan" 6 6 ay naging napakalawak. Ang data ng mga diksyunaryong ito ay ginagamit upang mag-compile ng mga aklat-aralin sa wikang banyaga (ang mga teksto ay binuo sa pinakakaraniwang ginagamit na bokabularyo) at pinakamababang mga diksyunaryo. Ang statistic calculus ay natagpuan ang isang espesyal na linguistic na paggamit sa paraan ng lexicostatistics o glottochronology ni M. Swadesh, kung saan, batay sa mga istatistikal na formula na isinasaalang-alang ang mga kaso ng pagkawala mula sa mga wika ng mga salita ng pangunahing pondo, ito ay posible na maitatag ang ganap na kronolohiya ng paghihiwalay ng mga pamilya ng wika 6 7 .

Sa mga nagdaang taon, ang mga kaso ng paglalapat ng mga pamamaraang matematikal sa materyal na pangwika ay tumaas nang malaki, at sa dami ng mga naturang pagtatangka, mas marami o hindi gaanong tiyak na mga direksyon ang nakabalangkas. Lumiko tayo<117>sa kanilang sunud-sunod na pagsasaalang-alang, nang hindi naglalagay ng mga detalye.

Magsimula tayo sa direksyon na binigyan ng pangalan ng stylostatistics. Sa kasong ito, pinag-uusapan natin ang kahulugan at katangian ng mga tampok na pangkakanyahan ng mga indibidwal na akda o may-akda sa pamamagitan ng dami ng mga ugnayan ng mga elementong linggwistika na ginamit. Ang istatistikal na diskarte sa pag-aaral ng mga pang-istilong penomena ay batay sa pag-unawa sa istilong pampanitikan bilang isang indibidwal na paraan ng pag-master ng mga paraan ng wika. Kasabay nito, ang mananaliksik ay ganap na nagambala mula sa tanong ng kwalitatibong kahalagahan ng mabibilang na mga elemento ng lingguwistika, na nakatuon lamang ang lahat ng kanyang atensyon sa dami na bahagi; ang semantiko na bahagi ng pinag-aralan na mga yunit ng wika, ang kanilang emosyonal at nagpapahayag na pagkarga, pati na rin ang kanilang bahagi sa tela ng isang gawa ng sining - ang lahat ng ito ay nananatiling wala sa account, ay tumutukoy sa tinatawag na redundant phenomena. Kaya, ang isang gawa ng sining ay lumilitaw sa anyo ng isang mekanikal na pinagsama-samang, ang pagtitiyak ng pagtatayo kung saan nahanap ang pagpapahayag nito lamang sa pamamagitan ng mga numerical na relasyon ng mga elemento nito. Ang mga kinatawan ng stylostatistics ay hindi pumikit sa lahat ng mga pangyayari na nabanggit, na sumasalungat sa mga pamamaraan ng tradisyonal na estilista, na walang alinlangan na kinabibilangan ng mga elemento ng subjectivity, na may isang solong kalidad ng pamamaraan ng matematika, na, sa kanilang opinyon, ay nagbabayad para sa lahat ng mga pagkukulang nito - ang objectivity ng mga resultang nakamit. "Kami ay nagsusumikap," sumulat, halimbawa, V. Fuchs, "... upang makilala ang estilo ng pagpapahayag ng linggwistika sa pamamagitan ng matematikal na paraan. Para sa layuning ito, ang mga pamamaraan ay dapat na nilikha, ang mga resulta nito ay dapat na kasing layunin ng mga resulta ng eksaktong mga agham... Ito ay nagpapahiwatig na, hindi bababa sa simula, haharapin lamang natin ang mga pormal na katangian ng istruktura, at hindi ang nilalaman ng semantiko. ng mga ekspresyong pangwika. . Sa ganitong paraan magkakaroon tayo ng isang sistema ng ordinal na relasyon, na sa kabuuan nito ay magiging batayan at panimulang punto ng matematikal na teorya ng istilo” 6 8 .<118>

Ang pinakasimpleng uri ng istatistikal na diskarte sa pag-aaral ng wika ng mga manunulat o indibidwal na mga gawa ay ang pagbilang ng mga salitang ginamit, dahil ang kayamanan ng diksyunaryo, tila, ay dapat ding makilala ang may-akda mismo sa isang tiyak na paraan. Gayunpaman, ang mga resulta ng naturang mga kalkulasyon ay nagbibigay ng medyo hindi inaasahang mga resulta sa bagay na ito at hindi nag-aambag sa anumang paraan sa aesthetic na kaalaman at pagsusuri ng isang akdang pampanitikan, na hindi bababa sa isa sa mga gawain ng stylistics. Narito ang ilang data sa kabuuang bilang ng mga salita na ginamit sa isang bilang ng mga gawa:

Bibliya (Latin). . . . . . . . . . 5649 salita

Bibliya (Hebreo). . . . 5642 salita

Demosthenes (pagsasalita). . . . . . . . . . . . 4972 salita

Sallust. . . . . . . . . . . . . . . . . 3394 na salita

Horace. . . . . . . . . . . . . . . . . . . .6084 na salita

Dante (Divine Comedy) 5860 na salita

(kabilang dito ang 1615 na wastong pangalan at heograpikal na pangalan)

Tasso (Furious Orland). . . . 8474 salita

Milton. . . . . . . . . . . . . . . . . . . . .8000 salita (tinatayang ibinigay)

Shakespeare. . . . . . . . . . . . . . . . . . .15000 salita

(humigit-kumulang, ayon sa iba pang mga mapagkukunan 20,000 salita)

Itinuturo ni O. Jespersen na ang diksyunaryo ng Zola, Kipling at Jack London ay higit na lumampas sa diksyunaryo ng Milton, ibig sabihin, ang bilang ay 8000 6 9 . Ang pagkalkula ng diksyunaryo ng mga talumpati ni US President W. Wilson ay natagpuan na ito ay mas mayaman kaysa kay Shakespeare. Dito dapat idagdag ang data ng mga psychologist. Kaya, Terman, batay sa mga obserbasyon ng isang malaking bilang ng mga kaso, natagpuan na ang bokabularyo ng isang average na bata ay tungkol sa 3600 salita, at sa edad na 14 - na 9000. Ang average na may sapat na gulang ay gumagamit ng 11700 salita, at isang tao ng "nadagdagan katalinuhan" hanggang 13500 7 0 . Kaya, ang naturang numerical data sa kanilang sarili ay hindi nagbibigay ng anumang mga batayan para sa pagtukoy ng mga pangkakanyahan na katangian ng mga gawa at "sa layunin" lamang<119>isinasaad nila ang paggamit ng ibang bilang ng mga salita ng iba't ibang may-akda, na, gaya ng ipinapakita ng mga kalkulasyon sa itaas, ay hindi nauugnay sa kamag-anak na artistikong halaga ng kanilang mga gawa.

Ang mga kalkulasyon ng kamag-anak na dalas ng paggamit ng mga salita ng mga indibidwal na may-akda ay medyo naiiba. Sa kasong ito, hindi lamang ang kabuuang halaga ng mga salita ang isinasaalang-alang, kundi pati na rin ang dalas ng paggamit ng mga indibidwal na salita. Ang pagproseso ng istatistika ng materyal na nakuha sa ganitong paraan ay binubuo sa katotohanan na ang mga salita na may pantay na dalas ng paggamit ay pinagsama-sama sa mga klase (o mga ranggo), na humahantong sa pagtatatag ng pamamahagi ng dalas ng lahat ng mga salita na ginamit ng isang naibigay na may-akda. Ang isang espesyal na kaso ng ganitong uri ng pagkalkula ay ang pagpapasiya ng kamag-anak na dalas ng mga espesyal na salita (halimbawa, Romansa bokabularyo sa mga gawa ni Chaucer, tulad ng ginawa ni Mersand 7 1). Ang kamag-anak na dalas ng mga salitang ginamit ng mga may-akda ay naglalaman ng parehong layunin ng impormasyon tungkol sa estilo ng mga indibidwal na may-akda bilang ang kabuuang mga kalkulasyon sa itaas, na may pagkakaiba lamang na ang resulta ay mas tumpak na numerical na data. Ngunit ginagamit din ito sa petsa ng mga indibidwal na gawa ng parehong may-akda sa batayan ng isang paunang pagkalkula ng kamag-anak na dalas ng kanyang paggamit ng mga salita sa iba't ibang panahon ng kanyang buhay (ayon sa mga gawa na napetsahan ng may-akda mismo). Ang isa pang uri ng paggamit ng data mula sa naturang mga kalkulasyon ay upang maitaguyod ang pagiging tunay ng may-akda ng mga akda kung saan ang tanong na ito ay tila nagdududa 7 2 . Sa huling kaso na ito, ang lahat ay batay sa isang paghahambing ng mga istatistikal na formula para sa dalas ng paggamit sa tunay at kontrobersyal na mga gawa. Hindi na kailangang pag-usapan ang napakahusay na relativity at approximateness ng mga resulta na nakuha ng naturang mga pamamaraan. Pagkatapos ng lahat, ang kamag-anak na dalas ng paggamit ay nag-iiba hindi lamang sa edad ng may-akda, ngunit depende rin sa genre, plot, at makasaysayang kapaligiran ng akda (cf., halimbawa, "Bread" at "Peter I" ni A . Tolstoy).<120>

Ang pagpapalalim ng pamamaraang inilarawan sa itaas, ang mga stylostatistics bilang isang katangian ng istilo ay nagsimulang gumamit ng pamantayan ng katatagan ng kamag-anak na dalas ng mga pinakakaraniwang ginagamit na salita. Ang pamamaraang ginamit sa kasong ito ay maaaring ilarawan sa pamamagitan ng pagpoproseso ng istatistika ng kuwento ni Pushkin na "The Captain's Daughter" nina Esselson at Epstein sa Institute of Slavonic Languages ​​​​sa Unibersidad ng Detroit (USA) 7 3 . Ang buong teksto ng kuwento (mga 30,000 paglitaw ng mga salita) ay isinailalim sa survey, at pagkatapos ay mga sipi na naglalaman ng mga 10,000 at 5,000 paglitaw. Dagdag pa, upang matukoy ang katatagan ng kamag-anak na dalas ng paggamit ng mga salita, ang 102 pinakakaraniwang salita (na may dalas na 1160 beses hanggang 35) ay inihambing sa kinakalkula na kamag-anak na dalas (ginawa batay sa mga piling sipi) na may ang aktwal na isa. Halimbawa, ang unyon na "at" ay ginamit nang 1,160 beses sa buong kwento. Sa isang sipi na naglalaman ng 5,000 paglitaw ng lahat ng mga salita, ang pang-ugnay na ito ay inaasahang gagamitin ng 5,000 x 1,160:30,000, o i-round up ng 193 beses, at sa isang sipi na naglalaman ng 10,000 paglitaw ng lahat ng mga salita, ito ay inaasahang gagamitin ng 10,000 x 1,160: 30,000, o 386 beses. Ang paghahambing ng data na nakuha gamit ang ganitong uri ng mga kalkulasyon sa aktwal na data ay nagpapakita ng napakaliit na paglihis (sa loob ng 5%). Batay sa naturang mga kalkulasyon, natagpuan na sa kuwentong ito ni Pushkin, ang pang-ukol na "k" ay ginagamit nang dalawang beses nang mas madalas kaysa sa "y", at ang panghalip na "ikaw" ay ginagamit nang tatlong beses na mas madalas kaysa sa "kanila", atbp. Kaya , sa kabila ng lahat ng mga pagbabago sa balangkas, kapwa sa buong kuwento at sa mga indibidwal na bahagi nito, may katatagan sa relatibong dalas ng paggamit ng mga salita. Kung ano ang naobserbahan kaugnay ng ilang (pinakakaraniwan) na mga salita ay malamang na naaangkop sa lahat ng salitang ginamit sa akda. Ito ay sumusunod na ang estilo ng may-akda ay maaaring mailalarawan sa pamamagitan ng isang tiyak na ratio ng pagkakaiba-iba ng average na dalas ng paggamit ng isang salita sa pangkalahatang dalas para sa isang partikular na wika.<121>ang dalas ng paggamit nito. Ang ratio na ito ay itinuturing bilang isang layunin na quantitative na katangian ng istilo ng may-akda.

Ang iba pang pormal na elemento ng istruktura ng wika ay pinag-aaralan sa katulad na paraan. Kaya, halimbawa, isinailalim ni V. Fuchs ang metrical features ng mga gawa ni Goethe, Rilke, Caesar, Sallust, atbp. sa isang comparative-statistical na pagsasaalang-alang. 7 4

Ang pamantayan ng katatagan ng kamag-anak na dalas ng paggamit ng mga salita, habang nililinaw ang pamamaraan ng quantitative characterization ng estilo, ay hindi nagpapakilala ng anumang panimula na bago kung ihahambing sa mas primitive na pamamaraan na nasuri sa itaas. Ang lahat ng mga pamamaraan ng stylostatistics sa huli ay nagbubunga ng pantay na walang pag-asa na "layunin" na mga resulta, na dumadausdos sa ibabaw ng dila at nakakapit lamang sa mga panlabas na palatandaan. Ang mga pamamaraan ng dami, tila, ay hindi makakatuon sa mga pagkakaiba-iba ng husay sa materyal na pinag-aaralan at sa katunayan ay na-level out ang lahat ng mga bagay na pinag-aaralan.

Kung saan kailangan ang pinakamataas na detalye, ang pinaka-pangkalahatang pamantayan ay inaalok; ang mga katangiang husay ay ipinahayag sa wika ng dami. Ito ay hindi lamang isang lohikal na kontradiksyon, kundi pati na rin isang hindi pagkakasundo sa likas na katangian ng mga bagay. Sa katunayan, ano ang mangyayari kung susubukan nating makakuha ng isang comparative stylistic (i.e., samakatuwid, qualitative) na katangian ng mga gawa ni Alexander Gerasimov at Rembrandt batay sa quantitative ratio ng pula at itim na pintura sa kanilang mga canvases? Ito ay tila isang ganap na walang kapararakan. Hanggang saan ang ganap na "layunin" na dami ng impormasyon tungkol sa pisikal na data ng isang tao ay makapagbibigay sa atin ng ideya ng lahat ng bagay na nagpapakilala sa isang tao at bumubuo ng kanyang tunay na kakanyahan? Halatang wala. Maaari lamang silang magsilbi bilang isang indibidwal na tanda na nagpapakilala sa isang tao mula sa isa pa, tulad ng isang imprint ng mga convolution sa hinlalaki. Ang sitwasyon ay katulad ng mga quantitative na katangian ng istilong pampanitikan. Kung titingnang mabuti, nagbibigay sila ng kaunting data para sa paghusga sa aktwal na istilo<122>mga katangian ng wika ng may-akda, pati na rin ang isang paglalarawan ng mga convolutions sa daliri para sa pag-aaral ng sikolohiya ng tao.

Sa lahat ng nasabi, dapat idagdag na noong nakaraan, sa tinatawag na pormal na paaralan ng kritisismong pampanitikan, isang pagtatangka na gumawa ng isang quantitative na pag-aaral ng estilo ng mga manunulat, kapag ang mga epithets, metapora, at ritmiko. -binilang ang melodic elements ng taludtod. Gayunpaman, ang pagtatangka na ito ay hindi na binuo.

Ang isa pang lugar ng aplikasyon ng mga pamamaraan sa matematika para sa pag-aaral ng mga linguistic phenomena ay maaaring i-grupo sa ilalim ng pangalan ng linguistic statistics. Nilalayon nitong pumasok sa mga pangunahing katanungan ng teorya ng wika, at sa gayon ay makakuha ng bokasyon sa larangan ng linggwistika mismo. Upang maging pamilyar sa direksyon na ito, pinakamahusay na bumaling sa nabanggit na gawain ni Herdan, sa mga salita ng isa sa maraming tagasuri nito, "isang napakalaking mapagpanggap na libro" 7 5 , gayunpaman, nakatanggap ng malawak na tugon sa mga linggwista 7 6 . Sa pagtingin sa katotohanan na si Herdan (tulad ng nabanggit na sa itaas) ay naghangad na kolektahin sa kanyang aklat ang lahat ng pinakamahalaga sa larangan ng aplikasyon ng mga pamamaraan sa matematika sa mga problema sa linggwistika, sa kanyang aklat ay talagang hindi tayo nakikitungo kay Herdan bilang isang buo. uso. Gaya ng ipinakikita ng mismong pamagat ng aklat, Language as Choice and Probability, ang pangunahing pokus nito ay ang paglilinaw kung ano sa wika ang natitira sa malayang pagpili ng nagsasalita at kung ano ang dahil sa imanent structure ng wika, tulad nito. sa pagtukoy ng quantitative ratio ng mga elemento ng una at pangalawang order. Ang aklat ni Kherdan ay nagbibigay ng halos kumpletong impormasyon tungkol sa lahat ng gawain sa lugar na ito na isinasagawa ng mga kinatawan ng iba't ibang mga specialty.<123>(mga pilosopo, lingguwista, mathematician, technician), ngunit hindi limitado dito at kasama ang maraming orihinal na obserbasyon, pagsasaalang-alang at konklusyon ng may-akda mismo. Bilang isang pagbubuod ng gawain, nagbibigay ito ng isang magandang ideya ng dami ng mga pamamaraan na ginamit, at ng mga resulta na nakamit sa kanilang tulong. Ang mga tanong na may kondisyong pinagsama-sama namin sa seksyon ng mga istatistika ng lingguwistika ay tinatalakay sa ikalawa at ikaapat na bahagi ng aklat.

Sa maraming mga kaso ng paglalapat ng mga pamamaraan ng matematikal na istatistika sa pag-aaral ng mga isyung pangwika, tututuon natin ang mga pinakapangkalahatan, na maaari ding ituring na pinakakaraniwan. Paggamit ng data mula sa ibang mga may-akda - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Deway 8 1 at iba pa, gayundin ang pagbanggit sa sarili niyang mga pag-aaral na tumutukoy sa relatibong dalas ng pamamahagi ng mga ponema, titik, haba ng salita (nasusukat sa bilang ng mga titik at pantig) , mga anyo ng gramatika at mga elemento ng panukat sa Latin at Greek na hexameter, itinatatag ni Herdan ang katotohanan ng katatagan ng relatibong dalas ng mga elementong linggwistika bilang karaniwang katangian ng lahat ng istrukturang pangwika. Nakuha niya ang sumusunod na tuntunin: "Ang mga proporsyon ng mga elemento ng linggwistika na kabilang sa isa o ibang antas o saklaw ng linguistic coding - ponolohiya, gramatika, sukatan - ay nananatiling pare-pareho para sa isang partikular na wika, sa isang takdang panahon ng pag-unlad nito at sa loob ng mga limitasyon ng sapat na malawak at walang kinikilingan na isinasagawang mga obserbasyon. » 8 2 . Ang panuntunang ito, na tinawag ni Herdan na pangunahing batas ng wika, ay hinahangad niyang bigyang-kahulugan at palawakin sa isang tiyak na paraan. "Siya," isinulat ni Herdan tungkol sa batas na ito, "ay isang pagpapahayag ng katotohanan na kahit dito, kung saan ang kalooban ng tao at kalayaan sa pagpili ay ipinagkaloob.<124>ang pinakamalawak na balangkas, kung saan ang malay-tao na pagpili at walang malasakit na paglalaro ay kahalili sa isa't isa, mayroong malaking katatagan sa kabuuan... sa gramatika, ngunit kaugnay din ng dalas ng paggamit ng mga partikular na ponema, leksikal na mga yunit (mga salita) at mga ponemang panggramatika at mga konstruksyon; sa madaling salita, ang pagkakatulad ay hindi lamang sa kung ano ang ginagamit, kundi pati na rin sa kung gaano kadalas ito ginagamit” 8 3 . Ang sitwasyong ito ay dahil sa maliwanag na mga dahilan, ngunit ito ay nagbibigay ng mga bagong konklusyon. Kapag sinusuri ang iba't ibang mga teksto o mga segment ng isang partikular na wika, halimbawa, makikita na ang mga relatibong frequency ng paggamit ng isang partikular na ponema (o iba pang elemento ng pagsasalita) ng iba't ibang tao ay nananatiling pareho. Ito ay humahantong sa interpretasyon ng mga indibidwal na anyo ng pananalita bilang ilang mga pagbabago sa patuloy na posibilidad ng paggamit ng itinuturing na ponema sa isang partikular na wika. Kaya, lumalabas na sa kanyang aktibidad sa pagsasalita ang isang tao ay napapailalim sa ilang mga batas ng posibilidad na may kaugnayan sa bilang ng mga elemento ng lingguwistika na ginamit. At pagkatapos, kapag naobserbahan natin ang isang malaking bilang ng mga elemento ng linggwistika sa isang malaking hanay ng mga teksto o mga segment ng pagsasalita, nakukuha natin ang impresyon ng sanhi ng pag-asa sa kahulugan na sa kasong ito ay mayroon ding pagpapasiya kaugnay sa paggamit ng ilang mga elemento ng linggwistika. . Sa madaling salita, lumalabas na katanggap-tanggap na igiit na kung ano ang tila intuitively na isang sanhi na relasyon ay quantitatively isang probabilidad 8 4 . Malinaw na mas malaki ang kabuuan<125>ang pagtitiyak ng mga sinuri na mga teksto o mga segment ng pagsasalita, mas malinaw na ang katatagan ng kamag-anak na dalas ng paggamit ng mga elemento ng lingguwistika ay makikita din sa indibidwal na paggamit (ang batas ng malalaking numero). Mula dito, nabuo ang isang bagong pangkalahatang konklusyon na ang wika ay isang mass phenomenon at dapat tratuhin nang ganoon.

Ang mga konklusyong ito, na naabot batay sa mga kalkulasyon ng dalas ng mga elemento ng phonetic, mga salita at mga anyo ng gramatika, na magkakasamang bumubuo ng isang wika, ay inilapat sa "istatistikong interpretasyon" ng paghahati ni Saussure sa "wika" (lalangue) at "speech" (laparole). ). Ayon kay Saussure, ang "wika" ay isang hanay ng mga gawi sa wika na ginagawang posible ang komunikasyon sa pagitan ng mga miyembro ng isang partikular na komunidad ng linggwistika. Ito ay isang panlipunang realidad, isang "mass phenomenon", obligado para sa lahat ng taong nagsasalita ng wikang ito. Ang Herdan, gaya ng ipinahiwatig, ay nagpapatunay na ang mga miyembro ng iisang komunidad ng wika ay magkatulad sa isa't isa hindi lamang sa paggamit nila ng parehong mga ponema, leksikal na yunit at mga anyo ng gramatika, ngunit gayundin sa katotohanan na ang lahat ng mga elementong ito ay ginagamit na may parehong dalas. . Kaya, ang kanyang istatistikal na kahulugan ng "wika" ay tumatagal ng sumusunod na anyo: "wika" (lalangue) ay ang kabuuan ng mga karaniwang elemento ng lingguwistika kasama ang kanilang relatibong posibilidad na magamit.

Ang kahulugang ito ng "wika" ay siya ring panimulang punto para sa kaukulang istatistikal na interpretasyon ng "speech", na, ayon kay Saussure, ay isang indibidwal na pahayag. Sa paghahambing ng "wika" bilang isang panlipunang kababalaghan ng "pagsasalita" bilang isang indibidwal na kababalaghan, isinulat ni Saussure: "Ang pagsasalita ay isang indibidwal na pagkilos ng kalooban at pag-unawa, kung saan kinakailangan na makilala ang: 1. mga kumbinasyon kung saan ginagamit ng paksang nagsasalita ang wika code upang maipahayag ang kanyang personal na kaisipan; 2. isang psychophysical mechanism na nagpapahintulot sa kanya na bigyang-diin ang mga kumbinasyong ito” 8 5 . Dahil ang "wika" sa linguistic statistics ay itinuturing bilang isang set ng mga elemento na may isang tiyak na kamag-anak<126>tiyak na posibilidad ng kanilang paggamit, hangga't kasama nito ang kabuuang istatistika o grupo (populasyon) bilang ang pinakamahalagang katangian at maaaring isaalang-alang sa aspetong ito. Alinsunod dito, ang "speech" ay nagiging isang hiwalay na sample na kinuha mula sa "wika" bilang isang statistical aggregate. Ang posibilidad sa kasong ito ay tinutukoy ng ratio ng "speech" sa "wika" (sa kanilang "quantitative" na pag-unawa), at ang distribusyon ng relatibong dalas ng paggamit ng iba't ibang elemento ng wika ay binibigyang-kahulugan bilang resulta ng isang kolektibong "pagpipilian" (pagpipilian) sa isang tiyak na kronolohikal na panahon ng pagkakaroon ng wika. Napagtatanto na ang gayong interpretasyon ng mga pagkakaiba sa pagitan ng "wika" at "pagsasalita" ay itinayo sa ganap na naiibang mga batayan kaysa kay Saussure, isinulat ni Herdan tungkol dito: "Itong tila maliit na pagbabago ng konsepto ni Saussure ay may mahalagang bunga na ang "wika" ( lalangue ) ngayon ay nakakakuha ng isang mahalagang katangian sa anyo ng isang pinagsama-samang istatistika (populasyon). Ang populasyon na ito ay nailalarawan sa pamamagitan ng ilang mga relatibong frequency o mga probabilidad ng pagbabagu-bago, ibig sabihin, ang bawat elemento ng lingguwistika ay kabilang sa isang tiyak na antas ng lingguwistika. Sa kasong ito, ang "speech" (laparole), alinsunod sa kahulugan nito, ay lumalabas na isang termino para sa pagtukoy sa mga sample ng istatistika na kinuha mula sa "wika" bilang isang istatistikal na populasyon. Ito ay nagiging malinaw na ang pagpipilian (pagpipilian) ay lilitaw dito sa anyo ng ratio ng "speech" sa "wika", bilang ratio ng isang sample na kinuha nang random sa isang statistical aggregate (populasyon). Ang mismong pagkakasunud-sunod ng pamamahagi ng dalas, bilang isang deposito ng aktibidad ng pagsasalita ng isang pamayanang lingguwistika sa mga siglo, ay isang elemento ng pagpili (pagpipilian), ngunit hindi ng indibidwal na pagpipilian, tulad ng sa estilo, ngunit ng kolektibong pagpili. Gamit ang isang metapora, maaari nating pag-usapan dito ang tungkol sa pagpili na ginawa ng diwa ng wika, kung naiintindihan natin sa pamamagitan nito ang mga prinsipyo ng komunikasyong pangwika, na alinsunod sa kumplikadong data ng kaisipan ng mga miyembro ng isang partikular na komunidad ng linggwistika. Ang katatagan ng serye ay resulta ng posibilidad (pagkakataon)» 8 6 .

Isang espesyal na kaso ng paglalapat ng nakasaad na prinsipyo<127>Ang pa ay ang delimitation sa wika ng normative phenomena mula sa "exceptions" (deviations). Sa linguostatistics, pinagtatalunan na ginagawang posible ng istatistikal na paraan na alisin ang fuzziness na umiiral sa isyung ito at magtatag ng malinaw na pamantayan para sa pagkilala sa pagitan ng mga phenomena na ito. Kung ang pamantayan ay nauunawaan bilang isang istatistikal na populasyon (sa kahulugan sa itaas), at ang pagbubukod (o pagkakamali) ay isang paglihis mula sa mga frequency na ipinapakita ng istatistikal na populasyon, kung gayon ang isang quantitative na solusyon ng tanong ay nagmumungkahi mismo. Ang lahat ay nagmumula sa isang istatistikal na relasyon sa pagitan ng "populasyon" at "outlier". Kung ang mga frequency na naobserbahan sa isang indibidwal na sample ay lumihis mula sa mga probabilidad dahil sa istatistikal na populasyon ng higit pa kaysa sa natutukoy ng isang serye ng mga bilang ng sample, kung gayon mayroon kaming dahilan upang tapusin na ang linya ng demarcation sa pagitan ng "pareho" (karaniwan) at "hindi ang parehong" (exception) ay nilabag.

Ang dami ng pagkakaiba sa pagitan ng "wika" at "pagsasalita" ay ginagamit din upang makilala ang dalawang uri ng mga elemento ng lingguwistika: gramatikal at leksikal. Ang panimulang punto para sa paglutas ng problemang ito, na kadalasang naghaharap ng malalaking paghihirap mula sa pananaw na pangwika, ay ang pagpapalagay na ang antas ng dalas ng mga elemento ng gramatika ay iba kaysa sa mga lexical na yunit. Ito ay di-umano'y nauugnay sa "paglalahat" ng mga elemento ng gramatika, kung paano sila naiiba sa mga konsepto na itinatakda ng mga lexical na yunit. Bilang karagdagan, ang mga elemento ng gramatika ay dapat, bilang isang panuntunan, na mas maliit sa dami: bilang mga independiyenteng salita (kabilang ang mga panghalip, pang-ukol, pang-ugnay at pantulong na mga salita) karaniwang binubuo sila ng isang maliit na bilang ng mga ponema, at sa anyo ng "mga konektadong anyo. " - mula sa isa o dalawang ponema 8 7 . Kung mas maliit ang elemento ng linggwistika, mas mababa ang kakayahan nitong "haba" (quantitative moment) na magsilbi bilang isang pagtukoy na katangian, at mas mahalaga ang "kalidad" ng mga ponema na nakukuha para sa layuning ito. Anong mga pamamaraan ang iminungkahi upang malutas ang problemang isinasaalang-alang? Ito ay nalulutas sa pamamagitan ng pagtukoy sa puro quantitative na konsepto ng gramatikal<128>load, "Ipagpalagay," isinulat ni Herdan sa koneksyon na ito, "na kami ay interesado sa paghahambing ng dalawang wika sa bagay na ito. Paano natin matutukoy sa isang tiyak na antas ng objectivity ang "grammatical load" na dinadala ng isang wika? Malinaw na ang load na ito ay magdedepende sa posisyon ng demarcation line na naghihiwalay sa grammar sa bokabularyo. Ang unang pagsasaalang-alang na maaaring pumasok sa ating isipan ay upang matukoy kung gaano "kumplikado" ang gramatika ng isang partikular na wika. Pagkatapos ng lahat, ang "complexity" ay isang qualitative na katangian, at ang konsepto ng "grammatical load" ay isang quantitative na katangian. Totoo, ang pag-load sa isang tiyak na lawak ay nakasalalay sa pagiging kumplikado, ngunit hindi ganap. Ang isang wika ay maaaring gantimpalaan ng isang lubhang kumplikadong gramatika, ngunit isang medyo maliit na bahagi lamang nito ang ginagamit sa aktibidad ng wika. Tinukoy namin ang "pagkarga ng gramatika" bilang ang kabuuan ng gramatika na dinadala ng isang wika kapag ito ay kumikilos, na agad na nagdadala ng aming problema sa larangan ng istrukturang linggwistika sa kahulugan kung saan ang disiplina ay tinukoy ni Saussure. Sa sumusunod na presentasyon, ginagamit ang mga quantitative na pamamaraan upang matukoy ang pagkakaiba ng mga wika, depende sa kung saan matatagpuan ang hangganan, na naghihiwalay sa gramatika sa bokabularyo” 8 8 . Sa madaling salita, ang mga pagkakaiba ng wika sa kasong ito ay dapat na bawasan sa mga pagkakaiba sa mga numerical na relasyon sa pagitan ng mga elemento ng gramatika at leksikal.

Ang mga materyales sa aming pagtatapon ay nagpinta ng sumusunod na larawan. Sa Ingles ("mga salitang gramatika" lamang ang isinasaalang-alang: mga panghalip, o, kung tawagin din sila, "mga kapalit", mga pang-ukol, mga pang-ugnay at pantulong na pandiwa), sa isang segment na kinabibilangan ng 78633 mga kaso ng paggamit ng lahat ng mga salita (1027 iba't ibang salita), 53,102 ang kaso ng paggamit ng mga elemento ng gramatika, o, mas tiyak, "mga salitang gramatika" (149 iba't ibang salita), na 67.53% na may 15.8% ng iba't ibang salita. Ganito ang datos ng Deway 8 9 . Ang ibang data ay nagpapakita ng ibang porsyento<129>ratio: 57.1% na may 5.4% iba't ibang salita 9 0 . Ang makabuluhang pagkakaibang ito ay ipinaliwanag sa pamamagitan ng pagkakaiba sa pagitan ng nakasulat at pasalitang wika. Ang mga nakasulat na anyo ng wika (unang datos) ay diumano'y gumagamit ng mas maraming elemento ng gramatika kaysa sa bibig (pangalawang kaso). Sa Divine Comedy ni Dante (pagkatapos ng orihinal na Italyano), itinatag ni Mariotti ang 54.4% ng mga paglitaw ng "mga salita sa gramatika".

Ang isa pa at, tila, isang mas perpektong paraan upang matukoy ang grammatical load ng isang wika ay ang bilangin ang mga ponema na kasama sa mga elemento ng gramatika. Sa kasong ito, hindi lamang independiyenteng mga salita sa gramatika ang isinasaalang-alang, kundi pati na rin ang mga kaugnay na anyo. Mayroong iba't ibang mga pagpipilian dito. Halimbawa, ang pagtukoy sa kamag-anak na dalas ng paggamit ng mga indibidwal na ponemang katinig sa mga elemento ng gramatika at paghahambing ng mga ito sa dalas ng kabuuang paggamit ng parehong mga ponemang ito (ang panghuling data ng naturang ratio sa Ingles ay nagbibigay ng isang proporsyon ng 99.9% hanggang 100,000 - kabuuang paggamit); o katulad na paghahambing ng mga katinig ayon sa magkakahiwalay na pangkat ng pag-uuri (labial, palatal, velar at iba pang ponema). Ang huling ratio dito ay nasa anyo ng isang proporsyon na 56.47% (sa mga elemento ng gramatika) hanggang 60.25% (sa kabuuang paggamit); o ang parehong paghahambing ng mga panimulang ponemang katinig (sa kasong ito, ang ratio ay 100.2% sa gramatikal na mga salita hanggang 99.95 sa kabuuang paggamit). Ang iba pang mas kumplikadong istatistikal na operasyon ay posible rin, na, gayunpaman, ay nagreresulta sa mga katulad na dami ng pagpapahayag ng problemang pinag-aaralan.

Ang ibinigay na quantitative data ay nagsisilbing batayan para sa isang pangkalahatang konklusyon. Nagsisimula ito sa katotohanan na ang distribusyon ng mga ponema sa mga elemento ng gramatika ay tumutukoy sa likas na katangian ng distribusyon (sa mga terminong numero, siyempre) ng mga ponema sa wika sa kabuuan. At ito, sa turn, ay nagpapahintulot sa amin na tapusin na ang paggamit ng mga elemento ng gramatika sa pinakamaliit na lawak ay nakasalalay sa indibidwal na pagpili at bumubuo sa bahaging iyon ng linguistic expression na kinokontrol ng mga probabilidad.<130>ness. Ang haka-haka na konklusyon na ito ay nakumpirma sa pamamagitan ng pagkalkula ng mga gramatikal na anyo sa wikang Ruso, na ginawa ni Esselson 9 1 . Ang pag-aaral ay sumailalim sa 46896 na mga salita na kinuha mula sa mga mapagkukunan ng II (mga gawa ni Griboedov, Dostoevsky, Goncharov, Saltykov-Shchedrin, Garshin, Belinsky, Amfiteatrov, Gusev-Orenburgsky, Ehrenburg, Simonov at N. Ostrovsky). Hinati ang mga ito sa mga kolokyal na salita (17,756 na salita o 37.9%) at di-kolokyal (29140 na salita o 62.1%). Pagkatapos ang buong hanay ng mga salita ay nahahati sa 4 na pangkat depende sa kanilang gramatikal na katangian: ang 1st group ay kinabibilangan ng mga pangngalan, pang-uri, pang-uri sa pag-andar ng mga pangngalan, panghalip at inflected numeral; sa ika-2 pangkat - mga pandiwa; sa ika-3 pangkat - mga pandiwang participle, mga participle sa pag-andar ng mga adjectives at nouns at gerunds; sa ika-4 na pangkat - hindi nagbabagong anyo ng pang-abay, pang-ukol, pang-ugnay at mga partikulo. Ang mga resulta ng buod (ibinigay din ang mga talahanayan na may data para sa mga indibidwal na may-akda) ng sumusunod na ratio:

1st group

2nd group

ika-3 pangkat

ika-4 na pangkat

kolokyal

hindi umiimik

Inilarawan ni Herdan ang pagsasaalang-alang sa dami ng datos na nakuha sa mga sumusunod na salita: "Ibinigay nila ang konklusyon na ang mga elemento ng gramatika ay dapat isaalang-alang bilang isang salik na tumutukoy sa posibilidad ng isang pagpapahayag ng wika. Ang ganitong konklusyon ay umiiwas sa mabigat na kwalipikasyon ng bawat salitang ginamit. Malinaw na, dahil ang gramatika at bokabularyo ay hindi nakaimbak sa hindi tinatablan ng tubig na mga shell, hindi rin purong "pagpipilian" o purong "pagkakataon." Ang parehong gramatika at bokabularyo ay naglalaman ng parehong mga elemento, bagaman sa makabuluhang pagkakaiba-iba ng mga proporsyon” 9 2 .<131>

Ang isang malaking bahagi ng aklat ni Herdan ay nakatuon sa pag-aaral ng duality o duality sa wika, at ang mismong konsepto ng duality ay batay sa mga katangiang matematikal.

Kaya, ang mga theorem sa projective geometry ay maaaring isaayos sa dalawang serye, upang ang bawat theorem ng isang serye ay maaaring makuha mula sa ilang theorem ng isa pang serye sa pamamagitan ng pagpapalit ng mga salita tuldok at tuwid. Halimbawa, kung ang pahayag ay ibinigay: "anumang magkaibang mga punto ay nabibilang sa isa at isang linya lamang," maaari nating makuha mula rito ang katumbas na pahayag: "anumang dalawang magkaibang linya ay nabibilang sa isa at isang punto lamang." Ang isa pang paraan para sa pagtukoy ng duality ay ang pag-plot ng iba't ibang mga eroplano ng phenomenon sa ilalim ng pag-aaral kasama ang abscissa at ordinates. Kaya, tulad ng ginagawa, halimbawa, Yul 9 3, ang iba't ibang frequency ng paggamit ay binibilang sa kahabaan ng abscissa axis, at ang bilang ng mga lexical unit na ang frequency ay tinutukoy, atbp., ay binibilang kasama ang ordinate axis. .linguistic research.

Sa ilalim ng konsepto ng duality na tinukoy sa paraang ito, na sa lahat ng mga kaso ay aktwal na may katangian ng isang binary code at kung saan ay itinuturing din na pinakamahalagang katangian ng istrukturang linggwistika, ang mga phenomena ng lubhang magkakaibang mga katangian ay dinala, na nagpapahintulot sa pagsalungat sa dalawang eroplano. : ang distribusyon ng paggamit ng mga salita ayon sa katangian ng mga leksikal na yunit at ang distribusyon ng mga leksikal na yunit ayon sa dalas.ang paggamit ng mga salita; nakasulat at pasalitang anyo ng pananalita; leksikal at gramatika na mga elemento; kasingkahulugan at kasalungat; ponema at ang grapikong representasyon nito; definable and defining (Saussure's signifiant and signifiy), atbp.

Pagkatapos ng isang quantitative na pag-aaral ng duality ng isa o isa pang partikular, linguistic phenomenon o limitadong "text", bilang isang panuntunan, ang isang konklusyon ay iginuhit, kung saan ang mga katangian ng linguistic universality ay maiugnay. Ang likas na katangian ng gayong mga konklusyon at ang paraan ng pagbibigay-katwiran sa mga ito ay makikita sa halimbawa<132>pag-aaral ng duality ng salita at konsepto (sa katunayan, pinag-uusapan natin ang ratio ng haba ng salita at dami ng konsepto - dapat tandaan na ang sobrang malayang paggamit ng linguistic at iba pang termino sa ang ganitong mga gawa ay kadalasang nagpapahirap sa pag-unawa). Mahalagang tandaan dito na ang internasyonal na katawagan ng mga sakit (mga 1000 pangalan) at ang pangkalahatang rehistro ng mga sakit sa England at Wells para sa 1949 ay ginamit bilang pinagmumulan ng mga obserbasyon ng ganitong uri ng linguistic duality. Sa kasong ito, ang sumusunod na pangkalahatang ginawa ang konklusyon: “ Bawat konsepto na nagsasaad ng pangkalahatang ideya ay may tinatawag na "sphere" o "volume." Pinapayagan nito sa pamamagitan ng daluyan nito na mag-isip tungkol sa maraming mga bagay o iba pang mga konsepto na nasa loob ng "sphere" nito. Sa kabilang banda, ang lahat ng mga bagay na kailangan upang tukuyin ang isang konsepto ay bumubuo ng tinatawag na "nilalaman" nito. Ang dami at nilalaman ay magkaugnay - mas maliit ang nilalaman at, nang naaayon, mas abstract ang konsepto, mas malaki ang saklaw o dami nito, ibig sabihin, mas maraming bagay ang dinadala sa ilalim nito. Ito ay makikita bilang isang pagkakatulad (sa conceptual sphere) sa mga prinsipyo ng coding, ayon sa kung saan ang haba ng isang simbolo at dalas ng paggamit ay magkakaugnay” 9 4 .

Ang prinsipyo ng duality ay nalalapat din sa mga partikular na problema. Halimbawa, kapag nagtatatag ng katumbas ng mga kahulugan ng mga salita sa dalawang magkaibang wika. Bilang resulta ng pag-aaral ng English-German na diksyunaryo ng Muret-Zanders gamit ang matematikal na paraan ng mga pag-ulit, napagpasyahan na ang posibilidad ng paggamit ng isang salitang Ingles na may isa o higit pang mga kahulugan sa pagsasalin ng Aleman ay nananatiling pare-pareho para sa bawat unang titik sa buong diksyunaryo 9 5 . Ang pagsasaalang-alang sa pagkakasunud-sunod ng salita sa mga diksyunaryo ng Tsino ay humahantong sa konklusyon na ito ay isang likas na taxonomic, dahil ang bilang ng mga stroke sa karakter ay nagpapahiwatig ng lugar nito (bilang isang independiyenteng radikal o isang tiyak na subclass na subordinate sa radikal). Ang taxonomy ay isang subordinating na prinsipyo ng klasipikasyon na ginagamit sa zoology at botany. Inaangkin ni Kherdan iyon<133>ang mga pundasyon ng Chinese lexicography ay binuo din sa mga prinsipyo ng taxonomy 9 6, atbp.

Ang paggawa ng isang pangkalahatang pagtatasa sa lugar na ito ng aplikasyon ng mga pamamaraan ng matematika sa pag-aaral ng mga problema sa linggwistika (i.e., mga istatistika ng lingguwistika), tila, kinakailangan upang magpatuloy mula sa posisyon na binuo ni Ettinger: "Maaaring epektibong magamit ang matematika. sa serbisyo ng linggwistika lamang kapag malinaw na sa mga linggwista ang tunay na limitasyon ng aplikasyon nito, gayundin ang mga posibilidad ng mga modelong matematikal na ginamit” 9 7 . Sa madaling salita, maaari nating pag-usapan ang tungkol sa linggwistika ng matematika kapag pinatunayan ng mga pamamaraang matematika ang kanilang pagiging angkop para sa paglutas ng mga problemang pangwika nang wasto, na sa kabuuan ng mga ito ay bumubuo ng agham ng wika. Kung hindi ito ang kaso, kahit na ito ay maaaring magbukas ng mga bagong aspeto ng siyentipikong pananaliksik, kung gayon sa kasong ito maaari nating pag-usapan ang anumang bagay, ngunit hindi tungkol sa linggwistika - sa kasong ito, ang ibig sabihin ay hindi iba't ibang uri ng inilapat na linggwistika (pag-uusapan natin ang tungkol sa ito mamaya). talumpati sa ibaba), ngunit siyentipiko, o teoretikal, linggwistika. Batay sa posisyon na ito, dapat tandaan na mula sa punto ng view ng isang linguist, marami sa linguistic statistics ay nagdududa at kahit na nakakalito.

Bumaling tayo sa pagsusuri ng dalawang halimbawa lamang (upang hindi magulo ang presentasyon), na nagsasaad na ang mga napakalaking pagtutol ay maaaring gawin sa bawat isa sa kanila. Dito mayroon tayong quantitative distinction sa pagitan ng grammatical at lexical units. Lumalabas na upang makagawa ng gayong pagkakaiba, kinakailangan na malaman nang maaga kung ano ang nabibilang sa larangan ng gramatika, at kung ano ang bokabularyo, dahil ang "pagkarga ng gramatika" ng wika (i.e., ang kabuuan ng mga elemento ng gramatika ginamit sa pananalita), gaya ng ipinahiwatig sa sinipi sa itaas, "ay depende sa linya ng demarcation na naghihiwalay sa bokabularyo mula sa gramatika." Nang hindi nalalaman kung saan namamalagi ang linyang ito, samakatuwid imposibleng iguhit ang ipinahiwatig na pagkakaiba. Ano nga ba ang kahulugan ng quantitative method ng pagkilala sa leksikal mula sa gramatika?<134>matic? Gayunpaman, para kay Herdan, hindi siya partikular na nag-iisip tungkol sa isyung ito at matapang na nag-uuri ng mga elemento ng lingguwistika, na tumutukoy sa mga elemento ng gramatika na "mga kaugnay na anyo", na, sa paghusga sa pagtatanghal, ay dapat na maunawaan bilang panlabas na inflection, at "mga salitang gramatika", na isama ang mga pang-ukol , pang-ugnay, pantulong na pandiwa at panghalip - ang huli sa pamamagitan ng katotohanan na sila ay "mga kahalili". Ngunit kung pag-uusapan lamang natin ang kalidad ng mga panghalip na ito at sa batayan na ito ay nauugnay ang mga ito sa mga elemento ng gramatika, kung gayon, malinaw naman, ang mga salitang tulad ng "nabanggit", "pinangalanan", "ibinigay", atbp., ay dapat ding maiugnay sa kanila, kaya kung paano rin sila kumilos bilang mga kinatawan. Kaugnay ng paraan ng paghihiwalay ng mga elemento ng gramatika na ginagamit sa mga istatistika ng lingguwistika, natural na lumilitaw ang tanong kung paano haharapin sa kasong ito ang gayong "di-pormal" na mga phenomena ng gramatika tulad ng pagkakasunud-sunod ng salita, tono, zero morphemes, paradigmatic na relasyon (ilan sa mga penomena na ito. , sa pamamagitan ng paraan, maghanap ng pagmuni-muni sa mga wikang iyon na pinag-aaralan ng mga pamamaraan ng matematika)? Paano gumuhit ng pagkakaiba sa mga wika na may mayaman na panloob na inflection (tulad ng, halimbawa, sa mga Semitic na wika), kung saan hindi lamang binago ng gramatika ang ugat (radikal), ngunit binibigyan din ito ng leksikal na pag-iral, dahil ang ugat na walang permutasyon ay may walang tunay na pag-iral sa wika? Ano ang dapat na maunawaan ng pagiging kumplikado ng gramatika ng isang wika, sa anong pamantayan ito natutukoy? Kung ang quantitative point, na sa kasong ito ay binibigyang-diin sa lahat ng posibleng paraan, kung gayon ang isa sa pinakamahirap na gramatika na mga wika ay magiging Ingles, na mayroong mga konstruksyon tulad ng Ishallhavebeencalling o Hewouldhavebeencalling. Sa mga pangungusap na ito, ang tawag lamang ang maaaring mauri bilang leksikal, at lahat ng iba pa, samakatuwid, ay dapat ituring na gramatikal. Anong mga batayan ang umiiral para sa pag-uugnay ng dalas ng paggamit ng mga elemento ng gramatika sa pangkalahatan o abstractness ng mga kahulugan ng mga gramatikal na salita? Pagkatapos ng lahat, ito ay lubos na halata na ang medyo malaking dalas ng paggamit ng mga elemento ng gramatika ay tinutukoy ng kanilang pag-andar sa pagbuo ng mga pangungusap, at para sa abstractness ng mga kahulugan, napakadaling makahanap ng isang malaking<135>ang bilang ng mga leksikal na elemento na madaling makipagkumpitensya sa mga elemento ng gramatika sa bagay na ito, na higit na mababa sa kanila sa dalas (halimbawa, pagiging, pagkakaroon, extension, espasyo, sangkap atbp).

Ang isang katulad na uri ng kahangalan ay lumitaw sa harap natin sa kaso ng kahulugan ng duality (duality) ng salita at konsepto. Kinakailangan na magkaroon ng isang kakaibang pag-unawa sa istrukturang kakanyahan ng wika upang isailalim ito sa pagsasaliksik gamit ang mga katawagan ng mga sakit at ang rehistro ng mga sakit sa ospital, na, tulad ng ipinahiwatig sa itaas, ay nagsilbing mapagkukunan ng materyal para sa napakahalagang linguistic. mga konklusyon. Nang hindi isinasaalang-alang ang ganap na hindi malinaw na paggamit ng mga naturang termino na walang linguistic na pag-iral, tulad ng globo, saklaw at nilalaman ng isang konsepto (nga pala, ang lexical na kahulugan ng salita at ang konsepto na tinutukoy ng siyentipikong termino ay masyadong nalilito), buksan natin ang konklusyon na ginawa sa kasong ito. Gaya ng nakasaad sa itaas, kami ay nakikitungo sa assertion na "saklaw at nilalaman ay magkaugnay." Ang buong kurso ng pangangatwiran na nagbubunga ng gayong konklusyon, pati na rin ang paraan ng matematikal na operasyon ng mga katotohanang pangwika, ay malinaw na nagpapakita na sa kasong ito ang isang napakahalagang kalidad ng wika ay ganap na binabalewala, na nakakasira sa lahat ng mga kalkulasyon na isinasagawa. : ang kakayahang ipahayag ang parehong bagay. nilalaman” ng mga yunit ng lingguwistika ng iba't ibang "volume", na walang alinlangan, bukod pa rito, magkaibang kamag-anak na dalas ng paggamit. Kaya, maaari naming italaga ang parehong tao bilang Petrov, ang aking kakilala, siya, isang Muscovite, isang binata, isang empleyado sa unibersidad, kapatid ng aking asawa, isang lalaki na nakilala namin sa tulay, atbp. Sa liwanag ng gayong mga katotohanan, mayroong Walang pag-aalinlangan ay mga partikular na konklusyon lamang, na, gayunpaman, tulad ng itinuro, ay binibigyan ng unibersal na kabuluhan, ngunit gayundin ang pagiging angkop ng paggamit ng mga pamamaraan ng dami sa kanilang mga problemang pangwika.

Ngunit kung minsan ang mga linggwista ay nag-aalok ng mga konklusyon, ang bisa nito ay walang pagdududa. Ito ang "pangunahing batas ng wika", na binubuo sa katotohanan na sa wika ay may isang tiyak na katatagan ng mga elemento nito at ang kamag-anak na dalas ng kanilang pagbanggit.<136>pagkonsumo. Ang problema sa ganitong uri ng mga pagtuklas, gayunpaman, ay matagal na silang kilala sa mga linggwista. Kung tutuusin, malinaw na kung ang wika ay walang tiyak na katatagan at ang bawat miyembro ng isang partikular na komunidad ng linggwistika ay malayang nag-iiba-iba ng mga elemento ng wika, kung gayon ang komunikasyon sa isa't isa ay hindi magiging posible at ang mismong pag-iral ng wika ay magiging walang kabuluhan. . Tulad ng para sa pamamahagi ng kamag-anak na dalas ng paggamit ng mga indibidwal na elemento ng wika, natagpuan nito ang pagpapahayag nito sa linggwistika sa anyo ng paglalaan ng mga kategorya ng passive at aktibong bokabularyo at gramatika, kung saan binigyang pansin ni L. V. Shcherba. Sa kasong ito, ang mga istatistikal na pamamaraan ay makakatulong lamang sa mga linggwista sa pamamahagi ng mga partikular na elemento ng linggwistika ayon sa mga kategorya ng relatibong dalas ng kanilang paggamit, ngunit wala silang dahilan upang i-claim na makatuklas ng anumang mga bagong pattern na mahalaga para sa teoretikal na lingguwistika.

Sa kabilang banda, ang linguostatistics ay nag-aalok ng ilang tunay na "orihinal" na mga konklusyon, na lubos na nagpapahiwatig ng likas na katangian ng siyentipikong pag-iisip ng mga tagasunod nito. Kaya, ang "vocabularyong pampulitika" sa mga gawa ni Churchill, Benes, Halifax, Stresemann at iba pa ay pinag-aaralan gamit ang mga kumplikadong istatistikal na pamamaraan, at ang mga pagsasalin ng kanilang mga gawa sa Ingles ay ginagamit sa mga kalkulasyon para sa mga hindi nagsasalita ng Ingles na mga may-akda. Ang mga resulta ng pagkalkula ay ipinakita sa anyo ng maraming mga talahanayan, mathematical formula at equation. Ang linguistic na interpretasyon ng dami ng data sa kasong ito ay nagmumula sa katotohanan na ang paggamit ni Churchill ng "politikal na bokabularyo" ay ang pinakakaraniwang (?) para sa grupong ito ng mga may-akda at ang paggamit ni Churchill ng mga salita sa mga kaso kung saan siya ay tumatalakay sa mga isyung pampulitika ay tipikal. ng English speech group 9 8 .

Sa isa pang kaso, pagkatapos ng naaangkop na mga pagmamanipula ng istatistika, napagpasyahan na nilabag ni Hitler ang duality sa pagitan ng "wika" at "speech" sa dami ng kahulugan ng mga terminong ito sa paggamit ng Nazi Germany. Ang isang espesyal na kaso ng pagkawasak ng duality na ito ay ang literal na pag-unawa<137>metaphorical turns (halimbawa, "ibuhos ang asin sa mga bukas na sugat"). Binansagan ng Nazi Germany ang sarili ng napakaraming hindi makatao na mga kilos na halos hindi na kailangan pang hatulan ito ng kalupitang pangwika na ito 9 9 . Ayon kay Kherdan, ang depinisyon ni Marx sa wika bilang ang agarang realidad ng pag-iisip ay humahantong din sa isang paglabag sa linguistic duality, at ang batas ng dialectics tungkol sa paglipat ng isang phenomenon sa kabaligtaran nito ay, sa kanyang opinyon, ang hindi nauunawaan na linguistic na batas ng duality. ng wika. Ang ganitong mga interpretasyon ay nagsasalita para sa kanilang sarili.

Sa wakas, ang isang karaniwang pagkukulang na likas sa lahat ng mga kaso sa itaas ng quantitative na paraan ng pag-aaral ng materyal na lingguwistika at sa gayon ay nakakakuha ng isang metodolohikal na katangian ay ang diskarte sa mga elemento ng linggwistika bilang isang mekanikal na hanay ng mga katotohanan na ganap na independyente sa bawat isa, alinsunod sa kung saan, kung mayroon man. o mga pattern, ang mga ito ay tumutukoy lamang sa mga numerical na relasyon ng pamamahagi ng mga autonomous na katotohanan, sa labas ng kanilang mga sistematikong dependency. Totoo, sinusubukan ni J. Watmou sa lahat ng posibleng paraan upang tiyakin na ang matematika ang mas mahusay kaysa sa anumang uri ng linguistic structural analysis, na may kakayahang magbunyag ng mga istrukturang katangian ng isang wika. "Ang modernong matematika," ang isinulat niya, "ay hindi tumatalakay sa pagsukat at calculus, na ang katumpakan nito ay limitado sa mismong kalikasan nito, ngunit pangunahin sa istruktura. Ito ang dahilan kung bakit ang matematika ay lubos na nakakatulong sa katumpakan ng pag-aaral ng wika - sa lawak na ang isang hiwalay na paglalarawan, kahit na mas limitado sa kalikasan, ay hindi kaya ng ... Tulad ng sa pisika, ang mga elemento ng matematika ay ginagamit upang ilarawan ang pisikal na mundo, dahil ang mga ito ay ipinapalagay na tumutugma sa mga elemento ng pisikal na mundo, kaya sa matematikal na lingguwistika ang mga elemento ng matematika ay dapat na tumutugma sa mga elemento ng mundo ng pananalita” 101 . Ngunit ang gayong pagbabalangkas ng tanong ay hindi nangangahulugang nakakatipid sa sitwasyon, dahil sa pinakamainam na magagawa nito<138>magbigay ng pagsusuri ng wika alinman bilang isang pisikal na istruktura, na malayo pa sa sapat para sa isang wika, at sa huling pagsusuri ay pareho pa rin ng mekanikal na katangian, o bilang isang istrukturang lohikal-matematika, at inililipat nito ang wika sa ibang eroplano, at sa maraming aspeto ay dayuhan dito. Hindi kalabisan na tandaan na hinuhulaan ni Watmow ang mga tagumpay ng matematikal na lingguwistika sa hinaharap lamang, at para sa kanilang mga tunay na resulta, sinusuri niya ang mga ito sa mga sumusunod na salita: “... halos lahat ng gawaing ginawa hanggang ngayon ni Herdan, Zipf, Yul, Giro (Guiraux) at iba pa, ay hindi nangangahulugang nasa labas ng saklaw ng kritisismo mula sa parehong linggwistika at matematika; she smacks of amateurishness to a great extent” 103 . Kaya, kung hindi natin susubukang hulaan ang hinaharap ng mga pamamaraan ng matematika sa pananaliksik sa linggwistika, ngunit subukang pahalagahan kung ano ang mayroon tayo ngayon, kung gayon, kung kinakailangan, kailangan nating aminin na, sa katunayan, ang matematika ay hanggang ngayon ay limitado sa larangan ng linggwistika lamang sa "pagsusukat at pagkalkula", at hindi ako makapagbigay ng isang husay na pagsusuri ng wika, na sinisiyasat ang istraktura nito.<139>

Subukan nating maging layunin hangga't maaari. Sa isang tiyak na bahagi, ang dami ng data, tila, ay maaaring gamitin ng linggwistika, ngunit bilang pantulong lamang at higit sa lahat sa mga problema na may praktikal na oryentasyon. Tungkol sa karamihan ng mga quantitative na pamamaraan ng pag-aaral ng indibidwal na linguistic phenomena, ang pangkalahatang konklusyon ni R. Brown ay walang alinlangan na makatwiran: "Maaari silang ituring bilang Kherdan isinasaalang-alang ang mga ito, ngunit ano ang kahulugan ng lahat ng ito?" 104 . Isipin natin na tinatanong natin ang tanong na: "Ano ang mga puno sa hardin na ito?". At bilang tugon ay nakukuha natin: "Mayroong isang daang puno sa hardin na ito." Ito ba ang sagot sa ating tanong, at talagang may katuturan ito? Ngunit patungkol sa maraming mga tanong sa wika, ang mga pamamaraan ng matematika ay nagbibigay ng mga ganoong sagot.

Gayunpaman, mayroong isang malawak na larangan ng aktibidad ng pananaliksik, na gumagamit ng pangunahing mga pamamaraan sa matematika at sa parehong oras na nakatuon ang mga ito sa materyal na lingguwistika, kung saan ang pagiging angkop ng naturang kumbinasyon ay walang pag-aalinlangan. Ang "kahulugan" ng aktibidad ng pananaliksik na ito, ang kahalagahan nito ay tinutukoy ng mga layunin kung saan ito naghahangad. Ito ay nasubok na sa pagsasanay. Sa kasong ito, pinag-uusapan natin ang mga problema na nauugnay sa paglikha ng mga makina ng impormasyon, mga istruktura para sa pagsasalin ng makina ng mga nakasulat na tekstong pang-agham, pag-automate ng pagsasalin ng oral speech mula sa isang wika patungo sa isa pa, at sa buong hanay ng mga gawain na pinagsama. sa mga isyung pangwika ng cybernetics. Ang buong hanay ng mga naturang problema ay karaniwang binibigyan ng pangkalahatang pangalan ng inilapat na lingguwistika. Kaya, ito ay nakikilala sa tinatawag na mathematical linguistics, na kinabibilangan ng mga lugar ng trabaho na itinalaga sa itaas bilang stylostatistics at linguistic statistics, bagama't hindi nito iniiwasan ang statistical processing ng linguistic material. Marahil ang pinakamahalagang katangian ng inilapat na linggwistika, na naghihiwalay dito sa matematikal na linggwistika, gaya ng nakabalangkas sa itaas, ay ang dating ay may kabaligtaran na direksyon: hindi matematika para sa linggwistika, ngunit linggwistika.<140>(pormal sa pamamagitan ng mga pamamaraang matematika) para sa malawak na hanay ng mga praktikal na problema.

Hindi na kailangang ibunyag ang nilalaman ng mga indibidwal na problema na kasama na ngayon sa napakalawak na lugar ng inilapat na lingguwistika. Kabaligtaran sa matematikal na lingguwistika, ang mga problemang ito ay aktibong tinatalakay sa literatura ng linggwistika ng Sobyet at wastong nagsisimulang sakupin ang isang lalong prominenteng lugar sa mga suliraning pang-agham ng mga institusyong pananaliksik 105 . Kaya, kilala na sila sa ating pamayanan sa wika. Ang sitwasyong ito, gayunpaman, ay hindi nagpapagaan sa atin ng pangangailangang isailalim ang mga ito sa pagninilay, lalo na, mula sa punto ng view ng mga prinsipyo ng agham ng wika. Ito ay walang alinlangan na makakatulong upang maalis ang mga hindi pagkakaunawaan na higit at mas madalas na lumitaw sa pagitan ng mga kinatawan ng mga agham na napakalayo sa isa't isa at makibahagi sa gawain sa mga problema ng inilapat na linggwistika, at magbalangkas ng mga paraan para sa kanilang tagpo, sa isang banda , at delimitasyon ng mga lugar ng pananaliksik, sa kabilang banda. Hindi sinasabi na ang mga sumusunod na pagsasaalang-alang ay kumakatawan sa punto ng pananaw ng linguist, at kinakailangan na ang mga matematiko ay hindi lamang subukang i-assimilate ito, ngunit, kaugnay sa mga tanong na itinaas, bigyan sila ng kanilang interpretasyon.

Ang linguist-theorist ay hindi sa anumang paraan ay makuntento sa katotohanan na sa lahat ng pagkakataon<141>wika para sa mga layuning itinakda ng inilapat na lingguwistika, ang kanilang batayan ay isang modelo ng matematika. Alinsunod dito, ang mga obserbasyon sa mga phenomena ng wika at ang mga resulta na nakuha sa ganitong paraan ay ipinahayag sa mga termino at konsepto ng matematika, ibig sabihin, sa pamamagitan ng mga equation at formula ng matematika. Tingnan natin ang isang halimbawa para sa kalinawan. Condon 1 06 at Zipf 1 07 itinatag na ang logarithms ng frequency ( f) ang mga paglitaw ng mga salita sa isang malaking teksto ay matatagpuan halos sa isang tuwid na linya, kung sila ay magkakaugnay sa diagram na may mga logarithms ng ranggo o ranggo ( r) ng mga salitang ito. Ang equation f=c:r, saan kasama ay isang pare-pareho na sumasalamin sa relasyon na ito sa limitadong kahulugan na c:r para sa itinakdang halaga r reproduces ang naobserbahang dalas na may mahusay na approximation. Relasyon sa pagitan f at r, ipinahayag ng isang mathematical formula, ay isang modelo para sa ugnayan sa pagitan ng mga sinusunod na halaga ng dalas ng paggamit at ang ranggo, o ranggo, ng mga salita. Ito ay isa sa mga kaso ng mathematical modeling. 

Ang buong teorya ng impormasyon ay ganap na nakabatay sa mathematical model ng proseso ng komunikasyon na binuo ni C. Shannon 108 . Ito ay tinukoy bilang "isang matematikal na disiplina na nakatuon sa mga pamamaraan ng pagkalkula at pagtatantya ng dami ng impormasyong nakapaloob sa anumang data, at ang pag-aaral ng mga proseso ng pag-iimbak at pagpapadala ng impormasyon" (TSB, vol. 51, p. 128). Alinsunod dito, ang mga pangunahing konsepto ng teorya ng impormasyon ay tumatanggap ng isang mathematical expression. Ang impormasyon ay sinusukat sa binit o binary units (isang code, kung saan ang wika ay inihalintulad, na may dalawang conditional na parehong probable signal na nagpapadala ng isang binary unit ng impormasyon sa panahon ng paghahatid ng bawat character. -alinman sa code at ang average na dami ng impormasyong ipinadala<142>mga pormasyon. Ang redundancy ay ipinahayag bilang isang porsyento ng kabuuang kakayahan sa pagpapadala ng code”, 1 09 atbp. Sa parehong paraan, ang pagsasalin ng makina ay nangangailangan ng algorithmic development ng pagpapakita ng mga elemento ng isang wika sa isa pa, atbp. 1 10 . Ito ay iba pang mga kaso ng pagmomolde.

Ang paggamit ng mga modelo na walang anumang kahulugan ay maaaring maging napakahalagang tulong, sa partikular, sa lahat ng posibilidad, sa paglutas ng mga problemang itinakda mismo ng linggwistika. Gayunpaman, para sa teoretikal na lingguwistika, napakahalaga na ang isang abstract na modelo, bilang panuntunan, ay hindi nagpaparami ng lahat ng mga tampok ng isang tunay na kababalaghan, ang lahat ng mga katangian ng pagganap nito. Kaya, ang isang arkitekto, bago bumuo ng isang bahay, ay maaaring lumikha ng kanyang modelo, na muling ginawa ang bahay na idinisenyo sa lahat ng pinakamaliit na detalye, at ito ay tumutulong sa kanya na malutas ang isang bilang ng mga praktikal na isyu na may kaugnayan sa pagtatayo ng bahay mismo. Ngunit ang gayong modelo ng isang bahay, gaano man ito katumpak, ay wala sa "function" na iyon at ang layunin kung saan ang lahat ng mga bahay ay itinayo sa pangkalahatan - hindi ito may kakayahang magbigay ng pabahay sa isang tao. Ang sitwasyon ay katulad ng wika, kung saan ang modelo ay hindi palaging magagawang kopyahin ang lahat ng mga katangian nito. Sa kasong ito, ang bagay ay mas kumplikado sa pamamagitan ng ang katunayan na hindi linguistic, ngunit matematikal na pamantayan ay ginagamit upang bumuo ng modelo. "Ang mga modelong matematika ... - isinulat ni A. Ettinger, - ay gumaganap ng isang napakahalagang papel sa lahat ng mga lugar ng teknolohiya, ngunit dahil sila ay isang kasangkapan para sa synthesis, ang kanilang kahalagahan para sa linggwistika, na pangunahin ay isang makasaysayang at mapaglarawang disiplina, ay natural na limitado. ” 1 11 .<143>

Ang matematikal na pagmomodelo ng isang wika ay aktuwal na naaangkop lamang sa static na estado nito, na kondisyon para sa isang linguist at sa katunayan ay direktang sumasalungat sa pangunahing kalidad ng isang wika, ang mismong anyo ng pagkakaroon nito ay ang pag-unlad. Hindi sinasabi na ang static na pag-aaral ng isang wika ay hindi nangangahulugang hindi kasama sa linggwistika at ito ang batayan para sa pag-iipon ng mga normatibong gramatika at diksyunaryo, descriptive grammar, praktikal na grammar at diksyunaryo na nagsisilbing gabay para sa praktikal na pag-aaral ng mga banyagang wika, atbp. .Gayunpaman, sa lahat ng gayong mga gawa, na higit na ginagamit sa kalikasan, sinasadya ng mga linggwista ang larangan ng pananaliksik at hindi sa anumang paraan ipinipikit ang kanilang mga mata sa iba pang aspeto ng wika 1 12 . Sa pamamagitan ng static na pagsusuri sa wika, sa partikular, ang mga katangian ng wikang nauugnay sa dinamikong kalikasan nito, tulad ng pagiging produktibo, pag-asa sa mga anyo ng pag-iisip, at malawak na pakikipag-ugnayan sa kultura, panlipunan, pampulitika, historikal at iba pang mga kadahilanan, ay ganap na nawawala mula sa ang larangan ng pananaw ng mananaliksik. Tanging sa synchronic plane lamang maituturing ang wika bilang isang sistema ng kumbensyonal na mga palatandaan o code, na, gayunpaman, ay lumalabas na ganap na hindi makatwiran sa sandaling magpatibay tayo ng isang dinamikong pananaw na mas angkop para sa wika. Nasa mga proseso ng pag-unlad na ang mga katangian ng wika tulad ng pagganyak, polysemy ng mga salita na walang matatag na mga hangganan, hindi awtonomiya ng kahulugan ng isang salita at ang sound shell nito, at ang malikhaing potensyal ng isang salita na nauugnay sa konteksto ay ipinahayag, at ang lahat ng ito ay nasa matalim na pagkakasalungatan sa mga pangunahing katangian ng isang code o isang tanda 1 13 . Malinaw, sa inilapat na linggwistika, maaari ding isipin ng isa ang lahat ng mga katangiang ito ng wika at, para sa mga praktikal na layunin, maging kontento sa, wika nga, isang "snapshot" ng wika, na may kakayahang magbigay ng medyo tinatayang ideya ng ang mekanismo ng paggana nito.<144>nirovaniya. Gayunpaman, ang bawat naturang "snapshot", kung isasaalang-alang bilang isang katotohanan ng wika, at hindi bilang isang katotohanan ng isang sistema ng mga karaniwang code, ay dapat na kasama sa walang katapusang proseso ng paggalaw kung saan ang wika ay palaging umiiral 1 14 . Hindi ito maaaring pag-aralan sa labas ng mga tiyak na kundisyon na nagpapakita ng kilusang ito, na nag-iiwan ng marka sa ibinigay na estado ng wika at tinutukoy ang potensyal para sa karagdagang pag-unlad nito. Narito mayroong parehong pagkakaiba sa pagitan ng isang panandaliang larawan ng isang tao at ang kanyang larawang ipininta gamit ang isang brush ng isang tunay na pintor. Sa gawain ng artista, mayroon kaming isang pangkalahatang imahe ng isang tao sa lahat ng pagka-orihinal hindi lamang sa kanyang pisikal na anyo, kundi pati na rin sa kanyang panloob na espirituwal na nilalaman. Mula sa isang artistikong larawan, maaari din nating basahin ang nakaraan ng taong inilalarawan dito at matukoy kung ano ang kaya niya sa kanyang mga aksyon. At ang isang snapshot, bagama't may kakayahang magbigay ng isang mas tumpak na imahe ng hitsura ng orihinal, ay wala sa mga katangiang ito at kadalasang nakakakuha ng parehong hindi sinasadyang tagihawat na tumalon sa ilong at<145>isang ganap na hindi pangkaraniwan na pose o ekspresyon, na sa huli ay humahantong sa isang pagbaluktot ng orihinal.

Dapat pansinin na ang paraan ng "mga snapshot" ay maaaring, siyempre, ilapat sa mga katotohanan ng pag-unlad ng wika. Ngunit sa kasong ito, talagang tatalakayin lamang natin ang mga hiwalay na estado ng wika, na, sa kanilang quantitative characterization, ay lumalabas na hindi hihigit sa isang comparative quantitative characterization ng iba't ibang mga wika. Ang ganitong uri ng quantitative na "dynamics" ay hindi maglalaman ng anumang bagay na organiko, at ang koneksyon sa pagitan ng mga indibidwal na estado ng wika ay nakasalalay lamang sa paghahambing ng mga numerical na relasyon. Kung sa kasong ito, masyadong, upang resort sa isang pagkakatulad, pagkatapos ay maaari naming sumangguni sa paglaki ng bata. Ang kanyang pag-unlad, siyempre, ay maaaring kinakatawan sa anyo ng dynamics ng numerical data tungkol sa kanyang timbang, taas, pagbabago ng mga ratio ng dami ng mga bahagi ng kanyang katawan, ngunit ang lahat ng data na ito ay ganap na hiwalay sa lahat ng bagay na pangunahing bumubuo sa indibidwal na kakanyahan. ng isang tao - ang kanyang karakter, hilig, gawi. , lasa, atbp.

Ang isa pang negatibong panig ng matematikal na "pagmomodelo" ng wika ay ang katotohanan na hindi ito maaaring magsilbi bilang pangkalahatang prinsipyo kung saan posible na magsagawa ng isang komprehensibo at komprehensibo - sistematikong paglalarawan ng wika. Ang isang matematikal na diskarte lamang sa mga phenomena ng wika, halimbawa, ay hindi magiging posible na masagot kahit na ang mga pangunahing katanungan (kung wala ito ay hindi maiisip ang mismong pag-iral ng agham ng wika), tulad ng: ano ang wika, kung ano ang dapat na mga phenomena. maiuugnay sa mga wastong lingguwistika, kung paano binibigyang kahulugan ang isang salita o pangungusap, ano ang mga pangunahing konsepto at kategorya ng wika, atbp. isang working hypothesis) sa lahat ng mga tanong na ito nang maaga. Hindi na kailangang pumikit sa katotohanan na sa lahat ng mga kaso na alam natin tungkol sa pag-aaral ng linguistic phenomena sa pamamagitan ng mga pamamaraang matematika, ang lahat ng mga konsepto at kategoryang ito ay tiyak na kailangang tanggapin bilang sila ay tinukoy ng tradisyonal o, medyo nagsasalita, husay na pamamaraan.

Ang tampok na ito ng mga pamamaraan sa matematika sa kanilang aplikasyon sa linggwistika ay napansin ni Spang-Hanssen noong pi<146>sal: “Dapat isaisip na ang mga naobserbahang katotohanan na tumatanggap ng quantitative expression ... ay walang halaga kung hindi sila magiging bahagi ng paglalarawan, at para sa linguistic na layunin dapat itong isang sistematikong paglalarawan, malapit na nauugnay sa isang qualitative linguistic paglalarawan at teorya” 1 15 . Sa isa pang talumpati ni Spang-Hanssen, nakita natin ang paglilinaw ng ideyang ito: "Hanggang sa mapatunayan ang posibilidad ng pagbuo ng quantitative system, at hangga't mayroong pangkalahatang tinatanggap na qualitative system para sa isang partikular na larangan ng pag-aaral, frequency calculations at iba pa. numerical na mga katangian mula sa linguistic point of view ay walang saysay ang pananaw" 1 16 . Ang mga katulad na ideya ay ipinahayag ni Uldall, na medyo hindi inaasahang nag-uugnay sa mga ito sa pag-unlad ng mga pangkalahatang teoretikal na pundasyon ng glossematics: "Kapag binilang o sinusukat ng isang linguist ang lahat ng kanyang binibilang at sinusukat, sa kanyang sarili ay hindi natutukoy sa dami; halimbawa, ang mga salita, kapag sila ay binibilang, ay tinukoy, kung sila ay tinukoy sa lahat, sa medyo magkaibang mga termino.<147>

Kaya, lumalabas na pareho sa teoretikal na termino at sa kanilang praktikal na aplikasyon, ang mga pamamaraan sa matematika ay direktang umaasa sa mga konsepto at kategorya ng linggwistika na tinukoy ng tradisyonal, pilolohikal, o, tulad ng nabanggit sa itaas, mga pamamaraan ng husay. Sa mga tuntunin ng inilapat na linggwistika, mahalagang mapagtanto ang pag-asa na ito, at, dahil dito, upang pamilyar sa kabuuan ng mga pangunahing kategorya ng tradisyonal na linggwistika.

Totoo, walang dahilan upang sisihin ang mga kinatawan ng eksaktong agham na nagtatrabaho sa larangan ng inilapat na lingguwistika para sa hindi paggamit ng data ng modernong linggwistika. Hindi ito tumutugma sa aktwal na estado ng mga bagay. Hindi lamang nila lubos na alam, ngunit malawak ding ginagamit sa kanilang gawain ang mga sistema ng mga tampok na pagkakaiba-iba na itinatag ng mga linggwist na katangian ng iba't ibang mga wika, ang pamamahagi at pagsasaayos ng mga elemento ng lingguwistika sa loob ng mga partikular na sistema ng wika, ang mga tagumpay ng acoustic phonetics, atbp. Ngunit sa kasong ito, kinakailangan ang isang napakahalagang reserbasyon. . Sa katunayan, ang mga kinatawan ng eksaktong agham ay gumagamit ng data ng isang direksyon lamang sa linggwistika - ang tinatawag na descriptive linguistics, na sadyang nakikilala ang sarili mula sa mga tradisyunal na problema ng teoretikal na linggwistika, malayo sa saklaw ng buong larangan ng linguistic na pananaliksik, mula sa isang wastong linguistic point of view, ito ay may mga makabuluhang metodolohikal na pagkukulang, na humantong ito sa kamakailang nahayag na krisis 1 18, at, bilang karagdagan, ay may purong praktikal na oryentasyon, na tumutugma sa mga interes ng inilapat na linggwistika. Ang lahat ng reserbasyon at paninisi na ginawa sa itaas laban sa static na pagsasaalang-alang ng wika ay naaangkop sa descriptive linguistics. Ang gayong isang panig na diskarte ng deskriptibong linggwistika ay maaari, ang imbestigador<148>gayunpaman, nabibigyang-katwiran lamang sa pamamagitan ng mga gawaing itinakda mismo ng linggwistika, ngunit malayong maubos nito ang buong nilalaman ng agham ng wika.

Sa proseso ng pagbuo ng mga tanong ng inilapat na lingguwistika, maaaring lumitaw ang mga bagong teoretikal na problema, at sa katunayan ay lumitaw na. Ang ilan sa mga problemang ito ay malapit na nauugnay sa mga tiyak na gawain ng inilapat na linggwistika at naglalayong malampasan ang mga paghihirap na lumitaw sa paglutas ng mga problemang ito. Ang iba pang mga problema ay direktang nauugnay sa teoretikal na lingguwistika, na nagpapahintulot sa isang bagong pananaw sa mga tradisyonal na ideya o pagbubukas ng mga bagong lugar ng linguistic na pananaliksik, mga bagong konsepto at teorya. Kabilang sa mga huling ito, halimbawa, ay ang problema sa paglikha ng isang "machine" na wika (o intermediary language), na pinaka malapit na nauugnay sa isang kumplikadong hanay ng mga pangunahing isyu ng teoretikal na linggwistika tulad ng relasyon ng mga konsepto at lexical na kahulugan, lohika at grammar, diachrony at synchrony, ang sign na katangian ng wika, ang esensya ng linguistic na kahulugan, ang mga prinsipyo ng pagbuo ng mga artipisyal na wika, atbp. 1 19 . Sa kasong ito, lalong mahalaga na magtatag ng mutual na pag-unawa at komonwelt sa karaniwang gawain ng mga kinatawan ng mga disiplinang pangwika at mga eksaktong agham. Tulad ng para sa linguistic side, sa kasong ito, tila, hindi natin dapat pag-usapan ang tungkol sa paglilimita sa mga pagsisikap ng, halimbawa, mga taga-disenyo ng mga makina ng pagsasalin nang maaga" at sinusubukang itatag ang mga kakayahan sa pagtatrabaho ng naturang mga makina gamit ang mga tula ni N. Gribachev o V. .Ang tuluyan ni Kochetov 1 20 . Ang makina mismo ay mahahanap ang mga limitasyon ng mga kakayahan nito, at kakayahang kumita - ang mga limitasyon ng paggamit nito. Ngunit ang mga linggwista, bilang kanilang kontribusyon sa karaniwang layunin, ay dapat magdala ng kanilang kaalaman sa mga tampok ng istruktura ng wika, ang versatility nito, ang panloob na intersecting na relasyon ng mga elemento nito, pati na rin ang malawak at multilateral na koneksyon ng wika sa pisikal, pisyolohikal. , mental at lohikal<149>mi phenomena, mga tiyak na pattern ng paggana at pag-unlad ng wika. Ang kabuuan ng kaalamang ito ay kinakailangan para sa mga taga-disenyo ng kani-kanilang mga makina upang hindi gumala sa mga maling direksyon, ngunit upang gawing may layunin at malinaw na nakatuon ang paghahanap. Kahit na ang napakaikling pagsusuri sa mga kaso ng paglalapat ng mga pamamaraang matematikal sa mga problema sa linggwistika, na ginawa sa sanaysay na ito, ay nakakumbinsi na ang gayong kaalaman ay hindi magiging labis para sa mga kinatawan ng eksaktong agham.

Sa batayan ng lahat ng mga pagsasaalang-alang sa itaas, ang isa ay malinaw na makakarating sa ilang pangkalahatang konklusyon.

Kaya, mathematical linguistics? Kung nangangahulugan ito ng paggamit ng mga pamamaraan sa matematika bilang isang unibersal na master key para sa paglutas ng lahat ng mga problema sa linggwistika, kung gayon ang mga naturang pag-aangkin ay dapat kilalanin bilang ganap na hindi makatwiran. Ang lahat ng nagawa sa direksyong ito ay napakakaunti o hindi man lang nagawa upang malutas ang mga tradisyunal na problema ng agham ng wika. Sa pinakamasama, ang aplikasyon ng mga pamamaraan sa matematika ay sinamahan ng mga halatang kalokohan o, mula sa isang linguistic na pananaw, ay ganap na walang kahulugan. Sa pinakamainam, ang mga pamamaraan sa matematika ay maaaring gamitin bilang mga pantulong na pamamaraan ng linguistic na pananaliksik, na inilalagay sa serbisyo ng mga tiyak at limitadong gawaing pangwika. Maaaring walang tanong sa anumang "quantitative philosophy of language" sa kasong ito. Sa isang pagkakataon, ang pisika, sikolohiya, pisyolohiya, lohika, sosyolohiya, at etnolohiya ay nakapasok sa kalayaan ng agham ng wika, ngunit hindi nila masupil ang linggwistika. Ang kabaligtaran ang nangyari - sinamantala ng linggwistika ang mga tagumpay ng mga agham na ito at, sa lawak na kinakailangan para sa sarili nito, nagsimulang gamitin ang kanilang tulong, sa gayon ay pinayaman ang arsenal ng mga diskarte sa pananaliksik nito. Ngayon, tila, oras na ng matematika. Inaasahan na ang bagong komunidad na ito ay makakatulong din sa pagpapalakas ng agham ng wika, sa pagpapabuti ng mga pamamaraan ng paggawa nito, at sa pagtaas ng kanilang pagkakaiba-iba. Kung gayon, lehitimong magsalita ng matematikal na lingguwistika gaya ng pisikal na lingguwistika, pisyolohikal na lingguwistika, lohikal na lingguwistika, sikolohikal na lingguwistika, at<150>atbp. Walang ganoong mga linggwista, iisa lamang ang linggwistika, na kumikitang gumagamit ng data ng iba pang mga agham bilang pantulong na kasangkapan sa pananaliksik. Kaya, walang dahilan upang umatras bago ang pagsalakay ng bagong agham at madaling ibigay dito ang mga posisyon na napanalunan nito. Napakaangkop dito na gunitain ang mga salita ni A. Martinet: “Marahil ay nakatutukso na sumapi sa isa o isa pang pangunahing kilusan ng pag-iisip sa pamamagitan ng paggamit ng ilang napiling termino, o ipahayag sa ilang mathematical formula ang higpit ng pangangatwiran ng isa. Gayunpaman, dumating na ang oras para matanto ng mga linggwista ang kalayaan ng kanilang agham at palayain ang kanilang mga sarili mula sa kababaan na iyon na ginagawang iugnay nila ang alinman sa kanilang mga aksyon sa isa o isa pang pangkalahatang prinsipyong pang-agham, bilang isang resulta kung saan ang mga tabas ng realidad ay palaging nagiging mas malabo lang, sa halip na maging mas malinaw.

Samakatuwid, ang matematika sa kanyang sarili at linggwistika sa kanyang sarili. Hindi nito ibinubukod ang kanilang tulong sa isa't isa o isang magiliw na pagpupulong sa magkasanib na gawain sa mga karaniwang problema. Ang ganitong uri ng lugar ng aplikasyon ng pinagsamang pagsisikap ng dalawang agham ay ang buong malawak na hanay ng mga problema na bahagi ng inilapat na linggwistika at may malaking pambansang kahalagahan sa ekonomiya. Ang isa ay dapat lamang na hilingin na sa kanilang magkasanib na gawain ang parehong mga agham ay nagpapakita ng pinakamataas na pag-unawa sa isa't isa, na walang alinlangan na mag-aambag sa pinakamataas na bunga ng kanilang kooperasyon.<151>

Magkano ang gastos sa pagsulat ng iyong papel?

Piliin ang uri ng trabaho Thesis (bachelor/specialist) Bahagi ng thesis Master's diploma Coursework with practice Teorya ng kurso Essay Essay Examination Tasks Attestation work (VAR/VKR) Business plan Exam questions MBA diploma Thesis (college/technical school) Other Cases Laboratory work , RGR On-line na tulong Ulat sa pagsasanay Paghahanap ng impormasyon Presentasyon sa PowerPoint Postgraduate abstract Mga kasamang materyales para sa diploma Article Test Drawings higit pa »

Salamat, isang email ang ipinadala sa iyo. Suriin ang iyong mail.

Gusto mo ba ng 15% discount na promo code?

Tumanggap ng SMS
may promo code

Matagumpay!

?Sabihin ang promo code habang nakikipag-usap sa manager.
Isang beses lang magagamit ang promo code sa iyong unang order.
Uri ng code na pang-promosyon - " graduate na trabaho".

Interaksyon ng matematika at linggwistika


Panimula

Kabanata 1. Ang kasaysayan ng aplikasyon ng mga pamamaraang matematikal sa linggwistika

1.1. Ang Pagbuo ng Structural Linguistics sa Pagliko ng ika-19 hanggang ika-20 Siglo

1.2. Paglalapat ng mga pamamaraang matematikal sa linggwistika sa ikalawang kalahati ng ikadalawampu siglo

Kabanata 2. Mga piling halimbawa ng paggamit ng matematika sa linggwistika

2.1. Pagsasalin ng makina

2.2.Mga pamamaraang istatistika sa pag-aaral ng wika

2.3. Pag-aaral ng wika sa pamamagitan ng mga pamamaraan ng pormal na lohika

2.4. Mga prospect para sa aplikasyon ng mga pamamaraan ng matematika sa linggwistika

Konklusyon

Panitikan

Apendise 1. Ronald Schleifer. Ferdinand de Saussure

Appendix 2. Ferdinand de Saussure (pagsasalin)

Panimula


Sa ika-20 siglo, nagkaroon ng patuloy na kalakaran tungo sa interaksyon at interpenetration ng iba't ibang larangan ng kaalaman. Ang mga hangganan sa pagitan ng mga indibidwal na agham ay unti-unting lumalabo; parami nang parami ang mga sangay ng mental na aktibidad na "nasa junction" ng kaalaman sa humanitarian, teknikal at natural na agham.

Ang isa pang halatang tampok ng modernidad ay ang pagnanais na pag-aralan ang mga istruktura at ang mga elemento ng bumubuo nito. Samakatuwid, ang isang pagtaas ng lugar, kapwa sa siyentipikong teorya at sa praktika, ay ibinibigay sa matematika. Ang pakikipag-ugnay, sa isang banda, sa lohika at pilosopiya, sa kabilang banda, sa mga istatistika (at, dahil dito, sa mga agham panlipunan), ang matematika ay tumagos nang mas malalim at mas malalim sa mga lugar na sa loob ng mahabang panahon ay itinuturing na puro. "makatao", pagpapalawak ng kanilang potensyal na heuristic (ang sagot sa tanong na "magkano" ay kadalasang makakatulong sa pagsagot sa mga tanong na "ano" at "paano"). Ang lingguwistika ay walang pagbubukod.

Ang layunin ng aking gawaing kurso ay maikli na i-highlight ang koneksyon sa pagitan ng matematika at isang sangay ng linggwistika bilang linggwistika. Mula noong 1950s, ang matematika ay ginamit sa linggwistika upang lumikha ng isang teoretikal na kagamitan para sa paglalarawan ng istruktura ng mga wika (parehong natural at artipisyal). Gayunpaman, dapat sabihin na hindi ito agad nakahanap ng gayong praktikal na aplikasyon para sa sarili nito. Sa una, ang mga pamamaraan ng matematika sa linggwistika ay nagsimulang gamitin upang linawin ang mga pangunahing konsepto ng linggwistika, gayunpaman, sa pag-unlad ng teknolohiya ng computer, ang gayong teoretikal na premise ay nagsimulang makahanap ng aplikasyon sa pagsasanay. Ang paglutas ng mga gawain tulad ng pagsasalin ng makina, pagkuha ng impormasyon ng makina, awtomatikong pagpoproseso ng teksto ay nangangailangan ng panimula ng bagong diskarte sa wika. Isang tanong ang bumangon sa harap ng mga linggwista: kung paano matututong kumatawan sa mga pattern ng linggwistika sa anyo kung saan direktang mailalapat ang mga ito sa teknolohiya. Ang terminong "mathematical linguistics", na popular sa ating panahon, ay tumutukoy sa anumang linguistic na pananaliksik na gumagamit ng mga eksaktong pamamaraan (at ang konsepto ng eksaktong mga pamamaraan sa agham ay palaging malapit na nauugnay sa matematika). Ang ilang mga siyentipiko sa mga nakaraang taon ay naniniwala na ang expression mismo ay hindi maaaring itaas sa ranggo ng isang termino, dahil hindi ito nangangahulugang anumang espesyal na "linggwistika", ngunit isang bagong direksyon lamang na nakatuon sa pagpapabuti, pagtaas ng katumpakan at pagiging maaasahan ng mga pamamaraan ng pananaliksik sa wika. . Gumagamit ang Linguistics ng parehong quantitative (algebraic) at non-quantitative na mga pamamaraan, na naglalapit dito sa mathematical logic, at, dahil dito, sa pilosopiya, at maging sa sikolohiya. Kahit na binanggit ni Schlegel ang pakikipag-ugnayan ng wika at kamalayan, at si Ferdinand de Saussure, isang kilalang linggwista noong unang bahagi ng ikadalawampu siglo (sasabihin ko ang tungkol sa kanyang impluwensya sa pag-unlad ng mga pamamaraan ng matematika sa linggwistika sa ibang pagkakataon), ikinonekta ang istraktura ng wika sa pag-aari nito. sa mga tao. Ang modernong mananaliksik na si L. Perlovsky ay higit pa, na tinutukoy ang dami ng mga katangian ng wika (halimbawa, ang bilang ng mga kasarian, mga kaso) na may mga kakaibang katangian ng pambansang kaisipan (higit pa tungkol dito sa Seksyon 2.2, "Mga Paraan ng Istatistika sa Linggwistika").

Ang pakikipag-ugnayan ng matematika at linggwistika ay isang multifaceted na paksa, at sa aking trabaho ay hindi ko tatalakayin ang lahat, ngunit, una sa lahat, sa mga inilapat na aspeto nito.

Kabanata I. Kasaysayan ng Paglalapat ng mga Paraang Matematika sa Linggwistika


1.1 Ang pagbuo ng structural linguistics sa pagliko ng XIX - XX na siglo


Ang paglalarawan sa matematika ng wika ay batay sa ideya ng wika bilang isang mekanismo, na bumalik sa sikat na Swiss linguist noong unang bahagi ng ikadalawampu siglo, si Ferdinand de Saussure.

Ang unang link ng kanyang konsepto ay ang teorya ng wika bilang isang sistema na binubuo ng tatlong bahagi (wika mismo - langue, speech - parole, at speech activity - langage), kung saan ang bawat salita (miyembro ng system) ay itinuturing na wala sa sarili. , ngunit may kaugnayan sa iba. mga miyembro. Bilang isa pang kilalang lingguwista, ang Dane Louis Hjelmslev, sa kalaunan ay nabanggit, si Saussure "ang unang humingi ng isang istruktural na diskarte sa wika, iyon ay, isang siyentipikong paglalarawan ng wika sa pamamagitan ng pagtatala ng mga ugnayan sa pagitan ng mga yunit."

Sa pag-unawa sa wika bilang isang hierarchical na istraktura, si Saussure ang unang nagbigay ng problema sa halaga at kahalagahan ng mga yunit ng lingguwistika. Ang mga hiwalay na phenomena at mga kaganapan (sabihin, ang kasaysayan ng pinagmulan ng mga indibidwal na Indo-European na mga salita) ay dapat na pag-aralan hindi sa kanilang sarili, ngunit sa isang sistema kung saan sila ay nauugnay sa mga katulad na bahagi.

Itinuring ng istrukturang yunit ng wika ng Saussure ang salitang, "sign", kung saan pinagsama ang tunog at kahulugan. Wala sa mga elementong ito ang umiiral nang wala ang isa't isa: samakatuwid, naiintindihan ng katutubong nagsasalita ang iba't ibang lilim ng kahulugan ng polysemantic na salita bilang isang hiwalay na elemento sa kabuuan ng istruktura, sa wika.

Kaya, sa teorya ni F. de Saussure makikita ang interaksyon ng linggwistika, sa isang banda, sa sosyolohiya at sikolohiyang panlipunan (dapat tandaan na sa parehong oras, ang phenomenology ni Husserl, ang psychoanalysis ni Freud, ang teorya ng relativity ni Einstein ay umuunlad, nagaganap ang mga eksperimento sa anyo at nilalaman sa panitikan, musika, at sining), sa kabilang banda, sa matematika (ang konsepto ng pagkakapare-pareho ay tumutugma sa algebraic na konsepto ng wika). Ang ganitong konsepto ay nagbago sa konsepto ng linguistic na interpretasyon tulad ng: Ang mga penomena ay nagsimulang bigyang kahulugan hindi kaugnay sa mga sanhi ng kanilang paglitaw, ngunit may kaugnayan sa kasalukuyan at hinaharap. Ang interpretasyon ay tumigil na maging independyente sa mga intensyon ng isang tao (sa kabila ng katotohanan na ang mga intensyon ay maaaring impersonal, "walang malay" sa kahulugan ng Freudian ng salita).

Ang paggana ng mekanismo ng linggwistika ay ipinakikita sa pamamagitan ng aktibidad ng pagsasalita ng mga katutubong nagsasalita. Ang resulta ng pagsasalita ay ang tinatawag na "mga tamang teksto" - mga pagkakasunud-sunod ng mga yunit ng pagsasalita na sumusunod sa ilang mga pattern, na marami sa mga ito ay nagbibigay-daan sa paglalarawan ng matematika. Ang teorya ng mga paraan upang ilarawan ang syntactic na istraktura ay tumatalakay sa pag-aaral ng mga pamamaraan para sa matematikal na paglalarawan ng mga tamang teksto (pangunahin ang mga pangungusap). Sa ganitong istraktura, ang mga analohiya sa linggwistika ay tinukoy hindi sa tulong ng kanilang mga likas na katangian, ngunit sa tulong ng mga relasyon sa sistema ("structural").

Ang mga ideya ni Saussure ay binuo sa Kanluran ng mga nakababatang kontemporaryo ng dakilang Swiss linguist: sa Denmark - L. Hjelmslev, na nabanggit ko na, na nagbunga ng algebraic theory ng wika sa kanyang akdang "Fundamentals of Linguistic Theory", sa the USA - E. Sapir, L. Bloomfield, C. Harris, sa Czech Republic - Russian scientist-emigrant N. Trubetskoy.

Ang mga regular na istatistika sa pag-aaral ng wika ay nagsimulang harapin ng walang iba kundi ang tagapagtatag ng genetika, si Georg Mendel. Noong 1968 lamang natuklasan ng mga philologist na, sa mga huling taon ng kanyang buhay, siya ay nabighani sa pag-aaral ng linguistic phenomena gamit ang mga pamamaraan ng matematika. Dinala ni Mendel ang pamamaraang ito sa linggwistika mula sa biology; noong dekada 1990, tanging ang pinakamapangahas na linggwista at biologist ang nag-angkin ng pagiging posible ng naturang pagsusuri. Sa mga archive ng monasteryo ng St. Tomasz sa Brno, na ang abbot ay si Mendel, ang mga sheet ay natagpuan na may mga hanay ng mga apelyido na nagtatapos sa "mann", "bauer", "mayer", at may ilang mga fraction at kalkulasyon. Sa pagsisikap na matuklasan ang mga pormal na batas ng pinagmulan ng mga pangalan ng pamilya, gumawa si Mendel ng mga kumplikadong kalkulasyon, kung saan isinasaalang-alang niya ang bilang ng mga patinig at katinig sa wikang Aleman, ang kabuuang bilang ng mga salita na isinasaalang-alang niya, ang bilang ng mga apelyido, atbp.

Sa ating bansa, ang istrukturang lingguwistika ay nagsimulang umunlad sa halos parehong oras tulad ng sa Kanluran - sa pagliko ng ika-19-20 siglo. Kasabay ng F. de Saussure, ang konsepto ng wika bilang isang sistema ay binuo sa kanilang mga gawa ng mga propesor ng Kazan University F.F. Fortunatov at I.A. Baudouin de Courtenay. Ang huli ay nakipag-ugnayan nang mahabang panahon kay de Saussure, ayon sa pagkakabanggit, ang Geneva at Kazan na mga paaralan ng linggwistika ay nakipagtulungan sa isa't isa. Kung si Saussure ay matatawag na ideologist ng "eksaktong" mga pamamaraan sa linggwistika, kung gayon ang Baudouin de Courtenay ay naglatag ng mga praktikal na pundasyon para sa kanilang aplikasyon. Siya ang unang naghiwalay ng linggwistika (bilang isang eksaktong agham na gumagamit ng mga istatistikal na pamamaraan at functional dependence) mula sa philology (isang komunidad ng mga humanitarian na disiplina na nag-aaral ng espirituwal na kultura sa pamamagitan ng wika at pananalita). Ang siyentipiko mismo ay naniniwala na "ang linggwistika ay maaaring maging kapaki-pakinabang sa malapit na hinaharap, napalaya lamang mula sa ipinag-uutos na unyon sa philology at kasaysayang pampanitikan" . Ang ponolohiya ay naging "lugar ng pagsubok" para sa pagpapakilala ng mga pamamaraang matematikal sa linggwistika - ang mga tunog bilang "mga atom" ng sistema ng wika, na may limitadong bilang ng mga madaling masusukat na katangian, ay ang pinaka maginhawang materyal para sa pormal at mahigpit na pamamaraan ng paglalarawan. Itinatanggi ng ponolohiya ang pagkakaroon ng kahulugan sa tunog, kaya inalis ang salik na "tao" sa mga pag-aaral. Sa ganitong diwa, ang mga ponema ay parang pisikal o biyolohikal na bagay.

Ang mga ponema, bilang pinakamaliit na elemento ng lingguwistika na katanggap-tanggap para sa persepsyon, ay kumakatawan sa isang hiwalay na globo, isang hiwalay na "phenomenological reality". Halimbawa, sa Ingles, ang tunog na "t" ay maaaring mabigkas nang iba, ngunit sa lahat ng pagkakataon, ang isang taong nagsasalita ng Ingles ay mapapansin ito bilang "t". Ang pangunahing bagay ay ang ponema ay gaganap ng kanyang pangunahing - makabuluhang - function. Bukod dito, ang mga pagkakaiba sa pagitan ng mga wika ay tulad na ang mga uri ng isang tunog sa isang wika ay maaaring tumutugma sa iba't ibang mga ponema sa isa pa; halimbawa, ang "l" at "r" sa Ingles ay magkaiba, habang sa iba pang mga wika ang mga ito ay mga uri ng parehong ponema (tulad ng Ingles na "t", binibigkas na mayroon o walang aspirasyon). Ang malawak na bokabularyo ng anumang natural na wika ay isang hanay ng mga kumbinasyon ng mas maliit na bilang ng mga ponema. Sa Ingles, halimbawa, 40 ponema lamang ang ginagamit sa pagbigkas at pagsulat ng humigit-kumulang isang milyong salita.

Ang mga tunog ng isang wika ay isang sistematikong nakaayos na hanay ng mga tampok. Noong 1920s-1930s, kasunod ni Saussure, Jacobson at N.S. Trubetskoy ay pinili ang "mga natatanging tampok" ng mga ponema. Ang mga tampok na ito ay batay sa istraktura ng mga organo ng pagsasalita - dila, ngipin, vocal cord. Halimbawa, sa Ingles ang pagkakaiba sa pagitan ng "t" at "d" ay ang pagkakaroon o kawalan ng isang "boses" (ang pag-igting ng mga vocal cord) at ang antas ng boses na nagpapakilala sa isang ponema mula sa isa pa. Kaya, ang ponolohiya ay maaaring ituring na isang halimbawa ng pangkalahatang tuntunin sa wika na inilarawan ni Saussure: "May mga pagkakaiba lamang sa wika". Ang mas mahalaga ay hindi ito: ang pagkakaiba ay kadalasang nagpapahiwatig ng eksaktong mga kondisyon kung saan ito matatagpuan; ngunit sa wika ay mayroon lamang mga pagkakaiba na walang tiyak na kondisyon. Isinasaalang-alang man natin ang "pagtatalaga" o "signified" - sa wika ay walang mga konsepto o tunog na umiiral bago ang pagbuo ng sistema ng wika.

Kaya, sa Saussurean linguistics, ang pinag-aralan na phenomenon ay nauunawaan bilang isang hanay ng mga paghahambing at pagsalungat ng wika. Ang wika ay parehong pagpapahayag ng kahulugan ng mga salita at isang paraan ng komunikasyon, at ang dalawang tungkuling ito ay hindi kailanman nagtutugma. Mapapansin natin ang paghahalili ng anyo at nilalaman: ang mga linguistic contrast ay tumutukoy sa mga istrukturang yunit nito, at ang mga yunit na ito ay nakikipag-ugnayan upang lumikha ng isang tiyak na makabuluhang nilalaman. Dahil random ang mga elemento ng wika, hindi maaaring maging batayan ang contrast o combination. Nangangahulugan ito na sa isang wika, ang mga natatanging tampok ay bumubuo ng isang phonetic contrast sa ibang antas ng pag-unawa, ang mga ponema ay pinagsama sa mga morpema, mga morpema sa mga salita, mga salita sa mga pangungusap, atbp. Sa anumang kaso, isang buong ponema, salita, pangungusap, atbp. ay higit pa sa kabuuan ng mga bahagi nito.

Iminungkahi ni Saussure ang ideya ng isang bagong agham ng ikadalawampu siglo, na hiwalay sa linggwistika, na pinag-aaralan ang papel ng mga palatandaan sa lipunan. Tinawag ni Saussure ang science semiology na ito (mula sa Greek na "semeon" - isang tanda). Ang "agham" ng semiotics, na umunlad sa Silangang Europa noong 1920s-1930s at sa Paris noong 1950s-1960s, ay nagpalawak ng pag-aaral ng wika at mga istrukturang linggwistika sa mga natuklasang pampanitikan na binubuo (o binabalangkas) sa tulong ng mga istrukturang ito. Bilang karagdagan, sa takip-silim ng kanyang karera, kasabay ng kanyang kurso sa pangkalahatang linggwistika, si Saussure ay nakikibahagi sa isang "semiotic" na pagsusuri ng huling Romanong tula, sinusubukang tumuklas ng sadyang binubuo ng mga anagram ng mga wastong pangalan. Ang pamamaraang ito sa maraming paraan ay kabaligtaran ng rasyonalismo sa pagsusuri nito sa linggwistika: ito ay isang pagtatangka na pag-aralan sa isang sistema ang problema ng "probability" sa wika. Ang ganitong pananaliksik ay nakakatulong na tumuon sa "tunay na bahagi" ng posibilidad; ang "pangunahing salita" kung saan hinahanap ni Saussure ang isang anagram ay, ayon kay Jean Starobinsky, "isang kasangkapan para sa makata, hindi ang pinagmulan ng buhay ng tula." Ang tula ay nagsisilbing palitan ang mga tunog ng keyword. Ayon kay Starobinsky, sa pagsusuring ito, "Hindi sumasali si Saussure sa paghahanap ng mga nakatagong kahulugan." Sa kabaligtaran, sa kanyang mga gawa, ang pagnanais na maiwasan ang mga tanong na may kaugnayan sa kamalayan ay kapansin-pansin: "dahil ang tula ay ipinahayag hindi lamang sa mga salita, kundi pati na rin sa kung ano ang ibinubunga ng mga salitang ito, ito ay lampas sa kontrol ng kamalayan at nakasalalay lamang sa ang mga batas ng wika” (tingnan ang . Appendix 1).

Ang pagtatangka ni Saussure na pag-aralan ang mga wastong pangalan sa huling Romanong tula ay binibigyang-diin ang isa sa mga bahagi ng kanyang pagsusuri sa linggwistika - ang arbitraryong katangian ng mga palatandaan, gayundin ang pormal na esensya ng linggwistika ni Saussure, na hindi kasama ang posibilidad ng pagsusuri ng kahulugan. Napagpasyahan ni Todorov na ngayon ang mga gawa ni Saussure ay tila lubos na pare-pareho sa kanilang pag-aatubili na pag-aralan ang mga simbolo ng isang kababalaghan na may malinaw na tinukoy na kahulugan [Appendix 1]. Sa paggalugad ng mga anagram, binibigyang-pansin lamang ni Saussure ang pag-uulit, ngunit hindi ang mga nakaraang opsyon. . . . Sa pag-aaral ng Nibelungenlied, tinukoy niya ang mga simbolo upang italaga lamang ang mga ito sa mga maling pagbabasa: kung hindi sinasadya, ang mga simbolo ay hindi umiiral. Pagkatapos ng lahat, sa kanyang mga akda sa pangkalahatang linggwistika, ginagawa niya ang pagpapalagay ng pagkakaroon ng isang semiolohiya na naglalarawan hindi lamang ng mga palatandaang pangwika; ngunit ang palagay na ito ay limitado sa pamamagitan ng katotohanan na ang semiology ay maaari lamang maglarawan ng random, arbitrary na mga palatandaan.

Kung ito ay talagang gayon, ito ay dahil lamang sa hindi niya maisip ang "intensiyon" na walang bagay; hindi niya lubusang madugtungan ang agwat sa pagitan ng anyo at nilalaman - sa kanyang mga akda ay naging tanong ito. Sa halip, bumaling siya sa "linguistic legitimacy". Sa pagitan, sa isang banda, ang mga konsepto ng ikalabinsiyam na siglo batay sa kasaysayan at mga subjective na haka-haka, at mga pamamaraan ng random na interpretasyon batay sa mga konseptong ito, at, sa kabilang banda, mga istruktural na konsepto na nagbubura ng oposisyon sa pagitan ng anyo at nilalaman (paksa at bagay) , kahulugan at pinagmulan sa structuralism, psychoanalysis, at maging sa quantum mechanics, ang mga sinulat ni Ferdinand de Saussure sa linguistics at semiotics ay nagmamarka ng pagbabago sa pag-aaral ng mga kahulugan sa wika at kultura.

Ang mga siyentipikong Ruso ay kinatawan din sa Unang Internasyonal na Kongreso ng mga Linguist sa The Hague noong 1928. S. Kartsevsky, R. Yakobson at N. Trubetskoy ay gumawa ng isang ulat na sinuri ang hierarchical na istraktura ng wika - sa diwa ng mga pinaka-modernong ideya para sa simula ng huling siglo. Si Jakobson sa kanyang mga akda ay bumuo ng mga ideya ni Saussure na ang mga pangunahing elemento ng isang wika ay dapat pag-aralan, una sa lahat, na may kaugnayan sa kanilang mga tungkulin, at hindi sa mga dahilan ng kanilang paglitaw.

Sa kasamaang palad, pagkatapos na maluklok si Stalin noong 1924, ang linggwistika ng Russia, tulad ng maraming iba pang mga agham, ay ibinalik. Maraming mga mahuhusay na siyentipiko ang napilitang mangibang-bayan, pinaalis sa bansa o namatay sa mga kampo. Noong kalagitnaan ng dekada 1950, naging posible ang isang tiyak na pluralismo ng mga teorya—higit pa sa Seksyon 1.2.


1.2 Paglalapat ng mga pamamaraang matematikal sa linggwistika sa ikalawang kalahati ng ikadalawampu siglo


Sa kalagitnaan ng ikadalawampu siglo, apat na paaralang pangwika sa daigdig ang nabuo, na ang bawat isa ay naging ninuno ng isang tiyak na "eksaktong" pamamaraan. Ang Leningrad phonological school (ang ninuno nito ay isang mag-aaral ng Baudouin de Courtenay L.V. Shcherba) ay gumamit ng isang psycholinguistic na eksperimento batay sa pagsusuri ng pagsasalita ng mga katutubong nagsasalita bilang pangunahing pamantayan para sa pag-generalize ng tunog sa anyo ng isang ponema.

Ang mga siyentipiko ng Prague Linguistic Circle, sa partikular, ang tagapagtatag nito na si N.S. Si Trubetskoy, na lumipat mula sa Russia, ay bumuo ng teorya ng mga pagsalungat - ang semantikong istraktura ng wika ay inilarawan nila bilang isang hanay ng mga oppositionally constructed semantic units - Sem. Ang teoryang ito ay inilapat sa pag-aaral hindi lamang sa wika, kundi pati na rin sa kulturang masining.

Ang mga ideologo ng American descriptivism ay ang mga linggwista na sina L. Bloomfield at E. Sapir. Ang wika ay ipinakita sa mga deskriptibista bilang isang hanay ng mga pahayag sa pagsasalita, na siyang pangunahing layunin ng kanilang pag-aaral. Ang kanilang pokus ay sa mga tuntunin ng siyentipikong paglalarawan (kaya ang pangalan) ng mga teksto: ang pag-aaral ng organisasyon, pag-aayos at pag-uuri ng kanilang mga elemento. Ang pormalisasyon ng mga pamamaraang analitikal sa larangan ng ponolohiya at morpolohiya (pagbuo ng mga prinsipyo para sa pag-aaral ng wika sa iba't ibang antas, pagsusuri sa pamamahagi, pamamaraan ng mga direktang nasasakupan, atbp.) ay humantong sa pagbabalangkas ng mga pangkalahatang katanungan ng pagmomolde ng linggwistika. Ang kawalan ng pansin sa plano ng nilalaman ng wika, gayundin ang paradigmatikong panig ng wika, ay hindi nagbigay-daan sa mga deskriptibista na ganap na bigyang-kahulugan ang wika bilang isang sistema.

Noong 1960s, nabuo ang teorya ng mga pormal na gramatika, na lumitaw pangunahin dahil sa gawain ng pilosopo at lingguwistang Amerikano na si N. Chomsky. Siya ay nararapat na ituring na isa sa mga pinakatanyag na modernong siyentipiko at pampublikong pigura, maraming mga artikulo, monograp at kahit isang buong dokumentaryo ang nakatuon sa kanya. Sa pangalan ng isang panimula na bagong paraan ng paglalarawan ng syntactic na istraktura na naimbento ni Chomsky - generative (generative) grammar - ang kaukulang trend sa linguistics ay tinawag na generativism.

Si Chomsky, isang inapo ng mga imigrante mula sa Russia, ay nag-aral ng linguistics, matematika at pilosopiya sa Unibersidad ng Pennsylvania mula noong 1945, na malakas na naiimpluwensyahan ng kanyang gurong si Zelig Harris - tulad ni Harris, isinasaalang-alang ni Chomsky at isinasaalang-alang pa rin ang kanyang pampulitikang pananaw na malapit sa anarkismo (siya ay kilala bilang kritiko ng umiiral na sistemang pampulitika ng US at bilang isa sa mga espirituwal na pinuno ng anti-globalismo).

Ang unang pangunahing gawaing pang-agham ni Chomsky, ang kanyang master's thesis na Morphology of Modern Hebrew (1951), ay nanatiling hindi nai-publish. Natanggap ni Chomsky ang kanyang titulo ng doktor mula sa Unibersidad ng Pennsylvania noong 1955, ngunit karamihan sa pananaliksik na pinagbabatayan ng kanyang disertasyon (nai-publish nang buo noong 1975 sa ilalim ng pamagat na The Logical Structure of Linguistic Theory) at ang kanyang unang monograph, Syntactic Structures (1957, Rus. trans . 1962), ay ginanap sa Harvard University noong 1951-1955. Sa parehong 1955, lumipat ang siyentipiko sa Massachusetts Institute of Technology, kung saan siya ay naging propesor noong 1962.

Ang teorya ni Chomsky ay dumaan sa ilang yugto sa pag-unlad nito.

Sa unang monograph na "Syntactic Structures", ipinakita ng siyentipiko ang wika bilang isang mekanismo para sa pagbuo ng isang walang katapusang hanay ng mga pangungusap gamit ang isang may hangganang hanay ng mga paraan ng gramatika. Upang ilarawan ang mga katangian ng lingguwistika, iminungkahi niya ang mga konsepto ng malalim (nakatago mula sa direktang pang-unawa at nabuo ng isang sistema ng recursive, ibig sabihin, maaaring ilapat nang paulit-ulit, mga panuntunan) at ibabaw (direktang pinaghihinalaang) mga istrukturang gramatika, pati na rin ang mga pagbabagong naglalarawan sa paglipat mula sa malalalim na istruktura hanggang sa ibabaw. Ang ilang mga istraktura sa ibabaw ay maaaring tumugma sa isang malalim na istraktura (halimbawa, ang passive construction Ang kautusan na nilagdaan ng pangulo ay nagmula sa parehong malalim na istraktura bilang ang aktibong konstruksiyon Ang pangulo ay pumirma sa atas) at vice versa (halimbawa, ang kalabuan Ina. loves daughter ay inilarawan bilang resulta ng pagkakaisa ng mga istruktura sa ibabaw na bumalik sa dalawang magkaibang malalim, sa isa kung saan ang ina ay ang nagmamahal sa anak na babae, at sa isa pa, ang mahal ng anak na babae).

Ang pamantayang teorya ni Chomsky ay itinuturing na "Aspects" na modelo na itinakda sa aklat ni Chomsky na "Aspects of the Theory of Syntax". Sa modelong ito, sa unang pagkakataon, ang mga tuntunin ng semantikong interpretasyon ay ipinakilala sa pormal na teorya, na nag-uugnay ng kahulugan sa malalim na mga istruktura. Sa Aspekto, ang linguistic competence ay laban sa paggamit ng wika (performance), ang tinatawag na Katz-Postal hypothesis tungkol sa pangangalaga ng kahulugan sa panahon ng pagbabago ay pinagtibay, na may kaugnayan kung saan ang konsepto ng opsyonal na pagbabago ay hindi kasama, at isang apparatus ng Ang mga tampok na sintaktik na naglalarawan sa pagkakatugma ng leksikal ay ipinakilala.

Noong 1970s, nagtrabaho si Chomsky sa teorya ng pamamahala at pagbubuklod (GB-theory - mula sa mga salitang gobyerno at nagbubuklod) - mas pangkalahatan kaysa sa nauna. Sa loob nito, tinalikuran ng siyentipiko ang mga tiyak na panuntunan na naglalarawan sa mga istrukturang sintaktik ng mga partikular na wika. Ang lahat ng mga pagbabago ay napalitan ng isang unibersal na paglipat ng pagbabago. Sa loob ng balangkas ng teorya ng GB, mayroon ding mga pribadong module, na ang bawat isa ay may pananagutan para sa sarili nitong bahagi ng grammar.

Kamakailan lamang, noong 1995, naglagay si Chomsky ng isang minimalist na programa, kung saan ang wika ng tao ay inilalarawan tulad ng machine language. Ito ay isang programa lamang, hindi isang modelo o isang teorya. Sa loob nito, kinilala ni Chomsky ang dalawang pangunahing subsystem ng kagamitan ng wika ng tao: ang lexicon at ang computing system, pati na rin ang dalawang interface - phonetic at logical.

Ang mga pormal na grammar ni Chomsky ay naging klasiko para sa paglalarawan hindi lamang natural kundi pati na rin ang mga artipisyal na wika - sa partikular, mga programming language. Ang pag-unlad ng structural linguistics sa ikalawang kalahati ng ika-20 siglo ay nararapat na ituring na isang "Chomskian revolution".

Ang Moscow Phonological School, na ang mga kinatawan ay A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, gumamit ng katulad na teorya sa pag-aaral ng phonetics. Unti-unti, ang mga "eksaktong" mga pamamaraan ay nagsisimulang ilapat patungkol hindi lamang sa phonetics, kundi pati na rin sa syntax. Parehong linguist at mathematician, dito at sa ibang bansa, ay nagsisimulang pag-aralan ang istruktura ng wika. Noong 1950s at 60s, nagsimula ang isang bagong yugto sa pakikipag-ugnayan sa pagitan ng matematika at linggwistika sa USSR, na nauugnay sa pag-unlad ng mga sistema ng pagsasalin ng makina.

Ang impetus para sa pagsisimula ng mga gawaing ito sa ating bansa ay ang mga unang pag-unlad sa larangan ng pagsasalin ng makina sa Estados Unidos (bagaman ang unang mekanisadong kagamitan sa pagsasalin ni P.P. Smirnov-Troyansky ay naimbento sa USSR noong 1933, ito, bilang primitive. , ay hindi naging laganap). Noong 1947, gumawa sina A. Butt at D. Britten ng isang code para sa pagsasalin ng salita-sa-salita gamit ang isang computer; makalipas ang isang taon, iminungkahi ni R. Richens ang isang panuntunan para sa paghahati ng mga salita sa mga stems at mga pagtatapos sa pagsasalin ng makina. Ibang-iba ang mga taon na iyon sa ngayon. Ang mga ito ay napakalaki at mamahaling mga makina na kumukuha ng buong mga silid at nangangailangan ng malaking kawani ng mga inhinyero, operator at programmer upang mapanatili ang mga ito. Karaniwan, ang mga computer na ito ay ginamit upang magsagawa ng mga kalkulasyon sa matematika para sa mga pangangailangan ng mga institusyong militar - ang bago sa matematika, pisika at teknolohiya na pinagsilbihan, una sa lahat, ang mga gawaing militar. Sa mga unang yugto, ang pagbuo ng MP ay aktibong suportado ng militar, habang (sa mga kondisyon ng Cold War) ang direksyon ng Russian-English na binuo sa USA, at ang direksyon ng Anglo-Russian sa USSR.

Noong Enero 1954, ang Georgetown Experiment, ang unang pampublikong pagpapakita ng pagsasalin mula sa Ruso sa Ingles sa makina ng IBM-701, ay naganap sa Massachusetts Technical University. Abstract ng mensahe tungkol sa matagumpay na pagpasa ng eksperimento, na ginawa ni D.Yu. Panov, ay lumitaw sa RJ "Mathematics", 1954, No. 10: "Pagsasalin mula sa isang wika patungo sa isa pa gamit ang isang makina: isang ulat sa unang matagumpay na pagsubok."

Si D. Yu. Panov (sa oras na iyon ay direktor ng Institute of Scientific Information - INI, kalaunan ay VINITI) ay umakit kay I. K. Belskaya, na kalaunan ay pinamunuan ang machine translation group sa Institute of Precise Mathematics at Computer Engineering ng USSR Academy of Sciences, upang magtrabaho sa pagsasalin ng makina. Sa pagtatapos ng 1955, ang unang karanasan ng pagsasalin mula sa Ingles sa Russian sa tulong ng BESM machine ay nagsimula noon. Ang mga programa para sa BESM ay pinagsama-sama ng N.P. Trifonov at L.N. Korolev, na ang tesis ng Ph.D. ay nakatuon sa mga pamamaraan para sa pagbuo ng mga diksyunaryo para sa pagsasalin ng makina.

Kaayon, ang trabaho sa pagsasalin ng makina ay isinagawa sa Kagawaran ng Applied Mathematics ng Mathematical Institute ng USSR Academy of Sciences (ngayon ay M.V. Keldysh Institute of Applied Mathematics ng Russian Academy of Sciences). Sa inisyatiba ng mathematician na si A.A. Lyapunov. Kasama niya ang O.S. Kulagin at ang kanyang mga mag-aaral na T.D. Sina Wentzel at N.N. Ricco. Ang mga ideya nina Lyapunov at Kulagina tungkol sa posibilidad ng paggamit ng teknolohiya upang magsalin mula sa isang wika patungo sa isa pa ay inilathala sa journal Nature, 1955, No. 8. Mula sa katapusan ng 1955, T.N. Moloshnaya, na pagkatapos ay nagsimulang independiyenteng gawain sa algorithm ng pagsasalin ng English-Russian.

Naaalala ni R. Frumkina, na sa oras na iyon ay nakikibahagi sa algorithm ng pagsasalin mula sa Espanyol, na sa yugtong ito ng gawain ay mahirap gumawa ng anumang mga pare-parehong hakbang. Mas madalas kailangan kong sundin ang heuristic na karanasan - sarili ko o mga kasamahan.

Gayunpaman, ang unang henerasyon ng mga sistema ng pagsasalin ng makina ay napakadi-perpekto. Ang lahat ng mga ito ay batay sa sunud-sunod na mga algorithm ng pagsasalin "salita sa salita", "parirala sa parirala" - ang mga semantikong koneksyon sa pagitan ng mga salita at pangungusap ay hindi isinasaalang-alang sa anumang paraan. Halimbawa, maaari nating banggitin ang mga pangungusap: “Hinahanap ni John ang kanyang kahon ng laruan. Sa wakas ay natagpuan niya ito. Ang kahon ay nasa panulat. Tuwang-tuwa si John. (Hinahanap ni John ang kanyang kahon ng laruan. Sa wakas ay nakita niya ito. Nasa playpen ang kahon. Tuwang-tuwa si John.).” Ang "Pulat" sa kontekstong ito ay hindi isang "panulat" (panulat), ngunit isang "playpen" (play-pen). Ang kaalaman sa mga kasingkahulugan, kasalungat at matalinghagang kahulugan ay mahirap ipasok sa isang computer. Ang isang promising na direksyon ay ang pagbuo ng mga computer system na nakatuon sa paggamit ng isang tao na tagasalin.

Sa paglipas ng panahon, ang mga direktang sistema ng pagsasalin ay pinalitan ng mga T-system (mula sa salitang Ingles na "paglipat" - pagbabagong-anyo), kung saan isinagawa ang pagsasalin sa antas ng mga istrukturang sintaktik. Ang mga algorithm ng mga T-system ay gumamit ng mekanismo na naging posible upang bumuo ng isang syntactic na istraktura ayon sa mga tuntunin ng grammar ng wika ng input na pangungusap (katulad ng kung paano itinuro ang isang banyagang wika sa mataas na paaralan), at pagkatapos ay i-synthesize ang output na pangungusap. sa pamamagitan ng pagbabago sa istrukturang sintaktik at pagpapalit ng mga kinakailangang salita mula sa diksyunaryo.

Si Lyapunov ay nagsalita tungkol sa pagsasalin sa pamamagitan ng pagkuha ng kahulugan ng isinalin na teksto at paglalahad nito sa ibang wika. Ang diskarte sa pagbuo ng mga machine translation system batay sa pagkuha ng semantic representation ng input sentence sa pamamagitan ng semantic analysis at synthesis ng input sentence ayon sa nakuha na semantic representation ay itinuturing pa rin na pinakaperpekto. Ang ganitong mga sistema ay tinatawag na I-systems (mula sa salitang "interlingua"). Gayunpaman, ang gawain ng paglikha ng mga ito, na itinakda noong huling bahagi ng 50s at unang bahagi ng 60s, ay hindi pa ganap na nalutas sa ngayon, sa kabila ng mga pagsisikap ng International Federation of IFIP, ang komunidad ng mundo ng mga siyentipiko sa larangan ng pagproseso ng impormasyon.

Naisip ng mga siyentipiko kung paano gawing pormal at bumuo ng mga algorithm para sa pagtatrabaho sa mga teksto, kung anong mga diksyunaryo ang dapat ipasok sa makina, kung anong mga pattern ng linguistic ang dapat gamitin sa pagsasalin ng makina. Ang tradisyunal na lingguwistika ay walang ganoong mga ideya - hindi lamang sa mga tuntunin ng semantika, kundi pati na rin sa mga tuntunin ng syntax. Sa oras na iyon, walang mga listahan ng mga syntactic constructions para sa anumang wika, ang mga kondisyon para sa kanilang compatibility at interchangeability ay hindi pinag-aralan, ang mga patakaran para sa pagbuo ng malalaking yunit ng syntactic structure mula sa mas maliliit na elemento ng constituent ay hindi binuo.

Ang pangangailangan na lumikha ng mga teoretikal na pundasyon ng pagsasalin ng makina ay humantong sa pagbuo at pag-unlad ng matematikal na lingguwistika. Ang nangungunang papel sa bagay na ito sa USSR ay ginampanan ng mga mathematician na si A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, mga linggwista na si V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Ang disertasyon ni Kulagina ay nakatuon sa pag-aaral ng pormal na teorya ng mga gramatika (kasabay ng N. Khomsky sa USA), iniharap ni Kuznetsov ang gawain ng axiomatization ng linguistics, na bumalik sa mga gawa ni F.F. Fortunatov.

Noong Mayo 6, 1960, ang Decree ng Presidium ng USSR Academy of Sciences "Sa pagbuo ng mga istruktura at matematikal na pamamaraan para sa pag-aaral ng wika" ay pinagtibay, at ang kaukulang mga dibisyon ay nilikha sa Institute of Linguistics at Institute of ang Wikang Ruso. Mula noong 1960, sa nangungunang makataong unibersidad ng bansa - ang philological faculty ng Moscow State University, Leninrad, Novosibirsk na unibersidad, Moscow State Institute of Foreign Languages ​​​​- nagsimulang magsanay sa larangan ng awtomatikong pagproseso ng teksto.

Gayunpaman, ang mga gawa sa pagsasalin ng makina sa panahong ito, na tinatawag na "klasikal", ay may teoretikal sa halip na praktikal na interes. Ang mga cost-effective na machine translation system ay nagsimulang malikha lamang noong dekada otsenta ng huling siglo. Pag-uusapan ko ito mamaya sa Seksyon 2.1, Machine Translation.

Kasama sa 1960s - 70s ang malalim na teoretikal na pag-unlad gamit ang mga pamamaraan ng set theory at mathematical logic, tulad ng field theory at fuzzy set theory.

Ang may-akda ng field theory sa linguistics ay ang Sobyet na makata, tagasalin at linguist na si V.G. Admoni. Una niyang binuo ang kanyang teorya batay sa wikang Aleman. Para kay Admoni, ang konsepto ng "patlang" ay tumutukoy sa isang arbitraryong hindi walang laman na hanay ng mga elementong pangwika (halimbawa, "lexical field", "semantic field").

Ang istraktura ng field ay heterogenous: ito ay binubuo ng isang core, ang mga elemento nito ay mayroong kumpletong hanay ng mga feature na tumutukoy sa isang set, at isang periphery, ang mga elemento nito ay maaaring magkaroon ng parehong feature ng isang ibinigay na set (hindi lahat) at mga kapitbahay. Magbibigay ako ng isang halimbawa na naglalarawan sa pahayag na ito: halimbawa, sa Ingles, ang larangan ng mga tambalang salita (“day-dream” - “dream” ay mahirap ihiwalay sa larangan ng mga parirala (“tear gas” - “tear gas”) .

Ang teorya ng fuzzy set na nabanggit na sa itaas ay malapit na nauugnay sa field theory. Sa USSR, ang mga linggwista na si V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, gayunpaman, ang ninuno nito ay ang American mathematician na si L. Zadeh, na noong 1965 ay naglathala ng artikulong "Fuzzy Logic". Sa pagbibigay ng katwiran sa matematika para sa teorya ng fuzzy set, itinuring ni Zade ang mga ito batay sa materyal na lingguwistika.

Sa teoryang ito, hindi gaanong pinag-uusapan ang tungkol sa pag-aari ng mga elemento sa isang naibigay na set (АОа), kundi tungkol sa antas ng pag-aari na ito (mАОа), dahil ang mga peripheral na elemento ay maaaring kabilang sa ilang mga patlang sa isang antas o iba pa. Si Zade (Lofti-zade) ay isang katutubong ng Azerbaijan, hanggang sa edad na 12 ay nagkaroon siya ng kasanayan sa pakikipag-usap sa apat na wika - Azerbaijani, Russian, English at Persian - at gumamit ng tatlong magkakaibang mga alpabeto: Cyrillic, Latin, Arabic. Kapag tinanong ang isang siyentipiko kung ano ang karaniwan sa pagitan ng fuzzy set theory at linguistics, hindi niya itinatanggi ang koneksyon na ito, ngunit nilinaw niya: "Hindi ako sigurado na ang pag-aaral ng mga wikang ito ay may malaking epekto sa aking pag-iisip. Kung ito ang kaso, pagkatapos lamang subconsciously. Sa kanyang kabataan, nag-aral si Zadeh sa isang Presbyterian school sa Tehran, at pagkatapos ng Ikalawang Digmaang Pandaigdig ay lumipat siya sa Estados Unidos. "Ang tanong ay hindi kung ako ay Amerikano, Ruso, Azerbaijani o anuman," sabi niya.

Mga katulad na abstract:

Ang wika at pananalita bilang isa sa mga pangunahing problema sa estilista. Ang konsepto ng ponema at antas ng ponolohiya. Ang konsepto ng wika bilang isang sistema at mga antas ng sistema ng wika. Ang konsepto ng mga morpema at ang kanilang mga uri. Isang pangungusap bilang syntactic unit ng isang teksto. Mga palatandaan ng sistema ng wika.

Panimula

Kabanata 1. Ang kasaysayan ng aplikasyon ng mga pamamaraang matematikal sa linggwistika

1.1. Ang Pagbuo ng Structural Linguistics sa Pagliko ng ika-19 hanggang ika-20 Siglo

1.2. Paglalapat ng mga pamamaraang matematikal sa linggwistika sa ikalawang kalahati ng ikadalawampu siglo

Kabanata 2. Mga piling halimbawa ng paggamit ng matematika sa linggwistika

2.1. Pagsasalin ng makina

2.2.Mga pamamaraang istatistika sa pag-aaral ng wika

2.3. Pag-aaral ng wika sa pamamagitan ng mga pamamaraan ng pormal na lohika

2.4. Mga prospect para sa aplikasyon ng mga pamamaraan ng matematika sa linggwistika

Konklusyon

Panitikan

Apendise 1. Ronald Schleifer. Ferdinand de Saussure

Appendix 2. Ferdinand de Saussure (pagsasalin)

Panimula

Sa ika-20 siglo, nagkaroon ng patuloy na kalakaran tungo sa interaksyon at interpenetration ng iba't ibang larangan ng kaalaman. Ang mga hangganan sa pagitan ng mga indibidwal na agham ay unti-unting lumalabo; parami nang parami ang mga sangay ng mental na aktibidad na "nasa junction" ng kaalaman sa humanitarian, teknikal at natural na agham.

Ang isa pang halatang tampok ng modernidad ay ang pagnanais na pag-aralan ang mga istruktura at ang mga elemento ng bumubuo nito. Samakatuwid, ang isang pagtaas ng lugar, kapwa sa siyentipikong teorya at sa praktika, ay ibinibigay sa matematika. Ang pakikipag-ugnay, sa isang banda, sa lohika at pilosopiya, sa kabilang banda, sa mga istatistika (at, dahil dito, sa mga agham panlipunan), ang matematika ay tumagos nang mas malalim at mas malalim sa mga lugar na sa loob ng mahabang panahon ay itinuturing na puro. "makatao", pagpapalawak ng kanilang potensyal na heuristic (ang sagot sa tanong na "magkano" ay kadalasang makakatulong sa pagsagot sa mga tanong na "ano" at "paano"). Ang lingguwistika ay walang pagbubukod.

Ang layunin ng aking gawaing kurso ay maikli na i-highlight ang koneksyon sa pagitan ng matematika at isang sangay ng linggwistika bilang linggwistika. Mula noong 1950s, ang matematika ay ginamit sa linggwistika upang lumikha ng isang teoretikal na kagamitan para sa paglalarawan ng istruktura ng mga wika (parehong natural at artipisyal). Gayunpaman, dapat sabihin na hindi ito agad nakahanap ng gayong praktikal na aplikasyon para sa sarili nito. Sa una, ang mga pamamaraan ng matematika sa linggwistika ay nagsimulang gamitin upang linawin ang mga pangunahing konsepto ng linggwistika, gayunpaman, sa pag-unlad ng teknolohiya ng computer, ang gayong teoretikal na premise ay nagsimulang makahanap ng aplikasyon sa pagsasanay. Ang paglutas ng mga gawain tulad ng pagsasalin ng makina, pagkuha ng impormasyon ng makina, awtomatikong pagpoproseso ng teksto ay nangangailangan ng panimula ng bagong diskarte sa wika. Isang tanong ang bumangon sa harap ng mga linggwista: kung paano matututong kumatawan sa mga pattern ng linggwistika sa anyo kung saan direktang mailalapat ang mga ito sa teknolohiya. Ang terminong "mathematical linguistics", na popular sa ating panahon, ay tumutukoy sa anumang linguistic na pananaliksik na gumagamit ng mga eksaktong pamamaraan (at ang konsepto ng eksaktong mga pamamaraan sa agham ay palaging malapit na nauugnay sa matematika). Ang ilang mga siyentipiko sa mga nakaraang taon ay naniniwala na ang expression mismo ay hindi maaaring itaas sa ranggo ng isang termino, dahil hindi ito nangangahulugang anumang espesyal na "linggwistika", ngunit isang bagong direksyon lamang na nakatuon sa pagpapabuti, pagtaas ng katumpakan at pagiging maaasahan ng mga pamamaraan ng pananaliksik sa wika. . Gumagamit ang Linguistics ng parehong quantitative (algebraic) at non-quantitative na mga pamamaraan, na naglalapit dito sa mathematical logic, at, dahil dito, sa pilosopiya, at maging sa sikolohiya. Kahit na binanggit ni Schlegel ang pakikipag-ugnayan ng wika at kamalayan, at si Ferdinand de Saussure, isang kilalang linggwista noong unang bahagi ng ikadalawampu siglo (sasabihin ko ang tungkol sa kanyang impluwensya sa pag-unlad ng mga pamamaraan ng matematika sa linggwistika sa ibang pagkakataon), ikinonekta ang istraktura ng wika sa pag-aari nito. sa mga tao. Ang modernong mananaliksik na si L. Perlovsky ay higit pa, na tinutukoy ang dami ng mga katangian ng wika (halimbawa, ang bilang ng mga kasarian, mga kaso) na may mga kakaibang katangian ng pambansang kaisipan (higit pa tungkol dito sa Seksyon 2.2, "Mga Paraan ng Istatistika sa Linggwistika").

Ang pakikipag-ugnayan ng matematika at linggwistika ay isang multifaceted na paksa, at sa aking trabaho ay hindi ko tatalakayin ang lahat, ngunit, una sa lahat, sa mga inilapat na aspeto nito.

Kabanata I. Kasaysayan ng Paglalapat ng mga Paraang Matematika sa Linggwistika

1.1 Ang pagbuo ng structural linguistics sa pagliko ng XIX - XX na siglo

Ang paglalarawan sa matematika ng wika ay batay sa ideya ng wika bilang isang mekanismo, na bumalik sa sikat na Swiss linguist noong unang bahagi ng ikadalawampu siglo, si Ferdinand de Saussure.

Ang unang link ng kanyang konsepto ay ang teorya ng wika bilang isang sistema na binubuo ng tatlong bahagi (ang wika mismo ay wika, pananalita - password, at aktibidad sa pagsasalita - wika), kung saan ang bawat salita (miyembro ng system) ay hindi isinasaalang-alang sa sarili nito, ngunit may kaugnayan sa iba pang mga miyembro. Bilang isa pang kilalang lingguwista, ang Dane Louis Hjelmslev, sa kalaunan ay nabanggit, si Saussure "ang unang humingi ng isang istruktural na diskarte sa wika, iyon ay, isang siyentipikong paglalarawan ng wika sa pamamagitan ng pagtatala ng mga ugnayan sa pagitan ng mga yunit."

Sa pag-unawa sa wika bilang isang hierarchical na istraktura, si Saussure ang unang nagbigay ng problema sa halaga at kahalagahan ng mga yunit ng lingguwistika. Ang mga hiwalay na phenomena at mga kaganapan (sabihin, ang kasaysayan ng pinagmulan ng mga indibidwal na Indo-European na mga salita) ay dapat na pag-aralan hindi sa kanilang sarili, ngunit sa isang sistema kung saan sila ay nauugnay sa mga katulad na bahagi.

Itinuring ng istrukturang yunit ng wika ng Saussure ang salitang, "sign", kung saan pinagsama ang tunog at kahulugan. Wala sa mga elementong ito ang umiiral nang wala ang isa't isa: samakatuwid, naiintindihan ng katutubong nagsasalita ang iba't ibang lilim ng kahulugan ng polysemantic na salita bilang isang hiwalay na elemento sa kabuuan ng istruktura, sa wika.

Kaya, sa teorya ni F. de Saussure makikita ang interaksyon ng linggwistika, sa isang banda, sa sosyolohiya at sikolohiyang panlipunan (dapat tandaan na sa parehong oras, ang phenomenology ni Husserl, ang psychoanalysis ni Freud, ang teorya ng relativity ni Einstein ay umuunlad, nagaganap ang mga eksperimento sa anyo at nilalaman sa panitikan, musika, at sining), sa kabilang banda, sa matematika (ang konsepto ng pagkakapare-pareho ay tumutugma sa algebraic na konsepto ng wika). Ang ganitong konsepto ay nagbago sa konsepto ng linguistic na interpretasyon tulad ng: Ang mga penomena ay nagsimulang bigyang kahulugan hindi kaugnay sa mga sanhi ng kanilang paglitaw, ngunit may kaugnayan sa kasalukuyan at hinaharap. Ang interpretasyon ay tumigil na maging independyente sa mga intensyon ng isang tao (sa kabila ng katotohanan na ang mga intensyon ay maaaring impersonal, "walang malay" sa kahulugan ng Freudian ng salita).

Ang paggana ng mekanismo ng linggwistika ay ipinakikita sa pamamagitan ng aktibidad ng pagsasalita ng mga katutubong nagsasalita. Ang resulta ng pagsasalita ay ang tinatawag na "mga tamang teksto" - mga pagkakasunud-sunod ng mga yunit ng pagsasalita na sumusunod sa ilang mga pattern, na marami sa mga ito ay nagbibigay-daan sa paglalarawan ng matematika. Ang teorya ng mga paraan upang ilarawan ang syntactic na istraktura ay tumatalakay sa pag-aaral ng mga pamamaraan para sa matematikal na paglalarawan ng mga tamang teksto (pangunahin ang mga pangungusap). Sa ganitong istraktura, ang mga analohiya sa linggwistika ay tinukoy hindi sa tulong ng kanilang mga likas na katangian, ngunit sa tulong ng mga relasyon sa sistema ("structural").

Ang mga ideya ni Saussure ay binuo sa Kanluran ng mga nakababatang kontemporaryo ng dakilang Swiss linguist: sa Denmark - L. Hjelmslev, na nabanggit ko na, na nagbunga ng algebraic theory ng wika sa kanyang akdang "Fundamentals of Linguistic Theory", sa the USA - E. Sapir, L. Bloomfield, C. Harris, sa Czech Republic - Russian scientist-emigrant N. Trubetskoy.

Ang mga regular na istatistika sa pag-aaral ng wika ay nagsimulang harapin ng walang iba kundi ang tagapagtatag ng genetika, si Georg Mendel. Noong 1968 lamang natuklasan ng mga philologist na, sa mga huling taon ng kanyang buhay, siya ay nabighani sa pag-aaral ng linguistic phenomena gamit ang mga pamamaraan ng matematika. Dinala ni Mendel ang pamamaraang ito sa linggwistika mula sa biology; noong dekada 1990, tanging ang pinakamapangahas na linggwista at biologist ang nag-angkin ng pagiging posible ng naturang pagsusuri. Sa mga archive ng monasteryo ng St. Tomasz sa Brno, na ang abbot ay si Mendel, ang mga sheet ay natagpuan na may mga hanay ng mga apelyido na nagtatapos sa "mann", "bauer", "mayer", at may ilang mga fraction at kalkulasyon. Sa pagsisikap na matuklasan ang mga pormal na batas ng pinagmulan ng mga pangalan ng pamilya, gumawa si Mendel ng mga kumplikadong kalkulasyon, kung saan isinasaalang-alang niya ang bilang ng mga patinig at katinig sa wikang Aleman, ang kabuuang bilang ng mga salita na isinasaalang-alang niya, ang bilang ng mga apelyido, atbp.

Sa ating bansa, ang istrukturang lingguwistika ay nagsimulang umunlad sa halos parehong oras tulad ng sa Kanluran - sa pagliko ng ika-19-20 siglo. Kasabay ng F. de Saussure, ang konsepto ng wika bilang isang sistema ay binuo sa kanilang mga gawa ng mga propesor ng Kazan University F.F. Fortunatov at I.A. Baudouin de Courtenay. Ang huli ay nakipag-ugnayan nang mahabang panahon kay de Saussure, ayon sa pagkakabanggit, ang Geneva at Kazan na mga paaralan ng linggwistika ay nakipagtulungan sa isa't isa. Kung si Saussure ay matatawag na ideologist ng "eksaktong" mga pamamaraan sa linggwistika, kung gayon ang Baudouin de Courtenay ay naglatag ng mga praktikal na pundasyon para sa kanilang aplikasyon. Siya ang unang naghiwalay ng linggwistika (bilang tumpak isang agham na gumagamit ng mga istatistikal na pamamaraan at functional dependence) mula sa philology (isang komunidad ng mga humanitarian na disiplina na nag-aaral ng espirituwal na kultura sa pamamagitan ng wika at pananalita). Ang siyentipiko mismo ay naniniwala na "ang linggwistika ay maaaring maging kapaki-pakinabang sa malapit na hinaharap, napalaya lamang mula sa ipinag-uutos na unyon sa philology at kasaysayang pampanitikan" . Ang ponolohiya ay naging "lugar ng pagsubok" para sa pagpapakilala ng mga pamamaraang matematikal sa linggwistika - ang mga tunog bilang "mga atom" ng sistema ng wika, na may limitadong bilang ng mga madaling masusukat na katangian, ay ang pinaka maginhawang materyal para sa pormal at mahigpit na pamamaraan ng paglalarawan. Itinatanggi ng ponolohiya ang pagkakaroon ng kahulugan sa tunog, kaya inalis ang salik na "tao" sa mga pag-aaral. Sa ganitong diwa, ang mga ponema ay parang pisikal o biyolohikal na bagay.

Ang mga ponema, bilang pinakamaliit na elemento ng lingguwistika na katanggap-tanggap para sa persepsyon, ay kumakatawan sa isang hiwalay na globo, isang hiwalay na "phenomenological reality". Halimbawa, sa Ingles, ang tunog na "t" ay maaaring mabigkas nang iba, ngunit sa lahat ng pagkakataon, ang isang taong nagsasalita ng Ingles ay mapapansin ito bilang "t". Ang pangunahing bagay ay ang ponema ay gaganap ng kanyang pangunahing - makabuluhang - function. Bukod dito, ang mga pagkakaiba sa pagitan ng mga wika ay tulad na ang mga uri ng isang tunog sa isang wika ay maaaring tumutugma sa iba't ibang mga ponema sa isa pa; halimbawa, ang "l" at "r" sa Ingles ay magkaiba, habang sa iba pang mga wika ang mga ito ay mga uri ng parehong ponema (tulad ng Ingles na "t", binibigkas na mayroon o walang aspirasyon). Ang malawak na bokabularyo ng anumang natural na wika ay isang hanay ng mga kumbinasyon ng mas maliit na bilang ng mga ponema. Sa Ingles, halimbawa, 40 ponema lamang ang ginagamit sa pagbigkas at pagsulat ng humigit-kumulang isang milyong salita.

Panimula

Kabanata 1. Ang kasaysayan ng aplikasyon ng mga pamamaraang matematikal sa linggwistika

1.1. Ang Pagbuo ng Structural Linguistics sa Pagliko ng ika-19 - Ika-20 Siglo

1.2. Paglalapat ng mga pamamaraang matematikal sa linggwistika sa ikalawang kalahati ng ikadalawampu siglo

Kabanata 2. Mga piling halimbawa ng paggamit ng matematika sa linggwistika

2.1. Pagsasalin ng makina

2.2.Mga pamamaraang istatistika sa pag-aaral ng wika

2.3. Pag-aaral ng wika sa pamamagitan ng mga pamamaraan ng pormal na lohika

2.4. Mga prospect para sa aplikasyon ng mga pamamaraan ng matematika sa linggwistika

Konklusyon

Panitikan

Apendise 1. Ronald Schleifer. Ferdinand de Saussure

Appendix 2. Ferdinand de Saussure (pagsasalin)

Panimula

Sa ika-20 siglo, nagkaroon ng patuloy na kalakaran tungo sa interaksyon at interpenetration ng iba't ibang larangan ng kaalaman. Ang mga hangganan sa pagitan ng mga indibidwal na agham ay unti-unting lumalabo; parami nang parami ang mga sangay ng mental na aktibidad na "nasa junction" ng kaalaman sa humanitarian, teknikal at natural na agham.

Ang isa pang halatang tampok ng modernidad ay ang pagnanais na pag-aralan ang mga istruktura at ang mga elemento ng bumubuo nito. Samakatuwid, ang isang pagtaas ng lugar, kapwa sa siyentipikong teorya at sa praktika, ay ibinibigay sa matematika. Ang pakikipag-ugnay, sa isang banda, sa lohika at pilosopiya, sa kabilang banda, sa mga istatistika (at, dahil dito, sa mga agham panlipunan), ang matematika ay tumagos nang mas malalim at mas malalim sa mga lugar na sa loob ng mahabang panahon ay itinuturing na puro. "makatao", pagpapalawak ng kanilang potensyal na heuristic (ang sagot sa tanong na "magkano" ay kadalasang makakatulong sa pagsagot sa mga tanong na "ano" at "paano"). Ang lingguwistika ay walang pagbubukod.

Ang layunin ng aking gawaing kurso ay maikli na i-highlight ang koneksyon sa pagitan ng matematika at isang sangay ng linggwistika bilang linggwistika. Mula noong 1950s, ang matematika ay ginamit sa linggwistika upang lumikha ng isang teoretikal na kagamitan para sa paglalarawan ng istruktura ng mga wika (parehong natural at artipisyal). Gayunpaman, dapat sabihin na hindi ito agad nakahanap ng gayong praktikal na aplikasyon para sa sarili nito. Sa una, ang mga pamamaraan ng matematika sa linggwistika ay nagsimulang gamitin upang linawin ang mga pangunahing konsepto ng linggwistika, gayunpaman, sa pag-unlad ng teknolohiya ng computer, ang gayong teoretikal na premise ay nagsimulang makahanap ng aplikasyon sa pagsasanay. Ang paglutas ng mga gawain tulad ng pagsasalin ng makina, pagkuha ng impormasyon ng makina, awtomatikong pagpoproseso ng teksto ay nangangailangan ng panimula ng bagong diskarte sa wika. Isang tanong ang bumangon sa harap ng mga linggwista: kung paano matututong kumatawan sa mga pattern ng linggwistika sa anyo kung saan direktang mailalapat ang mga ito sa teknolohiya. Ang terminong "mathematical linguistics", na popular sa ating panahon, ay tumutukoy sa anumang linguistic na pananaliksik na gumagamit ng mga eksaktong pamamaraan (at ang konsepto ng eksaktong mga pamamaraan sa agham ay palaging malapit na nauugnay sa matematika). Ang ilang mga siyentipiko sa mga nakaraang taon ay naniniwala na ang expression mismo ay hindi maaaring itaas sa ranggo ng isang termino, dahil hindi ito nangangahulugang anumang espesyal na "linggwistika", ngunit isang bagong direksyon lamang na nakatuon sa pagpapabuti, pagtaas ng katumpakan at pagiging maaasahan ng mga pamamaraan ng pananaliksik sa wika. . Gumagamit ang Linguistics ng parehong quantitative (algebraic) at non-quantitative na mga pamamaraan, na naglalapit dito sa mathematical logic, at, dahil dito, sa pilosopiya, at maging sa sikolohiya. Kahit na binanggit ni Schlegel ang pakikipag-ugnayan ng wika at kamalayan, at si Ferdinand de Saussure, isang kilalang linggwista noong unang bahagi ng ikadalawampu siglo (sasabihin ko ang tungkol sa kanyang impluwensya sa pag-unlad ng mga pamamaraan ng matematika sa linggwistika sa ibang pagkakataon), ikinonekta ang istraktura ng wika sa pag-aari nito. sa mga tao. Ang modernong mananaliksik na si L. Perlovsky ay higit pa, na tinutukoy ang dami ng mga katangian ng wika (halimbawa, ang bilang ng mga kasarian, mga kaso) na may mga kakaibang katangian ng pambansang kaisipan (higit pa tungkol dito sa Seksyon 2.2, "Mga Paraan ng Istatistika sa Linggwistika").

Ang pakikipag-ugnayan ng matematika at linggwistika ay isang multifaceted na paksa, at sa aking trabaho ay hindi ko tatalakayin ang lahat, ngunit, una sa lahat, sa mga inilapat na aspeto nito.

Kabanata I. Kasaysayan ng Paglalapat ng mga Paraang Matematika sa Linggwistika

1.1 Ang pagbuo ng structural linguistics sa pagliko ng XIX - XX na siglo

Ang paglalarawan sa matematika ng wika ay batay sa ideya ng wika bilang isang mekanismo, na bumalik sa sikat na Swiss linguist noong unang bahagi ng ikadalawampu siglo, si Ferdinand de Saussure.

Ang unang link ng kanyang konsepto ay ang teorya ng wika bilang isang sistema na binubuo ng tatlong bahagi (ang wika mismo ay wika, pananalita - password, at aktibidad sa pagsasalita - wika), kung saan ang bawat salita (miyembro ng system) ay hindi isinasaalang-alang sa sarili nito, ngunit may kaugnayan sa iba pang mga miyembro. Bilang isa pang kilalang lingguwista, ang Dane Louis Hjelmslev, sa kalaunan ay nabanggit, si Saussure "ang unang humingi ng isang istruktural na diskarte sa wika, iyon ay, isang siyentipikong paglalarawan ng wika sa pamamagitan ng pagtatala ng mga ugnayan sa pagitan ng mga yunit."

Sa pag-unawa sa wika bilang isang hierarchical na istraktura, si Saussure ang unang nagbigay ng problema sa halaga at kahalagahan ng mga yunit ng lingguwistika. Ang mga hiwalay na phenomena at mga kaganapan (sabihin, ang kasaysayan ng pinagmulan ng mga indibidwal na Indo-European na mga salita) ay dapat na pag-aralan hindi sa kanilang sarili, ngunit sa isang sistema kung saan sila ay nauugnay sa mga katulad na bahagi.

Itinuring ng istrukturang yunit ng wika ng Saussure ang salitang, "sign", kung saan pinagsama ang tunog at kahulugan. Wala sa mga elementong ito ang umiiral nang wala ang isa't isa: samakatuwid, naiintindihan ng katutubong nagsasalita ang iba't ibang lilim ng kahulugan ng polysemantic na salita bilang isang hiwalay na elemento sa kabuuan ng istruktura, sa wika.

Kaya, sa teorya ni F. de Saussure makikita ang interaksyon ng linggwistika, sa isang banda, sa sosyolohiya at sikolohiyang panlipunan (dapat tandaan na sa parehong oras, ang phenomenology ni Husserl, ang psychoanalysis ni Freud, ang teorya ng relativity ni Einstein ay pag-unlad, ang mga eksperimento ay nagaganap sa anyo at nilalaman sa panitikan, musika at sining), sa kabilang banda, sa matematika (ang konsepto ng systemicity ay tumutugma sa algebraic na konsepto ng wika). Ang ganitong konsepto ay nagbago sa konsepto ng linguistic na interpretasyon tulad ng: Ang mga penomena ay nagsimulang bigyang kahulugan hindi kaugnay sa mga sanhi ng kanilang paglitaw, ngunit may kaugnayan sa kasalukuyan at hinaharap. Ang interpretasyon ay tumigil na maging independyente sa mga intensyon ng isang tao (sa kabila ng katotohanan na ang mga intensyon ay maaaring impersonal, "walang malay" sa kahulugan ng Freudian ng salita).

Ang paggana ng mekanismo ng linggwistika ay ipinakikita sa pamamagitan ng aktibidad ng pagsasalita ng mga katutubong nagsasalita. Ang resulta ng pagsasalita ay ang tinatawag na "mga tamang teksto" - mga pagkakasunud-sunod ng mga yunit ng pagsasalita na sumusunod sa ilang mga pattern, na marami sa mga ito ay nagbibigay-daan sa isang paglalarawan ng matematika. Ang teorya ng mga paraan upang ilarawan ang syntactic na istraktura ay tumatalakay sa pag-aaral ng mga pamamaraan para sa matematikal na paglalarawan ng mga tamang teksto (pangunahin ang mga pangungusap). Sa ganitong istraktura, ang mga analohiya sa linggwistika ay tinukoy hindi sa tulong ng kanilang mga likas na katangian, ngunit sa tulong ng mga relasyon sa sistema ("structural").

Sa Kanluran, ang mga ideya ni Saussure ay binuo ng mga nakababatang kontemporaryo ng dakilang Swiss linguist: sa Denmark - L. Hjelmslev, na nabanggit ko na, na nagbunga ng algebraic theory ng wika sa kanyang akdang "Fundamentals of Linguistic Theory", sa ang USA - E. Sapir, L. Bloomfield, C. Harris, sa Czech Republic - ang Russian emigré scientist na si N. Trubetskoy.

Ang mga regular na istatistika sa pag-aaral ng wika ay nagsimulang harapin ng walang iba kundi ang tagapagtatag ng genetika, si Georg Mendel. Noong 1968 lamang natuklasan ng mga philologist na, sa mga huling taon ng kanyang buhay, siya ay nabighani sa pag-aaral ng linguistic phenomena gamit ang mga pamamaraan ng matematika. Dinala ni Mendel ang pamamaraang ito sa linggwistika mula sa biology; noong dekada 1990, tanging ang pinakamapangahas na linggwista at biologist ang nag-angkin ng pagiging posible ng naturang pagsusuri. Sa mga archive ng monasteryo ng St. Tomasz sa Brno, na ang abbot ay si Mendel, ang mga sheet ay natagpuan na may mga hanay ng mga apelyido na nagtatapos sa "mann", "bauer", "mayer", at may ilang mga fraction at kalkulasyon. Sa pagsisikap na matuklasan ang mga pormal na batas ng pinagmulan ng mga pangalan ng pamilya, gumawa si Mendel ng mga kumplikadong kalkulasyon, kung saan isinasaalang-alang niya ang bilang ng mga patinig at katinig sa wikang Aleman, ang kabuuang bilang ng mga salita na isinasaalang-alang niya, ang bilang ng mga apelyido, atbp.

Sa ating bansa, ang istrukturang lingguwistika ay nagsimulang umunlad sa halos parehong oras tulad ng sa Kanluran - sa pagliko ng ika-19-20 siglo. Kasabay ng F. de Saussure, ang konsepto ng wika bilang isang sistema ay binuo sa kanilang mga gawa ng mga propesor ng Kazan University F.F. Fortunatov at I.A. Baudouin de Courtenay. Ang huli ay nakipag-ugnayan nang mahabang panahon kay de Saussure, ayon sa pagkakabanggit, ang Geneva at Kazan na mga paaralan ng linggwistika ay nakipagtulungan sa isa't isa. Kung si Saussure ay matatawag na ideologist ng "eksaktong" mga pamamaraan sa linggwistika, kung gayon ang Baudouin de Courtenay ay naglatag ng mga praktikal na pundasyon para sa kanilang aplikasyon. Siya ang unang naghiwalay ng linggwistika (bilang tumpak isang agham na gumagamit ng mga istatistikal na pamamaraan at functional dependence) mula sa philology (isang komunidad ng mga humanitarian na disiplina na nag-aaral ng espirituwal na kultura sa pamamagitan ng wika at pananalita). Ang siyentipiko mismo ay naniniwala na "ang linggwistika ay maaaring maging kapaki-pakinabang sa malapit na hinaharap, napalaya lamang mula sa ipinag-uutos na unyon sa philology at kasaysayang pampanitikan" . Ang ponolohiya ay naging "lugar ng pagsubok" para sa pagpapakilala ng mga pamamaraang matematikal sa linggwistika - ang mga tunog bilang "mga atom" ng sistema ng wika, na may limitadong bilang ng mga madaling masusukat na katangian, ay ang pinaka maginhawang materyal para sa pormal at mahigpit na pamamaraan ng paglalarawan. Itinatanggi ng ponolohiya ang pagkakaroon ng kahulugan sa tunog, kaya inalis ang salik na "tao" sa mga pag-aaral. Sa ganitong diwa, ang mga ponema ay parang pisikal o biyolohikal na bagay.

Ang mga ponema, bilang pinakamaliit na elemento ng lingguwistika na katanggap-tanggap para sa persepsyon, ay kumakatawan sa isang hiwalay na globo, isang hiwalay na "phenomenological reality". Halimbawa, sa Ingles, ang tunog na "t" ay maaaring mabigkas nang iba, ngunit sa lahat ng pagkakataon, ang isang taong nagsasalita ng Ingles ay mapapansin ito bilang "t". Ang pangunahing bagay ay ang ponema ay gaganap ng kanyang pangunahing - makabuluhang - function. Bukod dito, ang mga pagkakaiba sa pagitan ng mga wika ay tulad na ang mga uri ng isang tunog sa isang wika ay maaaring tumutugma sa iba't ibang mga ponema sa isa pa; halimbawa, ang "l" at "r" sa Ingles ay magkaiba, habang sa iba pang mga wika ang mga ito ay mga uri ng parehong ponema (tulad ng Ingles na "t", binibigkas na mayroon o walang aspirasyon). Ang malawak na bokabularyo ng anumang natural na wika ay isang hanay ng mga kumbinasyon ng mas maliit na bilang ng mga ponema. Sa Ingles, halimbawa, 40 ponema lamang ang ginagamit sa pagbigkas at pagsulat ng humigit-kumulang isang milyong salita.

Ang mga tunog ng isang wika ay isang sistematikong nakaayos na hanay ng mga tampok. Noong 1920s -1930s, kasunod ni Saussure, Jacobson at N.S. Trubetskoy ay pinili ang "mga natatanging tampok" ng mga ponema. Ang mga tampok na ito ay batay sa istraktura ng mga organo ng pagsasalita - dila, ngipin, vocal cord. Halimbawa, sa Ingles ang pagkakaiba sa pagitan ng "t" at "d" ay ang pagkakaroon o kawalan ng isang "boses" (ang pag-igting ng mga vocal cord) at ang antas ng boses na nagpapakilala sa isang ponema mula sa isa pa. Kaya, ang ponolohiya ay maaaring ituring na isang halimbawa ng pangkalahatang tuntunin sa wika na inilarawan ni Saussure: "May mga pagkakaiba lamang sa wika". Ang mas mahalaga ay hindi ito: ang pagkakaiba ay kadalasang nagpapahiwatig ng eksaktong mga kondisyon kung saan ito matatagpuan; ngunit sa wika ay mayroon lamang mga pagkakaiba na walang tiyak na kondisyon. Isinasaalang-alang man natin ang "pagtatalaga" o "signified" - sa wika ay walang mga konsepto o tunog na umiiral bago ang pagbuo ng sistema ng wika.

Kaya, sa Saussurean linguistics, ang pinag-aralan na phenomenon ay nauunawaan bilang isang hanay ng mga paghahambing at pagsalungat ng wika. Ang wika ay parehong pagpapahayag ng kahulugan ng mga salita at isang paraan ng komunikasyon, at ang dalawang tungkuling ito ay hindi kailanman nagtutugma. Mapapansin natin ang paghahalili ng anyo at nilalaman: ang mga linguistic contrast ay tumutukoy sa mga istrukturang yunit nito, at ang mga yunit na ito ay nakikipag-ugnayan upang lumikha ng isang tiyak na makabuluhang nilalaman. Dahil random ang mga elemento ng wika, hindi maaaring maging batayan ang contrast o combination. Nangangahulugan ito na sa isang wika, ang mga natatanging tampok ay bumubuo ng isang phonetic contrast sa ibang antas ng pag-unawa, ang mga ponema ay pinagsama sa mga morpema, mga morpema - sa mga salita, mga salita - sa mga pangungusap, atbp. Sa anumang kaso, isang buong ponema, salita, pangungusap, atbp. ay higit pa sa kabuuan ng mga bahagi nito.

Iminungkahi ni Saussure ang ideya ng isang bagong agham ng ikadalawampu siglo, na hiwalay sa linggwistika, na pinag-aaralan ang papel ng mga palatandaan sa lipunan. Tinawag ni Saussure ang science semiology na ito (mula sa Greek na "semeîon" - isang tanda). Ang "agham" ng semiotics, na umunlad sa Silangang Europa noong 1920s at 1930s at sa Paris noong 1950s at 1960s, ay nagpalawak ng pag-aaral ng wika at mga istrukturang linggwistika sa mga natuklasang pampanitikan na binubuo (o nabuo) sa tulong ng mga istrukturang ito. Bilang karagdagan, sa takip-silim ng kanyang karera, kasabay ng kanyang kurso sa pangkalahatang linggwistika, si Saussure ay nakikibahagi sa isang "semiotic" na pagsusuri ng huling Romanong tula, sinusubukang tumuklas ng sadyang binubuo ng mga anagram ng mga wastong pangalan. Ang pamamaraang ito sa maraming paraan ay kabaligtaran ng rasyonalismo sa pagsusuri nito sa linggwistika: ito ay isang pagtatangka na pag-aralan sa isang sistema ang problema ng "probability" sa wika. Ang ganitong pananaliksik ay nakakatulong na tumuon sa "tunay na bahagi" ng posibilidad; ang "pangunahing salita" kung saan hinahanap ni Saussure ang isang anagram ay, ayon kay Jean Starobinsky, "isang kasangkapan para sa makata, hindi ang pinagmulan ng buhay ng tula." Ang tula ay nagsisilbing palitan ang mga tunog ng keyword. Ayon kay Starobinsky, sa pagsusuring ito, "Hindi sumasali si Saussure sa paghahanap ng mga nakatagong kahulugan." Sa kabaligtaran, sa kanyang mga gawa, ang pagnanais na maiwasan ang mga tanong na may kaugnayan sa kamalayan ay kapansin-pansin: "dahil ang tula ay ipinahayag hindi lamang sa mga salita, kundi pati na rin sa kung ano ang ibinubunga ng mga salitang ito, ito ay lampas sa kontrol ng kamalayan at nakasalalay lamang sa ang mga batas ng wika” (tingnan ang . Appendix 1).

Ang pagtatangka ni Saussure na pag-aralan ang mga wastong pangalan sa huling Romanong tula ay binibigyang-diin ang isa sa mga bahagi ng kanyang pagsusuri sa linggwistika - ang arbitraryong katangian ng mga palatandaan, gayundin ang pormal na esensya ng linggwistika ni Saussure, na hindi kasama ang posibilidad ng pagsusuri ng kahulugan. Napagpasyahan ni Todorov na ngayon ang mga gawa ni Saussure ay tila lubos na pare-pareho sa kanilang pag-aatubili na pag-aralan ang mga simbolo ng isang kababalaghan na may malinaw na tinukoy na kahulugan [Appendix 1]. Sa paggalugad ng mga anagram, binibigyang-pansin lamang ni Saussure ang pag-uulit, ngunit hindi ang mga nakaraang opsyon. . . . Sa pag-aaral ng Nibelungenlied, tinukoy niya ang mga simbolo upang italaga lamang ang mga ito sa mga maling pagbabasa: kung hindi sinasadya, ang mga simbolo ay hindi umiiral. Pagkatapos ng lahat, sa kanyang mga akda sa pangkalahatang linggwistika, ginagawa niya ang pagpapalagay ng pagkakaroon ng isang semiolohiya na naglalarawan hindi lamang ng mga palatandaang pangwika; ngunit ang palagay na ito ay limitado sa pamamagitan ng katotohanan na ang semiology ay maaari lamang maglarawan ng random, arbitrary na mga palatandaan.

Kung ito ay talagang gayon, ito ay dahil lamang sa hindi niya maisip ang "intensiyon" na walang bagay; hindi niya lubusang madugtungan ang agwat sa pagitan ng anyo at nilalaman - sa kanyang mga akda ay naging tanong ito. Sa halip, bumaling siya sa "linguistic legitimacy". Sa pagitan, sa isang banda, ang mga konsepto ng ikalabinsiyam na siglo batay sa kasaysayan at mga subjective na haka-haka, at mga pamamaraan ng random na interpretasyon batay sa mga konseptong ito, at, sa kabilang banda, mga istruktural na konsepto na nagbubura ng oposisyon sa pagitan ng anyo at nilalaman (paksa at bagay) , kahulugan at pinagmulan sa structuralism, psychoanalysis, at maging sa quantum mechanics - ang mga sinulat ni Ferdinand de Saussure sa linguistics at semiotics ay nagmamarka ng pagbabago sa pag-aaral ng mga kahulugan sa wika at kultura.

Ang mga siyentipikong Ruso ay kinatawan din sa Unang Internasyonal na Kongreso ng mga Linguist sa The Hague noong 1928. S. Kartsevsky, R. Yakobson at N. Trubetskoy ay gumawa ng isang ulat na sinuri ang hierarchical na istraktura ng wika - sa diwa ng mga pinaka-modernong ideya para sa simula ng huling siglo. Si Jakobson sa kanyang mga akda ay bumuo ng mga ideya ni Saussure na ang mga pangunahing elemento ng isang wika ay dapat pag-aralan, una sa lahat, na may kaugnayan sa kanilang mga tungkulin, at hindi sa mga dahilan ng kanilang paglitaw.

Sa kasamaang palad, pagkatapos na maluklok si Stalin noong 1924, ang linggwistika ng Russia, tulad ng maraming iba pang mga agham, ay ibinalik. Maraming mga mahuhusay na siyentipiko ang napilitang mangibang-bayan, pinaalis sa bansa o namatay sa mga kampo. Lamang mula noong kalagitnaan ng 1950s nagkaroon ng isang tiyak na pluralismo ng mga teorya na naging posible - higit pa dito sa Seksyon 1.2.

1.2 Paglalapat ng mga pamamaraang matematikal sa linggwistika sa ikalawang kalahati ng ikadalawampu siglo

Sa kalagitnaan ng ikadalawampu siglo, apat na paaralang pangwika sa daigdig ang nabuo, na ang bawat isa ay naging ninuno ng isang tiyak na "eksaktong" pamamaraan. Leningrad Phonological School(ang ninuno nito ay isang mag-aaral ng Baudouin de Courtenay L.V. Shcherba) ay gumamit ng isang psycholinguistic na eksperimento batay sa pagsusuri sa pagsasalita ng mga katutubong nagsasalita bilang pangunahing pamantayan para sa paglalahat ng tunog sa anyo ng isang ponema.

Mga siyentipiko Prague Linguistic Circle, sa partikular - ang tagapagtatag nito na si N.S. Si Trubetskoy, na lumipat mula sa Russia, ay bumuo ng teorya ng mga pagsalungat - ang semantikong istraktura ng wika ay inilarawan nila bilang isang hanay ng mga oppositionally constructed semantic units - Sem. Ang teoryang ito ay inilapat sa pag-aaral hindi lamang sa wika, kundi pati na rin sa kulturang masining.

Mga ideologo Amerikanong deskriptibismo ay mga linggwista na sina L. Bloomfield at E. Sapir. Ang wika ay ipinakita sa mga deskriptibista bilang isang hanay ng mga pahayag sa pagsasalita, na siyang pangunahing layunin ng kanilang pag-aaral. Ang kanilang pokus ay sa mga tuntunin ng siyentipikong paglalarawan (kaya ang pangalan) ng mga teksto: ang pag-aaral ng organisasyon, pag-aayos at pag-uuri ng kanilang mga elemento. Ang pormalisasyon ng mga pamamaraang analitikal sa larangan ng ponolohiya at morpolohiya (pagbuo ng mga prinsipyo para sa pag-aaral ng wika sa iba't ibang antas, pagsusuri sa pamamahagi, pamamaraan ng mga direktang nasasakupan, atbp.) ay humantong sa pagbabalangkas ng mga pangkalahatang katanungan ng pagmomolde ng linggwistika. Ang kawalan ng pansin sa plano ng nilalaman ng wika, gayundin ang paradigmatikong panig ng wika, ay hindi nagbigay-daan sa mga deskriptibista na ganap na bigyang-kahulugan ang wika bilang isang sistema.

Noong 1960s, nabuo ang teorya ng mga pormal na gramatika, na lumitaw pangunahin dahil sa gawain ng pilosopo at lingguwistang Amerikano na si N. Chomsky. Siya ay nararapat na ituring na isa sa mga pinakatanyag na modernong siyentipiko at pampublikong pigura, maraming mga artikulo, monograp at kahit isang buong dokumentaryo ang nakatuon sa kanya. Sa pangalan ng isang panimula na bagong paraan ng paglalarawan ng syntactic na istraktura na naimbento ni Chomsky - generative (generative) grammar - ang kaukulang kalakaran sa linggwistika ay tinawag generativism.

Si Chomsky, isang inapo ng mga imigrante mula sa Russia, ay nag-aral ng linguistics, matematika at pilosopiya sa Unibersidad ng Pennsylvania mula noong 1945, na malakas na naiimpluwensyahan ng kanyang gurong si Zelig Harris - tulad ni Harris, isinasaalang-alang ni Chomsky at isinasaalang-alang pa rin ang kanyang pampulitikang pananaw na malapit sa anarkismo (siya ay kilala bilang kritiko ng umiiral na sistemang pampulitika ng US at bilang isa sa mga espirituwal na pinuno ng anti-globalismo).

Ang unang pangunahing gawaing pang-agham ni Chomsky, ang master's thesis na "Morpolohiya ng Modernong Hebrew » (1951) ay nanatiling hindi nai-publish. Natanggap ni Chomsky ang kanyang titulo ng doktor mula sa Unibersidad ng Pennsylvania noong 1955, ngunit karamihan sa pananaliksik na pinagbabatayan ng kanyang disertasyon (nai-publish nang buo noong 1975 sa ilalim ng pamagat na The Logical Structure of Linguistic Theory) at ang kanyang unang monograph, Syntactic Structures (1957, Rus. trans . 1962), ay ginanap sa Harvard University noong 1951-1955. Sa parehong 1955, lumipat ang siyentipiko sa Massachusetts Institute of Technology, kung saan siya ay naging propesor noong 1962.

Ang teorya ni Chomsky ay dumaan sa ilang yugto sa pag-unlad nito.

Sa unang monograph na "Syntactic Structures", ipinakita ng siyentipiko ang wika bilang isang mekanismo para sa pagbuo ng isang walang katapusang hanay ng mga pangungusap gamit ang isang may hangganang hanay ng mga paraan ng gramatika. Upang ilarawan ang mga katangian ng lingguwistika, iminungkahi niya ang mga konsepto ng malalim (nakatago mula sa direktang pang-unawa at nabuo ng isang sistema ng recursive, ibig sabihin, maaaring ilapat nang paulit-ulit, mga panuntunan) at ibabaw (direktang pinaghihinalaang) mga istrukturang gramatika, pati na rin ang mga pagbabagong naglalarawan sa paglipat mula sa malalalim na istruktura hanggang sa ibabaw. Ang ilang mga istraktura sa ibabaw ay maaaring tumutugma sa isang malalim na istraktura (halimbawa, isang passive na istraktura Ang kautusan ay nilagdaan ng pangulo nagmula sa parehong Deep Structure bilang aktibong construct Pinirmahan ng Pangulo ang kautusan) at kabaliktaran (kaya, ang kalabuan mahal ng ina ang anak na babae inilarawan bilang resulta ng isang pagkakataon ng mga istruktura sa ibabaw na bumalik sa dalawang magkaibang malalim, kung saan ang ina ay ang nagmamahal sa anak na babae, at sa isa pa, ang minamahal ng anak na babae).

Ang pamantayang teorya ni Chomsky ay itinuturing na "Aspects" na modelo na itinakda sa aklat ni Chomsky na "Aspects of the Theory of Syntax". Sa modelong ito, sa unang pagkakataon, ang mga tuntunin ng semantikong interpretasyon ay ipinakilala sa pormal na teorya, na nag-uugnay ng kahulugan sa malalim na mga istruktura. Sa Aspekto, ang linguistic competence ay laban sa paggamit ng wika (performance), ang tinatawag na Katz-Postal hypothesis tungkol sa pangangalaga ng kahulugan sa panahon ng pagbabago ay pinagtibay, na may kaugnayan kung saan ang konsepto ng opsyonal na pagbabago ay hindi kasama, at isang apparatus ng Ang mga tampok na sintaktik na naglalarawan sa pagkakatugma ng leksikal ay ipinakilala.

Noong 1970s, nagtrabaho si Chomsky sa teorya ng kontrol at pagbubuklod (GB-theory - mula sa mga salita pamahalaan at nagbubuklod) ay mas pangkalahatan kaysa sa nauna. Sa loob nito, tinalikuran ng siyentipiko ang mga tiyak na panuntunan na naglalarawan sa mga istrukturang sintaktik ng mga partikular na wika. Ang lahat ng mga pagbabago ay napalitan ng isang unibersal na paglipat ng pagbabago. Sa loob ng balangkas ng teorya ng GB, mayroon ding mga pribadong module, na ang bawat isa ay may pananagutan para sa sarili nitong bahagi ng grammar.

Kamakailan lamang, noong 1995, naglagay si Chomsky ng isang minimalist na programa, kung saan ang wika ng tao ay inilalarawan tulad ng machine language. Ito ay isang programa lamang - hindi isang modelo o isang teorya. Sa loob nito, kinilala ni Chomsky ang dalawang pangunahing subsystem ng kagamitan ng wika ng tao: ang lexicon at ang computing system, pati na rin ang dalawang interface - phonetic at logical.

Ang mga pormal na grammar ni Chomsky ay naging klasiko para sa paglalarawan hindi lamang natural kundi pati na rin ang mga artipisyal na wika - sa partikular, mga programming language. Ang pag-unlad ng structural linguistics sa ikalawang kalahati ng ika-20 siglo ay nararapat na ituring na isang "Chomskian revolution".

Moscow Phonological School, na ang mga kinatawan ay sina A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, gumamit ng katulad na teorya sa pag-aaral ng phonetics. Unti-unti, ang mga "eksaktong" mga pamamaraan ay nagsisimulang ilapat patungkol hindi lamang sa phonetics, kundi pati na rin sa syntax. Parehong linguist at mathematician, dito at sa ibang bansa, ay nagsisimulang pag-aralan ang istruktura ng wika. Noong 1950s at 60s, nagsimula ang isang bagong yugto sa pakikipag-ugnayan sa pagitan ng matematika at linggwistika sa USSR, na nauugnay sa pag-unlad ng mga sistema ng pagsasalin ng makina.

Ang impetus para sa pagsisimula ng mga gawaing ito sa ating bansa ay ang mga unang pag-unlad sa larangan ng pagsasalin ng makina sa Estados Unidos (bagaman ang unang mekanisadong kagamitan sa pagsasalin ni P.P. Smirnov-Troyansky ay naimbento sa USSR noong 1933, ito, bilang primitive. , ay hindi naging laganap). Noong 1947, gumawa sina A. Butt at D. Britten ng isang code para sa pagsasalin ng salita-sa-salita gamit ang isang computer; makalipas ang isang taon, iminungkahi ni R. Richens ang isang panuntunan para sa paghahati ng mga salita sa mga stems at mga pagtatapos sa pagsasalin ng makina. Ibang-iba ang mga taon na iyon sa ngayon. Ang mga ito ay napakalaki at mamahaling mga makina na kumukuha ng buong mga silid at nangangailangan ng malaking kawani ng mga inhinyero, operator at programmer upang mapanatili ang mga ito. Karaniwan, ang mga computer na ito ay ginamit upang magsagawa ng mga kalkulasyon sa matematika para sa mga pangangailangan ng mga institusyong militar - ang bago sa matematika, pisika at teknolohiya na pinagsilbihan, una sa lahat, ang mga gawaing militar. Sa mga unang yugto, ang pagbuo ng MP ay aktibong suportado ng militar, habang (sa mga kondisyon ng Cold War) ang direksyon ng Russian-English na binuo sa USA, at ang direksyon ng Anglo-Russian sa USSR.

Noong Enero 1954, naganap ang "Georgetown Experiment" sa Massachusetts Technical University - ang unang pampublikong demonstrasyon ng pagsasalin mula sa Ruso sa Ingles sa makina ng IBM-701. Abstract ng mensahe tungkol sa matagumpay na pagpasa ng eksperimento, na ginawa ni D.Yu. Panov, ay lumitaw sa RJ "Mathematics", 1954, No. 10: "Pagsasalin mula sa isang wika patungo sa isa pa gamit ang isang makina: isang ulat sa unang matagumpay na pagsubok."

Si D. Yu. Panov (sa oras na iyon ay direktor ng Institute of Scientific Information - INI, kalaunan ay VINITI) ay umakit kay I. K. Belskaya, na kalaunan ay pinamunuan ang machine translation group sa Institute of Precise Mathematics at Computer Engineering ng USSR Academy of Sciences, upang magtrabaho sa pagsasalin ng makina. Sa pagtatapos ng 1955, ang unang karanasan ng pagsasalin mula sa Ingles sa Russian sa tulong ng BESM machine ay nagsimula noon. Ang mga programa para sa BESM ay pinagsama-sama ng N.P. Trifonov at L.N. Korolev, na ang tesis ng Ph.D. ay nakatuon sa mga pamamaraan para sa pagbuo ng mga diksyunaryo para sa pagsasalin ng makina.

Kaayon, ang trabaho sa pagsasalin ng makina ay isinagawa sa Kagawaran ng Applied Mathematics ng Mathematical Institute ng USSR Academy of Sciences (ngayon ay M.V. Keldysh Institute of Applied Mathematics ng Russian Academy of Sciences). Sa inisyatiba ng mathematician na si A.A. Lyapunov. Kasama niya ang O.S. Kulagin at ang kanyang mga mag-aaral na T.D. Sina Wentzel at N.N. Ricco. Ang mga ideya nina Lyapunov at Kulagina tungkol sa posibilidad ng paggamit ng teknolohiya upang magsalin mula sa isang wika patungo sa isa pa ay inilathala sa journal Nature, 1955, No. 8. Mula sa katapusan ng 1955, T.N. Moloshnaya, na pagkatapos ay nagsimulang independiyenteng gawain sa algorithm ng pagsasalin ng English-Russian.

Naaalala ni R. Frumkina, na sa oras na iyon ay nakikibahagi sa algorithm ng pagsasalin mula sa Espanyol, na sa yugtong ito ng gawain ay mahirap gumawa ng anumang mga pare-parehong hakbang. Mas madalas kailangan kong sundin ang heuristic na karanasan - sarili ko o mga kasamahan.

Gayunpaman, ang unang henerasyon ng mga sistema ng pagsasalin ng makina ay napakadi-perpekto. Ang lahat ng mga ito ay batay sa sunud-sunod na mga algorithm ng pagsasalin "salita sa pamamagitan ng salita", "parirala sa pamamagitan ng parirala" - ang mga koneksyon sa semantiko sa pagitan ng mga salita at pangungusap ay hindi isinasaalang-alang sa anumang paraan. Halimbawa, ang mga pangungusap ay: Hinahanap ni John ang kanyang kahon ng laruan.Sa wakas ay natagpuan niya ito. Ang kahon ay nasa panulat.Tuwang-tuwa si John. (Hinahanap ni John ang kanyang kahon ng laruan. Sa wakas ay nakita niya ito. Nasa playpen ang kahon. Tuwang-tuwa si John.).” Ang "Pulat" sa kontekstong ito ay hindi isang "panulat" (kasangkapan sa pagsulat), ngunit isang "playpen" ( play-pen). Ang kaalaman sa mga kasingkahulugan, kasalungat at matalinghagang kahulugan ay mahirap ipasok sa isang computer. Ang isang promising na direksyon ay ang pagbuo ng mga computer system na nakatuon sa paggamit ng isang tao na tagasalin.

Sa paglipas ng panahon, ang mga direktang sistema ng pagsasalin ay pinalitan ng mga T-system (mula sa salitang Ingles na "paglipat" - pagbabagong-anyo), kung saan isinagawa ang pagsasalin sa antas ng mga istrukturang sintaktik. Ang mga algorithm ng mga T-system ay gumamit ng mekanismo na naging posible upang bumuo ng isang syntactic na istraktura ayon sa mga tuntunin ng grammar ng wika ng input na pangungusap (katulad ng kung paano itinuro ang isang banyagang wika sa mataas na paaralan), at pagkatapos ay i-synthesize ang output na pangungusap. sa pamamagitan ng pagbabago sa istrukturang sintaktik at pagpapalit ng mga kinakailangang salita mula sa diksyunaryo.

Si Lyapunov ay nagsalita tungkol sa pagsasalin sa pamamagitan ng pagkuha ng kahulugan ng isinalin na teksto at paglalahad nito sa ibang wika. Ang diskarte sa pagbuo ng mga machine translation system batay sa pagkuha ng semantic representation ng input sentence sa pamamagitan ng semantic analysis at synthesis ng input sentence ayon sa nakuha na semantic representation ay itinuturing pa rin na pinakaperpekto. Ang ganitong mga sistema ay tinatawag na I-systems (mula sa salitang "interlingua"). Gayunpaman, ang gawain ng paglikha ng mga ito, na ibinalik noong huling bahagi ng 50s at unang bahagi ng 60s, ay hindi pa ganap na nalutas sa ngayon, sa kabila ng mga pagsisikap ng International Federation of IFIP - ang komunidad ng mundo ng mga siyentipiko sa larangan ng pagproseso ng impormasyon.

Naisip ng mga siyentipiko kung paano gawing pormal at bumuo ng mga algorithm para sa pagtatrabaho sa mga teksto, kung anong mga diksyunaryo ang dapat ipasok sa makina, kung anong mga pattern ng linguistic ang dapat gamitin sa pagsasalin ng makina. Ang tradisyunal na lingguwistika ay walang ganoong mga ideya - hindi lamang sa mga tuntunin ng semantika, kundi pati na rin sa mga tuntunin ng syntax. Sa oras na iyon, walang mga listahan ng mga syntactic constructions para sa anumang wika, ang mga kondisyon para sa kanilang compatibility at interchangeability ay hindi pinag-aralan, ang mga patakaran para sa pagbuo ng malalaking yunit ng syntactic structure mula sa mas maliliit na elemento ng constituent ay hindi binuo.

Ang pangangailangan na lumikha ng mga teoretikal na pundasyon ng pagsasalin ng makina ay humantong sa pagbuo at pag-unlad ng matematikal na lingguwistika. Ang nangungunang papel sa bagay na ito sa USSR ay ginampanan ng mga mathematician na si A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, mga linggwista na si V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Ang disertasyon ni Kulagina ay nakatuon sa pag-aaral ng pormal na teorya ng mga gramatika (kasabay ng N. Khomsky sa USA), iniharap ni Kuznetsov ang gawain ng axiomatization ng linguistics, na bumalik sa mga gawa ni F.F. Fortunatov.

Noong Mayo 6, 1960, ang Decree ng Presidium ng USSR Academy of Sciences "Sa pagbuo ng mga istruktura at matematikal na pamamaraan para sa pag-aaral ng wika" ay pinagtibay, at ang kaukulang mga dibisyon ay nilikha sa Institute of Linguistics at Institute of ang Wikang Ruso. Mula noong 1960, ang nangungunang humanitarian universities ng bansa - ang Faculty of Philology ng Moscow State University, Leninrad, Novosibirsk Universities, Moscow State Institute of Foreign Languages ​​​​ay nagsimulang magsanay ng mga tauhan sa larangan ng awtomatikong pagproseso ng teksto.

Gayunpaman, ang mga gawa sa pagsasalin ng makina sa panahong ito, na tinatawag na "klasikal", ay may teoretikal sa halip na praktikal na interes. Ang mga cost-effective na machine translation system ay nagsimulang malikha lamang noong dekada otsenta ng huling siglo. Pag-uusapan ko ito mamaya sa Seksyon 2.1, Machine Translation.

Kasama sa 1960s - 70s ang malalim na teoretikal na pag-unlad gamit ang mga pamamaraan ng set theory at mathematical logic, tulad ng field theory at fuzzy set theory.

Ang may-akda ng field theory sa linguistics ay ang Sobyet na makata, tagasalin at linguist na si V.G. Admoni. Una niyang binuo ang kanyang teorya batay sa wikang Aleman. Para kay Admoni, ang konsepto ng "patlang" ay tumutukoy sa isang arbitraryong hindi walang laman na hanay ng mga elementong pangwika (halimbawa, "lexical field", "semantic field").

Ang istraktura ng field ay heterogenous: ito ay binubuo ng isang core, ang mga elemento nito ay mayroong kumpletong hanay ng mga feature na tumutukoy sa isang set, at isang periphery, ang mga elemento nito ay maaaring magkaroon ng parehong feature ng isang ibinigay na set (hindi lahat) at mga kapitbahay. Magbibigay ako ng isang halimbawa na naglalarawan sa pahayag na ito: halimbawa, sa Ingles, ang larangan ng mga tambalang salita (“day-dream” - “dream” ay mahirap ihiwalay sa larangan ng mga parirala (“tear gas” - “tear gas”) .

Ang teorya ng fuzzy set na nabanggit na sa itaas ay malapit na nauugnay sa field theory. Sa USSR, ang mga linggwista na si V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, gayunpaman, ang ninuno nito ay ang American mathematician na si L. Zadeh, na noong 1965 ay naglathala ng artikulong "Fuzzy Logic". Sa pagbibigay ng katwiran sa matematika para sa teorya ng fuzzy set, itinuring ni Zade ang mga ito batay sa materyal na lingguwistika.

Sa teoryang ito, hindi gaanong pinag-uusapan ang tungkol sa pag-aari ng mga elemento sa isang naibigay na set (АОа), kundi tungkol sa antas ng membership na ito (mАОа), dahil ang mga peripheral na elemento ay maaaring kabilang sa ilang mga larangan sa isang antas o iba pa. Si Zade (Lofti-zade) ay isang katutubong ng Azerbaijan, hanggang sa edad na 12 ay nagkaroon siya ng kasanayan sa pakikipag-usap sa apat na wika - Azerbaijani, Russian, English at Persian - at gumamit ng tatlong magkakaibang mga alpabeto: Cyrillic, Latin, Arabic. Kapag tinanong ang isang siyentipiko kung ano ang karaniwan sa pagitan ng fuzzy set theory at linguistics, hindi niya itinatanggi ang koneksyon na ito, ngunit nilinaw niya: "Hindi ako sigurado na ang pag-aaral ng mga wikang ito ay may malaking epekto sa aking pag-iisip. Kung ito ang kaso, pagkatapos lamang subconsciously. Sa kanyang kabataan, nag-aral si Zadeh sa isang Presbyterian school sa Tehran, at pagkatapos ng Ikalawang Digmaang Pandaigdig ay lumipat siya sa Estados Unidos. "Ang tanong ay hindi kung ako ay isang Amerikano, Ruso, Azerbaijani o ibang tao," sabi niya sa isa sa mga pag-uusap, "Ako ay hinubog ng lahat ng mga kultura at mga tao na ito at medyo komportable sa bawat isa sa kanila." Sa mga salitang ito mayroong isang bagay na katulad sa kung ano ang nagpapakilala sa teorya ng mga malabo na hanay - isang pag-alis mula sa hindi malabo na mga kahulugan at matalim na mga kategorya.

Sa ating bansa, noong dekada 70, isinalin at pinag-aralan ang mga gawa ng mga Kanluraning linggwista noong ikadalawampu siglo. I.A. Isinalin ni Melchuk ang mga gawa ni N. Chomsky sa Russian. SA. Iniuugnay ni Slyusareva sa kanyang aklat na "The Theory of F. de Saussure in the Light of Modern Linguistics" ang mga postulate ng pagtuturo ni Saussure sa mga aktwal na problema ng linguistics noong dekada 70. May tendensiya sa karagdagang mathematization ng linggwistika. Ang mga nangungunang domestic unibersidad ay mga tauhan ng pagsasanay sa espesyalidad na "Mathematical (theoretical, applied) linguistics". Kasabay nito sa Kanluran ay mayroong isang matalim na paglukso sa pag-unlad ng teknolohiya ng kompyuter, na nangangailangan ng higit at higit pang mga bagong pundasyong pangwika.

Noong 1980s, Propesor ng Institute of Oriental Studies ng Academy of Sciences Yu.K. Si Lekomtsev, habang sinusuri ang wika ng linggwistika sa pamamagitan ng pagsusuri ng mga iskema, talahanayan at iba pang uri ng notasyon na ginagamit sa mga paglalarawang linggwistika, ay isinasaalang-alang ang mga sistemang pangmatematika na angkop para sa mga layuning ito (pangunahin ang mga sistema ng matrix algebra).

Kaya, sa buong ikadalawampu siglo, nagkaroon ng convergence ng eksaktong at humanities. Ang pakikipag-ugnayan ng matematika sa linggwistika ay lalong nakahanap ng mga praktikal na aplikasyon. Higit pa tungkol dito sa susunod na kabanata.

Kabanata 2. Mga piling halimbawa ng paggamit ng matematika sa linggwistika

2.1 Pagsasalin sa makina

Ang ideya ng pagsasalin mula sa isang wika patungo sa isa pa sa tulong ng isang unibersal na mekanismo ay lumitaw ilang siglo bago nagsimula ang mga unang pag-unlad sa lugar na ito - noong 1649, iminungkahi ni Rene Descartes ang ideya ng isang wika kung saan ang mga katumbas na ideya ng ang iba't ibang wika ay ipahahayag ng isang simbolo. Ang mga unang pagtatangka na ipatupad ang ideyang ito noong 1930s-40s, ang simula ng teoretikal na pag-unlad sa kalagitnaan ng siglo, ang pagpapabuti ng mga sistema ng pagsasalin sa tulong ng teknolohiya noong 1970s-80s, ang mabilis na pag-unlad ng teknolohiya ng pagsasalin sa huling dekada - ito ang mga yugto sa pagbuo ng machine translation bilang isang industriya. Ito ay mula sa mga gawa sa machine translation na ang computer linguistics bilang isang agham ay lumago.

Sa pag-unlad ng teknolohiya ng computer noong huling bahagi ng dekada 70 at unang bahagi ng dekada 80, itinakda ng mga mananaliksik ang kanilang sarili na mas makatotohanan at matipid na mga layunin - ang makina ay hindi naging isang katunggali (tulad ng ipinapalagay dati), ngunit isang katulong sa isang tagasalin ng tao. Ang pagsasalin ng makina ay huminto sa paglilingkod ng eksklusibong mga gawaing militar (lahat ng mga imbensyon at pananaliksik ng Sobyet at Amerikano, na pangunahing nakatuon sa Ruso at Ingles, ay nag-ambag sa Cold War sa isang paraan o iba pa). Noong 1978, ang mga natural na salita sa wika ay ipinadala sa pamamagitan ng Arpa interconnected network, at pagkaraan ng anim na taon, ang unang microcomputer translation program ay lumitaw sa Estados Unidos.

Noong dekada 70, binibili ng Commission of the European Communities ang English-French na bersyon ng Systran computer translator, na nag-order din ng French-English at Italian-English na bersyon, at ang Russian-to-English translation system na ginagamit ng US Armed Forces. Ito ay kung paano inilatag ang mga pundasyon ng proyekto ng EUROTRA.

Tungkol sa muling pagkabuhay ng machine translation noong 70-80s. Ang mga sumusunod na katotohanan ay nagpapatotoo: binibili ng Commission of the European Communities (CEC) ang English-French na bersyon ng Systran, gayundin ang sistema ng pagsasalin mula sa Russian patungo sa English (ang huli ay binuo pagkatapos ng ulat ng ALPAC at patuloy na ginagamit ng US Air Force at NASA); bilang karagdagan, ipinag-uutos ng CEC ang pagbuo ng mga bersyong French-English at Italian-English. Kasabay nito, mayroong mabilis na pagpapalawak ng mga aktibidad sa pagsasalin ng makina sa Japan; sa USA, iniutos ng Pan American Health Organization (PAHO) ang pagbuo ng isang Spanish-English na direksyon (SPANAM system); Pinopondohan ng US Air Force ang pagbuo ng isang machine translation system sa Linguistic Research Center sa University of Texas sa Austin; Ang pangkat ng TAUM sa Canada ay gumagawa ng kapansin-pansing pag-unlad sa pagbuo ng kanilang METEO (meteorological translation) system. Ang ilang mga proyekto ay nagsimula noong 70s at 80s. pagkatapos ay binuo sa ganap na komersyal na mga sistema.

Sa panahon ng 1978-93, 20 milyong dolyar ang ginugol sa pananaliksik sa larangan ng pagsasalin ng makina sa USA, 70 milyon sa Europa, at 200 milyon sa Japan.

Ang isa sa mga bagong pag-unlad ay ang teknolohiya ng TM (translation memory), na gumagana sa prinsipyo ng akumulasyon: sa panahon ng proseso ng pagsasalin, ang orihinal na segment (pangungusap) at ang pagsasalin nito ay nai-save, na nagreresulta sa pagbuo ng isang linguistic database; kung ang isang kapareho o katulad na segment ay matatagpuan sa bagong isinalin na teksto, ito ay ipinapakita kasama ng pagsasalin at isang indikasyon ng porsyento na tugma. Ang tagasalin pagkatapos ay gumawa ng desisyon (upang i-edit, tanggihan o tanggapin ang pagsasalin), ang resulta nito ay iniimbak ng system, kaya hindi na kailangang isalin ang parehong pangungusap nang dalawang beses. Ang isang kilalang komersyal na sistema batay sa teknolohiya ng TM ay kasalukuyang binuo ng TRADOS system (itinatag noong 1984).

Sa kasalukuyan, ilang dosenang kumpanya ang bumubuo ng mga komersyal na sistema ng pagsasalin ng makina, kabilang ang: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata Software; Linguistica b.v. at iba pa. Ngayon ay maaari mong gamitin ang mga serbisyo ng mga awtomatikong tagapagsalin nang direkta sa Web: alphaWorks; Online na Tagasalin ng PROMT; LogoMedia.net; Serbisyo sa Pagsasalin ng Babel Fish ng AltaVista; InfiniT.com; Pagsasalin ng Internet.

Ang mga komersyal na epektibong sistema ng pagsasalin ay lumitaw din sa ikalawang kalahati ng dekada 80 sa ating bansa. Ang mismong konsepto ng machine translation ay lumawak (nagsimula itong isama ang "paglikha ng isang bilang ng mga awtomatiko at automated na system at device na awtomatiko o semi-awtomatikong gumaganap sa buong ikot ng pagsasalin o mga indibidwal na gawain sa isang dialogue sa isang tao"), at tumaas ang laang-gugulin ng pamahalaan para sa pagpapaunlad ng industriyang ito.

Ang Russian, English, German, French at Japanese ay naging pangunahing wika ng mga domestic translation system. Ang All-Union Translation Center (VTsP) ay bumuo ng isang sistema para sa pagsasalin mula sa English at German sa Russian gamit ang EC-1035-ANRAP na computer. Binubuo ito ng tatlong diksyunaryo - input English at German at output Russian - sa ilalim ng isang software. Mayroong ilang mga pinapalitan na dalubhasang diksyunaryo - sa teknolohiya ng computer, programming, radio electronics, mechanical engineering, agrikultura, metalurhiya. Maaaring gumana ang system sa dalawang mode - awtomatiko at interactive, kapag ipinakita ng screen ang pinagmulang teksto at pagsasalin sa bawat parirala, na maaaring i-edit ng isang tao. Ang bilis ng pagsasalin ng teksto sa ANRAP (mula sa simula ng pag-type hanggang sa katapusan ng pag-print) ay humigit-kumulang 100 mga pahina bawat oras.

Noong 1989, nilikha ang isang pamilya ng mga komersyal na tagasalin ng uri ng SPRINT, nagtatrabaho sa Russian, English, German at Japanese. Ang kanilang pangunahing bentahe ay ang kanilang pagiging tugma sa IBM PC - kaya, ang mga domestic machine translation system ay umabot sa internasyonal na antas ng kalidad. Kasabay nito, ang isang sistema ng pagsasalin ng makina mula sa Pranses sa Russian FRAP ay binuo, na kinabibilangan ng 4 na yugto ng pagsusuri ng teksto: graphematic, morphological, syntactic at semantic. Sa LGPI sila. Herzen, ang trabaho ay isinasagawa sa isang apat na wika (Ingles, Pranses, Espanyol, Ruso) na sistemang SILOD-MP (Ingles-Russian at Franco-Russian na mga diksyunaryo ay ginamit sa industriyal na mode.

Para sa espesyal na pagsasalin ng mga teksto sa electrical engineering, umiral ang ETAP-2 system. Ang pagsusuri ng input text dito ay isinagawa sa dalawang antas - morphological at syntactic. Ang diksyunaryo ng ETAP-2 ay naglalaman ng humigit-kumulang 4 na libong mga entry; ang yugto ng pagbabago ng teksto - humigit-kumulang 1000 panuntunan (96 pangkalahatan, 342 pribado, ang iba ay diksyunaryo). Tiniyak ng lahat ng ito ang isang kasiya-siyang kalidad ng pagsasalin (sabihin, ang pamagat ng patent na "Optical phase grid arrangement at coupling device na may ganoong arrangement" ay isinalin bilang "Isang optical phase grid device at isang connecting device na may ganoong device" - sa kabila ng tautolohiya, ang kahulugan ay napanatili).

Sa Minsk Pedagogical Institute of Foreign Languages, batay sa English-Russian na diksyunaryo ng mga form at parirala ng salita, isang sistema para sa pagsasalin ng makina ng mga pamagat ay naimbento, sa Institute of Oriental Studies ng Academy of Sciences - isang sistema para sa pagsasalin. mula sa Hapon tungo sa Ruso. Ang unang awtomatikong serbisyo sa bokabularyo at terminology (SLOTHERM) para sa computing at programming, na nilikha sa Moscow Research Institute of Automation Systems, ay naglalaman ng humigit-kumulang 20,000 termino sa isang paliwanag na diksyunaryo at mga espesyal na diksyunaryo para sa linguistic na pananaliksik.

Ang mga sistema ng pagsasalin ng makina ay unti-unting nagsimulang gamitin hindi lamang para sa kanilang nilalayon na layunin, ngunit bilang isang mahalagang bahagi ng mga awtomatikong sistema ng pag-aaral (para sa pagtuturo ng pagsasalin, pagsuri sa spelling at kaalaman sa gramatika).

Ang dekada 90 ay nagdala ng mabilis na pag-unlad ng merkado ng PC (mula sa desktop hanggang sa bulsa) at teknolohiya ng impormasyon, ang malawakang paggamit ng Internet (na nagiging mas internasyonal at multilinggwal). Ang lahat ng ito ay ginawa ang karagdagang pag-unlad ng mga awtomatikong sistema ng pagsasalin sa demand. Mula noong unang bahagi ng 1990s Ang mga domestic developer ay pumapasok din sa merkado ng mga sistema ng PC.

Noong Hulyo 1990, ang unang komersyal na sistema ng pagsasalin ng makina sa Russia na tinatawag na PROMT (Programmer's Machine Translation) ay ipinakita sa PC Forum sa Moscow. Nanalo ang PROMT sa kumpetisyon ng NASA para sa supply ng mga MP system (PROMT ang tanging kumpanyang hindi Amerikano dito. noong 1992, naglabas ang PROMT ng isang buong pamilya ng mga system sa ilalim ng bagong pangalan na STYLUS para sa pagsasalin mula sa English, German, French, Italian at Spanish sa Russian at mula sa Russian sa English, at ang unang machine translation system para sa Windows ay nilikha noong ang batayan ng STYLUS noong 1993. Noong 1994, inilabas ang STYLUS 2.0 para sa Windows 3.X/95/NT, at noong 1995-1996 ang ikatlong henerasyon ng mga machine translation system, ganap na 32-bit STYLUS 3.0 para sa Windows 95/NT, habang matagumpay na nakumpleto ang pagbuo ng ganap na bago, ang unang Russian-German at Russian-French na sistema ng pagsasalin ng makina sa mundo.

Noong 1997, nilagdaan ang isang kasunduan sa kumpanyang Pranses na Softissimo sa paglikha ng mga sistema ng pagsasalin mula sa Pranses sa Aleman at Ingles at sa kabaligtaran, at noong Disyembre ng taong ito, inilabas ang unang sistema ng pagsasalin ng Aleman-Pranses sa mundo. Sa parehong taon, ang kumpanya ng PROMT ay naglabas ng isang sistema na ipinatupad gamit ang Gigant na teknolohiya, na sumusuporta sa ilang mga direksyon ng wika sa isang shell, pati na rin ang isang espesyal na tagasalin para sa pagtatrabaho sa Internet WebTranSite.

Noong 1998, isang buong konstelasyon ng mga programa ang inilabas sa ilalim ng bagong pangalang PROMT 98. Pagkalipas ng isang taon, naglabas ang PROMT ng dalawang bagong produkto: isang natatanging software package para sa pagtatrabaho sa Internet - PROMT Internet, at isang tagasalin para sa mga corporate mail system - PROMT Mail Tagasalin. Noong Nobyembre 1999, kinilala ang PROMT bilang ang pinakamahusay na sistema ng pagsasalin ng makina na sinubok ng French magazine na PC Expert, na nalampasan ang mga katunggali nito ng 30 porsiyento. Ang mga espesyal na solusyon sa server ay binuo din para sa mga kliyente ng korporasyon - ang corporate translation server na PROMT Translation Server (PTS) at ang Internet solution na PROMT Internet Translation Server (PITS). Noong 2000, in-update ng PROMT ang buong linya ng mga produkto ng software sa pamamagitan ng pagpapalabas ng bagong henerasyon ng mga MT system: PROMT Translation Office 2000, PROMT Internet 2000 at Magic Gooddy 2000.

Ang online na pagsasalin na may suporta ng sistema ng PROMT ay ginagamit sa isang bilang ng mga domestic at dayuhang site: Online Translator ng PROMT, InfiniT.com, Translate.Ru, Lycos, atbp., pati na rin sa mga institusyon ng iba't ibang mga profile para sa pagsasalin ng mga dokumento ng negosyo, mga artikulo at liham (may mga translation system na direktang binuo sa Outlook Express at iba pang email client).

Sa ngayon, umuusbong ang mga bagong teknolohiya sa pagsasalin ng makina batay sa paggamit ng mga artificial intelligence system at mga istatistikal na pamamaraan. Tungkol sa huli - sa susunod na seksyon.

2.2 Mga pamamaraan ng istatistika sa pag-aaral ng wika

Malaking atensyon sa modernong linggwistika ang ibinibigay sa pag-aaral ng linguistic phenomena gamit ang mga pamamaraan ng quantitative mathematics. Madalas na nakakatulong ang quantitative data upang mas malalim na maunawaan ang mga phenomena na pinag-aaralan, ang kanilang lugar at papel sa sistema ng mga kaugnay na phenomena. Ang sagot sa tanong na "magkano" ay nakakatulong upang masagot ang mga tanong na "ano", "paano", "bakit" - ganyan ang heuristic na potensyal ng isang quantitative na katangian.

Malaki ang papel na ginagampanan ng mga pamamaraan ng istatistika sa pagbuo ng mga sistema ng pagsasalin ng makina (tingnan ang Seksyon 2.1). Sa istatistikal na diskarte, ang problema sa pagsasalin ay isinasaalang-alang sa mga tuntunin ng isang maingay na channel. Isipin na kailangan nating isalin ang isang pangungusap mula sa Ingles sa Russian. Ang prinsipyo ng maingay na channel ay nag-aalok sa amin ng sumusunod na paliwanag ng kaugnayan sa pagitan ng isang Ingles at isang Russian na pangungusap: ang isang English na pangungusap ay walang iba kundi isang Russian na pangungusap na binaluktot ng ilang uri ng ingay. Upang mabawi ang orihinal na pangungusap na Ruso, kailangan nating malaman kung ano ang karaniwang sinasabi ng mga tao sa Russian at kung paano binaluktot ang mga pariralang Ruso sa Ingles. Isinasagawa ang pagsasalin sa pamamagitan ng paghahanap para sa gayong pangungusap na Ruso na nagpapalaki sa mga produkto ng walang kondisyong posibilidad ng pangungusap na Ruso at ang posibilidad ng pangungusap sa Ingles (orihinal) na ibinigay sa ibinigay na pangungusap na Ruso. Ayon sa teorama ni Bayes, ang Russian na pangungusap na ito ay ang pinaka-malamang na pagsasalin ng Ingles:

kung saan e ang pagsasalin na pangungusap at f ang orihinal na pangungusap

Kaya kailangan namin ng isang modelo ng pinagmulan at isang modelo ng channel, o isang modelo ng wika at isang modelo ng pagsasalin. Ang modelo ng wika ay dapat magtalaga ng marka ng posibilidad sa anumang pangungusap sa target na wika (sa aming kaso, Russian), at ang modelo ng pagsasalin sa orihinal na pangungusap. (tingnan ang talahanayan 1)

Sa pangkalahatan, gumagana ang isang machine translation system sa dalawang mode:

1. Pagsasanay sa system: isang training corpus ng mga parallel na teksto ay kinuha, at gamit ang linear programming, ang mga naturang value ng translation correspondence table ay hinahanap na nagpapalaki sa posibilidad ng (halimbawa) ang Russian na bahagi ng corpus na may available na English ayon sa sa napiling modelo ng pagsasalin. Ang isang modelo ng wikang Ruso ay itinayo sa bahaging Ruso ng parehong corpus.

2. Pagsasamantala: batay sa nakuhang data para sa isang hindi pamilyar na pangungusap sa Ingles, hinahanap ang isang Ruso na nagpapalaki sa produkto ng mga probabilidad na itinalaga ng modelo ng wika at modelo ng pagsasalin. Ang program na ginagamit para sa naturang paghahanap ay tinatawag na decoder.

Ang pinakasimpleng modelo ng pagsasalin ng istatistika ay ang modelo ng literal na pagsasalin. Ipinapalagay ng modelong ito na upang maisalin ang isang pangungusap mula sa isang wika patungo sa isa pa, sapat na upang isalin ang lahat ng mga salita (lumikha ng isang "bag ng mga salita"), at ibibigay ng modelo ang kanilang pagkakalagay sa tamang pagkakasunud-sunod. Upang bawasan ang P( a, f | e) hanggang P(a | e , f), i.e. mga probabilidad ng isang naibigay na pagkakahanay na binigyan ng isang pares ng mga pangungusap, ang bawat probabilidad na P(a, f | e) ay na-normalize ng kabuuan ng mga probabilidad ng lahat ng pagkakahanay ng isang ibinigay na pares ng mga pangungusap:

Ang pagpapatupad ng Viterbi algorithm na ginamit upang sanayin ang Modelo #1 ay ang mga sumusunod:

1. Ang buong talahanayan ng mga probabilidad ng pagsusulatan sa pagsasalin ay puno ng parehong mga halaga.

2. Para sa lahat ng posibleng variant ng magkapares na koneksyon ng mga salita, ang posibilidad na P(a, f | e) ay kinakalkula:

3. Ang mga halaga ng P(a, f | e) ay na-normalize upang makuha ang mga halaga ng P(a | e, f).

4. Ang dalas ng bawat pares ng pagsasalin ay kinakalkula, na natimbang ayon sa posibilidad ng bawat opsyon sa pagkakahanay.

5. Ang mga resultang weighted frequency ay na-normalize at bumubuo ng isang bagong talahanayan ng mga probabilidad ng pagsusulatan sa pagsasalin

6. Ulitin ang algorithm mula sa hakbang 2.

Isaalang-alang, bilang halimbawa, ang pagsasanay ng isang katulad na modelo sa isang corpus ng dalawang pares ng mga pangungusap (Larawan 2):

puting bahay

  • Bahay/Bahay

Pagkatapos ng isang malaking bilang ng mga pag-ulit, makakakuha tayo ng isang talahanayan (Talahanayan 2), na nagpapakita na ang pagsasalin ay isinasagawa nang may mataas na katumpakan.

Gayundin, malawakang ginagamit ang mga pamamaraang istatistika sa pag-aaral ng bokabularyo, morpolohiya, syntax, at istilo. Ang mga siyentipiko mula sa Perm State University ay nagsagawa ng isang pag-aaral batay sa assertion na ang mga stereotypical na parirala ay isang mahalagang "building material" ng teksto. Ang mga pariralang ito ay binubuo ng "nuklear" na paulit-ulit na mga salita at mga dependent na salita-specifier at may binibigkas na pang-istilong pangkulay.

Sa istilong pang-agham, ang mga salitang "nuklear" ay maaaring tawaging: pananaliksik, pag-aaral, gawain, suliranin, tanong, kababalaghan, katotohanan, pagmamasid, pagsusuri atbp. Sa pamamahayag, ang ibang mga salita ay magiging "nuklear", na may tumaas na halaga partikular para sa teksto ng pahayagan: oras, tao, kapangyarihan, negosyo, aksyon, batas, buhay, kasaysayan, lugar atbp. (kabuuan 29)

Ang partikular na interes ng mga linguist ay ang propesyonal na pagkakaiba-iba ng pambansang wika, ang orihinalidad ng paggamit ng bokabularyo at gramatika, depende sa uri ng hanapbuhay. Ito ay kilala na ang mga driver sa propesyonal na pagsasalita ay gumagamit ng form w tungkol sa fer, sabi ng mga medics k tungkol sa club sa halip na cocktail Yu sh - maaaring ibigay ang mga ganitong halimbawa. Ang gawain ng mga istatistika ay subaybayan ang pagkakaiba-iba ng pagbigkas at ang pagbabago sa pamantayan ng wika.

Ang mga pagkakaiba sa propesyonal ay humantong sa mga pagkakaiba hindi lamang sa gramatika, kundi pati na rin sa leksikal. Ipinangalan ang Yakut State University M.K. Ammosov, 50 mga talatanungan ay nasuri na may pinakakaraniwang mga reaksyon sa ilang mga salita sa mga manggagamot at tagabuo (Talahanayan 3).

Mga tagabuo

Tao

pasyente (10), personalidad (5)

lalaki (5)

mabuti

tulong (8), tulong (7)

masama (16)

isang buhay

kamatayan (10)

maganda (5)

kamatayan

bangkay (8)

buhay (6)

ang apoy

init (8), paso (6)

apoy (7)

daliri

kamay (14), panaritium (5)

malaki (7), index (6)

mata

paningin (6), mag-aaral, ophthalmologist (5 bawat isa)

kayumanggi (10), malaki (6)

ulo

isip (14), utak (5)

malaki (9), matalino (8), matalino (6)

matalo

kamalayan, buhay (4 bawat isa)

pera (5), hanapin (4)

Mapapansin na ang mga manggagamot ay mas madalas kaysa sa mga tagapagtayo ay nagbibigay ng mga asosasyon na may kaugnayan sa kanilang mga propesyonal na aktibidad, dahil ang salitang-stimuli na ibinigay sa talatanungan ay may higit na kinalaman sa kanilang propesyon kaysa sa propesyon ng isang tagabuo.

Ang mga istatistikal na regularidad sa isang wika ay ginagamit upang lumikha ng mga diksyunaryo ng dalas - mga diksyunaryo na nagbibigay ng mga numerical na katangian ng dalas ng mga salita (mga anyo ng salita, mga parirala) ng anumang wika - ang wika ng manunulat, anumang akda, atbp. Karaniwan, ang dalas ng paglitaw ng ang isang salita ay ginagamit bilang isang katangian ng dalas ng paglitaw ng isang salita sa teksto ng isang tiyak na volume

Ang modelo ng speech perception ay imposible nang walang diksyunaryo bilang mahalagang bahagi nito. Sa pang-unawa ng pagsasalita, ang pangunahing yunit ng pagpapatakbo ay ang salita. Mula rito, sa partikular, ang bawat salita ng pinaghihinalaang teksto ay dapat matukoy sa kaukulang yunit ng panloob na bokabularyo ng tagapakinig (o mambabasa). Natural lang na ipagpalagay na sa simula pa lang ang paghahanap ay limitado sa ilang subdomain ng diksyunaryo. Ayon sa karamihan sa mga modernong teorya ng speech perception, ang aktwal na phonetic analysis ng tunog na teksto sa isang tipikal na kaso ay nagbibigay lamang ng ilang bahagyang impormasyon tungkol sa posibleng phonological na hitsura ng salita, at ang ganitong uri ng impormasyon ay tumutugma sa hindi isa, ngunit isang tiyak na MARAMING salita. ng diksyunaryo; Samakatuwid, dalawang problema ang lumitaw:

(a) piliin ang naaangkop na hanay ayon sa ilang mga parameter;

(b) sa loob ng mga hangganan ng nakabalangkas na hanay (kung ito ay inilalaan nang sapat) upang "tanggalin" ang lahat ng mga salita, maliban sa isa lamang na pinakamahusay na tumutugma sa ibinigay na salita ng kinikilalang teksto. Isa sa mga diskarte sa "pag-dropout" ay ang pagbubukod ng mga salitang mababa ang dalas. Ito ay sumusunod na ang bokabularyo para sa speech perception ay isang frequency dictionary. Ito ay ang paglikha ng isang computer na bersyon ng dalas ng diksyunaryo ng wikang Ruso na ang unang gawain ng ipinakita na proyekto.

Batay sa materyal ng wikang Ruso, mayroong 5 mga diksyunaryo ng dalas (hindi binibilang ang mga diksyunaryo ng sangay). Pansinin lamang natin ang ilang pangkalahatang pagkukulang ng umiiral na mga diksyunaryo.

Ang lahat ng kilalang diksyonaryo ng dalas ng wikang Ruso ay batay sa pagproseso ng mga arrays ng nakasulat (naka-print) na mga teksto. Bahagyang para sa kadahilanang ito, kapag ang pagkakakilanlan ng isang salita ay higit na nakabatay sa pormal, graphic na pagkakataon, ang semantika ay hindi sapat na isinasaalang-alang. Bilang isang resulta, ang mga katangian ng dalas ay inilipat din, nabaluktot; halimbawa, kung ang compiler ng frequency dictionary ay nagsasama ng mga salita mula sa kumbinasyong "isa't isa" sa pangkalahatang istatistika ng paggamit ng salitang "kaibigan", kung gayon ito ay halos hindi makatwiran: dahil sa mga semantika, dapat nating aminin na ang mga ito ay na ibang mga salita, o sa halip, na ang isang independiyenteng yunit ng diksyunaryo ay kumbinasyon lamang sa kabuuan.

Gayundin, sa lahat ng umiiral na mga diksyunaryo, ang mga salita ay inilalagay lamang sa kanilang mga pangunahing anyo: mga pangngalan sa isahan na anyo, nominative case, mga pandiwa sa infinitive na anyo, atbp. Ang ilan sa mga diksyunaryo ay nagbibigay ng impormasyon tungkol sa dalas ng mga anyo ng salita, ngunit kadalasan ay hindi nila ito ginagawa nang pare-pareho nang sapat, hindi sa isang kumpletong paraan. Ang mga frequency ng iba't ibang anyo ng salita ng parehong salita ay halatang hindi tugma. Dapat isaalang-alang ng developer ng isang speech perception model na sa isang tunay na proseso ng perceptual, ito ay tiyak na isang tiyak na anyo ng salita na "nalulubog" sa teksto na napapailalim sa pagkilala: batay sa pagsusuri ng paunang seksyon ng exponent ng anyo ng salita, nabuo ang isang hanay ng mga salita na may magkaparehong simula, at ang paunang seksyon ng anyo ng salita ay hindi kinakailangang magkapareho sa paunang seksyon ng anyo ng diksyunaryo . Ito ay ang anyo ng salita na may isang tiyak na ritmikong istraktura, na isa ring napakahalagang parameter para sa perceptual na pagpili ng mga salita. Sa wakas, sa huling representasyon ng kinikilalang pagbigkas, muli, ang mga salita ay kinakatawan ng kaukulang mga anyo ng salita.

Maraming mga gawa na nagpapakita ng kahalagahan ng dalas sa proseso ng pang-unawa sa pagsasalita. Ngunit hindi namin alam ang mga gawa kung saan gagamitin ang dalas ng mga anyo ng salita - sa kabaligtaran, halos hindi binabalewala ng lahat ng may-akda ang dalas ng mga indibidwal na anyo ng salita, na eksklusibong tumutukoy sa mga lexemes. Kung ang mga resultang nakuha ng mga ito ay hindi itinuturing na artifact, kailangang ipagpalagay na ang katutubong nagsasalita sa anumang paraan ay may access sa impormasyon tungkol sa ratio ng mga frequency ng mga anyo ng salita at mga anyo ng diksyunaryo, ibig sabihin, sa katunayan, mga lexemes. Bukod dito, ang gayong paglipat mula sa isang anyo ng salita patungo sa isang lexeme, siyempre, ay hindi maipaliwanag ng natural na kaalaman sa kaukulang paradigm, dahil ang impormasyon ng dalas ay dapat gamitin bago ang pangwakas na pagkakakilanlan ng salita, kung hindi man ay nawawalan lamang ito ng kahulugan.

Ayon sa pangunahing istatistikal na katangian, posibleng matukoy gamit ang isang naibigay na kamag-anak na error na bahagi ng bokabularyo, na kinabibilangan ng mga salitang may mataas na dalas ng paglitaw, anuman ang uri ng teksto. Posible rin, sa pamamagitan ng pagpapasok ng sunud-sunod na pag-order sa diksyunaryo, upang makakuha ng isang serye ng mga diksyunaryo na sumasaklaw sa unang 100, 1000, 5000, atbp. ng mga madalas na salita. Ang mga istatistikal na katangian ng diksyunaryo ay interesado na may kaugnayan sa semantikong pagsusuri ng bokabularyo. Ang pag-aaral ng mga paksa-ideolohikal na grupo at mga larangang semantiko ay nagpapakita na ang mga leksikal na asosasyon ay sinusuportahan ng mga semantikong link na nakatuon sa paligid ng mga lexeme na may pinakakaraniwang kahulugan. Ang paglalarawan ng mga kahulugan sa loob ng patlang ng lexico-semantic ay maaaring isagawa sa pamamagitan ng pagtukoy ng mga salitang may pinakamaraming abstract na lexemes sa kahulugan. Tila, ang mga yunit ng diksyunaryo na "walang laman" (mula sa punto ng view ng mga nominative potencies) ay bumubuo ng isang homogenous na layer na ayon sa istatistika.

Ang mga bokabularyo para sa mga indibidwal na genre ay hindi gaanong mahalaga. Ang pag-aaral sa sukat ng kanilang pagkakapareho at ang likas na katangian ng mga distribusyon ng istatistika ay magbibigay ng kawili-wiling impormasyon tungkol sa qualitative stratification ng bokabularyo depende sa saklaw ng paggamit ng pagsasalita.

Ang pagsasama-sama ng malalaking dalas ng mga diksyunaryo ay nangangailangan ng paggamit ng teknolohiya ng computer. Ang pagpapakilala ng bahagyang mekanisasyon at automation sa proseso ng paggawa sa isang diksyunaryo ay kawili-wili bilang isang eksperimento sa pagproseso ng makina ng mga diksyunaryo para sa iba't ibang mga teksto. Ang ganitong diksyunaryo ay nangangailangan ng mas mahigpit na sistema para sa pagproseso at pag-iipon ng materyal sa bokabularyo. Sa miniature, ito ay isang information retrieval system na nakapagbibigay ng impormasyon tungkol sa iba't ibang aspeto ng teksto at bokabularyo. Ang ilang mga pangunahing kahilingan sa system na ito ay pinlano mula pa sa simula: ang kabuuang bilang ng mga salita sa imbentaryo, ang mga istatistikal na katangian ng isang salita at buong mga diksyunaryo, ang pag-order ng madalas at bihirang mga zone ng diksyunaryo, atbp. Ang machine card file ay nagbibigay-daan sa iyo upang awtomatikong bumuo ng mga reverse na diksyunaryo para sa mga indibidwal na genre at pinagmulan. Maraming iba pang kapaki-pakinabang na istatistikal na impormasyon tungkol sa wika ang kukunin mula sa naipon na hanay ng impormasyon. Ang diksyunaryo ng dalas ng computer ay lumilikha ng isang pang-eksperimentong batayan para sa paglipat sa isang mas malawak na automation ng gawaing bokabularyo.

Ang istatistikal na data ng mga diksyonaryo ng dalas ay maaari ding malawakang magamit sa paglutas ng iba pang mga problema sa wika - halimbawa, sa pagsusuri at pagtukoy ng aktibong paraan ng pagbuo ng salita ng modernong wikang Ruso, paglutas ng mga isyu ng pagpapabuti ng mga graphics at spelling, na nauugnay sa pagkuha sa account ng istatistikal na impormasyon tungkol sa bokabularyo (mahalagang isaalang-alang ang mga probabilistikong katangian ng mga kumbinasyon ng grapheme, mga uri ng mga kumbinasyon ng titik na natanto sa mga salita), praktikal na transkripsyon at transliterasyon. Ang mga istatistikal na parameter ng diksyunaryo ay magiging kapaki-pakinabang din sa paglutas ng mga problema sa pag-automate ng pag-type, pagkilala at awtomatikong pagbabasa ng literal na teksto.

Ang mga modernong paliwanag na diksyonaryo at gramatika ng wikang Ruso ay pangunahing itinayo batay sa panitikan at masining na mga teksto. May mga frequency na diksyunaryo ng wika ng A.S. Pushkin, A.S. Griboedova, F.M. Dostoevsky, V.V. Vysotsky at marami pang ibang may-akda. Sa Kagawaran ng Kasaysayan at Teorya ng Panitikan ng Estado ng Smolensk. Ang Pedagogical University ay nagtatrabaho sa loob ng ilang taon upang mag-compile ng mga frequency na diksyunaryo ng mga tekstong patula at prosa. Para sa pag-aaral na ito, napili ang mga diksyunaryo ng dalas ng lahat ng mga liriko ng Pushkin at dalawa pang makata ng ginintuang panahon - "Woe from Wit" ni Griboyedov at lahat ng tula ni Lermontov; Pasternak at limang iba pang makata ng Panahon ng Pilak - Balmont 1894-1903, "Mga Tula tungkol sa Magagandang Babae" ni Blok, "Bato" ni Mandelstam, "Haligi ng Apoy" ni Gumilyov, "Anno Domini MCMXXI" ni Akhmatova at "Mga Sister ng Ang Aking Buhay" ni Pasternak at apat pang makata ng Panahon ng Bakal - "Mga Tula ni Yuri Zhivago", "When it clears up", ang buong corpus ng lyrics ni M. Petrovs, "Malayo ang kalsada", "Windscreen", "Paalam sa snow" at "Horseshoes" ni Mezhirov, "Antimirov" ni Voznesensky at "Snowballs » Rylenkova.

Dapat pansinin na ang mga diksyunaryo na ito ay naiiba sa likas na katangian: ang ilan ay kumakatawan sa bokabularyo ng isang dramatikong gawain, ang iba - mga libro ng lyrics, o ilang mga libro, o ang buong corpus ng mga tula ng makata. Ang mga resulta ng pagsusuri na ipinakita sa papel na ito ay dapat gawin nang may pag-iingat, hindi sila maaaring kunin bilang isang ganap. Gayunpaman, sa tulong ng mga espesyal na hakbang, ang pagkakaiba sa ontological na kalikasan ng mga teksto ay maaaring mabawasan sa isang tiyak na lawak.

Sa mga nagdaang taon, ang pagsalungat sa pagitan ng kolokyal at pagsasalita sa libro ay naging mas malinaw na natanto. Ang isyung ito ay lalong matalas na tinalakay sa mga metodologo na humihingi ng turn sa pagtuturo patungo sa sinasalitang wika. Gayunpaman, ang pagtitiyak ng kolokyal na pananalita ay nananatiling hindi maipaliwanag.

Ang mga diksyunaryo ay naproseso sa pamamagitan ng paglikha ng isang user application sa kapaligiran ng EXCEL97 office program. Kasama sa application ang apat na worksheet ng EXCEL book - "Title Sheet", "Dictionaries" sheet na may paunang data, "Proximity" at "Distansya" na may mga resulta, pati na rin ang isang set ng mga macro.

Ang paunang impormasyon ay ipinasok sa sheet na "Mga Diksyunaryo". Ang mga diksyunaryo ng mga pinag-aralan na teksto ay isinusulat sa mga selulang EXCEL, ang huling hanay na S ay nabuo mula sa mga resultang nakuha at katumbas ng bilang ng mga salita na matatagpuan sa ibang mga diksyunaryo. Ang mga talahanayan na "Proximity" at "Mga Distansya" ay naglalaman ng mga kalkuladong sukat ng proximity M, correlation R at distansya D.

Ang application macros ay mga event-based programming procedures na nakasulat sa Visual Basic for Application (VBA). Ang mga pamamaraan ay batay sa mga bagay sa library ng VBA at ang kanilang mga pamamaraan sa pagproseso. Kaya, para sa mga pagpapatakbo na may mga worksheet ng application, ang pangunahing bagay na Worksheet (worksheet) at ang kaukulang paraan ng pag-activate ng sheet na Activate (activate) ay ginagamit. Ang pagtatakda ng hanay ng nasuri na source data sa Dictionary sheet ay isinasagawa sa pamamagitan ng Select method ng Range object (range), at ang paglilipat ng mga salita bilang mga value sa mga variable ay ginagawa bilang Value property (value) ng parehong Range bagay.

Sa kabila ng katotohanan na ang pagsusuri ng ugnayan ng ranggo ay nagpapaingat sa atin tungkol sa pagdepende ng mga paksa sa pagitan ng iba't ibang mga teksto, karamihan sa mga pinakamadalas na salita sa bawat teksto ay may mga tugma sa isa o higit pang mga teksto. Ipinapakita ng Column S ang bilang ng mga naturang salita sa 15 pinakamadalas na salita para sa bawat may-akda. Ang mga salitang naka-bold ay lumilitaw lamang sa isang salita ng makata sa aming talahanayan. Ang Blok, Akhmatova at Petrovs ay walang mga naka-highlight na salita, mayroon silang S = 15. Ang tatlong makata na ito ay may parehong 15 pinaka-madalas na salita, naiiba lamang sila sa lugar sa listahan. Ngunit kahit na si Pushkin, na ang bokabularyo ay ang pinaka orihinal, ay may S = 8, at mayroong 7 naka-highlight na salita.

Ang mga resulta ay nagpapakita na mayroong isang tiyak na layer ng bokabularyo na tumutok sa mga pangunahing tema ng tula. Bilang isang tuntunin, ang mga salitang ito ay maikli: mula sa kabuuang bilang (225) ng iisang pantig na paggamit ng salita 88, dalawang pantig 127, tatlong pantig 10. Kadalasan ang mga salitang ito ay kumakatawan sa mga pangunahing mitolohiya at maaaring magkapares: gabi - araw, lupa - langit (araw), Diyos - tao (tao), buhay - kamatayan, katawan - kaluluwa, Roma - mundo(sa Mandelstam); maaaring pagsamahin sa mga mythologem ng mas mataas na antas: langit, bituin, araw, lupa; sa isang tao, bilang panuntunan, ang katawan, puso, dugo, braso, binti, pisngi, mata ay namumukod-tangi. Sa mga estado ng tao, ang kagustuhan ay ibinibigay sa pagtulog at pag-ibig. Ang bahay at lungsod ay nabibilang sa mundo ng tao - Moscow, Roma, Paris. Ang pagkamalikhain ay kinakatawan ng mga lexemes salita at kanta.

Sina Griboedov at Lermontov ay halos walang mga salita na nagsasaad ng kalikasan sa mga madalas na salita. Mayroon silang tatlong beses na mas maraming mga salita na nagsasaad ng isang tao, mga bahagi ng kanyang katawan, mga elemento ng kanyang espirituwal na mundo. Pushkin at mga makata ng ikadalawampu siglo. ang mga pagtatalaga ng tao at kalikasan ay humigit-kumulang pantay. Sa mahalagang aspetong ito ng paksa, masasabi nating ang ikadalawampu siglo. sumunod kay Pushkin.

Minimal na Tema kaso kabilang sa mga pinaka-madalas na salita, ito ay matatagpuan lamang sa Griboyedov at Pushkin. Lermontov at mga makata ng ikadalawampu siglo. nagbibigay daan ito sa isang minimal na tema salita. Ang salita ay hindi ibinubukod ang mga gawa (ang biblikal na interpretasyon ng paksa: sa Bagong Tipan, ang lahat ng mga turo ni Jesucristo ay itinuturing na salita ng Diyos o salita ni Jesus, at kung minsan ay tinatawag ng mga apostol ang kanilang sarili na mga ministro ng Salita). Ang sagradong kahulugan ng salitang lexeme ay nakakumbinsi na ipinakita, halimbawa, sa taludtod ni Pasternak na "At ang imahe ng mundo, na inihayag sa Salita." Ang sagradong kahulugan ng lexeme salita kasabay ng at kaibahan sa mga gawain ng tao, ito ay nakakumbinsi na ipinakita sa tula ng parehong pangalan ni Gumilyov.

Ang mga token na matatagpuan lamang sa isang teksto ay nagpapakilala sa pagka-orihinal ng isang partikular na aklat o isang koleksyon ng mga aklat. Halimbawa, ang salitang "isip" ang pinakamadalas sa komedya ni Griboedov na "Woe from Wit" - ngunit hindi ito nangyayari sa mga frequency na salita ng iba pang mga teksto. Ang tema ng isip ang pinakamahalaga sa komedya. Ang lexeme na ito ay kasama ng imahe ng Chatsky, at ang pangalan ng Chatsky ay ang pinakamadalas sa komedya. Kaya, ang gawain ay organikong pinagsama ang pinakamadalas na karaniwang pangngalan na may pinakamadalas na pangngalang pantangi.

Ang pinakamataas na koepisyent ng ugnayan ay nag-uugnay sa mga tema ng mga trahedya na aklat na "The Pillar of Fire" ni Gumilyov at "Anno Domini MCMXXI" ni Akhmatova. Sa 15 pinakamadalas na pangngalan, mayroong 10 pangkaraniwan, kabilang ang dugo, puso, kaluluwa, pag-ibig, salita, langit. Alalahanin na ang aklat ni Akhmatova ay may kasamang isang miniature na "Hindi ka mabubuhay ...", na isinulat sa pagitan ng pag-aresto kay Gumilyov at ng kanyang pagpatay.

Ang mga tema ng kandila at ang karamihan ng tao sa pinag-aralan na materyal ay matatagpuan lamang sa "Mga Tula ni Yuri Zhivago". Ang tema ng kandila sa mga talata mula sa nobela ay may maraming kontekstwal na kahulugan: nauugnay ito sa imahe ni Jesucristo, na may mga tema ng pananampalataya, kawalang-kamatayan, pagkamalikhain, petsa ng pag-ibig. Ang kandila ang pinakamahalagang pinagmumulan ng liwanag sa mga sentral na eksena ng nobela. Ang tema ng karamihan ay bubuo na may kaugnayan sa pangunahing ideya ng nobela, kung saan ang pribadong buhay ng isang tao na may hindi matitinag na mga halaga ay salungat sa imoralidad ng bagong estado, na binuo sa mga prinsipyo ng pagpapasaya sa karamihan. .

Kasama rin sa gawain ang ikatlong yugto, na makikita rin sa programa, - ito ang pagkalkula ng pagkakaiba sa mga ordinal na bilang ng mga salita na karaniwan sa dalawang diksyunaryo at ang average na distansya sa pagitan ng parehong mga salita ng dalawang diksyunaryo. Ang yugtong ito ay nagbibigay-daan sa paglipat mula sa mga pangkalahatang uso sa pakikipag-ugnayan ng mga diksyunaryo na natukoy sa tulong ng mga istatistika tungo sa isang antas na papalapit sa teksto. Halimbawa, ang mga libro ng Gumilyov at Akhmatova ay makabuluhang nauugnay sa istatistika. Tinitingnan namin kung aling mga salita ang naging karaniwan para sa kanilang mga diksyonaryo, at, una sa lahat, pipiliin namin ang mga serial number na kaunti lang ang pagkakaiba o katumbas ng zero. Ang mga salitang ito ay may parehong bilang ng ranggo at, dahil dito, ang mga minimal na tema sa isipan ng dalawang makata ang parehong mahalaga. Susunod, dapat kang lumipat sa antas ng mga teksto at konteksto.

Nakakatulong din ang quantitative na pamamaraan upang pag-aralan ang mga katangian ng mga tao - mga katutubong nagsasalita. Sabihin, mayroong 6 na kaso sa Russian, walang mga kaso sa Ingles, at sa ilang mga wika ng mga mamamayan ng Dagestan, ang bilang ng mga kaso ay umabot sa 40. L. Perlovsky sa kanyang artikulong "Consciousness, Language and Culture" ay iniuugnay ang mga ito mga katangian na may ugali ng mga tao sa indibidwalismo o kolektibismo, na may pang-unawa sa mga bagay at phenomena nang hiwalay o may kaugnayan sa iba. Pagkatapos ng lahat, ito ay sa mundo na nagsasalita ng Ingles (walang mga kaso - ang bagay ay nakikita "sa pamamagitan ng kanyang sarili") na ang mga konsepto tulad ng indibidwal na kalayaan, liberalismo at demokrasya ay lumitaw (tandaan ko na ginagamit ko lamang ang mga konseptong ito na may kaugnayan sa wika, nang walang anumang mga katangian ng pagsusuri). Sa kabila ng katotohanan na ang gayong mga hula ay nananatili lamang sa antas ng mga matapang na pang-agham na hypotheses, nakakatulong silang tingnan ang mga pamilyar na phenomena sa isang bagong paraan.

Tulad ng nakikita natin, ang mga quantitative na katangian ay maaaring ilapat sa ganap na magkakaibang mga lugar ng linggwistika, na lalong lumalabo ang mga hangganan sa pagitan ng "eksakto" at "makatao" na mga pamamaraan. Ang linggwistika ay lalong gumagamit ng tulong hindi lamang sa matematika, kundi pati na rin sa teknolohiya ng kompyuter upang malutas ang mga problema nito.

2.3 Pag-aaral ng wika sa pamamagitan ng mga pamamaraan ng pormal na lohika

Sa mga di-quantitative na pamamaraan ng matematika, sa partikular, na may lohika, ang modernong teoretikal na lingguwistika ay nakikipag-ugnayan nang hindi gaanong mabunga kaysa sa dami. Ang mabilis na pag-unlad ng mga teknolohiya ng computer at ang paglago ng kanilang papel sa modernong mundo ay nangangailangan ng rebisyon ng diskarte sa pakikipag-ugnayan ng wika at lohika sa pangkalahatan.

Ang mga pamamaraan ng lohika ay malawakang ginagamit sa pagbuo ng mga pormal na wika, sa partikular, mga programming language, ang mga elemento nito ay ilang mga simbolo (katulad ng matematika), pinili (o binuo mula sa mga dating napiling simbolo) at binibigyang kahulugan sa isang tiyak na paraan, nauugnay. sa anumang "tradisyonal" na paggamit, pag-unawa at pag-unawa. mga function ng parehong mga simbolo sa ibang mga konteksto. Ang isang programmer ay patuloy na nakikitungo sa lohika sa kanyang trabaho. Ang punto ng programming ay tiyak na turuan ang computer na mangatuwiran (sa pinakamalawak na kahulugan ng salita). Kasabay nito, ang mga pamamaraan ng "pangangatwiran" ay nagiging ibang-iba. Ang bawat programmer ay gumugugol ng ilang oras sa paghahanap ng mga bug sa kanilang sarili at sa mga programa ng ibang tao. Iyon ay, upang maghanap ng mga pagkakamali sa pangangatwiran, sa lohika. At nag-iiwan din ito ng marka. Mas madaling makakita ng mga lohikal na pagkakamali sa ordinaryong pagsasalita. Ang kamag-anak na pagiging simple ng mga wikang pinag-aralan ng mga logician ay nagbibigay-daan sa kanila na ipaliwanag ang mga istruktura ng mga wikang ito nang mas malinaw kaysa sa maabot ng mga linguist na nagsusuri ng eksklusibong kumplikadong mga natural na wika. Sa pagtingin sa katotohanan na ang mga wikang pinag-aralan ng mga logician ay gumagamit ng mga ugnayang kinopya mula sa mga natural na wika, ang mga logician ay nakakagawa ng makabuluhang kontribusyon sa pangkalahatang teorya ng wika. Ang sitwasyon dito ay katulad ng nangyayari sa pisika: ang physicist ay bumubuo rin ng mga theorems para sa perpektong pinasimple na mga kaso na hindi nangyayari sa kalikasan sa lahat - siya ay bumubuo ng mga batas para sa mga ideal na gas, perpektong likido, nagsasalita tungkol sa paggalaw sa kawalan ng friction, atbp. Para sa mga idealized na kaso na ito, maaaring magtatag ng mga simpleng batas na makatutulong nang malaki sa pag-unawa sa kung ano talaga ang nangyayari at kung ano ang malamang na mananatiling hindi alam sa physics kung sinubukan nitong isaalang-alang ang katotohanan nang direkta, sa lahat ng pagiging kumplikado nito.

Sa pag-aaral ng mga natural na wika, ang mga lohikal na pamamaraan ay ginagamit upang ang mga nag-aaral ng wika ay hindi "kabisaduhin" ng maraming salita hangga't maaari, ngunit mas maunawaan ang istraktura nito. Gumamit din si L. Shcherba sa kanyang mga lektura ng isang halimbawa ng pangungusap na binuo alinsunod sa mga batas ng wikang Ruso: "Ang glitched kuzdra shteko ay nagboke ng bokra at nagkulot ng bokra," at pagkatapos ay tinanong ang mga estudyante kung ano ang ibig sabihin nito. Sa kabila ng katotohanan na ang kahulugan ng mga salita sa pangungusap ay nanatiling hindi malinaw (wala lang sila sa Russian), posible na malinaw na sagutin: "kuzdra" ang paksa, isang pambabae na pangngalan, sa isahan, nominative na kaso, " bokr” ay animated, at iba pa. Ang pagsasalin ng parirala ay naging ganito: "May isang bagay na pambabae nang sabay-sabay na gumawa ng isang bagay sa isang uri ng lalaking nilalang, at pagkatapos ay nagsimulang gumawa ng isang bagay na mahaba, unti-unting kasama ang kanyang anak." Ang isang katulad na halimbawa ng isang teksto (artistic) mula sa mga hindi umiiral na salita, na ganap na binuo ayon sa mga batas ng wika, ay ang Jabberwock ni Lewis Carroll (sa Alice in Wonderland, ipinaliwanag ni Carroll, sa pamamagitan ng bibig ng kanyang karakter na si Humpty Dumpty, ang kahulugan ng ang mga salitang inimbento niya: "luto" - alas-otso ng gabi, kapag oras na para magluto ng hapunan, "chlivky" - manipis at matalino, "shorek" - isang krus sa pagitan ng ferret, badger at corkscrew, "dive "- tumalon, sumisid, paikutin, "nava" - damo sa ilalim ng sundial (lumalawak nang kaunti sa kanan , medyo pakaliwa at isang maliit na likod), "ungol" - ungol at tumawa, "zelyuk" - a berdeng pabo, "myumzik" - isang ibon; ang kanyang mga balahibo ay magulo at lumalabas sa lahat ng direksyon, tulad ng isang walis, "mova" - malayo sa bahay) .

Isa sa mga pangunahing konsepto ng modernong lohika at teoretikal na lingguwistika, na ginagamit sa pag-aaral ng mga wika ng iba't ibang logico-mathematical calculus, natural na mga wika, upang ilarawan ang ugnayan sa pagitan ng mga wika ng iba't ibang "antas" at upang makilala ang relasyon sa pagitan ng Ang mga wikang isinasaalang-alang at ang mga paksa na inilarawan sa kanilang tulong, ay ang konsepto ng metalanguage. Ang metalanguage ay isang wikang ginagamit upang ipahayag ang mga paghatol tungkol sa ibang wika, ang bagay na wika. Sa tulong ng isang metalanguage, pinag-aaralan nila ang istruktura ng mga kumbinasyon ng karakter (ekspresyon) ng object ng wika, nagpapatunay ng mga teorema tungkol sa mga katangiang nagpapahayag nito, tungkol sa kaugnayan nito sa ibang mga wika, atbp. Ang wikang pinag-aaralan ay tinatawag ding paksang wika sa kaugnayan sa metalanguage na ito. Ang paksang wika at ang metalanguage ay maaaring ordinaryong (natural) na mga wika. Maaaring iba ang metalanguage sa object language (halimbawa, sa English textbook para sa mga Russian, ang Russian ay metalanguage, at ang English ay object language), ngunit maaari rin itong magkasabay o bahagyang naiiba, halimbawa, sa mga espesyal na terminolohiya. (Ang terminolohiya sa wikang Ruso ay isang elemento ng metalanguage upang ilarawan ang wikang Ruso, ang tinatawag na semantic factor ay bahagi ng metalanguage para sa paglalarawan ng mga semantika ng natural na mga wika).

Ang konsepto ng "metalinguage" ay naging napakabunga na may kaugnayan sa pag-aaral ng mga pormal na wika na binuo sa loob ng balangkas ng matematikal na lohika. Hindi tulad ng mga pormal na paksang wika, sa kasong ito, ang metalanguage, kung saan nabuo ang metateorya (pag-aaral ng mga katangian ng teorya ng paksa na nabuo sa paksang wika), ay, bilang panuntunan, isang ordinaryong natural na wika, sa ilang espesyal na paraan limitadong fragment ng isang natural na wika na hindi naglalaman ng anumang uri ng kalabuan. , metapora, "metapisiko" na konsepto, atbp. mga elemento ng ordinaryong wika na pumipigil sa paggamit nito bilang isang kasangkapan para sa tumpak na siyentipikong pananaliksik. Kasabay nito, ang metalanguage mismo ay maaaring gawing pormal at (anuman ito) maging paksa ng pananaliksik na isinagawa sa pamamagitan ng metametalanguage, at ang naturang serye ay maaaring "isipin" na lumalaki nang walang katiyakan.

Itinuturo sa atin ng lohika ang isang mabungang pagkakaiba sa pagitan ng object ng wika at ng metalanguage. Ang object ng wika ay ang pinaka paksa ng lohikal na pananaliksik, at ang metalanguage ay ang hindi maiiwasang artipisyal na wika kung saan isinasagawa ang naturang pananaliksik. Ang lohikal na pag-iisip ay binubuo lamang sa pagbabalangkas ng mga relasyon at istruktura ng isang tunay na wika (object language) sa wika ng mga simbolo (metalanguage).

Ang metalanguage sa anumang kaso ay dapat na "hindi mas mahirap" kaysa sa layunin nitong wika (iyon ay, para sa bawat pagpapahayag ng huli sa metalanguage ay dapat mayroong pangalan nito - "pagsasalin") - kung hindi man, kung ang mga kinakailangan na ito ay hindi natutugunan (na kung saan ay tiyak na ang kaso sa natural na mga wika, kung ang mga espesyal na kasunduan ay hindi nagbibigay ng iba pa, ang mga semantic na kabalintunaan (antinomy) ay lumitaw.

Habang parami nang parami ang mga bagong programming language ay nilikha, na may kaugnayan sa problema ng mga tagasalin ng programming, nagkaroon ng isang kagyat na pangangailangan upang lumikha ng mga metalanguage. Sa kasalukuyan, ang Backus-Naur form na metalanguage (pinaikling BNF) ang pinakakaraniwang ginagamit para sa paglalarawan ng syntax ng mga programming language. Ito ay isang compact form sa anyo ng ilang mga formula na katulad ng mga mathematical. Para sa bawat konsepto ng wika ay may kakaibang metaformula (normal na pormula). Binubuo ito ng kaliwa at kanang bahagi. Ang kaliwang bahagi ay tumutukoy sa konsepto na tinutukoy, at ang kanang bahagi ay tumutukoy sa hanay ng mga tinatanggap na mga konstruksyon ng wika na pinagsama sa konseptong ito. Gumagamit ang formula ng mga espesyal na metacharacter sa anyo ng mga angle bracket, na naglalaman ng tinukoy na konsepto (sa kaliwang bahagi ng formula) o isang dating tinukoy na konsepto (sa kanang bahagi nito), at ang paghihiwalay ng kaliwa at kanang bahagi ay ipinahiwatig ng ang "::=" metacharacter, ang kahulugan nito ay katumbas ng mga salitang "by definition there is". Ang mga metalinguistic na formula ay naka-embed sa mga tagapagsalin sa ilang anyo; sa kanilang tulong, ang mga construct na ginamit ng programmer ay sinusuri para sa pormal na pagsunod sa alinman sa mga construct na syntactically valid sa wikang ito. Mayroon ding mga hiwalay na metalanguage ng iba't ibang agham - kaya, ang kaalaman ay umiiral sa anyo ng iba't ibang metalanguage.

Ang mga lohikal na pamamaraan ay nagsilbing batayan para sa paglikha ng mga artificial intelligence system batay sa konsepto ng connectionism. Ang koneksyonismo ay isang espesyal na kalakaran sa pilosopikal na agham, na ang paksa ay mga katanungan ng kaalaman. Sa loob ng balangkas ng trend na ito, ang mga pagtatangka ay ginagawa upang ipaliwanag ang mga intelektwal na kakayahan ng isang tao gamit ang mga artipisyal na neural network. Binubuo ng malaking bilang ng mga istrukturang yunit na katulad ng mga neuron, na may bigat na itinalaga sa bawat elemento na tumutukoy sa lakas ng koneksyon sa iba pang mga elemento, ang mga neural network ay pinasimpleng mga modelo ng utak ng tao. Ang mga eksperimento sa mga neural network ng ganitong uri ay nagpakita ng kanilang kakayahang matutong magsagawa ng mga gawain tulad ng pagkilala ng pattern, pagbabasa, at pagtukoy ng mga simpleng istrukturang gramatika.

Ang mga pilosopo ay nagsimulang magkaroon ng interes sa koneksyonismo, dahil ang diskarte sa koneksyonista ay nangako na magbibigay ng alternatibo sa klasikal na teorya ng isip at ang ideya na malawakang pinanghahawakan sa loob ng teoryang ito na ang mga gawain ng isip ay katulad ng pagproseso ng simbolikong wika sa pamamagitan ng digital. kompyuter. Ang konseptong ito ay napakakontrobersyal, ngunit sa mga nakaraang taon ay nakahanap ito ng higit pang mga tagasuporta.

Ang lohikal na pag-aaral ng wika ay nagpatuloy sa konsepto ni Saussure ng wika bilang isang sistema. Ang katotohanan na ito ay patuloy na nagpapatuloy ay nagpapatunay muli sa katapangan ng siyentipikong haka-haka sa simula ng huling siglo. Ilalaan ko ang huling seksyon ng aking trabaho sa mga prospect para sa pagbuo ng mga pamamaraan ng matematika sa linggwistika ngayon.

2.4 Mga prospect para sa aplikasyon ng mga pamamaraan ng matematika sa linggwistika

Sa panahon ng teknolohiya ng kompyuter, ang mga pamamaraan ng matematikal na lingguwistika ay nakatanggap ng bagong pananaw sa pag-unlad. Ang paghahanap ng mga solusyon sa mga problema ng linguistic analysis ay lalong ipinapatupad sa antas ng mga sistema ng impormasyon. Kasabay nito, ang automation ng proseso ng pagproseso ng materyal na lingguwistika, na nagbibigay sa mananaliksik ng mga makabuluhang pagkakataon at pakinabang, ay hindi maiiwasang maglagay ng mga bagong kinakailangan at gawain para sa kanya.

Ang kumbinasyon ng "eksaktong" at "makatao" na kaalaman ay naging matabang lupa para sa mga bagong tuklas sa larangan ng linggwistika, computer science at pilosopiya.

Ang pagsasalin ng makina mula sa isang wika patungo sa isa pa ay nananatiling isang mabilis na lumalagong sangay ng teknolohiya ng impormasyon. Sa kabila ng katotohanan na ang pagsasalin na tinulungan ng computer ay hindi kailanman maihahambing sa kalidad sa pagsasalin ng tao (lalo na para sa mga tekstong pampanitikan), ang makina ay naging isang kailangang-kailangan na katulong sa isang tao sa pagsasalin ng malalaking volume ng teksto. Ito ay pinaniniwalaan na sa malapit na hinaharap ay malilikha ang higit pang mga advanced na sistema ng pagsasalin, batay sa pangunahing pagsusuri sa semantiko ng teksto.

Ang isang pantay na pangakong direksyon ay ang interaksyon ng linggwistika at lohika, na nagsisilbing pilosopikal na pundasyon para sa pag-unawa sa teknolohiya ng impormasyon at ang tinatawag na "virtual reality". Sa malapit na hinaharap, ang trabaho ay magpapatuloy sa paglikha ng mga artificial intelligence system - bagaman, muli, hindi ito magiging katumbas ng tao sa mga kakayahan nito. Ang ganitong kumpetisyon ay walang kabuluhan: sa ating panahon, ang makina ay dapat maging (at maging) hindi isang karibal, ngunit isang katulong sa tao, hindi isang bagay mula sa larangan ng pantasya, ngunit bahagi ng totoong mundo.

Ang pag-aaral ng wika sa pamamagitan ng mga istatistikal na pamamaraan ay nagpapatuloy, na ginagawang posible upang mas tumpak na matukoy ang mga katangian ng husay nito. Mahalagang mahanap ng pinakamatapang na hypotheses tungkol sa wika ang kanilang matematikal, at samakatuwid ay lohikal, patunay.

Ang pinakamahalagang bagay ay ang iba't ibang sangay ng aplikasyon ng matematika sa linggwistika, na dati ay medyo nakahiwalay, sa mga nagdaang taon ay naiugnay sa isa't isa, na nagkokonekta sa isang magkakaugnay na sistema, sa pamamagitan ng pagkakatulad sa sistema ng wika na natuklasan noong isang siglo ni Ferdinand de Saussure at Yvan Baudouin de Courtenay. Ito ang pagpapatuloy ng kaalamang siyentipiko.

Ang linggwistika sa modernong mundo ay naging pundasyon para sa pag-unlad ng teknolohiya ng impormasyon. Hangga't ang computer science ay nananatiling isang mabilis na umuunlad na sangay ng aktibidad ng tao, ang unyon ng matematika at linggwistika ay patuloy na gaganap ng papel nito sa pag-unlad ng agham.

Konklusyon

Sa paglipas ng ika-20 siglo, malayo na ang narating ng mga teknolohiya sa kompyuter - mula sa militar hanggang sa mapayapang paggamit, mula sa isang makitid na hanay ng mga layunin hanggang sa pagtagos sa lahat ng sangay ng buhay ng tao. Ang matematika bilang isang agham ay nakakita ng bagong praktikal na kahalagahan sa pag-unlad ng teknolohiya ng kompyuter. Ang prosesong ito ay nagpapatuloy ngayon.

Ang dati nang hindi akalain na "tandem" ng "physicist" at "lyricists" ay naging realidad. Para sa buong pakikipag-ugnayan ng matematika at computer science sa humanities, kinakailangan ang mga kwalipikadong espesyalista mula sa magkabilang panig. Habang ang mga computer scientist ay lalong nangangailangan ng sistematikong makataong kaalaman (linguistic, cultural, philosophical) upang maunawaan ang mga pagbabago sa realidad sa kanilang paligid, sa interaksyon ng tao at teknolohiya, para makabuo ng parami nang paraming bagong linguistic at mental na konsepto, para magsulat mga programa, kung gayon ang anumang "Humanities" sa ating panahon para sa kanilang propesyonal na paglago ay dapat na makabisado ng hindi bababa sa mga pangunahing kaalaman sa pagtatrabaho sa isang computer.

Ang matematika, na malapit na magkakaugnay sa informatics, ay patuloy na umuunlad at nakikipag-ugnayan sa mga natural na agham at humanidades. Sa bagong siglo, ang trend patungo sa mathematization ng agham ay hindi humihina, ngunit, sa kabaligtaran, ay tumataas. Sa batayan ng dami ng data, ang mga batas ng pag-unlad ng wika, ang makasaysayang at pilosopikal na mga katangian ay naiintindihan.

Ang mathematical formalism ay pinakaangkop para sa paglalarawan ng mga pattern sa linguistics (tulad ng, sa katunayan, sa ibang mga agham - parehong humanidades at natural). Ang sitwasyon kung minsan ay umuunlad sa agham sa paraang walang paggamit ng angkop na wikang matematikal, imposibleng maunawaan ang kalikasan ng pisikal, kemikal, atbp. hindi posible ang proseso. Paglikha ng isang planetary model ng atom, ang sikat na English physicist ng XX century. Si E. Rutherford ay nakaranas ng mga kahirapan sa matematika. Noong una, hindi tinanggap ang kanyang teorya: hindi ito nakakumbinsi, at ang dahilan nito ay ang kamangmangan ni Rutherford sa teorya ng probabilidad, batay sa mekanismo kung saan posible lamang na maunawaan ang representasyon ng modelo ng mga pakikipag-ugnayan ng atomic. Napagtanto ito, na sa oras na iyon ang isang natitirang siyentipiko, ang may-ari ng Nobel Prize, ay naka-enrol sa seminar ng mathematician Professor Lamb at sa loob ng dalawang taon, kasama ang mga mag-aaral, ay dumalo sa isang kurso at nagtrabaho sa isang workshop sa teorya ng posibilidad. . Batay dito, nagawang ilarawan ni Rutherford ang pag-uugali ng elektron, na nagbibigay sa kanyang modelo ng istruktura na nakakumbinsi na katumpakan at nakakakuha ng pagkilala. Ganoon din sa linggwistika.

Nagtatanong ito, ano ang napaka-matematika sa layunin na mga phenomena, salamat sa kung saan maaari silang ilarawan sa wika ng matematika, sa wika ng dami ng mga katangian? Ito ay mga homogenous na yunit ng bagay na ipinamahagi sa espasyo at oras. Yaong mga agham na mas malayo kaysa sa iba patungo sa paghihiwalay ng homogeneity, at lumabas na mas angkop para sa paggamit ng matematika sa kanila.

Ang Internet, na mabilis na umunlad noong dekada 1990, ay nagsama-sama ng mga kinatawan ng iba't ibang bansa, mamamayan at kultura. Sa kabila ng katotohanan na ang Ingles ay patuloy na pangunahing wika ng internasyonal na komunikasyon, ang Internet ay naging multilinggwal sa ating panahon. Ito ay humantong sa pagbuo ng matagumpay na komersyal na mga sistema ng pagsasalin ng makina na malawakang ginagamit sa iba't ibang larangan ng aktibidad ng tao.

Ang mga network ng computer ay naging isang bagay ng pilosopikal na pagmuni-muni - parami nang parami ang mga bagong linguistic, lohikal, mga konsepto ng pananaw sa mundo na nalikha na makakatulong upang maunawaan ang "virtual reality". Sa maraming mga gawa ng sining, nilikha ang mga senaryo - mas madalas na pesimistiko - tungkol sa pangingibabaw ng mga makina sa mga tao, at virtual reality - sa labas ng mundo. Malayo sa palaging ang gayong mga pagtataya ay naging walang kabuluhan. Ang teknolohiya ng impormasyon ay hindi lamang isang promising na industriya para sa pamumuhunan ng kaalaman ng tao, ito rin ay isang paraan upang kontrolin ang impormasyon, at, dahil dito, sa pag-iisip ng tao.

Ang hindi pangkaraniwang bagay na ito ay may parehong negatibo at positibong panig. Negatibo - dahil ang kontrol sa impormasyon ay salungat sa hindi maiaalis na karapatang pantao sa libreng pag-access dito. Positibo - dahil ang kawalan ng kontrol na ito ay maaaring humantong sa mga sakuna na kahihinatnan para sa sangkatauhan. Sapat na upang alalahanin ang isa sa pinakamatalinong pelikula ng huling dekada - "When the World Ends" ni Wim Wenders, na ang mga karakter ay ganap na nahuhulog sa "virtual reality" ng kanilang sariling mga pangarap na naitala sa isang computer. Gayunpaman, hindi isang solong siyentipiko at hindi isang solong artista ang maaaring magbigay ng isang hindi malabo na sagot sa tanong: kung ano ang naghihintay sa agham at teknolohiya sa hinaharap.

Ang pagtutok sa "hinaharap", kung minsan ay tila kamangha-manghang, ay isang natatanging katangian ng agham noong kalagitnaan ng ikadalawampu siglo, nang ang mga imbentor ay naghangad na lumikha ng mga perpektong modelo ng teknolohiya na maaaring gumana nang walang interbensyon ng tao. Ipinakita ng panahon ang utopiang katangian ng naturang pananaliksik. Gayunpaman, hindi kinakailangan na hatulan ang mga siyentipiko para dito - kung wala ang kanilang sigasig noong 1950s - ang teknolohiya ng impormasyon ng 60s ay hindi makakagawa ng napakalakas na paglukso noong dekada 90, at wala tayo sa kung ano ang mayroon tayo ngayon.

Binago ng mga huling dekada ng ikadalawampu siglo ang mga priyoridad ng agham - ang pananaliksik, ang mga mapag-imbentong pathos ay nagbigay daan sa komersyal na interes. Muli, ito ay hindi mabuti o masama. Ito ay isang katotohanan kung saan ang agham ay lalong isinama sa pang-araw-araw na buhay.

Ang ika-21 siglo ay nagpatuloy sa kalakaran na ito, at sa ating panahon sa likod ng mga imbensyon ay hindi lamang katanyagan at pagkilala, ngunit, una sa lahat, pera. Ito rin ang dahilan kung bakit mahalagang tiyakin na ang pinakabagong mga nagawa ng agham at teknolohiya ay hindi mahuhulog sa mga kamay ng mga teroristang grupo o diktatoryal na rehimen. Ang gawain ay mahirap sa punto ng imposible; upang mapagtanto ito hangga't maaari ay ang gawain ng buong komunidad ng mundo.

Ang impormasyon ay isang sandata, at ang mga sandata ay hindi gaanong mapanganib kaysa sa mga sandatang nuklear o kemikal - hindi lamang ito kumikilos sa pisikal, ngunit sa halip ay sikolohikal. Kailangang isipin ng sangkatauhan kung ano ang mas mahalaga para dito sa kasong ito - kalayaan o kontrol.

Ang pinakabagong mga pilosopikal na konsepto na may kaugnayan sa pag-unlad ng mga teknolohiya ng impormasyon at isang pagtatangka na maunawaan ang mga ito ay nagpakita ng mga limitasyon ng parehong natural-science materialism, na nangingibabaw noong ika-19 at unang bahagi ng ika-20 siglo, at matinding idealismo, na tumatanggi sa kahalagahan ng materyal na mundo. . Mahalaga para sa modernong kaisipan, lalo na ang kaisipan ng Kanluran, na mapagtagumpayan ang dualismong ito sa pag-iisip, kapag ang nakapaligid na mundo ay malinaw na nahahati sa materyal at ideal. Ang landas patungo dito ay isang diyalogo ng mga kultura, isang paghahambing ng iba't ibang mga punto ng pananaw sa mga nakapalibot na phenomena.

Paradoxically, ang teknolohiya ng impormasyon ay maaaring gumanap ng isang mahalagang papel sa prosesong ito. Ang mga network ng kompyuter, at lalo na ang Internet, ay hindi lamang isang mapagkukunan para sa libangan at masiglang aktibidad sa komersyo, ito rin ay isang paraan ng makabuluhan, kontrobersyal na komunikasyon sa pagitan ng mga kinatawan ng iba't ibang sibilisasyon sa modernong mundo, gayundin para sa isang diyalogo sa pagitan ng nakaraan at ang kasalukuyan. Masasabi nating itinutulak ng Internet ang spatial at temporal na mga hangganan.

At sa diyalogo ng mga kultura sa pamamagitan ng information technology, mahalaga pa rin ang papel ng wika bilang pinakamatandang unibersal na paraan ng komunikasyon. Kaya naman ang linggwistika, sa pakikipag-ugnayan sa matematika, pilosopiya at computer science, ay nakaranas ng pangalawang kapanganakan at patuloy na umuunlad ngayon. Ang takbo ng kasalukuyan ay magpapatuloy sa hinaharap - "hanggang sa katapusan ng mundo", tulad ng 15 taon na ang nakalilipas, ang parehong hinulaang V. Wenders. Totoo, hindi alam kung kailan mangyayari ang wakas na ito - ngunit mahalaga ba ito ngayon, dahil ang hinaharap ay magiging kasalukuyan pa rin.

Appendix 1

Ferdinand de Saussure

Ang Swiss linguist na si Ferdinand de Saussure (1857-1913) ay malawak na itinuturing na tagapagtatag ng modernong linggwistika sa mga pagtatangka nitong ilarawan ang istruktura ng wika sa halip na ang kasaysayan ng mga partikular na wika at mga anyo ng wika. Sa katunayan, ang pamamaraan ng Structuralism sa linguistics at literary studies at isang makabuluhang sangay ng Semiotics ay natagpuan ang kanilang pangunahing panimulang punto sa kanyang trabaho sa pagpasok ng ikadalawampu siglo. Pinagtatalunan pa nga na ang masalimuot ng mga estratehiya at konsepto na tinawag na "poststructuralism" - ang akda nina Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes, at iba pa - ay iminungkahi ng gawa ni Saussure. sa linguistics at anagrammatic readings ng late Latin poetry.panitikan modernismo hanggang sa psychoanalysis at pilosopiya noong unang bahagi ng ikadalawampu siglo. Tulad ng pagtatalo nina Algirdas Julien Greimas at Joseph Courtés sa Semiotics and Language: An Analytic Dictionary, sa ilalim ng heading na "Interpretation," isang bagong paraan ng interpretasyon ang lumitaw noong unang bahagi ng ikadalawampu siglo na kinilala nila sa Saussurean linguistics, Husserlian Phenomenology, at Freudian psychoanalysis. Sa mode na ito, "ang interpretasyon ay hindi na isang bagay ng pag-uugnay ng isang naibigay na nilalaman sa isang form na kung hindi man ay kulang ng isa; sa halip, ito ay isang paraphrase na bumubuo sa ibang paraan ng katumbas na nilalaman ng isang elementong nagpapakahulugan sa loob ng isang partikular na semiotic system" ( 159). sa ganitong pag-unawa ng "interpretasyon," ang anyo at nilalaman ay hindi naiiba; sa halip, ang bawat "form" ay, bilang kahalili, isang semantikong "nilalaman" din, isang "nagbibigay-kahulugan na anyo," upang ang interpretasyon ay nag-aalok ng isang analogical na paraphrase ng isang bagay na nagsasaad na sa loob ng ibang sistema ng kahulugan.

Ang ganitong reinterpretasyon ng anyo at pag-unawa - na inilalarawan ni Claude Lévi-Strauss sa isa sa kanyang pinaka-programmatic na mga artikulasyon ng konsepto ng structuralism, sa "Istruktura at Anyo: Mga Pagninilay sa isang Trabaho ni Vladimir Propp" - ay implicit sa Posthumous Course ni Saussure. sa General Linguistics (1916, trans., 1959, 1983).Sa kanyang buhay, medyo kaunti ang inilathala ni Saussure, at ang kanyang pangunahing gawain, ang Course, ay ang transkripsyon ng kanyang mga mag-aaral ng ilang mga kurso sa pangkalahatang linggwistika na kanyang inaalok noong 1907-11. Sa Kurso ay tinawag ni Saussure ang "pang-agham" na pag-aaral ng wika na taliwas sa gawain sa makasaysayang linggwistika na ginawa noong ikalabinsiyam na siglo. wika, makasaysayang (o "diachronic") linguistics ay sumubaybay sa pinagmulan at pag-unlad ng mga wikang Kanluranin mula sa isang pinagmumulan ng karaniwang wika, una ay isang "Indo-European" na wika at pagkatapos ay isang mas naunang "p roto-Indo-European" na wika.

Eksakto ang pag-aaral na ito ng mga natatanging paglitaw ng mga salita, na may kaakibat na palagay na ang pangunahing "yunit" ng wika ay, sa katunayan, ang positibong pag-iral ng mga "mga elemento ng salita," na kinuwestiyon ni Saussure. Ang kanyang gawain ay isang pagtatangka na bawasan ang masa ng mga katotohanan tungkol sa wika, na pinag-aralan nang napakaliit ng makasaysayang linggwistika, sa isang napapamahalaang bilang ng mga panukala. Ang "comparative school" ng ika-labing-siyam na siglo na Philology, sabi ni Saussure sa Course, "ay hindi nagtagumpay sa pag-set up ng tunay na agham ng linguistics" dahil "bigo itong hanapin ang kalikasan ng bagay ng pag-aaral nito" (3). Ang "kalikasan," sabi niya, ay matatagpuan hindi lamang sa "elemental" na mga salita na binubuo ng isang wika - ang tila "positibong" katotohanan (o "mga sangkap") ng wika - ngunit sa mga pormal na relasyon na nagdudulot ng mga iyon. "mga sangkap."

Ang sistematikong muling pagsusuri ni Saussure sa wika ay batay sa tatlong pagpapalagay. Ang una ay ang siyentipikong pag-aaral ng wika ay kailangang paunlarin at pag-aralan ang sistema sa halip na ang kasaysayan ng linguistic phenomena. Dahil dito, nakikilala niya ang mga partikular na pangyayari ng wika - ang partikular na "mga kaganapan sa pagsasalita," na itinalaga niya bilang parol - at ang wastong layunin ng linggwistika, ang sistema (o "kodigo") na namamahala sa mga kaganapang iyon, na itinalaga niya bilang langue. Ang ganitong sistematikong pag-aaral, bukod pa rito, ay nangangailangan ng isang " synchronic" na konsepto ng ugnayan ng mga elemento ng wika sa isang partikular na sandali kaysa sa "diachronic" na pag-aaral ng pag-unlad ng wika sa pamamagitan ng kasaysayan.

Ang palagay na ito ay nagbunga ng kung ano ang itinalaga ni Roman Jakobson noong 1929 bilang "istrukturalismo," kung saan "anumang hanay ng mga phenomena na sinusuri ng kontemporaryong agham ay itinuturing hindi bilang isang mekanikal na pagsasama-sama ngunit bilang isang istrukturang kabuuan ang mekanikal na konsepto ng mga proseso ay nagbubunga sa tanong. ng kanilang tungkulin" ("Romantic" 711). Sa siping ito, ipinapahayag ni Jakobson ang intensyon ni Saussure na tukuyin ang linggwistika bilang isang sistemang siyentipiko kumpara sa isang simple, "mekanikal" na pagtutuos ng mga makasaysayang aksidente. Bukod dito, inilalarawan din ni Jakobson ang pangalawang batayan na palagay sa Saussurean - maaari nating ngayon ay tinatawag itong "istruktura" - linggwistika: na ang mga pangunahing elemento ng wika ay maaari lamang pag-aralan kaugnay ng kanilang mga tungkulin sa halip na kaugnay ng kanilang mga sanhi. European "mga salita"), ang mga pangyayari at entidad na iyon ay kailangang ilagay sa loob ng isang sistematikong balangkas kung saan nauugnay ang mga ito sa iba pang tinatawag na mga kaganapan at entidad. Ito ay isang radikal na reorientasyon sa pag-iisip ng karanasan at mga penomena, isa na ang kahalagahan ng pilosopo na si Ernst Cassirer ay inihambing sa "bagong agham ng Galileo na noong ikalabing pitong siglo ay nagbago sa ating kabuuan. konsepto ng pisikal na mundo" (sinipi sa Culler, Pursuit 2 4). Ang pagbabagong ito, gaya ng nabanggit nina Greimas at Courtés, ay muling nag-iisip ng "interpretasyon" at sa gayon ay muling nagkakaroon ng paliwanag at pag-unawa sa kanilang mga sarili. Sa halip na ang paliwanag ay "sa mga tuntunin ng isang kababalaghan" ng mga sanhi, upang, bilang isang "epekto," ito ay sa ilang mga paraan subordinate sa mga sanhi nito, ang paliwanag dito ay binubuo sa pagpapailalim ng isang kababalaghan sa nito na nakatuon sa hinaharap na "function" o "layunin." Ang paliwanag ay hindi na independyente sa mga intensyon o layunin ng tao (kahit na ang mga intensyon na iyon ay maaaring impersonal, communal, o, sa mga terminong Freudian, "walang malay").

Sa kanyang linguistics, tinupad ni Saussure ang pagbabagong ito partikular sa redefinition ng linguistic "word," na inilalarawan niya bilang linguistic "sign" at binibigyang-kahulugan sa functionalist terms. Ang tanda, sabi niya, ay ang unyon ng "isang konsepto at isang tunog na imahe," na tinawag niyang "signified at signifier " (66-67; ang pagsasalin ni Roy Harris noong 1983 ay nag-aalok ng mga terminong "signification" at "signal" ). Ang likas na katangian ng kanilang "kombinasyon" ay "functional" na hindi ang signified o ang signifier ay ang "sanhi" ng iba; sa halip, "bawat isa ay ang mga halaga nito mula sa isa" (8). elemento ng wika, ang sign , na may kaugnayan at ginagawa ang pangunahing pagpapalagay ng makasaysayang linggwistika, ibig sabihin, ang pagkakakilanlan ng mga elementong yunit ng wika at kahulugan (i.e., "mga salita"), napapailalim sa mahigpit na pagsusuri. ang salitang "puno" bilang ang "parehong" salita ay hindi dahil ang salita ay binibigyang kahulugan ng mga likas na katangian - ito ay hindi isang "mekanikal na pagsasama-sama" ng gayong mga katangian - ngunit dahil ito ay tinukoy bilang isang elemento sa isang sistema, ang "kabuuan ng istruktura" , ng wika.

Ang ganitong relational (o "diacritical") na kahulugan ng isang entity ay namamahala sa konsepto ng lahat ng elemento ng wika sa structural linguistics. Ito ay pinakamalinaw sa pinakakahanga-hangang tagumpay ng Saussurean linguistics, ang pagbuo ng mga konsepto ng "ponema" at "mga natatanging katangian" ng wika. Ang mga ponema ay ang pinakamaliit na articulated at signifying unit ng isang wika. Ang mga ito ay hindi ang mga tunog na nangyayari sa wika ngunit ang mga "tunog na imahe" na binanggit ni Saussure, na nahuhuli ng mga nagsasalita - kahanga-hangang nahuhuli - bilang nagbibigay ng kahulugan. (Kaya, inilalarawan ni Elmar Holenstein ang linguistics ni Jakobson, na sumusunod kay Saussure sa mahahalagang paraan, bilang "phenomenological structuralism.") Ito ay para sa kadahilanang ito na ang nangungunang tagapagsalita para sa Prague School Structuralism, Jan Mukarovsky, ay nabanggit noong 1937 na "istruktura . . . ay isang phenomenological at hindi isang empirical reality; ito ay hindi ang gawain mismo, ngunit isang hanay ng mga functional na relasyon na matatagpuan sa kamalayan ng isang kolektibo (henerasyon, milieu, atbp.)" (sinipi sa Galan 35). Gayundin, si Lévi-Strauss, ang nangungunang tagapagsalita para sa istrukturalismong Pranses , binanggit noong 1960 na "ang istraktura ay walang natatanging nilalaman; ito ay kuntento mismo, at ang lohikal na organisasyon kung saan ito inaresto ay inaakalang pag-aari ng tunay" (167; tingnan din ang Jakobson, Fundamentals 27-28).

Ang mga ponema, kung gayon, ang pinakamaliit na nakikitang elemento ng wika, ay hindi mga positibong bagay kundi isang "phenomenological reality." Sa Ingles, halimbawa, ang ponema /t/ ay maaaring bigkasin sa maraming iba't ibang paraan, ngunit sa lahat ng pagkakataon ay makikilala ito ng isang nagsasalita ng Ingles bilang gumagana bilang isang /t/. Ang isang aspirated t (i.e., a t binibigkas na may parang h na hininga pagkatapos nito), isang mataas na tunog o mababang tunog na t, isang pinahabang tunog na t, at iba pa, ay lahat ay gagana sa parehong paraan sa pagkilala sa kahulugan ng "to" at "do" sa Ingles. Bukod dito, ang mga pagkakaiba sa pagitan ng mga wika ay tulad na ang phonological variation sa isang wika ay maaaring bumuo ng mga natatanging phonemes sa isa pa; kaya, ang Ingles ay nakikilala sa pagitan ng /l/ at /r/, samantalang ang ibang mga wika ay napakaayos na ang mga artikulasyong ito ay itinuturing na mga pagkakaiba-iba ng parehong ponema (tulad ng aspirated at unaspirated t sa Ingles). Sa bawat natural na wika, ang napakaraming posibleng salita ay kumbinasyon ng maliit na bilang ng mga ponema. Ang Ingles, halimbawa, ay nagtataglay ng wala pang 40 ponema na nagsasama-sama upang bumuo ng higit sa isang milyong iba't ibang salita.

Ang mga ponema ng wika ay mismong sistematikong nakaayos na mga istruktura ng mga tampok. Noong 1920s at 1930s, kasunod ng pangunguna ni Saussure ", ibinukod nina Jakobson at N. S. Trubetzkoy ang "mga natatanging katangian" ng mga ponema. Ang mga tampok na ito ay nakabatay sa istrukturang pisyolohikal ng mga organ ng pagsasalita - dila, ngipin, vocal chords, at iba pa - na Binanggit ni Saussure sa Kurso at inilalarawan ni Harris bilang "pisyolohikal na ponetika" ( 39; Ang naunang pagsasalin ni Baskin ay gumagamit ng terminong "ponolohiya" [(1959) 38]) - at sila ay pinagsama sa "mga bundle" ng binary opposition upang bumuo ng mga ponema. Halimbawa, sa Ingles ang pagkakaiba sa pagitan ng /t/ at /d/ ay ang pagkakaroon o kawalan ng "boses" (ang pakikipag-ugnayan ng mga vocal chords), at sa antas ng pagbigkas ng mga ponemang ito ay katumbas ng pagtukoy sa isa't isa. Sa ganitong paraan, ang ponolohiya ay isang tiyak na halimbawa ng isang pangkalahatang tuntunin ng wika na inilarawan ni Saussure: Sa wika ay may mga pagkakaiba lamang. mas mahalaga pa: ang pagkakaiba ay karaniwang nagpapahiwatig ng mga positibong termino kung saan naka-set up ang pagkakaiba; ngunit sa wika ay may mga pagkakaiba lamang na walang positibong termino. Kunin man natin ang signified o ang signifier, ang wika ay walang mga ideya o tunog na umiral bago ang linguistic system. ( 120)

Sa balangkas na ito, ang mga pagkakakilanlang pangwika ay tinutukoy hindi sa pamamagitan ng mga likas na katangian ngunit sa pamamagitan ng sistematikong ("istruktura") na mga relasyon.

Sinabi ko na ang phonology ay "sumusunod sa pangunguna" ni Saussure, dahil kahit na ang kanyang pagsusuri sa pisyolohiya ng produksyon ng wika ay "sa kasalukuyan," gaya ng sabi ni Harris, "matatawag na "pisikal," kumpara sa alinman sa "psychological" o "functional." "" (Pagbasa 49), dahil dito sa Kurso ay ipinahayag niya ang direksyon at mga balangkas ng isang functional analysis ng wika. Katulad nito, ang kanyang tanging pinalawig na nai-publish na gawa, Mémoire sur le système primitif des voyelles dans les lanues indo-européennes (Memoir sa primitive na sistema ng mga patinig sa mga wikang Indo-European), na lumitaw noong 1878, ay ganap na nasa loob ng proyekto ng ikalabinsiyam- siglo makasaysayang linggwistika. Gayunpaman, sa loob ng gawaing ito, tulad ng ipinagtalo ni Jonathan Culler, ipinakita ni Saussure ang "kabuuan ng pag-iisip ng wika bilang isang sistema ng mga bagay na puro relasyon, kahit na nagtatrabaho sa gawain ng muling pagtatayo ng kasaysayan" (Saussure 66). Sa pamamagitan ng pagsusuri sa mga sistematikong istruktural na relasyon sa mga ponema upang isaalang-alang ang mga pattern ng paghahalili ng patinig sa umiiral na mga wikang Indo-European, iminungkahi ni Saussure na bilang karagdagan sa ilang iba't ibang ponema /a/, tiyak na mayroong isa pang ponema na maaaring pormal na ilarawan. "Ang dahilan kung bakit napaka-kahanga-hanga ang gawa ni Saussure," pagtatapos ni Culler, "ay ang katotohanan na makalipas ang halos limampung taon, nang matuklasan at ma-decipher ang cuneiform Hittite, ito ay natagpuang naglalaman ng isang ponema, nakasulat na h, na kumikilos tulad ng hula ni Saussure. . Natuklasan niya, sa pamamagitan ng isang pormal na pagsusuri, kung ano ang kilala ngayon bilang mga laryngeal ng Indo-European" (66).

Ang konseptong ito ng relational o diacritical na pagpapasiya ng mga elemento ng signification, na parehong implicit at tahasang sa Course, ay nagmumungkahi ng ikatlong palagay na namamahala sa structural linguistics, na tinatawag ni Saussure na "ang arbitrary na katangian ng sign." Sa pamamagitan nito, nangangahulugan siya na ang relasyon sa pagitan ng signifier at signified sa wika ay hindi kinakailangan (o "motivated"): ang isa ay madaling mahanap ang sound signifier arbre bilang signifier tree upang makiisa sa konseptong "puno". Ngunit higit pa rito, nangangahulugan ito na ang ipinahiwatig ay arbitrary din: ang isa ay madaling tukuyin ang konseptong "puno" sa pamamagitan ng makahoy na kalidad nito (na hindi kasama ang mga puno ng palma) gaya ng laki nito (na hindi kasama ang "mababang makahoy na halaman" na ating tumawag sa mga bushes). Dapat nitong linawin na ang pag-numero ng mga pagpapalagay na aking inilalahad ay hindi kumakatawan sa isang pagkakasunud-sunod ng priyoridad: ang bawat palagay - ang sistematikong katangian ng kahulugan (pinakamahusay na nahuhuli sa pamamagitan ng pag-aaral ng wika "sabay-sabay"), ang relasyonal o "diakritikal" na katangian ng mga elemento ng signification, ang arbitrary na katangian ng mga palatandaan - nakukuha ang halaga nito mula sa iba.

Ibig sabihin, Saussurean linguistics ang mga phenomena na pinag-aaralan nito sa mga pangkalahatang relasyon ng kumbinasyon at contrast sa wika. Sa konseptong ito, ang wika ay parehong proseso ng pagpapahayag ng kahulugan (signification) at ang produkto nito (komunikasyon), at ang dalawang tungkuling ito ng wika ay hindi magkapareho o ganap na magkatugma (tingnan ang Schleifer, "Deconstruction"). Dito, makikita natin ang paghahalili sa pagitan ng anyo at nilalaman na inilalarawan nina Greimas at Courtés sa modernist na interpretasyon: ang wika ay nagpapakita ng mga kaibahan na pormal na tumutukoy sa mga yunit nito, at ang mga yunit na ito ay nagsasama-sama sa mga susunod na antas upang lumikha ng makabuluhang nilalaman. Dahil arbitraryo ang mga elemento ng wika, bukod dito, hindi masasabing basic ang contrast o combination. Kaya, sa wika ay nagsasama-sama ang mga natatanging katangian upang makabuo ng magkasalungat na ponema sa ibang antas ng pangamba, ang mga ponema ay nagsasama-sama upang makabuo ng mga magkasalungat na morpema, ang mga morpema ay nagsasama-sama upang makabuo ng mga salita, ang mga salita ay nagsasama-sama upang makabuo ng mga pangungusap, at iba pa. Sa bawat pagkakataon, ang buong ponema, o salita, o pangungusap, at iba pa, ay mas malaki kaysa sa kabuuan ng mga bahagi nito (tulad ng tubig, H2O, sa halimbawa ni Saussure [(1959) 103] ay higit pa sa mekanikal na pagsasama-sama. ng hydrogen at oxygen).

Ang tatlong pagpapalagay ng Kurso sa Pangkalahatang Linggwistika ay humantong kay Saussure na tumawag para sa isang bagong agham ng ikadalawampu siglo na lalampas sa agham pangwika upang pag-aralan ang "buhay ng mga palatandaan sa loob ng lipunan." Pinangalanan ni Saussure ang agham na ito na "semiology (mula sa Greek semeîon "sign")" (16). Ang "agham" ng semiotics, tulad ng ginawa sa Silangang Europa noong 1920s at 1930s at Paris noong 1950s at 1960s, ay nagpalawak ng pag-aaral ng wika at mga istrukturang linggwistika sa mga artifact na pampanitikan na binuo (o articulated) ng mga istrukturang iyon. Sa buong huling bahagi ng kanyang karera, bukod pa rito, kahit na siya ay nag-aalok ng mga kurso sa pangkalahatang linggwistika, itinuloy ni Saussure ang kanyang sariling "semiotic" na pagsusuri ng huli na tula ng Latin sa pagtatangkang tuklasin ang sadyang itinatagong mga anagram ng mga wastong pangalan. Ang paraan ng pag-aaral sa maraming paraan ay kabaligtaran ng functional rationalism ng kanyang linguistic analysis: sinubukan nito, gaya ng binanggit ni Saussure sa isa sa 99 na kuwaderno kung saan niya itinuloy ang pag-aaral na ito, na sistematikong suriin ang problema ng "pagkakataon," na " nagiging hindi maiiwasang pundasyon ng lahat" (sinipi sa Starobinski 101). Ang nasabing pag-aaral, gaya ng sinabi mismo ni Saussure, ay nakatuon sa "materyal na katotohanan" ng pagkakataon at kahulugan (binanggit 101), upang ang "theme-word" na ang anagram ay hinahanap ni Saussure, gaya ng sinabi ni Jean Starobinski, "ay, para sa makata. , isang instrumento, at hindi isang mahalagang mikrobyo ng tula. Ang tula ay kinakailangan upang muling gamitin ang phonic na materyales ng tema-salita" (45). Sa pagsusuring ito, sinabi ni Starobinski, "Hindi nawala si Saussure sa kanyang sarili sa paghahanap ng mga nakatagong kahulugan." Sa halip, ang kanyang akda ay tila nagpapakita ng pagnanais na iwasan ang lahat ng mga problema na nagmumula sa kamalayan: "Dahil ang tula ay hindi lamang natanto sa mga salita ngunit ito ay isang bagay na ipinanganak mula sa mga salita, ito ay nakatakas sa arbitraryong kontrol ng kamalayan upang umasa lamang sa isang uri ng lingguwistika legalidad. "(121).

Iyon ay, ang pagtatangka ni Saussure na tumuklas ng mga wastong pangalan sa huling mga tula ng Latin - ang tinatawag ni Tzvetan Todorov na pagbabawas ng isang "salita . . . to its signifier" (266) - binibigyang-diin ang isa sa mga elementong namamahala sa kanyang linguistic analysis, ang arbitrary na katangian ng sign. (Idiniin din nito ang pormal na katangian ng Saussurean linguistics - "Ang wika," aniya, "ay isang anyo at hindi isang sangkap" - na mabisang nag-aalis ng mga semantika bilang isang pangunahing bagay ng pagsusuri.) Bilang pagtatapos ni Todorov, ang gawa ni Saussure ay lumilitaw na kapansin-pansing homogenous ngayon sa pagtanggi nitong tanggapin ang mga simbolikong penomena. . . . Sa kanyang pananaliksik sa anagrams, binibigyang-pansin lamang niya ang mga phenomena ng pag-uulit, hindi sa mga evocation. . . . Sa kanyang mga pag-aaral sa Nibelungen, kinikilala niya ang mga simbolo lamang upang maiugnay ang mga ito sa mga maling pagbabasa: dahil hindi ito sinasadya, ang mga simbolo ay hindi umiiral. Sa wakas sa kanyang mga kurso sa pangkalahatang linggwistika, pinag-isipan niya ang pagkakaroon ng semiology, at sa gayon ay ng mga palatandaan maliban sa mga linggwistika; ngunit ang paninindigang ito ay sabay-sabay na nililimitahan ng katotohanan na ang semiology ay nakatuon sa isang solong uri ng tanda: yaong mga arbitraryo. (269-70)

Kung ito ay totoo, ito ay dahil hindi maisip ni Saussure ang "intensiyon" nang walang paksa; hindi niya lubos na makatakas sa pagsalungat sa pagitan ng anyo at nilalaman na ang kanyang trabaho ay napakaraming nagawa upang itanong. Sa halip, ginamit niya ang "liguistic legality." Matatagpuan sa pagitan, sa isang banda, mga konsepto ng kasaysayan ng ikalabinsiyam na siglo, subjectivity, at ang paraan ng sanhi ng interpretasyon na pinamamahalaan ng mga konseptong ito at, sa kabilang banda, mga konsepto ng "structuralist" ng ikadalawampung siglo ng tinatawag ni Lévi-Strauss na "Kantianism without isang transendental na paksa" (na binanggit sa Connerton 23) - mga konsepto na nagbubura sa pagsalungat sa pagitan ng anyo at nilalaman (o paksa at bagay) at ang hierarchy ng foreground at background sa ganap na structuralism, psychoanalysis, at kahit na quantum mechanics - ang gawa ni Ferdinand Si de Saussure sa linggwistika at semiotika ay sumasaklaw sa isang hudyat na sandali sa pag-aaral ng kahulugan at kultura.

Ronald Schleifer

Appendix 2

Ferdinand de Saussure (pagsasalin)

Ang Swiss linguist na si Ferdinand de Saussure (1857-1913) ay itinuturing na tagapagtatag ng modernong linggwistika - salamat sa kanyang mga pagtatangka na ilarawan ang istraktura ng wika, at hindi ang kasaysayan ng mga indibidwal na wika at mga anyo ng salita. Sa pangkalahatan, ang mga pundasyon ng mga pamamaraang istruktural sa linggwistika at kritisismong pampanitikan at, sa malaking lawak, ang semiotika ay inilatag sa kanyang mga gawa sa pinakadulo simula ng ikadalawampu siglo. Napatunayan na ang mga pamamaraan at konsepto ng tinatawag na "post-structuralism", na binuo sa mga akda nina Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes at iba pa, ay bumalik sa mga linggwistikong gawa ni Saussure at anagrammatic readings ng huling Romanong tula. Dapat pansinin na ang gawain ni Saussure sa linguistics at linguistic na interpretasyon ay nakakatulong upang ikonekta ang isang malawak na hanay ng mga intelektwal na disiplina - mula sa pisika hanggang sa mga inobasyong pampanitikan, psychoanalysis at pilosopiya ng unang bahagi ng ikadalawampu siglo. Sumulat sina A. J. Greimas at J. Kurte sa Semiotics and Language: "Ang isang analytical dictionary na may pamagat na "Interpretation" bilang isang bagong uri ng interpretasyon ay lumitaw sa simula ng ika-20 siglo kasama ang linguistics ng Saussure, ang phenomenology ni Husserl at ang psychoanalysis ni Freud. Sa ganoong kaso, "ang interpretasyon ay hindi ang pagpapatungkol ng isang ibinigay na nilalaman sa isang form na kung hindi man ay kulang ng isa; sa halip, ito ay isang paraphrase na bumubuo sa ibang paraan ng parehong nilalaman ng isang makabuluhang elemento sa loob ng isang ibinigay na semiotic system" (159) ). Sa ganitong pag-unawa sa "interpretasyon", ang anyo at nilalaman ay hindi mapaghihiwalay; sa kabaligtaran, ang bawat anyo ay puno ng semantikong kahulugan (“makabuluhang anyo”), kaya ang interpretasyon ay nag-aalok ng bago, katulad na muling pagsasalaysay ng isang bagay na makabuluhan sa ibang sistema ng pag-sign.

Ang isang katulad na pag-unawa sa anyo at nilalaman, na ipinakita ni Claude Lévi-Strauss sa isa sa mga pangunahing akda ng estrukturalismo, ("Istruktura at Anyo: Mga Pagninilay sa mga Gawa ni Vladimir Propp"), ay makikita sa posthumously-publish na libro ni Saussure na "Course in Pangkalahatang Linggwistika" (1916, trans., 1959, 1983). Sa panahon ng kanyang buhay, si Saussure ay naglathala ng kaunti, "Course" - ang kanyang pangunahing gawain - ay nakolekta mula sa mga tala ng mga mag-aaral na dumalo sa kanyang mga lektura sa pangkalahatang lingguwistika noong 1907-11. Sa Kurso, nanawagan si Saussure ng "pang-agham" na pag-aaral ng wika, na inihambing ito sa comparative-historical linguistics ng ikalabinsiyam na siglo. Ang gawaing ito ay maaaring ituring na isa sa mga pinakadakilang tagumpay ng pag-iisip ng Kanluranin: ang pagkuha ng mga indibidwal na salita bilang mga istruktural na elemento ng wika bilang batayan, ang historikal (o "diachronic") linguistics ay pinatunayan ang pinagmulan at pag-unlad ng mga wikang Kanlurang Europeo mula sa isang karaniwan, Indo-European na wika - at isang naunang Proto-Indo-European.

Eksaktong pag-aaral na ito ng mga kakaibang paglitaw ng mga salita, na may kaakibat na palagay na ang pangunahing "yunit" ng wika ay, sa katunayan, ang positibong pag-iral ng mga "elemento ng salita" na ito na kinuwestiyon ni Saussure. Ang kanyang trabaho ay isang pagtatangka na bawasan ang maraming mga katotohanan tungkol sa wikang kaswal na pinag-aralan ng comparative linguistics sa isang maliit na bilang ng mga theorems. Ang comparative philological school ng ika-19 na siglo, isinulat ni Saussure, "ay hindi nagtagumpay sa paglikha ng isang tunay na paaralan ng linggwistika" dahil "hindi nito naunawaan ang kakanyahan ng bagay ng pag-aaral" (3). Ang "esensya" na ito, sabi niya, ay namamalagi hindi lamang sa mga indibidwal na salita - ang "mga positibong sangkap" ng wika - kundi pati na rin sa mga pormal na koneksyon na tumutulong sa mga sangkap na ito na umiral.

Ang "pagsubok" ng wika ni Saussure ay batay sa tatlong pagpapalagay. Una, ang pang-agham na pag-unawa sa wika ay nakabatay hindi sa isang historikal, ngunit sa isang istruktural na kababalaghan. Samakatuwid, nakilala niya ang pagitan ng mga indibidwal na phenomena ng wika - "mga kaganapan sa pananalita", na tinukoy niya bilang "parole" - at ang nararapat, sa kanyang opinyon, bagay ng pag-aaral ng linggwistika, ang sistema (code, istraktura) na kumokontrol sa mga kaganapang ito. ("wika"). Ang ganitong sistematikong pag-aaral, bukod dito, ay nangangailangan ng "kasabay" na konsepto ng ugnayan sa pagitan ng mga elemento ng wika sa isang takdang sandali, sa halip na isang "diachronic" na pag-aaral ng pag-unlad ng wika sa pamamagitan ng kasaysayan nito.

Ang hypothesis na ito ang nangunguna sa kung ano ang tatawagin ni Roman Jakobson noong 1929 na "structuralism" - isang teorya kung saan "anumang hanay ng mga phenomena na sinisiyasat ng modernong agham ay itinuturing na hindi bilang isang mekanikal na akumulasyon, ngunit bilang isang istrukturang kabuuan kung saan ang nakabubuo na bahagi ay nauugnay sa ang function" ("Romantikong "711). Sa siping ito, binalangkas ni Jakobson ang ideya ni Saussure na tukuyin ang wika bilang isang istraktura, kumpara sa "mekanikal" na enumeration ng mga makasaysayang kaganapan. Bilang karagdagan, si Jakobson ay bumuo ng isa pang Saussurean assumption, na naging tagapagpauna ng structural linguistics: ang mga pangunahing elemento ng wika ay dapat pag-aralan na may kaugnayan hindi sa kanilang mga sanhi, ngunit sa kanilang mga tungkulin. Ang mga hiwalay na phenomena at mga kaganapan (sabihin, ang kasaysayan ng pinagmulan ng mga indibidwal na Indo-European na mga salita) ay dapat na pag-aralan hindi sa kanilang sarili, ngunit sa isang sistema kung saan sila ay nauugnay sa mga katulad na bahagi. Ito ay isang radikal na pagliko sa paghahambing ng mga phenomena sa nakapaligid na katotohanan, ang kahalagahan kung saan ang pilosopo na si Ernst Cassirer ay inihambing sa "agham ni Galileo, na noong ikalabing pitong siglo ay binawi ang mga ideya tungkol sa materyal na mundo." dahil dito, ang mga paliwanag mismo. Ang mga penomena ay nagsimulang bigyang-kahulugan hindi kaugnay sa mga sanhi ng kanilang paglitaw, ngunit kaugnay sa epekto na maaari nilang magkaroon sa kasalukuyan at sa hinaharap. Ang interpretasyon ay tumigil na maging independyente sa mga intensyon ng isang tao (sa kabila ng katotohanan na ang mga intensyon ay maaaring maging impersonal, "walang malay" sa kahulugan ng Freudian ng salita).

Sa kanyang linggwistika, partikular na ipinakita ni Saussure ang pagbabagong ito sa pagbabago ng konsepto ng salita sa linggwistika, na tinukoy niya bilang isang tanda at inilalarawan sa mga tuntunin ng mga tungkulin nito. Ang isang tanda para sa kanya ay isang kumbinasyon ng tunog at kahulugan, "signified at designation" (66-67; sa pagsasalin sa Ingles ng 1983 ni Roy Harris - "signification" at "signal"). Ang likas na katangian ng tambalang ito ay "functional" (ni isa o ang iba pang elemento ay maaaring umiral nang wala ang isa't isa); bukod pa rito, "ang isa ay humihiram ng mga katangian mula sa iba" (8). Kaya, tinukoy ni Saussure ang pangunahing elemento ng istruktura ng wika - ang tanda - at ginagawang batayan ng historikal na linggwistika ang pagkakakilanlan ng mga palatandaan sa mga salita, na nangangailangan ng partikular na mahigpit na pagsusuri. Samakatuwid, mauunawaan natin ang iba't ibang kahulugan ng, sabihin nating, ang parehong salitang "puno" - hindi dahil ang salita ay isang hanay lamang ng ilang mga katangian, ngunit dahil ito ay tinukoy bilang isang elemento sa sistema ng tanda, sa "kabuuan ng istruktura", sa wika.

Ang ganitong kamag-anak ("diacritical") na konsepto ng pagkakaisa ay sumasailalim sa konsepto ng lahat ng elemento ng wika sa istrukturang linggwistika. Ito ay lalong malinaw sa pinaka orihinal na pagtuklas ng Saussurean linguistics, sa pagbuo ng konsepto ng "ponema" at "mga natatanging katangian" ng wika. Ang mga ponema ay ang pinakamaliit sa sinasalita at makabuluhang mga yunit ng wika. Ang mga ito ay hindi lamang mga tunog na nangyayari sa wika, ngunit "mga tunog na imahe", sabi ni Saussure, na itinuturing ng mga katutubong nagsasalita bilang may kahulugan. (Dapat tandaan na tinawag ni Elmar Holenstein ang linguistics ni Jakobson, na nagpapatuloy sa mga ideya at konsepto ng Saussure sa mga pangunahing probisyon nito, "phenomenological structuralism"). Iyon ang dahilan kung bakit ang nangungunang tagapagsalita ng Prague School of Structuralism, si Jan Mukarowski, ay naobserbahan noong 1937 na "istruktura. . . hindi isang empirical, ngunit isang phenomenological na konsepto; hindi ito ang resulta mismo, ngunit isang hanay ng mga makabuluhang relasyon ng kolektibong kamalayan (henerasyon, iba pa, atbp.)”. Isang katulad na kaisipan ang ipinahayag noong 1960 ni Lévi-Strauss, ang pinuno ng estrukturalismong Pranses: “Ang istruktura ay walang tiyak na nilalaman; ito ay sa sarili nitong makabuluhan, at ang lohikal na konstruksyon kung saan ito nakapaloob ay ang imprint ng realidad.

Sa turn, ang mga ponema, bilang ang pinakamaliit na elemento ng lingguwistika na katanggap-tanggap para sa persepsyon, ay kumakatawan sa isang hiwalay na integral na "phenomenological reality". Halimbawa, sa Ingles, ang tunog na "t" ay maaaring mabigkas nang iba, ngunit sa lahat ng pagkakataon, ang isang taong nagsasalita ng Ingles ay mapapansin ito bilang "t". Ang aspirated, itinaas o ibinaba, isang mahabang "t" na tunog, atbp. ay pantay na makikilala ang kahulugan ng mga salitang "to" at "do". Bukod dito, ang mga pagkakaiba sa pagitan ng mga wika ay tulad na ang mga uri ng isang tunog sa isang wika ay maaaring tumutugma sa iba't ibang mga ponema sa isa pa; halimbawa, ang "l" at "r" sa Ingles ay magkaiba, habang sa ibang mga wika ang mga ito ay mga uri ng parehong ponema (tulad ng Ingles na "t", binibigkas nang may at walang aspirasyon). Ang malawak na bokabularyo ng anumang natural na wika ay isang hanay ng mga kumbinasyon ng mas maliit na bilang ng mga ponema. Sa Ingles, halimbawa, 40 ponema lamang ang ginagamit sa pagbigkas at pagsulat ng humigit-kumulang isang milyong salita.

Ang mga tunog ng isang wika ay isang sistematikong nakaayos na hanay ng mga tampok. Noong 1920s -1930s, kasunod ni Saussure, Jacobson at N.S. Trubetskoy ay pinili ang "mga natatanging tampok" ng mga ponema. Ang mga tampok na ito ay batay sa istruktura ng mga organo ng pagsasalita - dila, ngipin, vocal cords - Napansin ito ni Saussure sa "Course of General Linguistics", at tinawag ito ni Harris na "physiological phonetics" (sa naunang pagsasalin ni Baskin, ang terminong "phonology " ay ginagamit) - sila ay konektado sa "knots » durg laban sa isang kaibigan upang gumawa ng mga tunog. Halimbawa, sa Ingles, ang pagkakaiba sa pagitan ng "t" at "d" ay ang pagkakaroon o kawalan ng "boses" (ang tensyon ng mga vocal cords), at ang antas ng boses na nagpapakilala sa isang ponema mula sa isa pa. Kaya, ang ponolohiya ay maaaring ituring na isang halimbawa ng pangkalahatang tuntunin sa wika na inilarawan ni Saussure: "May mga pagkakaiba lamang sa wika." Ang mas mahalaga ay hindi ito: ang pagkakaiba ay kadalasang nagpapahiwatig ng eksaktong mga kondisyon kung saan ito matatagpuan; ngunit sa wika ay mayroon lamang mga pagkakaiba na walang tiyak na kondisyon. Isinasaalang-alang man natin ang "pagtatalaga" o "signified" - sa wika ay walang mga konsepto o tunog na umiiral bago ang pagbuo ng sistema ng wika.

Sa ganitong istraktura, ang mga analohiya sa linggwistika ay tinukoy hindi sa tulong ng kanilang mga likas na katangian, ngunit sa tulong ng mga relasyon sa sistema ("structural").

Nabanggit ko na na ang ponolohiya sa pagbuo nito ay umasa sa mga ideya ni Saussure. Bagama't ang kanyang pagsusuri sa linguistic physiology sa modernong panahon, sabi ni Harris, "ay tatawaging 'pisikal', bilang kabaligtaran sa 'psychological' o 'functional', sa The Course ay malinaw niyang ipinahayag ang direksyon at mga pangunahing prinsipyo ng functional analysis ng wika. Ang kanyang tanging nai-publish na akda noong nabubuhay pa siya, ang Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Mga tala sa orihinal na sistema ng patinig sa mga wikang Indo-European), na inilathala noong 1878, ay ganap na naaayon sa paghahambing na pangkasaysayang lingguwistika ng ika-19 na siglo. Gayunpaman, sa gawaing ito, sabi ni Jonathan Culler, ipinakita ni Saussure "ang pagiging mabunga ng ideya ng wika bilang isang sistema ng magkakaugnay na phenomena, kahit na sa muling pagtatayo nito sa kasaysayan." Sinusuri ang ugnayan sa pagitan ng mga ponema, na nagpapaliwanag ng paghalili ng mga patinig sa mga modernong wika ng grupong Indo-European, iminungkahi ni Saussure na bilang karagdagan sa maraming iba't ibang mga tunog na "a", dapat mayroong iba pang mga ponema na inilarawan nang pormal. "Ang dahilan kung bakit ang gawain ni Saussure ay partikular na kahanga-hanga," pagtatapos ni Kaller, "ay halos 50 taon na ang lumipas, nang matuklasan at ma-decipher ang Hittite cuneiform, isang ponema ang natagpuan, sa pagsulat na tinutukoy ng "h", na kumikilos tulad ng hinulaang ni Saussure. Sa pamamagitan ng pormal na pagsusuri, natuklasan niya ang kilala ngayon bilang guttural sound sa mga wikang Indo-European.

Sa konsepto ng isang kamag-anak (diacritical) na kahulugan ng mga palatandaan, parehong tahasan at ipinahiwatig sa Kurso, mayroong isang ikatlong pangunahing pagpapalagay ng istrukturang linggwistika, na tinawag ni Saussure na "arbitraryong katangian ng tanda." Sa pamamagitan nito ay sinadya na ang ugnayan sa pagitan ng tunog at kahulugan sa wika ay hindi motibasyon ng anupaman: ang isang tao ay madaling ikonekta ang salitang "arbre" at ang salitang "puno" sa konsepto ng "puno". Bukod dito, nangangahulugan ito na ang tunog ay arbitrary din: maaaring tukuyin ng isa ang konsepto ng "puno" sa pamamagitan ng pagkakaroon ng bark (maliban sa mga puno ng palma) at sa laki (maliban sa "mababang makahoy na halaman" - mga palumpong). Mula dito dapat na malinaw na ang lahat ng mga pagpapalagay na ipinakita ko ay hindi nahahati sa higit pa at hindi gaanong mahalaga: bawat isa sa kanila - ang sistematikong katangian ng mga palatandaan (pinaka naiintindihan sa "kasabay" na pag-aaral ng wika), ang kanilang kamag-anak (diacritical) kakanyahan, ang di-makatwirang kalikasan ng mga palatandaan - nagmula sa iba.

Kaya, sa Saussurean linguistics, ang pinag-aralan na phenomenon ay nauunawaan bilang isang hanay ng mga paghahambing at pagsalungat ng wika. Ang wika ay parehong pagpapahayag ng kahulugan ng mga salita (pagtatalaga) at ang kanilang resulta (komunikasyon) - at ang dalawang tungkuling ito ay hindi kailanman nag-tutugma (tingnan ang "Deconstruction of Language" ni Shleifer). Makikita natin ang paghahalili ng anyo at nilalaman na inilalarawan nina Greimas at Kurte sa pinakabagong bersyon ng interpretasyon: ang mga linguistic contrast ay tumutukoy sa mga istrukturang unit nito, at ang mga unit na ito ay nakikipag-ugnayan sa sunud-sunod na mga antas upang lumikha ng isang tiyak na makabuluhang nilalaman. Dahil random ang mga elemento ng wika, hindi maaaring maging batayan ang contrast o combination. Nangangahulugan ito na sa isang wika, ang mga natatanging tampok ay bumubuo ng isang phonetic contrast sa ibang antas ng pag-unawa, ang mga ponema ay pinagsama sa contrasting morphemes, morphemes - sa mga salita, mga salita - sa mga pangungusap, atbp. Sa anumang kaso, isang buong ponema, salita, pangungusap, atbp. ay higit pa sa kabuuan ng mga bahagi nito (tulad ng tubig, sa halimbawa ni Saussure, higit pa sa kumbinasyon ng hydrogen at oxygen).

Tatlong pagpapalagay ng "Course of General Linguistics" ang humantong kay Saussure sa ideya ng isang bagong agham ng ikadalawampu siglo, na hiwalay sa linguistics, na nag-aaral ng "buhay ng mga palatandaan sa lipunan." Tinawag ni Saussure ang science semiology na ito (mula sa Greek na "semeîon" - isang tanda). Ang "agham" ng semiotics, na umunlad sa Silangang Europa noong 1920s at 1930s at sa Paris noong 1950s at 1960s, ay nagpalawak ng pag-aaral ng wika at mga istrukturang linggwistika sa mga natuklasang pampanitikan na binubuo (o nabuo) ayon sa mga istrukturang ito. Bilang karagdagan, sa takip-silim ng kanyang karera, na kahanay sa kanyang kurso sa pangkalahatang linggwistika, si Saussure ay nakikibahagi sa isang "semiotic" na pagsusuri ng huling Romanong tula, sinusubukang tumuklas ng sadyang binubuo ng mga anagram ng mga wastong pangalan. Ang pamamaraang ito sa maraming paraan ay kabaligtaran ng rasyonalismo sa pagsusuri sa wika nito: ito ay isang pagtatangka, gaya ng isinulat ni Saussure sa isa sa 99 na kuwaderno, na pag-aralan sa sistema ang problema ng "probability", na "naging batayan ng lahat. " Ang nasabing pagsisiyasat, ang sabi mismo ni Saussure, ay nakakatulong na tumuon sa "tunay na panig" ng posibilidad; Ang "pangunahing salita" kung saan hinahanap ni Saussure ang isang anagram ay, ayon kay Jean Starobinsky, "isang kasangkapan para sa makata, at hindi ang mapagkukunan ng buhay para sa tula. Ang tula ay nagsisilbing baligtarin ang mga tunog ng susing salita. Ayon kay Starobinsky, sa pagsusuring ito, "Hindi sumasali si Saussure sa paghahanap ng mga nakatagong kahulugan." Sa kabaligtaran, sa kanyang mga gawa, ang pagnanais na maiwasan ang mga tanong na may kaugnayan sa kamalayan ay kapansin-pansin: "dahil ang tula ay ipinahayag hindi lamang sa mga salita, kundi pati na rin sa kung ano ang ibinubunga ng mga salitang ito, ito ay lampas sa kontrol ng kamalayan at nakasalalay lamang sa mga batas ng wika.”

Ang pagtatangka ni Saussure na pag-aralan ang mga wastong pangalan sa huling Romanong tula (tinawag ito ni Tsvetan Todorov na isang pagdadaglat ng "isang salita ... bago ito isulat") ay nagbibigay-diin sa isa sa mga bahagi ng kanyang linguistic analysis - ang arbitrary na katangian ng mga palatandaan, pati na rin ang ang pormal na kakanyahan ng Saussurean linguistics ("Wika," inaangkin niya, "ang kakanyahan ng anyo, hindi ang kababalaghan"), na hindi kasama ang posibilidad ng pagsusuri sa kahulugan. Tinapos ni Todorov na ngayon ang mga sinulat ni Saussure ay tila kapansin-pansing pare-pareho sa kanilang pag-aatubili na pag-aralan ang mga simbolo [phenomena na may mahusay na tinukoy na kahulugan]. . . . Sa paggalugad ng mga anagram, binibigyang-pansin lamang ni Saussure ang pag-uulit, ngunit hindi ang mga nakaraang opsyon. . . . Sa pag-aaral ng Nibelungenlied, tinukoy niya ang mga simbolo upang italaga lamang ang mga ito sa mga maling pagbabasa: kung hindi sinasadya, ang mga simbolo ay hindi umiiral. Pagkatapos ng lahat, sa kanyang mga akda sa pangkalahatang linggwistika, ginagawa niya ang pagpapalagay ng pagkakaroon ng isang semiolohiya na naglalarawan hindi lamang ng mga palatandaang pangwika; ngunit ang palagay na ito ay limitado sa pamamagitan ng katotohanan na ang semilogy ay maaari lamang maglarawan ng mga random, arbitrary na mga palatandaan.

Kung ito ay talagang gayon, ito ay dahil lamang sa hindi niya maisip ang "intensiyon" na walang bagay; hindi niya lubusang madugtungan ang agwat sa pagitan ng anyo at nilalaman - sa kanyang mga akda ay naging tanong ito. Sa halip, bumaling siya sa "linguistic legitimacy". Nakatayo sa pagitan, sa isang banda, ng mga konsepto ng ikalabinsiyam na siglo batay sa kasaysayan at mga pansariling haka-haka, at mga pamamaraan ng hindi sinasadyang interpretasyon batay sa mga konseptong ito, at, sa kabilang banda, mga konseptong istruktural, na tinawag ni Lévi-Strauss na "Kantianism na walang transendente na aktor. " - binubura ang oposisyon sa pagitan ng anyo at nilalaman (paksa at bagay), kahulugan at pinagmulan sa estrukturalismo, psychoanalysis at maging quantum mechanics, ang mga sinulat ni Ferlinand de Saussure sa linguistics at semiotics ay nagmamarka ng pagbabago sa pag-aaral ng mga kahulugan sa wika at kultura.

Ronald Shleifer

Panitikan

1. Admoni V.G. Mga Batayan ng teorya ng gramatika / V.G. Admoni; USSR Academy of Sciences.-M.: Nauka, 1964.-104p.

3. Arapov, M.V., Herts, M.M. Mga pamamaraan sa matematika sa linggwistika. M., 1974.

4. Arnold I.V. Ang semantikong istruktura ng salita sa modernong Ingles at ang pamamaraan para sa pag-aaral nito. /I.V. Arnold-L .: Edukasyon, 1966. - 187 p.

6.Bashlykov A.M. Awtomatikong sistema ng pagsasalin. / A.M. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 p.

7.Baudouin de Courtenay: Theoretical heritage and modernity: Abstracts of the reports of the international scientific conference / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 p.

8. A. V. Gladkiy, Mga Elemento ng Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 p.

9. Golovin, B.N. Wika at istatistika. /B.N. Golovin - M., 1971. - 210 p.

10. Zvegintsev, V.A. Teoretikal at inilapat na lingguwistika. / V.A. Zvegintsev - M., 1969. - 143 p.

11. Kasevich, V.B. Semantika. Syntax. Morpolohiya. // V.B. Kasevich - M., 1988. - 292 p.

12. Lekomtsev Yu.K. Panimula sa pormal na wika ng linggwistika / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 p., may sakit.

13. Linguistic legacy ng Baudouin de Courtenay sa pagtatapos ng ikadalawampu siglo: Abstracts of the reports of the international scientific and practical conference March 15-18, 2000. - Krasnoyarsk, 2000. - 125 p.

Matveeva G.G. Mga nakatagong kahulugan sa gramatika at pagkakakilanlan ng taong panlipunan (“portrait”) ng tagapagsalita / G.G. Matveev. - Rostov, 1999. - 174 p.

14. Melchuk, I.A. Karanasan sa pagbuo ng mga modelong pangwika na "Meaning Text"./ I.A. Melchuk. - M., 1974. - 145 p.

15. Nelyubin L.L. Pagsasalin at inilapat na lingguwistika / L.L. Nelyubin. - M.: Higher School, 1983. - 207 p.

16. Sa eksaktong paraan ng pananaliksik sa wika: sa tinatawag na "mathematical linguistics" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva at iba pa - M., 1961. - 162 p.

17. Piotrovsky L.G. Mathematical Linguistics: Textbook / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Higher School, 1977. - 160 p.

18. Siya ay. Teksto, makina, tao. - L., 1975. - 213 p.

19. Siya ay. Applied Linguistics / Ed. A.S. Gerda. - L., 1986. - 176 p.

20. Revzin, I.I. mga modelo ng wika. M., 1963. Revzin, I.I. Modernong istruktural na lingguwistika. Mga problema at pamamaraan. M., 1977. - 239 p.

21. Revzin, I.I., Rozentsveig, V.Yu. Mga Batayan ng pangkalahatan at pagsasalin ng makina / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 p.

22. Slyusareva N.A. Ang teorya ni F. de Saussure sa liwanag ng modernong linggwistika / N.A. Slyusareva. - M.: Nauka, 1975. - 156 p.

23. Kuwago, L.Z. Analytical linguistics / L.Z. Kuwago - M., 1970. - 192 p.

24. Saussure F. de. Mga Tala sa Pangkalahatang Linggwistika / F. de Saussure; Per. mula kay fr. - M.: Pag-unlad, 2000. - 187 p.

25. Siya ay. Kurso ng Pangkalahatang Linggwistika / Per. mula kay fr. - Yekaterinburg, 1999. -426 p.

26. Mga istatistika ng pagsasalita at awtomatikong pagsusuri ng teksto / Ed. ed. R.G. Piotrovsky. L., 1980. - 223 p.

27. Stoll, P. Sets. Lohika. Axiomatic theories / R. Stoll; Per. mula sa Ingles. - M., 1968. - 180 p.

28. Tenier, L. Mga Batayan ng istrukturang syntax. M., 1988.

29. Ubin I.I. Automation ng mga aktibidad sa pagsasalin sa USSR / I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 p.

30. Faure, R., Kofman, A., Denis-Papin, M. Modern Mathematics. M., 1966.

31. Shenk, R. Pagproseso ng konseptong impormasyon. M., 1980.

32. Shikhanovich, Yu.A. Panimula sa modernong matematika (mga paunang konsepto). M., 1965

33. Shcherba L.V. Mga patinig na Ruso sa mga termino ng husay at dami / L.V. Shcherba - L.: Nauka, 1983. - 159 p.

34. Abdullah-zade F. Mamamayan ng mundo // Spark - 1996. - No. 5. - p.13

35. V.A. Uspensky. Preliminary para sa mga mambabasa ng "New Literary Review" sa mga semiotic na mensahe ni Andrei Nikolaevich Kolmogorov. - Bagong Pagsusuri sa Panitikan. -1997. - Hindi. 24. - S. 18-23

36. Perlovsky L. Kamalayan, wika at kultura. - Kaalaman ay kapangyarihan. -2000. №4 - S. 20-33

37. Frumkina R.M. Tungkol sa amin - pahilig. // Russian Journal. - 2000. - No. 1. - p. 12

38. Fitialov, S.Ya. Sa Syntax Modeling sa Structural Linguistics // Mga Problema ng Structural Linguistics. M., 1962.

39. Siya ay. Sa equivalence ng NN grammar at dependency grammar // Mga Problema ng Structural Linguistics. M., 1967.

40. Chomsky, N. Lohikal na pundasyon ng teoryang linggwistika // Bago sa linggwistika. Isyu. 4. M., 1965

41. Schleifer R. Ferdinand de Saussure//press. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. pindutin. jhu.ru

46. ​​tl.wikipedia.org