Universal language module. Paggamit ng modular na pagtuturo ng wikang banyaga upang bumuo ng awtonomiya ng mag-aaral

Ang isa sa mga modernong teknolohiya na nagbibigay-daan sa paglutas ng problema ng pagbabago ng paradigm ng edukasyon ay modular na edukasyon, dahil ito ay batay sa mga posisyon ng isang aktibo, aktibo, nababaluktot na diskarte sa pagbuo ng proseso ng pedagogical.

Sa huling bahagi ng 80s - unang bahagi ng 90s ng XX siglo, isang bagong termino mula sa larangan ng mga teknikal na agham ay "pumutok" sa pedagogical science, lalo na "module". Module (mula sa lat. modulus-"maliit na sukat") - isang mahalagang bahagi, mapaghihiwalay o hindi bababa sa mental na nakikilala mula sa pangkalahatan. Modular karaniwang tinatawag na isang bagay na binubuo ng malinaw na tinukoy na mga bahagi, na kadalasang maaaring alisin o idagdag nang hindi sinisira ang bagay sa kabuuan.

Marami na ang naisulat at napag-usapan tungkol sa mga benepisyo ng modular na pag-aaral sa sistema ng edukasyon. Modular na pag-aaral - isang paraan ng pagsasaayos ng proseso ng edukasyon batay sa block-modular na presentasyon ng impormasyong pang-edukasyon.

Ang kakanyahan ng modular na pagsasanay ay ang nilalaman ng pagsasanay ay nakabalangkas sa mga autonomous na organisasyon at metodolohikal na mga bloke - mga module, ang nilalaman at dami nito ay maaaring mag-iba depende sa mga layunin ng didactic, profile at pagkakaiba-iba ng antas ng mga mag-aaral, ang mga pagnanais ng mga mag-aaral na pumili ng isang indibidwal na tilapon ng paggalaw kasama ang kurso ng pagsasanay. Ang mga module ay maaaring sapilitan at elektibo. Ang mga module mismo ay nabuo: bilang isang istrukturang yunit ng kurikulum sa espesyalidad; bilang isang organisasyonal at metodolohikal na interdisciplinary na istraktura, sa anyo ng isang hanay ng mga seksyon mula sa iba't ibang mga disiplina, pinag-isa ayon sa pampakay na batayan; o bilang isang organisasyonal at metodolohikal na yunit ng istruktura sa loob ng balangkas ng isang akademikong disiplina. Ang isang kinakailangang elemento ng modular na pagsasanay ay karaniwang isang sistema ng rating para sa pagtatasa ng kaalaman, na kinabibilangan ng pagmamarka ng pag-unlad ng mga mag-aaral batay sa mga resulta ng pag-aaral ng bawat modyul.

Sa pedagogical science, ang modyul ay itinuturing na isang mahalagang bahagi ng buong sistema, nang walang kaalaman kung saan hindi gumagana ang didactic system. Sa mga tuntunin ng nilalaman nito, ito ay isang kumpleto, lohikal na nakumpletong bloke.

Ang modular na edukasyon, na bahagyang ginagamit sa mga paaralan sa England at Sweden, ay itinayo alinsunod sa mga patakaran ng modularity, kapag ang disenyo ng materyal na pang-edukasyon ay nagsisiguro na ang bawat mag-aaral ay nakakamit ang mga itinakdang didactic na gawain, ay may pagkakumpleto ng materyal sa module at ang pagsasama ng iba't ibang uri at anyo ng edukasyon. Ang positibong epekto na nakamit bilang isang resulta ng naturang pagsasanay ay nauugnay sa dinamika nito, na binubuo sa pagkakaiba-iba ng nilalaman ng mga elemento at module. Ang mga layunin ng pagsasanay na ito ay nabuo sa mga tuntunin ng mga pamamaraan ng aktibidad at mga mode ng pagkilos, na nahahati sa mga siklo ng katalusan at mga siklo ng iba pang mga uri ng aktibidad. Ang modular na pag-aaral ay nakikilala sa pamamagitan ng isang problemadong diskarte, isang malikhaing saloobin ng mag-aaral sa pag-aaral. Ang kakayahang umangkop nito ay nauugnay sa pagkakaiba-iba at indibidwalisasyon ng pag-aaral batay sa paulit-ulit na mga diagnostic upang matukoy ang antas ng kaalaman, mga pangangailangan, at ang indibidwal na bilis ng aktibidad ng pag-aaral ng mag-aaral.

Ang mga gabay na prinsipyo ng modular na pag-aaral ay kinabibilangan ng:

  • 1) mga prinsipyo ng modularity;
  • 2) pagbubuo ng nilalaman ng pagsasanay sa magkakahiwalay na elemento;
  • 3) dinamismo;
  • 4) mga aktibidad;
  • 5) kakayahang umangkop;
  • 6) mulat na pananaw;
  • 7) versatility ng methodological advice at parity.

Ang prinsipyo ng modularity ay nagsasaad ng kabuuan at pagkakumpleto, pagkakumpleto at pagkakapare-pareho ng pagbuo ng mga yunit ng materyal na pang-edukasyon sa anyo ng mga bloke-modules, kung saan ang materyal na pang-edukasyon ay nakabalangkas sa anyo ng isang sistema ng mga elemento ng edukasyon. Mula sa mga bloke-modules, tulad ng mula sa mga elemento, ang isang kurso sa pagsasanay sa paksa ay itinayo. Ang mga elemento sa loob ng block-module ay mapagpapalit at magagalaw. Ang pagbuo ng materyal na pang-edukasyon ay nangyayari sa proseso ng isang nakumpletong siklo ng mga aktibidad na pang-edukasyon.

Ito ay ang modyul na maaaring kumilos bilang isang programa sa pagsasanay, indibidwal sa nilalaman, mga pamamaraan ng pagtuturo, ang antas ng pagsasarili, ang bilis ng aktibidad na pang-edukasyon at nagbibigay-malay ng mag-aaral. Sa mga mahahalagang katangian ng modular na pag-aaral ay nakasalalay ang pagkakaiba nito sa iba pang mga sistema ng pag-aaral.

Una, ang nilalaman ng pagsasanay ay ipinakita sa kumpletong independiyenteng mga complex (mga bloke ng impormasyon), ang asimilasyon na kung saan ay isinasagawa alinsunod sa layunin. Ang layunin ng didactic ay nabuo para sa mag-aaral at naglalaman ng hindi lamang isang indikasyon ng dami ng pinag-aralan na nilalaman, kundi pati na rin ang antas ng asimilasyon nito. Bilang karagdagan, ang bawat mag-aaral ay tumatanggap ng nakasulat na payo mula sa guro kung paano kumilos nang mas makatwiran, kung saan mahahanap ang kinakailangang materyal na pang-edukasyon.

Pangalawa, nagbabago ang paraan ng komunikasyon sa pagitan ng guro at mag-aaral. Ito ay isinasagawa sa pamamagitan ng mga module at kasama ang personal na indibidwal na komunikasyon. Ito ay ang mga module na ginagawang posible upang ilipat ang pag-aaral sa paksa - ang subjective na batayan. Ang mga relasyon ay nagiging pare-pareho, pantay sa pagitan ng guro at mag-aaral.

Pangatlo, ang mag-aaral ay gumagawa ng maximum na oras nang nakapag-iisa, natututo sa pagtatakda ng layunin, pagpaplano sa sarili, organisasyon sa sarili, pagpipigil sa sarili at pagpapahalaga sa sarili.

Yu.B. Kuzmenkova Tinutukoy ang isang module bilang isang self-contained na mini-course at ipinapalagay na ang kursong ito (tulad ng iba pa) ay idinisenyo alinsunod sa mga ibinigay na layunin, mga pamamaraan ng kanilang pagpapatupad at pagpapatunay ng mga resultang nakamit. Ayon kay Yu.B. Kailangang magtakda ng Kuzmenkova ng limitadong bilang ng mga partikular na gawain na makatotohanang magagawa sa isang limitadong panahon ng oras ng pag-aaral. Upang gawin ito, ito ay maginhawa upang bumuo ng ilang mga panandaliang at umiikot na mga module alinsunod sa minarkahang core (para sa anumang programa) na mga bahagi - pampakay na oryentasyon at target na oryentasyon - at bumuo ng mga ito nang sunud-sunod at / o kahanay sa loob ng balangkas ng pangkalahatang kurso. Ang isa sa mga tampok ng iminungkahing diskarte ay ang posibilidad ng pagkita ng kaibhan, na ginagawang posible na malinaw na makilala sa pagitan ng mga napiling setting ng target; Kasabay nito, tulad ng ipinapakita ng kasanayan, medyo maginhawang hatiin ang mga module sa mga module ng wika at pagsasalita. Ang pagkakaiba-iba na ito ay batay sa prinsipyo ng pagtutuon ng pansin, ayon sa kung saan ang pag-unlad ng materyal na pang-edukasyon, lalo na ang mga hindi pamilyar, ay nagiging mas epektibo kapag nag-iiba ng mga paghihirap at nag-aalis ng mga ito nang paisa-isa. (11, 21-28)

Alinsunod dito, kapag nag-iipon ng mga module ng wika, dapat itong tumuon sa pag-master ng isang tiyak na paksa (o isang tiyak na pagkakasunud-sunod ng mga paksa) na nauugnay sa pag-aaral ng isang aspeto ng wika - halimbawa, mula sa kaukulang seksyon ng phonetics, grammar. o bokabularyo, habang ang pag-iipon ng mga module ng pagsasalita ay ipinapalagay bilang ang pangunahing gawain ay upang makabisado ang anumang mga kasanayan at kakayahan sa loob ng balangkas ng isang uri ng RD (o dalawang kaugnay na mga - receptive at reproductive).

Ang mga modernong pag-aaral ng modular na prinsipyo ng pag-aayos ng proseso ng edukasyon ay nakikilala ang tatlong pangunahing bloke sa istruktura ng modyul: isang bloke na naglalaman ng materyal na pag-aaralan, praktikal at kontrol na mga bloke.

L.N. at ako. Iminungkahi ng mga Kuznetsov ang sumusunod na istraktura ng module:

target na bloke (didaktikong layunin ng pag-aaral ng modyul, mga gawaing nakatuon sa personalidad na makakamit ang layunin).

I-update ang block (isang listahan ng mga pangunahing kaalaman at pamamaraan ng pagkilos na kinakailangan upang pag-aralan ang paksa, pagsasanay, pagsusulit at iba pang independiyenteng gawain para sa pag-update

pangunahing kaalaman).

Harangan ng problema (mga problemang sitwasyon na personal na makabuluhan para sa mga mag-aaral, emosyonal na mayaman na materyal sa paksa).

I-block ang mga pondo (kagamitan at didactic na materyales (patuloy na ina-update), methodological finds).

Teoretikal na bloke (isang listahan ng kaalaman sa paksa at pamamaraan ng pagkilos, pag-systematize ng mga ideya, prinsipyo, pattern, pamamaraan, pag-generalize ng mga pamamaraan ng pagkilos, pagtatanghal ng nilalaman at istraktura ng paksa sa anyo ng isang suporta (orientasyon sa paksa).

Block ng aplikasyon (isang sistema ng mga multi-level na gawain para sa variable na pag-uulit at pagsasama-sama).

Paglalahat bloke (didactic na materyal para sa maigsi na generalization, systematization ng materyal na pang-edukasyon, pagmuni-muni).

recess block (materyal sa pagsasanay ng tumaas na pagiging kumplikado).

I-block ang "exit" (didactic na materyal para sa mga pagsusulit, pagsusulit, mga ulat sa mga kumperensyang pang-edukasyon, para sa takdang-aralin).

Talahanayan 2. Posibleng pagbuo ng module ng wika

Ang mga layunin ng pagsasanay ay maaaring kabilang ang kumplikadong pag-unlad ng mga kasanayan at kakayahan, at kapag nagtatrabaho sa napiling paksa, maaari mong gamitin ang iba't ibang uri ng pagbabasa / pakikinig, mga laro sa paglalaro, pagtatanghal, pagsulat ng mga ulat, pagsulat ng mga sanaysay, atbp. - ngunit walang kabiguan na may diin sa nangingibabaw na pag-unlad ng mga kasanayang leksikal. Ang bokabularyo (sa dami na kinokontrol sa pamamagitan ng isang minimum na diksyunaryo) ay mahusay na hinihigop sa kurso ng pagbuo ng mga kasanayan sa komunikasyon sa napiling larangan - sa mga kondisyonal na sitwasyon sa komunikasyon ng iba't ibang uri.

Kung, gayunpaman, ang mga mag-aaral ay walang sapat na oras na nakalaan sa pangunahing kurso sa pag-aaral ng mga partikular na seksyon ng phonetics o grammar, posible rin na bumuo ng isang modyul na nakatuon sa pag-master ng mga kinakailangang kasanayan sa loob ng isang makitid na paksa. Halimbawa, "Pagwawasto ng pagbigkas ng mga patinig na Aleman" o "Pagwawasto ng paggamit ng mga anyo ng pandiwa ng panahunan" (sa huling kaso, isang magandang halimbawa ay ang paglipat ng diin mula sa mga pagsasanay sa pagsasanay sa pag-aaral ng gramatika sa konteksto). Kasabay nito, posible na komprehensibong bumuo ng mga kasanayan sa pagsasalita batay sa kilalang materyal na leksikal. Ang priyoridad, gayunpaman, ay nakatuon sa gawaing may materyal sa grammar o phonetics.

Posibleng bumuo ng iba't ibang makitid na pampakay na mga module, pagpili ng mga setting ng target batay sa talahanayan 3 tulad ng sumusunod.

Talahanayan 3. Pagpapaunlad ng kinakailangang kaalaman sa mga aspeto ng wika

Dapat pansinin na ang tagal at dalas ng mga mini-courses ay mga variable at ang modyul ay hindi kinakailangang isang buong aralin, maaari itong kalahating aralin, o ilang bahagi nito, o isang serye ng mga aralin na nakaayos ayon sa tema na mas mahabang tagal. Kapag kino-compile ang programa, maaaring iba-iba ang mga ito at gamitin sa iba't ibang kumbinasyon: dalawang magkaibang module ng wika sa loob ng programa ng mga elective na kurso ay maaaring i-stretch sa buong unang quarter, at i-line up nang magkatulad sa loob ng isang aralin (10 minuto - phonetic, ang iba pa. ng time grammatical), at ang lexical module ay maaaring magsimula sa ikalawang quarter, o kung hindi man. Ang pagpili at pagkakasunud-sunod ng pagpapakilala ng mga module ay tinutukoy ng mga partikular na pangangailangan ng mga mag-aaral. Mahalaga na mula sa punto ng view ng pagpaplano, ang pangunahing kinakailangan ay isang sistematikong diskarte sa organisasyon ng mga klase (ang kanilang cyclicity, pagpapatuloy, pag-uulit at, nang naaayon, regular na pag-uulat), kung hindi, ang lahat ng mga modular na pagbabagong ito ay magiging magulo. .

Ito ay pinaka-maginhawa upang bumuo ng mga module para sa pagtuturo ng grammar, dahil ito ang gramatika na nagdudulot ng pinakamalaking kahirapan sa pag-aaral, ito ay dahil sa kamangmangan sa gramatika kaya ang mga mag-aaral ay nakakagawa ng maraming pagkakamali sa pasalita at pasulat na pananalita, kaya't tatalakayin natin ang aspetong ito ng wika nang mas detalyado.

Ang grammar ay isang koleksyon ng mga tuntunin tungkol sa pagpapalit ng mga salita at pagsasama-sama ng mga salita sa mga pangungusap. Ginagawa nitong posible na bihisan ang mga kaisipan ng tao sa isang materyal na shell ng wika. Ang gramatika ay hindi maaaring ihiwalay sa pagsasalita; kung walang gramatika, ang karunungan sa anumang anyo ng pagsasalita ay hindi maiisip, dahil ito, kasama ang bokabularyo at tunog na komposisyon, ay ang materyal na batayan ng pagsasalita. Ang isang katangiang katangian ng gramatika ay ang pag-abstract mula sa partikular at konkreto, kinakailangan ang pangkalahatan na pinagbabatayan ng pagbabago ng mga salita at ang kanilang mga kumbinasyon sa mga pangungusap at bumubuo ng mga tuntuning panggramatika mula dito.

Mula sa itaas ay sumusunod na ang gramatika ay may malaking praktikal na kahalagahan. Samakatuwid, sa kasalukuyang eksperimento, isasaalang-alang ang isang modyul para sa pagtuturo ng gramatika.

Kaya, gamit ang iba't ibang mga module, posible na matagumpay na ipatupad ang mga komunikasyon sa intra-subject at inter-subject, pagsamahin ang nilalamang pang-edukasyon, na bumubuo nito sa lohika ng nilalaman ng nangungunang akademikong paksa na may pangangailangan na pag-iba-iba ang nilalamang pang-edukasyon.

Nagustuhan ang aming site? Ang iyong mga repost at rating ay ang pinakamahusay na papuri para sa amin!

Katamtamang gusali ng garrison na nagbibigay-daan sa iyong makipagpalitan ng mga crafting reagents para sa mga mapagkukunan ng garrison at vice versa. Bilang karagdagan, nagbubukas ito ng access sa mga paksyon (Alyansa) at (Horde). Pinapayagan kang gamitin ang auction.

Inirerekomenda namin ang paggamit ng addon. Master plan- ito ang pinakamahusay na addon para sa pamamahala ng garrison sa ngayon. Ang addon ay mahahanap at mada-download. Para sa maginhawang pamamahala ng misyon, inirerekomenda namin ang paggamit ng addon Tagapamahala ng Misyon ng Garrison. Maaari mong mahanap at i-download ito.

1.pangkahalatang ideya

2. Paano magbukas ng access sa trading shop?

Sa seksyong ito, sasabihin namin sa iyo kung paano makakuha ng access sa level 1, 2 at 3 shop.

2.1. Trading Post Level 1

Ang tindahan ng unang antas ay magagamit kaagad pagkatapos ng pagtatayo ng bulwagan ng bayan.

2.2. Garrison Blueprint: Trading Post Level 2

Garrison Blueprint: Trading Post, Level 2 ay mabibili sa level 98 o pagkatapos magtayo ng outpost sa Spiers of Arak. Nagkakahalaga ito ng 1000g o palitan para sa Outpost Establishment Notes. Ang mga tala ay maaaring makuha nang dalawang beses: sa unang pagkakataon - sa panahon ng mga pakikipagsapalaran sa Gorgrond, ang pangalawa - sa panahon ng mga pakikipagsapalaran sa Spiers of Arak, kaya nagse-save ng ilang ginto. Nasa ibaba ang lokasyon ng mga mangangalakal para sa Horde at Alliance.

2.3. Garrison Blueprint: Trading Post Level 3

Ang Garrison Blueprint: Trading Post Level 3 ay isang gantimpala mula sa Savage Friends (Alliance) o Savage Friends (Horde) na tagumpay, na itinaas sa 3 sa 5 Draenor factions: (Alliance), (Horde), (Alliance), (Horde) , (Alyansa), (Horde). Ang tagumpay ay ibinahagi ng lahat ng mga character sa account.

Matapos makumpleto ang tagumpay, hindi ka dapat umasa na ang blueprint ay magically lalabas sa iyong bag. Tumungo sa Spartz Boltwhack (Alliance) o Rezlak (Horde) at bilhin ito sa halagang 1000g.

3. Palitan

Kapag bumisita sa shop sa unang pagkakataon, makakatanggap ka ng quest (Alliance) o A Little Tricks (Horde). Pagkatapos makumpleto ang paghahanap, magkakaroon ka ng access sa merchant. Nagbebenta siya ng mga Draenor crafting reagents: ore, damo, karne, fillet ng isda, balahibo, balat, at kaakit-akit na alikabok. Presyo para sa 5 mga yunit Ang reagent ay mula 20 hanggang 50x Garrison Resources (palaging iba ang mga presyo para sa Horde at Alliance).

4. Mga order

Ang mga pang-araw-araw na order sa Trading Post ay nagbibigay-daan sa iyo na makipagpalitan ng mga reagents para sa Garrison Resources. Exchange rate - 5 reagents para sa 20 mapagkukunan.

5. Auction

Kapag bumisita sa ikalawang antas ng tindahan sa unang pagkakataon, maaari mong gawin ang paghahanap mula sa sinaunang mekanismo ng kalakalan: (Alliance) o (Horde). Makakatanggap ka ng 5 bahagi, ang bawat isa ay dapat pagsamahin sa iba't ibang mga item:

  • Ang Arcane Crystal module ay nangangailangan ng 4 na reagents, na maaaring makuha mula sa mga mob at boss sa mga pagsalakay o pag-atake ng garrison:
  • Ang module ng pamamahala ng auction ay nangangailangan ng 3 reagents, na maaaring makuha mula sa mga mandurumog at boss sa mga piitan:

Ang ETAP-3 ay isang multifunctional na natural language text processing system na binuo mula noong 1980s. isang grupo ng mga Russian linguist, mathematician at programmer sa Institute for Information Transmission Problems ng Russian Academy of Sciences. Ang sistema ng ETAP-3 ay batay sa teoryang "Kahulugan Û Teksto", na binuo ni I.A. Melchuk, at ang integral na teorya ng wika na binuo ni Yu.D. Apresyan.

Ang STAGE-3 ay hindi isang komersyal na pag-unlad na naglalayong makamit ang isang partikular na layunin ng aplikasyon. Ang aming pangunahing gawain ay linguistic modelling ng natural na wika at computer na pagpapatupad ng mga naturang modelo. Ipinapaliwanag nito ang aming pagnanais na bumuo ng mga modelo na sapat hangga't maaari mula sa linguistic na pananaw. Kadalasan, ang malawak na linguistic na impormasyon ay ipinasok sa system, hindi alintana kung ito ay kinakailangan upang mapabuti ang kahusayan ng computer text processing o hindi. Sa partikular, nagsusumikap kaming makakuha ng wastong linguistikong mga istrukturang sintaktik para sa bawat pangungusap, hindi dahil kung hindi, ang pangungusap ay hindi maaaring, halimbawa, maisasalin nang tama sa ibang wika, ngunit dahil lamang ito ay kinakailangan ng gawain ng pagmomodelo ng natural na syntax ng wika. Gayunpaman, kami ay kumbinsido na, sa huling pagsusuri, ang teoretikal na kasapatan at pagkakumpleto ng linguistic na impormasyon ay nagbubunga mula sa isang praktikal na pananaw.

Lahat ng STAGE-3 application ay gumagamit ng orihinal na 3-valued logic system at ang detalyadong pormal na linguistic na paglalarawan ng wika FORET (tingnan ang Apresyan et al. 1992a, Apresjan et al. 1992b).

2. Stage-3: modules, properties, architecture, implementation

2.1.Mga Module

Ang ETAP-3 system ay naglalaman ng mga sumusunod na pangunahing module:

  • Mataas na Kalidad ng Machine Translation System
  • Module para sa pagbuo ng mga tekstong Ruso batay sa Universal Network Language (UNL)
  • Likas na interface ng wika para sa mga database
  • Sistema ng magkasingkahulugan paraphrasing ng mga pangungusap
  • Syntax error corrector
  • Computer-assisted language learning system
  • Lugar ng trabaho para sa syntactic markup ng text corpus.

Sa ibaba ay maikli nating ilalarawan ang lahat ng mga modyul na ito, at tatalakayin natin ang isa sa mga ito - ang module ng UNL - nang mas detalyado.

2.1.1. ETAP-3 machine translation system

Ang pangunahing module ng ETAP-3 ay isang machine translation (MT) system na naghahatid ng limang pares ng mga wika. Available ang mga sistema ng pagsasalin para sa (1) English sa Russian, (2) Russian sa English, (3) Russian sa Korean, (4) Russian sa French, at (5) Russian sa German.

Sa ngayon, ang unang dalawang sistema ay binuo sa pinakadetalye. Ang sistema ng pagsasalin mula sa Ingles patungo sa Ruso at mula sa Ruso sa Ingles, na maaaring ituring bilang isang solong bidirectional na module, ay idinisenyo upang isalin ang mga tunay na teksto, pangunahin ang mga paksang pang-agham at teknikal. Ang pinakamahusay na mga resulta ay nakuha para sa mga teksto sa computer science, electrical engineering, economics, at pulitika, dahil ang mga pinagsamang diksyonaryo ng mga gumaganang wika ng system (bawat isa ay naglalaman ng humigit-kumulang 50,000 mga entry) ay pangunahing nakatuon sa bokabularyo ng mga paksang ito. Gayunpaman, nakayanan din ng ETAP-3 ang mga teksto sa mga pang-araw-araw na paksa, dahil kamakailan ang mga diksyunaryo ay makabuluhang napunan ng pang-araw-araw na bokabularyo. Para sa bawat lexeme sa combinatorial dictionary, ang syntactic, word-forming, semantic at word-forming features nito, ang management model nito, pati na rin ang impormasyon tungkol sa set phrases na may ganitong lexeme.

Bilang karagdagan, mayroong isang Russian morphological dictionary (100,000 mga entry sa diksyunaryo), na, bilang karagdagan sa purong morphological na impormasyon, ay naglalaman ng pangunahing syntactic na impormasyon tungkol sa lexeme at ang tinatayang katumbas ng pagsasalin nito. Ang English morphological dictionary ay may parehong istraktura (60,000 entries). Ang sistema ay batay sa komprehensibong mga paglalarawan ng gramatika ng mga wikang Ingles at Ruso, na pinagsama-sama ng mga developer ng STAGE-3.

Para sa iba pang mga pares ng mga wika, ang mga sistema ng pagsasalin ay umiiral sa antas ng mga prototype.

Kung ang STAGE-3 ay nakatanggap ng isang homonymous na pangungusap at hindi mareresolba ng system ang homonymy na ito, kung gayon ang ilang mga opsyon sa pagsasalin ay inaalok sa output. Sa lahat ng iba pang mga kaso, ang system ay gumagawa ng isang pinaka-kapanipaniwalang syntactic na istraktura at isang pinaka-malamang na pagsasalin. Kung nais ng user ng system na makuha ang lahat ng posibleng pagsasalin, maaari niyang piliin ang naaangkop na opsyon, at "tatandaan" ng system ang lahat ng kaso ng hindi nalutas na homonymy at ibibigay ang lahat ng posibleng syntactic na istruktura ng pangungusap na may lexical na nilalaman na katanggap-tanggap para sa kanila. Isaalang-alang natin ang isang tunay na halimbawa. Alok Gumawa sila ng pangkalahatang komento na... na may napiling opsyon na "lahat ng mga opsyon sa pagsasalin", isinalin ito sa Russian sa dalawang paraan, na naiiba pareho sa mga syntactic na istruktura at sa pagpili ng bokabularyo: (a) Gumawa sila ng pangkalahatang komento na... at (b) Pinilit nila ang heneral na ituro iyon

2.1.2. Likas na interface ng wika para sa mga database

Ang module na ito ng ETAP-3 system ay nagsasalin ng mga query na ibinigay sa libreng anyo sa natural na wika (Ingles o Russian) sa mga expression ng wika ng query sa SQL. Ang module ay nagsasalin din mula sa SQL patungo sa natural na wika. Ang module ay batay sa isang semantic component na partikular na binuo para sa layuning ito, na nagsasalin ng malalim na syntactic na istraktura sa isang pormal na semantic na representasyon, kung saan ang isa ay madaling lumipat sa isang representasyon sa wikang SQL.

2.1.3. Sistema ng synonymic paraphrasing

Ang modyul na ito ay idinisenyo upang magsagawa ng mga eksperimentong pangwika upang makakuha ng iba't ibang magkasingkahulugan at parang magkasingkahulugan na mga paraphrase ng mga pangungusap na Ruso at Ingles. Ang sistema ay nakabatay sa apparatus ng lexical functions, isa sa pinakamahalagang inobasyon ng "Meaning Û Text" theory. Ang resulta ng magkasingkahulugan paraphrasing module ay maaaring ilarawan ng sumusunod na halimbawa:

(1) Inutusan ng direktor si John na magsulat ng ulat - Inutusan ng direktor si John na magsulat ng ulat - Inutusan si John ng direktor na magsulat ng ulat - Nakatanggap si John ng utos mula sa direktor na magsulat ng ulat.

Ang lugar na ito ng pananaliksik sa lingguwistika ay tila napaka-promising, dahil maaari itong magkaroon ng malawak na iba't ibang mga aplikasyon, halimbawa, sa pagtuturo ng mga katutubong at banyagang wika, sa mga sistema ng pag-akda at mga sistema ng pagpaplano ng teksto.

2.1.4. Syntax error corrector

Ang modyul na ito ay dinisenyo para sa pagproseso ng mga teksto sa Russian. Ang layunin nito ay hanapin at itama ang iba't ibang uri ng mga pagkakamali sa kasunduan sa gramatika, gayundin sa pamamahala ng kaso.

2.1.5 Sistema ng pagtuturo ng wikang kompyuter

Ang module na ito ay isang stand-alone na software application, ibig sabihin, isang computer game sa anyo ng isang dialogue. Maaaring gamitin ang program na ito kapag nagtuturo ng Ruso, Ingles at Aleman bilang isang wikang banyaga. Ang laro ay inilaan para sa mga taong nakabisado na ang wika, ngunit gustong palawakin ang kanilang bokabularyo, pangunahin sa pamamagitan ng mga set na parirala at paraphrasing. Ang sistema ay nakabatay sa apparatus ng lexical functions. Ang programa ay maaari ding matagumpay na magamit ng mga katutubong nagsasalita ng mga wika sa itaas na gustong pagyamanin ang kanilang bokabularyo (halimbawa, mga mamamahayag, guro at maging mga pulitiko).

2.1.6. Lugar ng trabaho para sa syntactic markup ng text corpus.

Ang bagong binuo na module na ito ay gumagamit ng mga diksyunaryo ng ETAP-3, pati na rin ang mga morphological at parsing analyzer ng system, upang bumuo ng unang syntactically marked corpus ng mga tekstong Russian. Ito ay isang halo-halong application: ang istraktura ng puno na nagreresulta mula sa awtomatikong pagsusuri ay ine-edit ng isang tao gamit ang maginhawang mga graphical na tool.

2.2. Mga pangunahing katangian ng system

Kabilang sa mga pangunahing tampok ng sistema ng ETAP-3 sa kabuuan at ang mga indibidwal na module nito, ang mga sumusunod ay maaaring mapansin:

  • Paggamit ng Mga Panuntunan bilang Pangunahing Yunit ng isang Algorithm
  • Tiered na diskarte
  • Pagsasalin sa pamamagitan ng yugto ng paglilipat
  • Paggamit ng Dependency Syntax Tree
  • Lexicalist approach
  • Kakayahang tumanggap ng mga opsyon sa pagsasalin
  • Posibilidad ng magkakaibang paggamit ng mga mapagkukunang pangwika

Sa kasalukuyang bersyon ng ETAP-3, lahat ng module ay gumagamit lamang ng mga algorithm na nakabatay sa panuntunan. Gayunpaman, sa ilang kamakailang mga eksperimento, ang MT module ay dinagdagan ng isang bahagi batay sa access sa translation memory (translation memory) , at isang statistical component na semi-awtomatikong kumukuha ng katumbas ng pagsasalin mula sa bilingual text corpora (tingnan ang Iomdin & Streiter 1999).

Tulad ng maraming iba pang natural na language text processing system, ang ETAP-3 ay nailalarawan sa pamamagitan ng isang layered na diskarte. Sa panahon ng pagproseso, ang bawat pangungusap ay dumaan sa ilang yugto at sa bawat yugto ay ipinakita sa anyo ng isang tiyak na istruktura: 1) morphological, 2) syntactic at 3) normalized (o deep-syntactic). Ang aktwal na pagsasalin (paglipat) ay isinasagawa sa antas ng isang normalized na syntactic na istraktura, i.e. Ang mga istrukturang na-normalize ng Ingles ay kino-convert sa mga kaukulang istrukturang na-normalize ng Russian at kabaliktaran.

Ang pinagkaiba ng ETAP-3 sa karamihan ng mga katulad na sistema ay ang paggamit ng mga syntactic dependency tree upang kumatawan sa istruktura ng isang pangungusap (karamihan sa mga natural na sistema ng pagpoproseso ng teksto ng wika sa buong mundo ay gumagamit ng mga istruktura ng mga direktang nasasakupan).

Ang STAGE-3 ay nailalarawan sa pamamagitan ng isang lexicalist approach na ang impormasyong naitala sa diksyunaryo ay itinuturing na kasinghalaga ng impormasyong naitala sa gramatika. Alinsunod dito, ang mga diksyunaryo ng ETAP-3 ay naglalaman ng higit na impormasyon kaysa sa mga diksyunaryo na ginagamit sa ibang mga katulad na sistema. Ang entry sa diksyunaryo ng ETAP-3 ay naglalaman, bilang karagdagan sa pangalan ng lexeme, impormasyon tungkol sa syntactic at semantic na mga tampok ng lexeme, modelo ng pamamahala nito, katumbas ng pagsasalin, iba't ibang mga patakaran, pati na rin ang mga halaga ng lexical function. , ang keyword kung saan ay ang lexeme na ito. Syntactic signs ang mga salita ay nagpapakilala sa kanyang kakayahan o kawalan ng kakayahan na kumilos sa ilang mga sintaktikong konstruksyon. Ang isang salita ay maaaring magtalaga ng ilang syntactic na mga tampok mula sa isang pangkalahatang listahan na naglalaman ng higit sa 200 mga tampok. Mga tampok na semantiko kailangan upang suriin ang semantic agreement sa pagitan ng mga salita sa isang pangungusap. Modelo ng pamamahala ang salita ay naglalaman ng impormasyon tungkol sa panlabas na pagpapahayag ng mga actant ng ibinigay na salita (halimbawa, ang salita ay maaaring kontrolin ang isa o isa pang pang-ukol o pang-ugnay, o isa o isa pang case form ng isang pangalan). Ang pinakamahalagang bahagi ng entry sa diksyunaryo ay mga regulasyon. Ang lahat ng mga panuntunan sa STAGE-3 ay ipinamamahagi sa pagitan ng gramatika at bokabularyo. Ang mga tuntunin sa grammar ay mas pangkalahatan at nalalapat sa malawak na mga klase ng mga salita, habang ang mga panuntunang tinutukoy sa mga entry sa diksyunaryo (direkta o sa pamamagitan ng sanggunian) ay nalalapat sa maliliit na grupo ng mga salita o kahit na mga solong salita. Tinitiyak ng naturang organisasyon ng mga panuntunan na ang system ay awtomatikong na-configure upang iproseso ang bawat indibidwal na panukala. Sa panahon ng proseso ng pagsasalin, tanging ang mga panuntunang iyon ang naisaaktibo, ang sanggunian kung saan ay tahasang nakapaloob sa mga entry sa diksyunaryo ng mga salitang nakapaloob sa pangungusap.

Bilang isang paglalarawan, ipinakita namin ang isang fragment ng entry sa diksyunaryo ng salitang Ingles pagkakataon:

SYNT:COUNT,PREDTO,PREDTHAT

DES:"FACT","ABSTRACT"

D1.1: NG"TAO"

D2.1: NG"KATOTOHANAN"

D2.2: TO2

D2.3: NA1

SYN1: PAGKAKATAON

MAGN: GOOD1/FAIR1/EXCELLENT

ANTIMAGN: BAHAY/PAYAT/MAHULI/LITTLE1/MALIIT

OPER1: MAGKAROON/PANINDIGAN1

TOTOONG1-M: KUMUHA

ANTIREAL1-M: MISS1

INCEPOPER1: GET

FINOPER1: TALO

CAUSFUNC1: MAGBIGAY /BIGAY

TRANS: PAGKAKATAON/ NANGYAYARI

R:COMPOS/MODIF/POSSES

1.1 DEP-LEXA(X,Z,PREPOS,BY1)

1 ZAMRUZ:Z(PO1)

2 ZAMRUZ:X(RANDOMNESS)

1 ZAMRUZ:Z(RANDOM)

TRAF:RA-EXPANS.16

TRAF:RA-EXPANS.22

Sa pagbuo ng sistema ng ETAP-3, sinubukan naming buuin ang mga bahagi nito sa paraang magagamit ang mga ito para sa iba't ibang layunin. Sa partikular, ang pangunahing mga mapagkukunan ng gramatika at bokabularyo ng system ay ginagamit sa lahat ng mga module nito. Halimbawa, ginagamit ang mga diksyunaryong Ruso sa yugto ng pagsusuri kapag nagsasalin mula sa Ruso sa Ingles at sa yugto ng synthesis kapag nagsasalin mula sa Ingles patungo sa Ruso; ang parehong mga diksyunaryo ay ginagamit sa MP module, sa paraphrasing system, sa syntactically marked corpus, atbp. Bukod dito, ang ilan sa mga mapagkukunan ng system ay maaaring "ihiwalay" mula dito at, pagkatapos na pinuhin depende sa mga kinakailangan ng customer, ay maaaring gamitin sa iba't ibang sistema ng pagproseso ng natural - mga teksto ng wika.

2.3 Pangkalahatang arkitektura ng ETAP-3 system

Upang magbigay ng pangkalahatang ideya ng paggana ng ETAP-3 system, ipinakita namin ang pangkalahatang algorithm ng MP module (Scheme 1). Ang lahat ng iba pang mga module, na may isang tiyak na reserbasyon, ay maituturing na mga derivatives ng isang ito.

MACHINE TRANSLATION MODULE NG STAGE-3 SYSTEM

(ARKITEKTURA)

2.4. Pagpapatupad

Ang ETAP-3 system ay ipinatupad sa isang MicroVax computer (VMS operating system). Kamakailan lamang, ang bagong software ay nilikha para sa pagtatrabaho sa ETAP-3 sa mga personal na computer sa ilalim ng Windows NT 4.0, na nagpapahintulot sa lexicographer na gumamit ng ilang karagdagang tool at mas mahusay na magpanatili at mag-edit ng mga diksyunaryo.

3. Interface para sa wikang UNL

3.1 Background at mga layunin

UNL module ay binuo bilang bahagi ng isang malawak na internasyonal na proyekto na may napakaambisyosong layunin: upang madaig, kahit sa isang bahagi, ang hadlang sa wika na naghihiwalay sa mga gumagamit ng Internet. Sa kabila ng katotohanan na sa pagdating ng Internet, ang temporal at spatial na mga hadlang sa pagitan ng mga tao ay halos nawala, ang mga gumagamit ng Internet ay patuloy na pinaghihiwalay ng isang hadlang sa wika. Ito, tila, ang pangunahing hadlang sa matagumpay na internasyonal at interpersonal na komunikasyon sa lipunan ng impormasyon. Ang pagkakaiba-iba ng mga wikang sinasalita ng mga gumagamit ng Internet ay kinilala bilang isa sa mga pinipilit na problema ng sangkatauhan. Sa anumang kaso, ito ay pinatunayan ng katotohanan na ang proyekto, na naglalayong lutasin ang problemang ito, ay isinasagawa sa ilalim ng tangkilik ng UN at pinag-ugnay ng Institute for Advanced Study sa UN University.

Ang proyekto ay itinatag noong 1996. Sa kasalukuyan, 15 mga unibersidad at mga instituto ng pananaliksik mula sa Brazil, Germany, India, Indonesia, Jordan, Spain, Italy, China, Latvia, Mongolia, Russia, Thailand, France at Japan ang kalahok sa proyekto.

Inaasahan na ang mga koponan mula sa ibang mga bansa ay sasali sa proyekto sa mga darating na taon, upang sa huli ay pinlano nitong sakupin ang mga opisyal na wika ng lahat ng mga bansang miyembro ng UN.

Ang ideya ng proyekto ay ang mga sumusunod. Ang isang unibersal na wikang tagapamagitan ay iminungkahi na sapat na makapangyarihan upang ipahayag ang lahat ng mahahalagang impormasyon na ipinahihiwatig ng mga teksto ng natural na wika. Ang wikang ito ay ang Universal Networking Language (UNL) na iminungkahi ni H. Uchida (United Nations University). Para sa bawat natural na wika, iminungkahi na bumuo ng dalawang sistema: isang "deconverter" na magsasalin ng mga teksto mula sa wikang UNL sa isang partikular na wika, at isang "enconverter" na magko-convert ng mga teksto sa isang partikular na wika sa mga expression ng UNL na wika. Dapat itong bigyang-diin na ang pagbuo ng teksto ng UNL ay hindi ganap na awtomatiko. Ang pamamaraang ito ay binalak bilang isang dialogue sa pagitan ng isang computer at isang tao (editor).

Kaya, ang proyektong ito ay pangunahing naiiba sa tradisyonal na pagsasalin ng makina. Una sa lahat, ang input para sa pagbuo ng mga teksto sa iba't ibang natural na wika ay ang istraktura ng UNL, ang kalidad nito ay hindi nakasalalay sa di-kasakdalan ng mga pamamaraan ng pagsusuri ng teksto. Sa panahon ng interactive na gusali ng UNL Susuriin ng structure editor ang mga resulta ng awtomatikong enconverter, itatama ang mga error at lulutasin ang natitirang kalabuan. Maaaring patakbuhin ng editor ang deconverter at isalin kung ano ang na-edit nito UNL pagpapahayag sa iyong sariling wika upang suriin ang iyong gawa at gumawa ng karagdagang mga pagbabago sa ekspresyon kung kinakailangan.

Isa pang mahalagang pagkakaiba ng sistema ng UNL mula sa machine translation ay nakasalalay sa katotohanan na ang mga expression sa wika Ang mga UNL ay maaaring mabuo at maiimbak anuman ang mga natural na wika kung saan isasalin ang mga tekstong ito. Ang UNL ay maaaring isipin bilang isang generic na paraan upang kumatawan sa isang halaga. Upang awtomatikong iproseso ang UNL text, halimbawa, upang i-index ito, hanapin ito, o kunin ang impormasyon mula dito, hindi kinakailangang isalin ang tekstong ito sa natural na wika. Ang huli ay kinakailangan lamang kung ang isang tao ay gagana sa teksto.

Ang isang enconverter at isang deconventor para sa bawat natural na wika ay bumubuo ng isang server ng wika na binalak na i-host sa Internet. Ang lahat ng mga server ng wika ay ikokonekta sa isang network ng UNL, na magbibigay-daan sa gumagamit ng Internet na isalin ang anumang dokumento mula sa UNL sa kanyang sariling wika, pati na rin isalin sa UNL ang mga tekstong iyon na gusto niyang gawing available sa publiko.

3.2 UNL na wika

Sa artikulong ito, hindi namin mailalarawan nang detalyado ang wika ng UNL, dahil ang paksang ito ay nararapat sa isang hiwalay na artikulo, na malamang na isusulat ng lumikha ng wika, si Dr. Hiroshi Uchida. Tatalakayin lamang natin ang mga katangian ng wikang UNL na magiging mahalaga para sa karagdagang presentasyon. Ang kumpletong detalye ng wika ng UNL ay matatagpuan sa http://www.unl.ias.unu.edu/.

Ang UNL ay isang wika sa kompyuter na idinisenyo upang kumatawan sa impormasyon sa paraang magiging posible na makabuo ng mga tekstong naglalaman ng impormasyong ito sa isang malawak na iba't ibang mga wika. Ang isang expression ng UNL ay isang nakadirekta na hypergraph na tumutugma sa isang natural na pangungusap ng wika. Ang mga graph arc ay tumutukoy sa mga relasyong semantiko, halimbawa, ahente(aktor)bagay(isang bagay),oras(oras),lugar(lugar),instrumento(kagamitan),mode(Modus Operandi) at iba pa.Sa mga node ng graph ay ang tinatawag na Universal Words (CS) na nagsasaad ng mga konsepto, o mga grupo ng CS. Ang mga node ay maaaring bigyan ng mga katangian. Ang mga katangian ay naglalaman ng karagdagang impormasyon tungkol sa paggamit ng isang node sa isang ibinigay na pangungusap, halimbawa, @imperative, @generic, @hinaharap, @obligation.

Ang bawat US ay tumutugma sa ilang salitang Ingles. Ang ilang mga salita ay may mga semantic delimiter na nagpapalinaw sa mga kahulugan ng mga salitang ito. Sa karamihan ng mga kaso, ipinapahiwatig ng mga delimiter ang lugar ng konsepto sa base ng kaalaman. Ginagawa ito sa sumusunod na paraan. Pangkalahatang Salita ng Uri A (icl>B) binibigyang kahulugan bilang 'Ang A ay kabilang sa kategorya B'. Halimbawa, US coach walang anumang delimiters ay may parehong kahulugan sa salitang Ingles coach pangkalahatan. Ang mga delimiter ay ginagamit upang linawin ang kahulugan ng isang salita. Oo, ang ekspresyon coach (icl>transportasyon) dapat intindihin bilang 'coach bilang isang paraan ng transportasyon, iyon ay, bus; pagpapahayag coach (icl>tao) may interpretasyon ' coach parang lalaki, ibig sabihin, tagapagsanay, at ang expression coach (icl>do)- interpretasyon' coach bilang isang uri ng aksyon', iyon ay, isang pandiwa tren. Sa madaling salita, ginagawang posible ng apparatus ng mga limiter na katawanin ang US bilang isang salitang Ingles na kinuha sa eksaktong isang kahulugan. Bilang karagdagan, binibigyang-daan ka ng mga delimiter na magpakilala ng mga konsepto kung saan walang solong-salitang pagtatalaga sa wikang Ingles. Halimbawa, sa Russian mayroong isang malawak na pangkat ng mga pandiwa ng paggalaw, ang kahulugan nito ay kinabibilangan ng isang indikasyon ng pamamaraan o paraan ng paggalaw: lumipad papasok, lumangoy, gumapang, tumakbo at iba pa.Walang isang salitang Ingles na mga sulat para sa mga pandiwa ng pangkat na ito. Gayunpaman, batay sa mga salitang Ingles, posible na bumuo ng isang ES na malapit sa kanila sa kahulugan, halimbawa, halika (meet>ship) nangangahulugang 'dumating, ang sasakyan ay isang barko'.

Magbigay tayo ng halimbawa ng isang ekspresyon sa wikang UNL na tumutugma sa pangungusap sa Ingles

(2) Gayunpaman, ang pagkakaiba ng wika ay hadlang sa maayos na daloy ng impormasyon sa ating lipunan.

Bawat linya ng UNL ang istraktura ay isang pagpapahayag ng anyo kaugnayan (RS1, RS2). Para sa pagiging simple, ang mga semantic delimiter para sa mga unibersal na salita ay tinanggal.

aoj( [email protected]@[email protected]@gayunpaman, [email protected])

mod( [email protected]@[email protected]@gayunpaman, [email protected])

mod( [email protected], wika)

aoj(makinis, [email protected])

mod( [email protected], impormasyon)

scn( [email protected], lipunan)

pos(lipunan, tayo)

3.3. Pagsasalin mula sa UNL sa Russian sa ETAP-3 system

Tulad ng nabanggit na sa seksyon 1, ang STAP-3 ay isang sistema ng paglilipat, at ang aktwal na pagsasalin ay isinasagawa sa yugto ng normalized syntactic structure (NormSS). Sa antas na ito, ito ay pinaka-maginhawa upang magtatag ng isang sulat sa pagitan ng wikang Ruso at UNL, dahil ang mga expression ng UNL na wika at normalized syntactic na mga istraktura ay nagpapakita ng maraming pagkakatulad. Narito ang mga pinakamahalaga:

  1. Parehong sinakop ng UNL language expression at NormSS ang isang intermediate na posisyon sa pagitan ng surface at semantic na representasyon ng isang pangungusap at humigit-kumulang tumutugma sa tinatawag na deep-syntactic level. Sa antas na ito, ang kahulugan ng lexical units ay hindi nabulok sa primitives, at ang mga relasyon sa pagitan ng lexical units ay pareho para sa lahat ng mga wika;
  2. Sa parehong mga expression ng UNL at NormSS, ang mga node ay mga terminal na elemento (mga leksikal na yunit) sa halip na mga syntactic na kategorya;
  3. Ang mga node ay naglalaman ng mga karagdagang katangian (mga katangian);
  4. Sa parehong mga expression ng UNL at NormSS, ang mga arc ay nakadirekta sa mga dependency.

Kasabay nito, may mga makabuluhang pagkakaiba sa pagitan ng mga expression ng UNL at NormSS:

  1. Sa NormSS, ang lahat ng node ay mga lexical unit, at sa UNL, ang isang node ay maaaring isang subgraph.
  2. Sa NormSS, ang isang node ay palaging tumutugma sa isang solong halaga ng salita, at ang halaga ng SS ay maaaring mas malawak o mas makitid kaysa sa halaga ng katumbas na salitang Ingles:

2.1. Ang halaga ng CSS ay maaaring tumugma sa ilang mga halaga ng isang salita nang sabay-sabay (tingnan sa itaas).

2.2. Maaari silang tumugma sa isang libreng parirala (halimbawa, nakabatay sa kompyuter o mataas na kalidad).

2.3. Maaaring tumutugma ang mga ito sa ilang anyo ng salita (halimbawa, ang salita pinakamahusay ay isang anyo ng salita mabuti o mabuti).

2.4. Maaari silang magpahiwatig ng isang konsepto kung saan walang direktang katumbas sa Ingles.

  1. Ang NormSS ay ang pinakasimple sa lahat ng konektadong mga graph, katulad ng isang puno, habang ang isang UNL na expression ay isang hypergraph.
  2. Sa UNL, ang mga arc ay maaaring bumuo ng mga loop at mag-link ng mga indibidwal na subgraph.
  3. Ang mga node sa NormSS ay konektado sa pamamagitan ng puro syntactic na relasyon na walang anumang kahulugan, habang ang mga relasyon sa UNL ay tumutukoy sa mga semantic na tungkulin.
  4. Ang mga katangian sa NormSS ay tumutugma sa mga katangiang panggramatika, habang ang kahulugan ng maraming katangian ng UNL ay inihahatid sa pamamagitan ng lexical na paraan, parehong sa English at sa Russian (halimbawa, mga modal verbs).
  5. Ang NormSS ay naglalaman ng impormasyon tungkol sa pagkakasunud-sunod ng mga salita sa isang pangungusap, at ang naturang impormasyon ay wala sa isang UNL na expression.

Ang panukala ng NormSS (2) ay ang sumusunod:


  1. Transition mula sa UNL Expression tungo sa Intermediate Representation (IR)
  2. Ang paglipat mula sa PP sa Russian NormSS (NormSSR).
  3. Synthesis ng panukalang Ruso para sa NormSSR.

Ang una sa mga hakbang na ito ay ang interface sa pagitan ng UNL at ang ETAP-3 system, at ang iba ay isinasagawa sa pamamagitan ng karaniwang paraan ng English-Russian na module ng ETAP-3 system.

Ang algorithm ng pagsasalin mula sa UNL sa Russian ay ipinapakita sa Scheme 3.

Tulad ng sumusunod mula sa itaas, ang paglipat mula sa isang expression sa wikang UNL patungo sa NormSS ay dapat na malutas ang sumusunod na limang problema:

  1. Palitan ang lahat ng CL ng mga salitang Ingles hangga't maaari. Lilitaw ang mga Russian lexemes sa yugto ng pagsasalin ng English-Russian kapag tinutukoy ang English dictionary. Kung walang nakitang katumbas sa Ingles para sa RS, ang halaga ng RS na ito ay dapat na ipahayag sa ibang paraan.
  2. Isalin ang UNL syntactic relations sa ETAP-3 syntactic relations, direkta man o sa pamamagitan ng lexical na paraan.
  3. Isalin ang mga katangian ng wika ng UNL sa STAGE-3 na mga katangiang gramatika, direkta man o gamit ang mga lexical na paraan.
  4. I-convert ang UNL graph sa isang dependency tree.
  5. Tukuyin ang ayos ng salita sa pangungusap.

Ang una at (bahagi) ang pangalawang gawain ay nalutas sa tulong ng mga diksyunaryo ng UNL - English at English combinatorial. Para sa lahat ng iba pang mga gawain, ang mga tuntuning nakasulat sa pormal-lohikal na wikang FORET ay may pananagutan.

Kaya, ang lahat ng mga gawaing ito ay nalutas alinman sa tulong ng mga diksyunaryo o sa tulong ng mga patakaran. Ang mga tuntunin ay nahahati sa tatlong klase depende sa antas ng pagiging pangkalahatan: PANGKALAHATANG, Stencil at VOCABULARY na mga tuntunin ay nakikilala. Maaaring i-activate ang mga pangkalahatang tuntunin kapag naproseso ang anumang alok. Ang iba pang dalawang uri ng mga panuntunan ay nalalapat lamang kung ang pangungusap na pinoproseso ay naglalaman ng isang salita na naglalaman ng isang reference sa ilang panuntunan (sa kaso ng isang template na panuntunan) o ang panuntunan mismo (sa kaso ng isang panuntunan sa diksyunaryo). Tinitiyak ng naturang organisasyon ng mga panuntunan ang awtomatikong pag-tune ng system: tanging ang mga panuntunang iyon na kinakailangan upang maproseso ang isang partikular na alok ang isinaaktibo.

3.4. Kasalukuyang estado ng mga gawain at mga plano para sa hinaharap

Available ang isang pang-eksperimentong bersyon ng module ng pagsasalin ng UNL sa Russian sa http://proling.iitp.ru/Deco . Sa tag-araw ng 2000, plano naming gawing available ang module para sa pangkalahatang paggamit. Ang aming susunod na gawain ay lumikha ng isang interactive na enconverter.

Dahil malinaw sa Scheme 3, ang interface sa pagitan ng UNL at ang mga istruktura kung saan gumagana ang ETAP-3 machine translation module ay isinasagawa sa antas ng English NormSS. Ang parehong diagram ay nagpapakita na ang Ingles na pagsasalin ng orihinal na UNL Ang mga expression ay isang likas na produkto ng naturang arkitektura. Upang gawin ito, sapat na upang ipadala ang English NormSS para sa synthesis. Ilang matagumpay na eksperimento ang naisagawa na sa direksyong ito.

Panitikan

Yu.D. Apresyan, I.M. Boguslavsky, L.L. Iomdin at iba pa. (1992 a ). Linguistic processor para sa mga kumplikadong sistema ng impormasyon. Agham, 256 p. M.

Si Ju. D. Apresjan, I. M. Boguslavsky, L. L. Iomdin etal. (1992b) ETAP-2: The Linguistics of a Machine Translation System. // META, Vol. 37, Blg. 1, pp. 97-112.

Igor Boguslavsky (1995). Isang bi-directional na Russian-to-English machine translation system (ETAP-3). // Proceedings of the Machine Translation Summit V. Luxembourg.

Leonid Iomdin at Oliver Streiter. (1999). Pag-aaral mula sa Parallel Corpora: Mga Eksperimento sa Machine Translation. // Dialogue"99: Computational Linguistics and its Applications International Workshop. Tarusa, Russia, Hunyo 1999. Vol.2, pp. 79-88.

Ang pag-aaral kung saan nakatuon ang artikulong ito ay isinagawa nang may bahagyang suportang pinansyal mula sa Russian Foundation for Basic Research (grant no. 99-06-80277).