Konekäännösjärjestelmät. Maailmamme nykyinen globalisaatio johtaa tarpeeseen vaihtaa asiakirjoja eri maissa sijaitsevien ja eri kieliä puhuvien ihmisten ja organisaatioiden välillä. Näissä olosuhteissa perinteisen manuaalisen käännöstekniikan käyttö estää etnisten yhteyksien kehittymisen. Monisivuisen dokumentaation manuaalinen kääntäminen vaatii kääntäjiltä pitkän ajan ja korkean palkan. Vastaanotetun sähköpostin tai selaimella katsotun web-sivun käännös tulee tehdä välittömästi, eikä ole mahdollisuutta ja aikaa kutsua kääntäjää. Konekäännösjärjestelmät ratkaisevat nämä ongelmat. Toisaalta ne pystyvät kääntämään monisivuisia asiakirjoja suurella nopeudella (yksi sivu sekunnissa) ja toisaalta kääntämään web-sivuja lennossa, reaaliajassa. PROMT:tä ja Sokratesta pidetään parhaina venäläisistä konekäännösjärjestelmistä. Konekäännösjärjestelmät kääntävät tekstejä, jotka perustuvat kielen muodolliseen "tietoon" (kielen syntaksi - lauseiden muodostamissäännöt, sananmuodostussäännöt) ja sanakirjojen käyttöön. Käännösohjelma analysoi ensin tekstin yhdellä kielellä ja muodostaa sitten tämän tekstin toisella kielellä. Nykyaikaiset konekäännösjärjestelmät mahdollistavat teknisen dokumentaation, liikekirjeen ja muiden erikoistekstien kääntämisen riittävän laadukkaasti. Ne eivät kuitenkaan sovellu taideteosten kääntämiseen, koska ne eivät pysty riittävästi kääntämään metaforia, allegorioita ja muita ihmisen taiteellisen luovuuden elementtejä. Kysymyksiä:
- Miksi tarvitsemme ohjelmia - kääntäjiä? Miten tietokonesanakirjat rakennetaan? Mitä tekstejä ei pitäisi kääntää tietokonekääntäjillä?
![](https://i0.wp.com/refdb.ru/images/1474/2946699/4520dec2.jpg)
- auttaa opiskelijoita oppimaan algoritmin käsitteen, algoritmien ominaisuudet ja algoritmien tyypit. opiskelijoiden tietokulttuurin kasvatus, tarkkaavaisuus, tarkkuus, kurinalaisuus, pitkäjänteisyys. algoritmisen ajattelun kehittäminen, kognitiiviset kiinnostuksen kohteet, tietokonetaidot.
- Org. hetki. (1 min) Tietojen päivittäminen. (5 min) Teoreettinen osa. (15 min) Käytännön osa. (10 min) D / s (2 min) Kysymyksiä opiskelijoilta. (5 min) Oppitunnin yhteenveto. (2 minuuttia)
Näkymä tavallisesta graafisesta objektista | Tarkoitus |
| Algoritmin alku |
| Algoritmin loppu |
| Suoritettu toiminto kirjoitetaan suorakulmion sisään |
| Toimintojen suorittamisen ehto on kirjoitettu rombin sisään |
| Toista laskuri |
Toimintojen järjestys |
Algoritmin luomisen vaiheet: 1. Algoritmi tulee esittää sen kehittäjälle ymmärrettävässä muodossa. 2. Algoritmi on esitettävä algoritmissa kuvatut toiminnot suorittavan objektin (mukaan lukien henkilö) ymmärrettävässä muodossa. Objektia, joka suorittaa algoritmin, kutsutaan yleensä suorittajaksi. Toteuttaja- objekti, joka suorittaa algoritmin. Ihanteellisia esiintyjiä ovat koneet, robotit, tietokoneet... Tietokone– algoritmien automaattinen suorittaja. Tietokoneystävällisellä ohjelmointikielellä kirjoitettua algoritmia kutsutaan ohjelmoida. Kysymyksiä:
- Mikä on algoritmi? Anna esimerkkejä algoritmeista. Mitä algoritmien ominaisuuksia tiedät? Millaisia algoritmeja tiedät? Mitä tapoja kirjoittaa algoritmeja tiedät? Mikä on algoritmin suorittaja? Mikä on ohjelma?
Aloita painamalla näppäintä. Voit vaihtaa ikkunatilasta koko näytön tilaan painamalla +-näppäimiä. Jos haluat vaihtaa syöttökielen tässä kuoressa, käytä vasemmalla olevaa näppäinyhdistelmää + latinalaiseen asetteluun, oikealla - venäjäksi. Avautuvan ikkunan ylärivillä on valikko mahdollisista toimintatiloista, alimmalla rivillä on lyhyt viittaus päätoimintonäppäinten tarkoitukseen. Loput näytöstä kuuluu tekstieditori-ikkunaan ja on tarkoitettu ohjelmatekstin syöttämiseen ja muokkaamiseen. Kun astumme ohjelmaan, työskentelemme QBasic-ympäristöön sisäänrakennetulla tekstieditorilla. Ohjelmatekstiä varten sinun on kirjoitettava tämä teksti näppäimistöllä. Kohdistimen sijainti ilmaistaan vilkkuvalla keltaisella alaviivalla. Jokainen komento syötetään erilliselle riville. Siirry seuraavalle riville painamalla -näppäintä. Jos ohjelman teksti ei häiritse näyttöä, voit käyttää vierityspalkkeja. No, osaat jo työskennellä tekstieditorissa. Yritetään nyt kirjoittaa ja ajaa yksinkertainen ohjelma. Kirjoita ohjelmaikkunaan teksti: PRINT "Hei!" Tulosta-komento tulostaa tekstiä näytölle. Komentomerkinnän rekisterillä ei ole merkitystä. Suorita ohjelma Suorita → Suorita -komennolla tai painamalla -näppäintä. Näet näytöllä ohjelmasi tuloksen.
Voit palata ohjelman muokkaustilaan painamalla mitä tahansa näppäintä. Yritä suorittaa ohjelma uudelleen. Aina kun käynnistät, näytöllä näkyy lause "Hei!". Lisää CLS-komento, jotta näyttö tyhjenee, kun käynnistät ohjelman. CLS PRINT "Hei!" Nyt käynnistyksen jälkeen CLS-komento suoritetaan ensin - tyhjennä näyttö ja sitten PRINT-komento - tulostetaan näytölle. Katsotaan mitä tapahtuu, jos teet virheen kirjoittaessasi komentoa. Tee virhe PRINT-komennossa (esimerkiksi PRNT). Kun suoritat ohjelman, saat virheilmoituksen. Virheellinen komento näkyy korostettuna.
Napsauta OK ja korjaa virhe. Tiedosto-valikkoa käytetään ohjelmien tallentamiseen ja avaamiseen. Kun tallennat tiedostoa, sääntö 8.3 koskee tiedoston nimeä. Yritä tallentaa ohjelma tiedostoon. Luodaan nyt ohjelma, joka laskee suorakulmion alueen. CLS a = 3 b = 4 s=a*b LOPPU A, B, C ovat muuttujia suorakulmion pituuden, leveyden ja alueen tallentamiseen. Muuttujan nimi voi sisältää vain latinalaisia kirjaimia ja numeroita (ja alkaa kirjaimella). Opimme lisää muuttujista seuraavalla oppitunnilla. END on ohjelman lopun lauseke. Muuttujia voidaan syöttää näppäimistöltä. Korjaa ohjelma näin: CLS INPUT "Syötä pituus: ", a INPUT "Syötä leveys: ", b s=a*b TULOSTA "Suorakulmion pinta-ala on ",s LOPPU Suorita ohjelma. Nyt muuttujien a ja b arvot on syötettävä näppäimistöltä. Syötä pituusarvo ja paina , anna sitten leveysarvo ja paina uudelleen. (eli arvon syöttäminen lopetetaan painamalla näppäintä). Yritä jäljellä olevana aikana "leikkiä" ohjelman kanssa itse. Oppilaat suorittavat tehtävän. IV. D / s Tiedä mikä algoritmi on, algoritmien ominaisuudet ja tyypit, tapoja kirjoittaa algoritmeja. Lisätehtävä: etsi tietoa yleisimmistä ohjelmointikielistä. V. Opiskelijoiden kysymykset. Vastaukset opiskelijoiden kysymyksiin. VI. Yhteenveto oppitunnista. Yhteenveto oppitunnista. Arvostelu. Oppitunnilla tutustuttiin siihen, mikä algoritmi on, mitä ominaisuuksia sillä on ja miten se voidaan kirjoittaa. Aloimme tutustua ohjelmointiin QBasic-kielellä ja kirjoitimme oman pienen ohjelmamme. Oppitunti numero 27. Aihe: "Johdatus ohjelmointikieleen". Oppitunnin tavoitteet:
- auttaa opiskelijoita oppimaan käsitteen algoritmi, ohjelma, opettaa luomaan yksinkertaisia ohjelmia Basic-ohjelmointikielellä. opiskelijoiden tietokulttuurin kasvatus, tarkkaavaisuus, tarkkuus, kurinalaisuus, pitkäjänteisyys. algoritmisen ajattelun kehittäminen, kognitiiviset kiinnostuksen kohteet, tietokonetaidot.
Informatiikan ja maantieteen tunti 10. luokalla Aihe: Ihmiskunnan globaalit ongelmat
OppituntiOppitunnin tarkoitus: paljastaa käsitteen "ihmiskunnan globaalit ongelmat" sisältö; muodostaa tietoa ihmiskunnan globaaleista ongelmista; analysoida kunkin ongelman syitä, olemusta, piirteitä, mahdollisia ratkaisutapoja niihin.
Edistää näiden käsitteiden käyttöä sellaisten ongelmien ratkaisemisessa, joihin vastaus ei ole numero tai väite, vaan toimintasarjan kuvaus;
Informatiikan laitos TiivistelmäMestarikurssi Aihe: “Menetelmät informatiikan ja ict:n avoimen oppitunnin valmisteluun ja toteuttamiseen. Epätyypillisiä tapoja suunnitella esitys ms powerpointissa "
OppituntiTunti pidetään luokilla 8-11 koulun teemasuunnitelmasta riippuen ja voidaan pitää myös luokilla 5-7 osana lisätunteja tarpeen mukaan, mutta ehdottomasti MS Word -ohjelman opiskelun jälkeen, ts.
Tällä hetkellä on olemassa kolmenlaisia konekäännösjärjestelmiä:
Kielioppisääntöihin perustuvat järjestelmät (Rule-Based Machine Translation, RBMT);
Tilastojärjestelmät (Statistic Machine Translation, SMT);
hybridijärjestelmät;
Kielioppipohjaiset järjestelmät analysoivat käännösprosessissa käytettävää tekstiä. Käännös tehdään tietyn kieliparin sisäänrakennettujen sanakirjojen sekä molempien kielten semanttiset, morfologiset ja syntaktiset mallit kattavien kielioppien perusteella. Kaiken tämän tiedon perusteella lähdeteksti muunnetaan peräkkäin, lause virkkeeltä, tekstiksi vaaditulla kielellä. Tällaisten järjestelmien toiminnan perusperiaate on lähdetekstien ja lopullisten tekstien rakenteiden välinen yhteys.
Kielioppisääntöihin perustuvat järjestelmät jaetaan usein kolmeen muuhun alaryhmään - sanasta sanaan -käännösjärjestelmät, siirtojärjestelmät ja kieltenväliset järjestelmät.
Kielioppisääntöihin perustuvien järjestelmien etuja ovat kieliopillinen ja syntaktinen tarkkuus, tuloksen pysyvyys sekä kyky sopeutua tiettyyn aihealueeseen. Kielioppisääntöihin perustuvien järjestelmien haittoja ovat tarve luoda, ylläpitää ja päivittää kielellisiä tietokantoja, tällaisen järjestelmän luomisen monimutkaisuus sekä sen korkea hinta.
Tilastojärjestelmät käyttävät työssään tilastollista analyysiä. Järjestelmään ladataan kaksikielinen tekstikorpus (joka sisältää suuren määrän lähdekielellä olevaa tekstiä ja sen "manuaalista" käännöstä vaaditulle kielelle), minkä jälkeen järjestelmä analysoi kieltenvälisten vastaavuuksien tilastot, syntaktiset rakenteet jne. järjestelmä on itseoppiva - valitessaan käännösvaihtoehtoa se luottaa aikaisempiin tilastoihin. Mitä suurempi sanavarasto kieliparissa on ja mitä tarkempi se on, sitä parempi on tilastollisen konekäännöksen tulos. Jokaisen uuden käännetyn tekstin myötä myöhempien käännösten laatu paranee.
Tilastojärjestelmät ovat nopeita asentaa ja uusia käännösohjeita on helppo lisätä. Puutteista merkittävimpiä ovat lukuisten kielioppivirheiden esiintyminen ja käännöksen epävakaus.
Hybridijärjestelmissä yhdistyvät aiemmin kuvatut lähestymistavat. Hybridikonekäännösjärjestelmien odotetaan yhdistävän kaikki tilastojärjestelmien ja sääntöpohjaisten järjestelmien edut.
1.3 Konekäännösjärjestelmien luokittelu
Konekäännösjärjestelmät ovat ohjelmia, jotka suorittavat täysin automaattisen käännöksen. Ohjelman pääkriteeri on käännöksen laatu. Lisäksi käyttäjälle tärkeitä seikkoja ovat käyttöliittymän käyttömukavuus, ohjelman helppous integroida muihin asiakirjankäsittelytyökaluihin, aiheiden valinta ja sanakirjan täydennysapuohjelma. Internetin myötä suuret konekäännöstoimittajat ovat sisällyttäneet tuotteisiinsa verkkorajapintoja ja integroineet ne myös muihin ohjelmistoihin ja sähköpostiin, mikä mahdollistaa MT:n käyttämisen Web-sivujen, sähköpostien ja online-keskustelujen kääntämiseen.
Uudet CompuServen vieraiden kielten foorumin jäsenet kysyvät usein, voiko kukaan suositella hyvää konekäännösohjelmaa kohtuulliseen hintaan.
Vastaus tähän kysymykseen on poikkeuksetta "ei". Vastaajasta riippuen vastaus voi sisältää kaksi pääargumenttia: joko se, että koneet eivät voi kääntää tai että konekäännös on liian kallista.
Molemmat väitteet ovat tietyssä määrin päteviä. Vastaus ei kuitenkaan ole läheskään niin yksinkertainen. Konekääntämisen (MT) ongelmaa tutkittaessa on tarpeen tarkastella erikseen tämän ongelman eri alaosia. Seuraava jako perustuu Larry Childsin vuoden 1990 kansainvälisessä teknisen viestinnän konferenssissa pitämiin luentoihin:
Täysin automaattinen käännös;
Automaattinen konekäännös ihmisen osallistumisella;
Tietokonetta käyttävän henkilön suorittama käännös.
Täysin automatisoitu konekäännös. Useimmat ihmiset tarkoittavat tällaista konekäännöstä puhuessaan konekäännöksestä. Merkitys tässä on yksinkertainen: tietokoneeseen syötetään teksti yhdellä kielellä, tämä teksti käsitellään ja tietokone tulostaa saman tekstin toisella kielellä. Valitettavasti tämäntyyppisten automaattisten käännösten käyttöönotossa on tiettyjä esteitä, joita ei ole vielä voitettava.
Suurin ongelma on itse kielen monimutkaisuus. Otetaan esimerkiksi sanan "voi" merkitykset. Modaalisen apuverbin päämerkityksen lisäksi sanalla "voi" on substantiivina useita virallisia ja slangimerkityksiä: "pankki", "käymälä", "vankila". Lisäksi tällä sanalla on arkaainen merkitys - "tietää tai ymmärtää". Olettaen, että kohdekielessä on oma sana jokaiselle näistä arvoista, kuinka tietokone voi erottaa ne toisistaan?
Kuten käy ilmi, jonkin verran edistystä on saavutettu sellaisten käännösohjelmien kehittämisessä, jotka erottelevat merkityksen kontekstin perusteella. Uusimmat tutkimukset tekstien analysoinnissa tukeutuvat enemmän todennäköisyysteoriaan. Täysin automatisoitu laajan aihealueen tekstien konekäännös on kuitenkin edelleen mahdoton tehtävä.
Automaattinen konekäännös ihmisen osallistumisella. Tällainen konekäännös on nyt melko mahdollista. Kun puhutaan konekäännöksistä, joissa on henkilön osallistuminen, ne tarkoittavat yleensä tekstien muokkaamista sekä ennen että sen jälkeen, kun ne on käsitelty tietokoneella. Ihmiskääntäjät muuttavat tekstejä niin, että koneet ymmärtävät ne. Kun tietokone on tehnyt käännöksen, ihmiset muokkaavat jälleen karkeaa konekäännöstä, jolloin kohdekielellä oleva teksti on oikea. Tämän työjärjestyksen lisäksi on olemassa MT-järjestelmiä, jotka vaativat jatkuvaa ihmisen kääntäjän läsnäoloa kääntämisen aikana, jotta tietokone kääntäisi erityisen monimutkaisia tai moniselitteisiä rakenteita.
Ihmisavusteinen konekäännös soveltuu laajemmin teksteihin, joissa on rajoitettu sanavarasto kapeasti rajatuista aiheista.
Ihmisavusteisen konekäännösten käytön taloudellisuus on edelleen kiistanalainen. Itse ohjelmat ovat yleensä melko kalliita, ja jotkut niistä vaativat erikoislaitteiston toimiakseen. Muokkaus ennen ja jälkeen on opeteltava, eikä se ole miellyttävää työtä. Sanatietokantojen luominen ja ylläpito on työläs prosessi ja vaatii usein erityistaitoja. Kuitenkin organisaatiolle, joka kääntää suuria määriä tekstejä tarkasti määritellyllä aihealueella, ihmisen avustama konekäännös voi olla melko kustannustehokas vaihtoehto perinteiselle ihmiskäännökselle.
Tietokonetta käyttävän henkilön suorittama käännös. Tällä lähestymistavalla ihmiskääntäjä asetetaan käännösprosessin keskipisteeseen, kun taas tietokoneohjelma nähdään työkaluna, joka tekee käännösprosessista tehokkaamman ja käännöksen tarkemman. Nämä ovat tavallisia sähköisiä sanakirjoja, jotka tarjoavat käännöksen vaaditusta sanasta, jolloin henkilö on vastuussa oikean vaihtoehdon valinnasta ja käännetyn tekstin merkityksestä. Tällaiset sanakirjat helpottavat suuresti käännösprosessia, mutta vaativat käyttäjältä tietyn kielen tuntemuksen ja viettämään aikaa sen toteuttamiseen. Ja silti itse käännösprosessi nopeutuu ja helpottuu huomattavasti.
Kääntäjän työssään avustavista järjestelmistä tärkein paikka on ns. Translation Memory (TM) -järjestelmät, jotka ovat vuorovaikutteinen työkalu vastaavien tekstisegmenttien parien keräämiseen alkuperäisellä kielellä ja kääntämiseen. tietokanta, jossa on mahdollisuus etsiä ja muokata niitä myöhemmin. Näitä ohjelmistotuotteita ei ole tarkoitettu erittäin älykkäiden tietoteknologioiden käyttöön, vaan ne päinvastoin perustuvat kääntäjän luovan potentiaalin hyödyntämiseen. Työn aikana kääntäjä itse muodostaa tietokannan (tai saa sen muilta kääntäjiltä tai asiakkaalta), ja mitä enemmän se sisältää yksiköitä, sitä suurempi on sen käytöstä tuotto.
Tässä on luettelo tunnetuimmista TM-järjestelmistä:
Transit Sveitsin yritys Star,
Trados (USA),
Käännöspäällikkö IBM:ltä,
Ranskalaisen LANT-yrityksen Eurolang Optimizer,
DejaVu, ATRIL (USA),
WordFisher (Unkari).
TM-järjestelmät mahdollistavat identtisten tekstiosien toistuvan kääntämisen poissulkemisen. Kääntäjä suorittaa segmentin käännöksen vain kerran, minkä jälkeen jokainen seuraava segmentti tarkastetaan vastaavuuden varalta (täysi tai sumea) tietokannan kanssa, ja jos identtinen tai samanlainen segmentti löytyy, se tarjotaan käännöksenä. vaihtoehto.
Tällä hetkellä TM-järjestelmiä kehitetään parhaillaan. Esimerkiksi Star's Transit -järjestelmän ydin perustuu hermoverkkoteknologiaan.
Huolimatta TM-järjestelmien laajasta valikoimasta, niillä on muutamia yhteisiä piirteitä:
Tasaustoiminto. Yksi TM-järjestelmien eduista on kyky käyttää jo käännettyä materiaalia tästä aiheesta. TM-tietokanta saadaan vertaamalla segmenttikohtaisesti alkuperäisiä ja käännöstiedostoja.
Tuonti-vienti-suodattimien saatavuus. Tämä ominaisuus varmistaa TM-järjestelmien yhteensopivuuden useiden tekstinkäsittely- ja julkaisujärjestelmien kanssa ja antaa kääntäjälle suhteellisen riippumattomuuden asiakkaasta.
Mekanismi sumeiden tai täydellisten osumien etsimiseen. Juuri tämä mekanismi edustaa TM-järjestelmien tärkeintä etua. Jos järjestelmä kohtaa tekstiä käännettäessä segmentin, joka on identtinen tai lähellä aiemmin käännettyä, niin jo käännetty segmentti tarjotaan kääntäjälle muunnelmana nykyisen jakson käännöksestä, joka voidaan korjata. Käyttäjä määrittää sumean vastaavuuden asteen.
Tuki temaattisille sanakirjoille. Tämä ominaisuus auttaa kääntäjää pysymään sanastossa. Pääsääntöisesti, jos käännetty segmentti sisältää sanan tai lauseen temaattisesta sanakirjasta, se korostetaan värillisesti ja tarjotaan sen käännös, joka voidaan lisätä käännettävään tekstiin automaattisesti.
Keinot etsiä tekstin katkelmia. Tämä työkalu on erittäin kätevä käännöstä muokatessa. Jos työprosessin aikana löydettiin onnistuneempi versio minkä tahansa tekstin fragmentin käännöksestä, tämä fragmentti löytyy kaikista TM-segmenteistä, minkä jälkeen tarvittavat muutokset tehdään peräkkäin TM-segmentteihin.
Tietysti, kuten kaikilla ohjelmistotuotteilla, TM-järjestelmillä on etunsa ja haittansa sekä laajuutensa. Kuitenkin suhteessa TM-järjestelmiin suurin haittapuoli on niiden korkea hinta.
TM-järjestelmiä on erityisen kätevää kääntää asiakirjoja, kuten käyttöohjeita, käyttöohjeita, suunnittelu- ja liiketoimintadokumentaatioita, tuoteluetteloita ja muita samantyyppisiä asiakirjoja, joissa on paljon osumia.
Aihe: "Tietokonekääntäjät. Tekstintunnistusjärjestelmät.
Oppitunnin tavoitteet:
- auttaa opiskelijoita ymmärtämään tietokonesanakirjoja ja konekäännösjärjestelmiä, perehtymään näiden ohjelmien ominaisuuksiin, opettamaan näiden ohjelmien käyttöä. Auta oppilaita ymmärtämään OCR - tekstintunnistusohjelmia, tutustumaan ohjelman datan ominaisuuksiin, opettamaan skannatun tekstin tunnistamista, siirtämistä ja muokkaamista Wordissa. opiskelijoiden tietokulttuurin kasvatus, tarkkaavaisuus, tarkkuus, kurinalaisuus, pitkäjänteisyys. kognitiivisten kiinnostuksen kohteiden kehittyminen, tietokonetaidot, itsehillintä, muistiinpanokyky.
Laitteet:
taulu, tietokone, tietokoneesitys.
Tuntisuunnitelma:
1) Organisatorinen hetki. (1 minuutti)
2) Tiedon toteutuminen. (5 minuuttia)
3) Teoreettinen osa. (10 minuuttia)
4) Käytännön osa. (15 minuuttia)
5) Kotitehtävät (2 min)
6) Opiskelijoiden kysymykset. (5 minuuttia)
7) Oppitunnin tulos. (2 minuuttia)
Tuntien aikana:
I. Organisatorinen hetki.
Tervehdys, paikalla olevien tarkkailu. Oppitunnin selitys.
II. Tiedon päivitys.
Kuten näet, saadaksesi sähköisen, muokattavaksi valmiin kopion mistä tahansa painetusta tekstistä, OCR-ohjelman on suoritettava "ketju" useista erillisistä toiminnoista.
Ensin sinun on tunnistettava sivulla olevan tekstin rakenne: valitse sarakkeet, taulukot, kuvat ja niin edelleen. Seuraavaksi valitut tekstifragmentit sivun graafisesta kuvasta on muutettava tekstiksi.
Jos lähdedokumentissa on typografinen laatu (melko suuri fontti, ei huonosti tulostettuja merkkejä tai korjauksia), tunnistusongelma ratkeaa vertaamalla rasterimalliin. Ensinnäkin sivun bittikartta jaetaan yksittäisiin merkkikuviin. Sitten kukin niistä asetetaan peräkkäin järjestelmämuistissa olevien symbolimallien päälle ja valitaan malli, jossa on vähiten pisteitä, jotka eroavat syötekuvasta.
Kun tunnistetaan asiakirjoja, joiden tulostuslaatu on heikko (kirjoitettu teksti, faksi ja niin edelleen), merkintunnistusmenetelmää käytetään tiettyjen rakenneosien (segmentit, renkaat, kaaret jne.) perusteella.
Mikä tahansa symboli voidaan kuvata joukolla parametriarvoja, jotka määrittävät sen elementtien suhteellisen sijainnin. Esimerkiksi kirjain "H" ja kirjain "I" koostuvat kolmesta segmentistä, joista kaksi on yhdensuuntaisia toistensa kanssa ja kolmas yhdistää nämä segmentit. Näiden kirjainten välinen ero on niiden kulmien koosta, jotka kolmas segmentti muodostaa kahden muun kanssa.
Rakenteellisella menetelmällä tunnistettaessa tunnusomaiset yksityiskohdat erottuvat vääristyneestä symbolikuvasta ja niitä verrataan symbolien rakenteellisiin kuvioihin. Tämän seurauksena valitaan symboli, jonka kaikkien rakenteellisten elementtien kokonaisuus ja niiden järjestely vastaa eniten tunnistettua symbolia.
Yleisimmät optiset merkintunnistusjärjestelmät, kuten Cognitiven ABBYY FineReader ja CuneiForm, käyttävät sekä rasteri- että strukturoituja tunnistusmenetelmiä. Lisäksi nämä järjestelmät ovat "itseoppivia" (jokaista asiakirjaa varten ne luovat sopivat merkkimallit) ja siksi monisivuisen asiakirjan tunnistamisen nopeus ja laatu lisääntyy vähitellen.
Voit ostaa tekstintunnistusohjelmiston erikseen tai hankkia sen ilmaiseksi ostamasi skannerin mukana.
Ehkä tunnetuin OCR-ohjelmisto on ABBYYn FineReader. Tämä ohjelma jää useimmiten mieleen tunnistusjärjestelmistä.
FineReaderin avulla voit tunnistaa lähes millä tahansa kirjasimella kirjoitetut tekstit ilman aiempaa koulutusta. FineReader-ohjelman ominaisuus on korkea tunnistustarkkuus ja alhainen herkkyys tulostusvirheille, mikä saavutetaan käyttämällä "kokonaisvaltaista tarkoituksenmukaista mukautuvaa tunnistustekniikkaa".
FineReaderissa on paljon lisäominaisuuksia, joita keskivertokäyttäjä ei välttämättä tarvitse, mutta jotka tekevät vaikutuksen tietyille ostajaryhmille. Joten yksi FineReaderin valttikorteista on tuki uskomattomalle määrälle tunnistuskieliä - 176, joista löydät eksoottisia ja ikivanhoja kieliä ja jopa suosittuja ohjelmointikieliä.
Mutta kaikki ominaisuudet eivät sisälly ohjelman yksinkertaisimpiin versioihin, jotka saat ilmaiseksi skannerin mukana. Eräskannaus, taulukoiden ja kuvien asiantunteva käsittely - kaikkea tätä varten kannattaa ostaa ammattimainen versio ohjelmasta.
Kaikilla FineReaderin versioilla, yksinkertaisimmasta tehokkaimpaan, on käyttäjäystävällinen käyttöliittymä. Tunnistusprosessin aloittamiseksi sinun tarvitsee vain laittaa asiakirja skanneriin ja painaa ohjelman työkalupalkin ainoaa painiketta (ohjattu skannaus- ja lukutoiminto). Kaikki muut toiminnot - skannaus, kuvan jakaminen "lohkoiksi" ja lopuksi ohjelman todellinen tunnistus suoritetaan automaattisesti. Käyttäjän tarvitsee vain asettaa haluamasi skannausparametrit.
Tunnistuksen laatu riippuu pitkälti siitä, kuinka hyvä kuva saadaan skannauksen aikana. Kuvan laatua ohjataan asettamalla skannauksen perusparametrit: kuvatyyppi, resoluutio ja kirkkaus.
Harmaan skannaus on tunnistusjärjestelmän optimaalinen tila. Jos skannataan harmaassa tilassa, kirkkauden valinta suoritetaan automaattisesti. Jos haluat, että asiakirjan sisältämät värielementit (kuvat, kirjaimet ja taustavärit) siirretään sähköiseen asiakirjaan värisäilytyksen avulla, on valittava värikuvatyyppi. Muussa tapauksessa käytä harmaata kuvatyyppiä.
Optimaalinen tarkkuus tavalliselle tekstille on 300 dpi ja 400-600 dpi pienellä tekstillä (9 pistettä tai vähemmän).
Kun sivun tunnistus on valmis, FineReader tarjoaa käyttäjälle valinnan: skannata ja tunnistaa edelleen (monisivuinen asiakirja) tai tallentaa tuloksena oleva teksti johonkin monista suosituista muodoista - Microsoft Office -asiakirjoista HTML- tai PDF-muotoon. Voit kuitenkin siirtää asiakirjan välittömästi Wordiin tai Exceliin ja korjata kaikki tunnistusvirheet jo siellä (ilman sitä on yksinkertaisesti mahdotonta tehdä). Samalla FineReader säilyttää täysin kaikki asiakirjan muotoilun ja graafisen suunnittelun ominaisuudet.
- Miksi tarvitsemme tekstintunnistusohjelmia? Miten tekstintunnistus tehdään? Mitä tekstintunnistusohjelmia tiedät? Mitä he käyttivät? Mikä resoluutio on optimaalinen tekstin, kuvien skannaamiseen?
III. Käytännön osa.
1. Työskentely tekstinkääntäjän kanssa (korteilla)
2. Harjoitellaan nyt työskentelyä ABBYY FineReaderin kanssa. Käytämme skannerin mukana tulevaa yksinkertaistettua versiota.
IV. Kotitehtävät
Tiedä mitä automaattiset tekstinkäännösohjelmat ovat, osaa työskennellä näiden ohjelmien kanssa. Lisätehtävä: muodosta yhteys Internetiin ja käytä mitä tahansa online-kääntäjää tekstin kääntämiseen.
Tiedä mitä tekstintunnistusohjelmat ovat, osaa työskennellä näiden ohjelmien kanssa. Lisätehtävä: asenna OCR-ohjelma kotona ja valmistele essee mistä tahansa aiheesta. Tunnista teksti OCR:ssä, muokkaa ja muotoile Wordissa.
V. Opiskelijoiden kysymykset.
Vastaukset opiskelijoiden kysymyksiin.
VI. Yhteenveto oppitunnista.
Yhteenveto oppitunnista. Arvostelu.
Tunnilla tutustuttiin tekstien tietokonekäännösohjelmiin, opittiin kääntämään sanoja ja tekstiä käännösohjelmalla.
Oppitunnilla tutustuimme OCR-ohjelmiin, opimme tunnistamaan skannatun kuvan ABBYY FineReader 5.0:lla.
Vieraiden kielten taito ei ole vain hyödyllinen taito jokapäiväisessä elämässä, vaan myös yksi tärkeimmistä vaatimuksista työpaikkaa haettaessa. Tällä hetkellä yhden tai jopa useamman vieraan kielen osaamisen tarve on yhä tärkeämpää.
Kielen (englannin tai saksan) taitoa tarvitaan sihteerille paitsi lomamatkalla ulkomaille, myös vastaanottaessaan liikekumppaneita ulkomailta, arjessa uutisia lukiessa tai elokuvia katsellessa. Siksi monet rutiini- ja arkitoimet, jotka eivät aiemmin vaatineet vieraan kielen taitoa, ovat nykyään kansainvälisten integraatioprosessien kehittymisen ja yritysten laajalle levinneen globalisaatiohalun vuoksi yhä vaikeampia, jos luottaa vain yksi kieli.
Nykyään vieraiden kielten taito ei kuitenkaan yksin riitä, sillä päivittäin käännettävän tiedon määrä on lisääntynyt huomattavasti. Samalla tämä tehtävä ratkaistaan onnistuneesti, eikä kenenkään ole vaikeaa kääntää sopimus tai ulkomaisen sivuston sisältö muutamassa sekunnissa. Ja kaikki siksi, että tässä tapauksessa käännösohjelma harjoittaa kääntämistä: henkilöllä ei ole aikaa räpäyttää silmää, ja käännös on jo valmis.
Kohde Tämän oppitunnin tarkoituksena on auttaa opiskelijoita saamaan käsityksen tietokonesanakirjoista ja konekäännösjärjestelmistä, esitellä näiden ohjelmien ominaisuuksia ja opettaa näiden ohjelmien käyttöä.
Ladata:
Esikatselu:
Oppitunnin aihe: "Tekstien ja tietokonesanakirjojen konekäännösjärjestelmät"
Oppitunnin tavoitteet:
- auttaa opiskelijoita saamaan käsityksen tietokonesanakirjoista ja konekäännösjärjestelmistä, perehdyttää heitä näiden ohjelmien ominaisuuksiin, opettaa näiden ohjelmien käyttöä.
- kognitiivisten kiinnostusten kehittyminen, itsehillintä, muistiinpanokyky.
- opiskelijoiden tietokulttuurin kasvatus, tarkkaavaisuus, tarkkuus, kurinalaisuus, pitkäjänteisyys.
Oppitunnin tyyppi: oppitunti uuden materiaalin oppimiseen
Laitteet:
tietokone, projektori, näyttö, tietokoneesitys.
Tuntien aikana:
I. Org. hetki
Tervehdys, paikalla olevien tarkkailu.
II. Tiedon päivitys
Vähintään yhden vieraan kielen taitoa tarvitaan nykyään kaikille, kuten ilmaa. Erityisesti käyttäjille: loppujen lopuksi on mahdotonta välttää törmäystä englannin kielen kanssa työskennellessäsi tietokoneella. No, jos se koski vain tiedostoja, joissa oli ohjelmien dokumentaatio (joita ei perinteisesti kukaan lue maassamme) tai ohjelmavalikoiden nimiä (joissa voit oppia navigoimaan kieltä tietämättä, tieteellisellä töksähdyksellä ja tukoilulla).
On huonoa, jos et osaa vierasta kieltä... Olen kuitenkin pahoillani - osittain - voit auttaa asentamalla jonkin erikoistuneita käännösohjelmia tietokoneellesi tai käyttämällä tietokoneen sanakirjoja.
Kirjoita ylös oppitunnin aihe "Tekstien konekäännösjärjestelmät
ja tietokonesanakirjoja.
Tänään oppitunnilla saat käsityksen tietokonesanakirjoista ja automaattisista tekstinkäännösjärjestelmistä ja tutustut näiden ohjelmien ominaisuuksiin.
III. Johdatus uuteen materiaaliin
Kirjoittamisen myötä ihmiset saivat tehokkaan työkalun tiedon tallentamiseen ja viestintään. Ensimmäiset meille tulleet kirjoitukset temppelien ja hautojen seinillä kertovat kuninkaiden ja kenraalien teoista, jotka tapahtuivat vuosisatoja sitten. Lisäksi ihmiset kirjasivat taloudellisen toiminnan tuloksia voidakseen käydä kauppaa, kerätä veroja jne.
Kansojen välisen kirjallisen viestinnän helpottamiseksi luotiin ensimmäiset sanakirjat. Sumerilaiset papit kirjoittivat yhden näistä sanakirjoista savitauluille. Jokainen tabletti jaettiin kahteen yhtä suureen osaan. Toisaalta kirjoitettiin sumerilainen sana ja toisaalta samankaltainen sana toisella kielellä, joskus lyhyellä selityksellä. Sanakirjojen rakenne ei ole juurikaan muuttunut siitä nykypäivään.
Tällä hetkellä on olemassa tuhansia sanakirjoja satojen kielten kääntämiseen (englanti-venäläinen, saksa-ranska ja niin edelleen), ja jokainen niistä voi sisältää kymmeniä tuhansia sanoja.
Paperiversiossa sanakirja on paksu satojen sivujen kirja, jossa oikean sanan etsiminen on melko työlästä prosessia.
Maailmamme nykyinen globalisaatio johtaa tarpeeseen vaihtaa asiakirjoja eri maissa sijaitsevien ja eri kieliä puhuvien ihmisten ja organisaatioiden välillä.
Näissä olosuhteissa perinteisen manuaalisen käännöstekniikan käyttö estää etnisten yhteyksien kehittymisen. Monisivuisen dokumentaation manuaalinen kääntäminen vaatii kääntäjiltä pitkän ajan ja korkean palkan. Vastaanotetun sähköpostin tai selaimella katsotun web-sivun käännös tulee tehdä välittömästi, eikä ole mahdollisuutta ja aikaa kutsua kääntäjää.
Konekäännösjärjestelmät ratkaisevat nämä ongelmat.
Henkilökohtaisen tietokoneen käyttöönoton myötä alettiin luoda sähköisiä sanakirjoja, mikä helpotti oikean sanan löytämistä ja tarjosi monia uusia hyödyllisiä toimintoja (sanan äänestys, synonyymien etsiminen jne.).
Konekäännöstekniikkaa on parannettu vähitellen. Ja jos ensimmäisten järjestelmien kääntämisen laatu ja nopeus jättivät paljon toivomisen varaa, nyt tietokone pystyy todella kääntämään tekstiä kielestä toiseen johdonmukaisesti. Ja nykyaikaisemmat järjestelmät hyväksyttävällä laadulla kääntävät yhden sivun tekstiä sekunnissa.
Tietokonesanakirjat ovat monikielisiä.
Niiden avulla käyttäjä voi valita kielet ja käännössuunnan (esimerkiksi englanti-venäläinen, espanja-venäläinen jne.)
Yleisesti käytettyjen sanojen pääsanakirjan lisäksi ne voivat sisältää kymmeniä erikoissanakirjoja tietoalueilta (tekniikka, lääketiede jne.)
Tarjoa sanakirjamerkintöjen nopea haku.
Voit kirjoittaa lauseita ja tekstejä.
Voi olla multimediaa, esim. tarjoavat käyttäjälle mahdollisuuden kuunnella puhujien, äidinkielenään puhuvien sanoja.
Tietokonekääntäjien perusvaatimukset
Tehokkuus koostuu sanaston ja temaattisten osien jatkuvasta päivittämisestä.
Joustavuus suunniteltu tietylle aihealueelle.
Nopeus - mahdollisuus automaattiseen tekstitietojen syöttämiseen ja käsittelyyn paperilta. Yksi tällainen järjestelmä (OCR-System) korvaa joka päivä yli kymmenen kokenutta konekirjoittajaa.
Tarkkuus on lukutaito ja riittävä käännetyn tekstin merkityksen siirtäminen kohdekielelle.
Tietokonekäännösjärjestelmillä on hyvät ja huonot puolensa.
Plussat
Suuri käännösnopeus. Tietokonekäännösjärjestelmien avulla voit kääntää monisivuisia asiakirjoja suurella nopeudella.
Monipuolisuus.Ammattikääntäjä on pääsääntöisesti erikoistunut tiettyä aihetta koskevien tekstien kääntämiseen. Käännösohjelmien avulla voit kääntää riittävän laadukkaasti teknisiä asiakirjoja, liikekirjeenvaihtoa ja muita erikoistekstejä.
Alhaiset käännöskustannukset. Käyttämällä ammattikääntäjien palveluita joudumme maksamaan rahaa jokaisesta käännöksen sivusta. Usein tekstistä ei kuitenkaan tarvitse saada täydellistä käännöstä, vaan on saatava kiinni lähetetyn kirjeen merkitys tai Internetin sivun sisältö. Tässä tapauksessa käännösjärjestelmästä tulee epäilemättä luotettava ja tehokas avustaja.
Luottamuksellisuus. Monet käyttäjät käyttävät säännöllisesti konekäännösjärjestelmiä henkilökohtaisten kirjeiden kääntämiseen, koska kaikki eivät ole valmiita antamaan ulkopuoliselle kääntäjälle henkilökohtaista kirjeenvaihtoa tai uskomaan kaupallisten tai taloudellisten asiakirjojen kääntämistä.
Online-käännös ja verkkosisällön käännös. Voit kääntää verkkosivuja reaaliajassa. Online-käännöspalvelut ovat aina käsillä ja auttavat sinua kääntämään tiedot nopeasti oikeaan aikaan. Lisäksi nykyään käännösjärjestelmien avulla voidaan kääntää Internet-sivujen sisältöä ja hakukoneiden kyselyitä.
Miinukset
Mutta näihin järjestelmiin ei voida täysin luottaa. He ovattehdä semanttisia ja tyylivirheitä eikä sovellu taideteosten kääntäminen, koska he eivät pysty kääntämään riittävästi metaforia, allegorioita ja muita ihmisen taiteellisen luovuuden elementtejä.
Tämä johtuu siitä, että he kääntävät tekstejä, jotka perustuvat muodolliseen "tietoon": kielen syntaksiin (lauseiden muodostussäännöt), sananmuodostuksen sääntöihin ja sanakirjojen käyttöön.
Konekäännösten käyttö ilman aiheen mukauttamista on monien Internet-vitsien aihe.
Lause "Kissamme synnytti kolme kissanpentua - kaksi valkoista ja yksi musta", jonka PROMT-verkkokääntäjä muutti "Kissamme synnytti kolme kissanpentua - kaksi valkoista ja yhden afroamerikkalaisen." Jos "afrikkalaisamerikkalainen" voitiin silti tehdä "mustiksi" kirjoittamalla "musta kissanpentu", niin "kissa" ei voinut vaihtaa sukupuolta: esimerkiksi naaraskissa käännettiin "naaraskissaksi".
Ohjelma ei tunnista lauseen kontekstia ja kääntää termit sanatarkasti, sen lisäksi, että se ei erota erisnimiä tavallisista sanoista. Sama PROMT-kääntäjä muuttaa "Leo Tolstoin" "Lion Thickiksi" ("lihava leijona").
Google-kääntäjä päinvastoin käytti usein sanaa "riisi" (riisi) Yhdysvaltain entisen ulkoministerin sukunimeksi.
Mitä tehdä tällaisten virheiden välttämiseksi?
- Ennen kuin aloitat kääntämisen, sinun onmääritä tekstityyppieli miltä ihmiselämän alueelta se on edustettuna (talous, urheilu, tiede jne.). Loppujen lopuksi jokaisella alueella on omat vivahteensa ja ehdot.
- Käännösvirheiden syynä on usein kirjoitusvirheet käännetty teksti. Tämä koskee myös tunnistettuja tekstejä. Kääntäjät merkitsevät virheelliset sanat tuntemattomiksi, koska ne eivät ole sanakirjoissa tässä muodossa. Huonompi jos onvirheitä välimerkeissä- yksi väärin sijoitettu pilkku voi vääristää koko lauseen käännöksen.
- Työskentele tekstikatkelmien kanssa. Älä koskaan käännä koko tekstiä kerralla. Se sisältää aina sanoja, joita ei ole sanakirjassa ja joita järjestelmä ei käännä oikein.
Internetin tietokonekääntäjät tarjoavat valikoiman temaattisia sanakirjoja ja käännössuunnan. Niiden avulla voit kääntää minkä tahansa tekstin, joka on kirjoitettu käännösikkunaan tai kopioitu leikepöydältä, web-sivuilta, mukaan lukien hyperlinkit, sekä sähköpostit.
Suosituimmat ovat Google,PROMT, Yandex.translation.
Translate.ru on ensimmäinen venäläinen verkkopalvelu, joka on suunniteltu kääntämään tekstiä tai verkkosivuja muille kielille. Käännettäessä yksittäistä sanaa se tuottaa sanakirjamerkinnän. Avattu 6. maaliskuuta 1998 PROMT:n toimesta.
Yandex.Translation on Yandexin verkkopalvelu, joka on suunniteltu kääntämään osa tekstistä tai verkkosivusta toiselle kielelle. Järjestelmä rakentaa kirjeenvaihtosanakirjansa miljoonien käännettyjen tekstien analyysin perusteella. Käännettävää tekstiä tietokone vertaa ensin sanatietokantaan, sitten kielimallien tietokantaan, yrittäen määrittää ilmaisun merkitystä kontekstissa.
Google Kääntäjä on Googlen verkkopalvelu, joka on suunniteltu kääntämään automaattisesti osan tekstistä tai verkkosivusta toiselle kielelle. Joillekin kielille tarjotaan käyttäjille käännösvaihtoehtoja, esimerkiksi teknisille termeille, jotka tulisi sisällyttää tuleviin käännösjärjestelmän päivityksiin. Palvelu sisältää myös koko web-sivun kääntämisen ja jopa samanaikaisen tiedonhaun käännöksen kanssa toiselle kielelle.
Konekäännösjärjestelmän käyttäminen voi merkittävästi lyhentää tekstien kääntämiseen kuluvaa aikaa. Parhaat venäjän konekäännösjärjestelmät ovatPROMT, ABBYY Lingvo, Multitran, SlovoEd.
Elektroninen sanakirja ABBYY Lingvo. Monikielinen versio kattaa 15 kieltä. ABBYY Lingvossa ei ole kokotekstin käännöstoimintoa, mutta tekstien sana-sanan kääntäminen leikepöydältä on mahdollista.
Elektroninen sanakirja Promt. PROMT tarjoaa käännösohjelmia ja PROMT-sanakirjoja tekstien kääntämiseen englannista, saksasta, ranskasta, espanjasta ja muista kielistä venäjäksi ja päinvastoin. Täydellinen ratkaisu liiketoiminnan ja teknisten asiakirjojen, sähköpostin, verkkosivustojen ja esitysten automaattiseen kääntämiseen.
Kääntäjiä ei ole saatavana vain henkilökohtaisille tietokoneille, vaan myös matkapuhelimille, tableteille ja muille laitteille.
Esimerkiksi tarvittavien tekstikappaleiden kääntämiseksi nopeasti ja kätevästi luotiin ohjelma Androidille - Quick Translator. Sen tärkein etu on, että se kääntää tekstit kopioituaan ne leikepöydälle. Sinun tarvitsee vain korostaa ne tekstin osat, jotka tarvitset saadaksesi nopean käännöksen suoraan Android-tabletillasi tai -puhelimellasi.
IV. Tutkitun aineiston konsolidointi
Tapasimme luokassatietokonesanakirjat ja automaattiset tekstinkäännösjärjestelmät sekä näiden ohjelmien ominaisuudet.
1. Mitkä ovat tietokonekääntäjien vaatimukset?
2. Mitkä ovat tietokonesanakirjojen edut perinteisiin paperisanakirjoihin verrattuna?
3. Milloin on suositeltavaa käyttää tietokonekäännösjärjestelmiä?
4. Mitä tekstejä ei saa kääntää tietokonekääntäjillä?
5. Mitkä ovat parhaiden venäläisten konekäännösjärjestelmien nimet?
V. Kotitehtävät
Valmistaudu käytännön työhön
VI. Yhteenveto oppitunnista.
Yhteenveto oppitunnista. Arvostelu.
LUETTELO KÄYTETTYÄ KIRJALLISTA
Mikheeva E.V. Tietotekniikka ammatillisessa toiminnassa. – M.: Akatemia, 2006. – 384 s.
Sapkov V.V. Tietotekniikka ja toimistotyön tietokoneistaminen. – M.: Akatemia, 2006. – 288 s.
Konekäännösjärjestelmien tyypit //logrus.ru
Vieraalla kielellä laaditut asiakirjat on käännettävä venäjäksi. Muuten niistä aiheutuneita kuluja ei hyväksytä verotuksessa. Joskus käännöstä ei kuitenkaan tarvita. Esimerkiksi, jos puhumme latinaksi koodatun elektronisen lipun tiedoista (Venäjän liittovaltion veroviraston kirje 7. kesäkuuta 2011 nro ED-4-3 / 8983).
Asiakirjojen kääntämisen tarve
Venäjän federaation 25. lokakuuta 1991 annetun lain nro 18071 "Venäjän federaation kansojen kielistä" 16 artiklan 1 kohdan mukaisesti maamme organisaatioiden virallinen toimistotyö tapahtuu venäjäksi. .
Ja kuten Venäjän federaation kirjanpitoa ja taloudellista raportointia koskevan asetuksen, Venäjän valtiovarainministeriön 29. heinäkuuta 1998 annetulla määräyksellä nro 34n, 9 kohdassa vahvistetaan, omaisuuden, velkojen ja liiketoimien kirjanpito (taloudelliset tosiasiat) toiminta) kirjataan Venäjän federaation valuutassa - ruplissa .
Samaan aikaan omaisuuden, velkojen ja muiden taloudellisen toiminnan tosiasioiden dokumentointi, kirjanpito- ja raportointirekisterien ylläpito hoidetaan venäjäksi. Lisäksi sanotaan: muilla kielillä laadituissa ensisijaisissa kirjanpitoasiakirjoissa on oltava rivi riviltä käännös venäjäksi.
Näiden normien perusteella valvontaviranomaiset päättelevät, että ensisijaiset asiakirjat, jos ne on laadittu vieraalla kielellä, on käännettävä venäjäksi. Tämä mielipide on ilmaistu erityisesti Venäjän valtiovarainministeriön 3. marraskuuta 2009 päivätyissä kirjeissä nro 03-03-06 / 725, päivätty 14. syyskuuta 2009 nro 03-03-05 / 170, päivätty helmikuuta 16, 2009 nro 03-03-05/23.
Vaikka organisaatiot onnistuvat puolustamaan kuluja tuomioistuimissa, jotka vahvistetaan asiakirjoilla ilman käännöstä (Moskovan piirin liittovaltion monopolien vastaisen palvelun asetukset, 21. huhtikuuta 2011 nro KA-A40 / 2152-11, 8. lokakuuta 2008 nro KA -A40 / 8061-08).
Myös välimiehet ovat useimmiten veronmaksajien puolella huomauttaen, että asiakirjojen venäjäksi kääntämisen puute ei voi olla perusteena arvonlisäveron vähentämisestä kieltäytymiselle. Esimerkki tästä on Moskovan piirin liittovaltion monopolien vastaisen palvelun 1. huhtikuuta 2009 antama päätös nro KA-A40 / 132809, 16. maaliskuuta 2009 nro KA-A40 / 1450-09, Moskovan piirin liittovaltion monopolien vastainen palvelu. Länsi-Siperian piiri, 5. maaliskuuta 2007 nro F04-979 /2007(31967-A45-14).
Jos matkatoimiston asiakirjoista ei kuitenkaan ole käännöstä, kulujen verotusmahdollisuutta tai vähennysoikeutta joutuu todennäköisesti puolustamaan tuomioistuimessa. Tässä tapauksessa oikeudenkäynnin lopputulos ei välttämättä ole verovelvollisen edullinen.
Kuinka kääntää asiakirja
Talousosasto selventää, että käännöksen voi tehdä sekä ammattikääntäjä että organisaatio itse tai pikemminkin sen työntekijä (kirjeet 14.9.2009 nro 03-03-05 / 170, 20.3.2006 nro 03 -02-07 /1-66).
Samaan aikaan lainsäädännössä ei säädetä, kuinka tällainen asiakirja on laadittava. Siksi se voidaan suorittaa erillisenä asiakirjana tai kirjoittaa venäjänkielisellä tekstillä ulkomaisen ensisijaisen asiakirjan valokopioon.
On huomattava, että käännöksen voi suorittaa myös ensisijaisen asiakirjan myöntänyt organisaatio, esimerkiksi todistuksen muodossa (Venäjän valtiovarainministeriön kirje nro 03-03-05 / 170).
Milloin pärjäät ilman käännöstä?
Joissakin tapauksissa asiakirjoja ei tarvitse kääntää.
Tätä ei tarvitse tehdä ensinnäkin, jos saat säännöllisesti ulkomaisilta vastapuoliltasi vakioasiakirjoja, joissa vain numeeriset indikaattorit eroavat (numero, asiakirjan päivämäärä, hinta jne.), riittää, että käännät asiakirjan muodon. asiakirja kerran venäjäksi. Asiaa koskevat selitykset on annettu Venäjän valtiovarainministeriön 3. marraskuuta 2009 päivätyssä kirjeessä nro 03-03-06/1/725.
Toiseksi, ei vaadita kääntämään tietoja, jotka eivät ole välttämättömiä aiheutuneiden kulujen vahvistamiseksi.
Esimerkiksi hinnan soveltamisehdot, lentokuljetuksen säännöt, matkatavaroiden kuljetussäännöt. Päätalousosaston virkamiehet kiinnittivät tähän huomiota 14.9.2009 päivätyllä kirjeellä nro 03-03-05 / 170.
Kolmanneksi latinalaisilla kirjaimilla täytetyn sähköisen lipun virallisia (koodattuja) tietoja ei tarvitse kääntää (Venäjän liittovaltion verohallinnon kirjeet 7. kesäkuuta 2011 nro ED-4-3 / 8983, 26. huhtikuuta , 2010 nro ШС-37- 3/ [sähköposti suojattu]).
Mutta kun sähköisen lipun arvot on todella ilmoitettu vieraalla kielellä eivätkä ne täsmää Unified International Codifiers -standardien mukaisten formalisoitujen (koodattujen) arvojen tai koodien kanssa, nämä lipun indikaattorit (arvot) ovat käännetty venäjäksi.
Käännöskulujen kirjaaminen
Kirjanpidossa matkatoimiston käännöspalveluiden maksukulut sisältyvät muihin kuluihin sinä kuukautena, jolloin ne suoritetaan. Tämä näkyy tilin 91 "Muut tuotot ja kulut" veloituskirjauksessa (alatili "Muut kulut") ja tilin 76 "Selvitykset eri velallisten ja velkojien kanssa" hyvityksessä (lausekkeet 11, 16, 18 PBU 10/99 "Järjestön kulut").
Tällaiset kulut hyväksytään myös voiton verotukseen - osana muita maksuna tietopalveluista (Venäjän federaation verolain 14 momentti, 1 momentti, 264 §) tai muina kuluina. Tästä - Venäjän liittovaltion veroviraston Moskovan kirjeessä, päivätty 26. toukokuuta 2008 nro 20-12 / 050126. Totta, tämä sääntö koskee kolmannen osapuolen käännöksen kustannuksia.
Muista, että Venäjän federaation verolain 252 artiklan vaatimusten noudattamiseksi asiakirjojen käännöskustannukset on dokumentoitava.
Kun "yksinkertaistaminen" ottaa huomioon tällaiset kustannukset eivät toimi. Koska niitä ei ole määrätty suljetussa sallittujen kulujen luettelossa (Venäjän federaation verolain 346.16 artiklan 1 kohta).
Tärkeää muistaa
Kolmannen osapuolen asiakirjojen käännöskustannukset voidaan vähentää tuloverotuksessa. Mutta on mahdotonta hyväksyä niitä "yksinkertaistettuna".