ទស្សនវិជ្ជាកុំព្យូទ័រ។ ភាសាវិទ្យាតាមការគណនាជាវិន័យភាសាដែលបានអនុវត្ត

ភាសាវិទ្យា (ពីឡាតាំង lingua -
ភាសា), ភាសាវិទ្យា, ភាសាវិទ្យា - វិទ្យាសាស្ត្រ,
សិក្សាភាសា។
នេះគឺជាវិទ្យាសាស្ត្រធម្មជាតិ ភាសាមនុស្សជាទូទៅ
និងអំពីភាសាទាំងអស់នៃពិភពលោកដូចជារបស់គាត់។
អ្នកតំណាងផ្ទាល់ខ្លួន។
អេ អារម្មណ៍ទូលំទូលាយពាក្យ, ភាសាវិទ្យា
បែងចែកទៅជាវិទ្យាសាស្ត្រ និងជាក់ស្តែង។ ជា​ញឹកញាប់
ដោយភាសាវិទ្យាគឺមានន័យយ៉ាងជាក់លាក់
ភាសាវិទ្យាវិទ្យា។ វាគឺជាផ្នែកមួយនៃ semiotics
វិទ្យាសាស្ត្រនៃសញ្ញា។
ភាសាវិទ្យាត្រូវបានអនុវត្តយ៉ាងជំនាញដោយអ្នកភាសាវិទ្យា។

ភាសាវិទ្យា និងព័ត៌មានវិទ្យា។
ក្នុង​ជីវិត សង្គមទំនើប តួនាទីសំខាន់លេងដោយស្វ័យប្រវត្តិ
ព​ត៌​មាន​វិទ្យា។ ប៉ុន្តែការអភិវឌ្ឍន៍ ព​ត៌​មាន​វិទ្យាបន្ត
មិនស្មើគ្នាខ្លាំង៖ ប្រសិនបើ កម្រិតទំនើប វិទ្យាសាស្ត្រ​កុំព្យូទ័រនិង
មធ្យោបាយនៃការប្រាស្រ័យទាក់ទងគឺអស្ចារ្យណាស់ បន្ទាប់មកនៅក្នុងវិស័យនៃដំណើរការ semantic
ភាពជោគជ័យនៃព័ត៌មានគឺតិចតួចជាង។ ជោគជ័យទាំងនេះពឹងផ្អែកជាចម្បងលើ
វឌ្ឍនភាពក្នុងការសិក្សាអំពីដំណើរការ ការគិតរបស់មនុស្ស, ដំណើរការនៃការនិយាយ
ការទំនាក់ទំនងរវាងមនុស្ស និងសមត្ថភាពក្នុងការក្លែងធ្វើដំណើរការទាំងនេះនៅលើកុំព្យូទ័រ។ ហើយនេះគឺជាភារកិច្ចនៃភាពស្មុគស្មាញបំផុត។ យើងកំពុងនិយាយលើការបង្កើតការសន្យា
បច្ចេកវិទ្យាព័ត៌មាន បន្ទាប់មកបញ្ហានៃដំណើរការដោយស្វ័យប្រវត្តិនៃអត្ថបទ
ព័ត៌មាន​ដែល​បង្ហាញ​ជា​ភាសា​ធម្មជាតិ​មក​ដល់​មុខ។
នេះត្រូវបានកំណត់ដោយការពិតដែលថាការគិតរបស់មនុស្សមានទំនាក់ទំនងយ៉ាងជិតស្និទ្ធជាមួយនឹងភាសារបស់គាត់។ ច្រើនទៀត
ជាងនេះទៅទៀត ភាសាធម្មជាតិគឺជាឧបករណ៍នៃការគិត។ គាត់ក៏ជា
មធ្យោបាយសកលនៃការទំនាក់ទំនងរវាងមនុស្ស - មធ្យោបាយនៃការយល់ឃើញ,
ការប្រមូលផ្តុំ ការផ្ទុក ដំណើរការ និងការបញ្ជូនព័ត៌មាន។
បញ្ហាក្នុងការប្រើប្រាស់ ភាសាធម្មជាតិនៅក្នុងស្វ័យប្រវត្តិ
ដំណើរការព័ត៌មានគឺជាវិទ្យាសាស្ត្រនៃភាសាវិទ្យាគណនា។ វិទ្យាសាស្ត្រនេះ។
បានលេចឡើងនាពេលថ្មីៗនេះ - នៅវេននៃហាសិបនិងហុកសិប
សតវត្សទីចុងក្រោយ។ ដំបូងក្នុងអំឡុងពេលនៃការបង្កើតរបស់វាវាមានភាពខុសគ្នា
ចំណងជើង៖ ភាសាវិទ្យាគណិតវិទ្យា ភាសាវិទ្យាគណនា វិស្វកម្ម
ភាសាវិទ្យា។ ប៉ុន្តែនៅដើមទសវត្សរ៍ទី 80 ឈ្មោះនេះបានជាប់គាំង
ភាសាកុំព្យូទ័រ។

ភាសាវិទ្យាគណនាគឺជាវិស័យចំណេះដឹងទាក់ទងនឹងការដោះស្រាយបញ្ហា
ដំណើរការដោយស្វ័យប្រវត្តិនៃព័ត៌មានដែលបង្ហាញជាភាសាធម្មជាតិ។
កណ្តាល បញ្ហាវិទ្យាសាស្ត្រភាសាកុំព្យូទ័រគឺជាបញ្ហា
ការធ្វើគំរូដំណើរការនៃការយល់ពីអត្ថន័យនៃអត្ថបទ (ការផ្លាស់ប្តូរពីអត្ថបទទៅ
ការតំណាងជាផ្លូវការនៃអត្ថន័យរបស់វា) និងបញ្ហានៃការសំយោគការនិយាយ (ការផ្លាស់ប្តូរពី
តំណាងជាផ្លូវការនៃអត្ថន័យនៃអត្ថបទភាសាធម្មជាតិ) ។ បញ្ហាទាំងនេះ
កើតឡើងនៅពេលដោះស្រាយបញ្ហាអនុវត្តមួយចំនួន៖
1) ការរកឃើញដោយស្វ័យប្រវត្តិ និងការកែកំហុសនៅពេលបញ្ចូលអត្ថបទទៅក្នុងកុំព្យូទ័រ។
2) ការវិភាគនិងសំយោគដោយស្វ័យប្រវត្តិ ការនិយាយផ្ទាល់មាត់,
3) ការបកប្រែដោយស្វ័យប្រវត្តិអត្ថបទពីភាសាមួយទៅភាសាមួយទៀត
4) ការប្រាស្រ័យទាក់ទងជាមួយកុំព្យូទ័រជាភាសាធម្មជាតិ
5) ការចាត់ថ្នាក់ដោយស្វ័យប្រវត្តិ និងការធ្វើលិបិក្រមនៃឯកសារអត្ថបទ របស់ពួកគេ។
ការសង្ខេបដោយស្វ័យប្រវត្តិ ស្វែងរកឯកសារក្នុងមូលដ្ឋានទិន្នន័យអត្ថបទពេញ។
ជាងពាក់កណ្តាលសតវត្សកន្លងមកនេះ ក្នុងវិស័យភាសាវិទ្យាគណនា។
វិទ្យាសាស្រ្តសំខាន់និង លទ្ធផលជាក់ស្តែង៖ ប្រព័ន្ធម៉ាស៊ីន
ការបកប្រែអត្ថបទពីភាសាធម្មជាតិមួយទៅភាសាមួយទៀតដោយស្វ័យប្រវត្តិ
ស្វែងរកព័ត៌មាននៅក្នុងអត្ថបទ ប្រព័ន្ធសម្រាប់ការវិភាគដោយស្វ័យប្រវត្តិ និងការសំយោគនៃការនិយាយផ្ទាល់មាត់ និង
ជាច្រើនទៀត។ ប៉ុន្តែក៏មានការខកចិត្តផងដែរ។ ឧទាហរណ៍បញ្ហានៃការបកប្រែម៉ាស៊ីន
អត្ថបទ​ពី​ភាសា​មួយ​ទៅ​ភាសា​មួយ​ប្រែ​ទៅ​ជា​ពិបាក​ជាង​ការ​គិត​ទៅ​ទៀត។
អ្នកត្រួសត្រាយផ្លូវនៃការបកប្រែតាមម៉ាស៊ីន និងអ្នកស្នងតំណែងរបស់ពួកគេ។ ដូចគ្នានេះដែរអាចត្រូវបាននិយាយអំពី
ការស្វែងរកដោយស្វ័យប្រវត្តិសម្រាប់ព័ត៌មាននៅក្នុងអត្ថបទ និងអំពីភារកិច្ចនៃការវិភាគ និងសំយោគផ្ទាល់មាត់
សុន្ទរកថា។ តាមមើលទៅអ្នកវិទ្យាសាស្ត្រ និងវិស្វករនៅតែត្រូវប្រឹងប្រែង
សម្រេចបាននូវលទ្ធផលដែលចង់បាន។

ដំណើរការភាសាធម្មជាតិ (eng. natural language processing; syntactic,
morphological, ការវិភាគតាមន័យធៀបអត្ថបទ) ។ នេះក៏រួមបញ្ចូលផងដែរ៖
Corpus ភាសាវិទ្យា ការបង្កើត និងការប្រើប្រាស់សារអេឡិចត្រូនិច
ការបង្កើត វចនានុក្រមអេឡិចត្រូនិច, thesauri, ontologies ។ ឧទាហរណ៍ Lingvo ។ វចនានុក្រម
ប្រើជាឧទាហរណ៍ សម្រាប់ការបកប្រែដោយស្វ័យប្រវត្តិ ការពិនិត្យអក្ខរាវិរុទ្ធ។
ការបកប្រែអត្ថបទដោយស្វ័យប្រវត្តិ។ ពេញនិយមក្នុងចំណោមអ្នកបកប្រែរុស្ស៊ី
គឺ Promt ។ ស្គាល់ក្នុងចំណោមឥតគិតថ្លៃ កម្មវិធី​បកប្រែ​ហ្គូហ្គលបកប្រែ
ការទាញយកការពិតដោយស្វ័យប្រវត្តិពីអត្ថបទ (ការទាញយកព័ត៌មាន) (ការពិតភាសាអង់គ្លេស
ការទាញយក, ការជីកយករ៉ែអត្ថបទ)
ការសង្ខេបអត្ថបទដោយស្វ័យប្រវត្តិ (ភាសាអង់គ្លេសដោយស្វ័យប្រវត្តិ) ។ មុខងារនេះត្រូវបានបើក
ឧទាហរណ៍នៅក្នុង Microsoft Word ។
ការកសាងប្រព័ន្ធគ្រប់គ្រងចំណេះដឹង។ សូមមើលប្រព័ន្ធអ្នកជំនាញ
ការបង្កើតប្រព័ន្ធសំណួរ-ចម្លើយ (ប្រព័ន្ធឆ្លើយសំណួរជាភាសាអង់គ្លេស) ។
ការទទួលស្គាល់តួអក្សរអុបទិក (OCR) ។ ឧទាហរណ៍ FineReader
ការទទួលស្គាល់ការនិយាយដោយស្វ័យប្រវត្តិ (ASR) ។ មានកម្មវិធីបង់ប្រាក់ និងឥតគិតថ្លៃ
ការសំយោគការនិយាយដោយស្វ័យប្រវត្តិ

Timofeeva Maria Kirillovna
វេជ្ជបណ្ឌិត វិទ្យាសាស្ត្រ philoological, ជាន់ខ្ពស់ អ្នកស្រាវជ្រាវមន្ទីរពិសោធន៍នៃប្រព័ន្ធតក្កវិជ្ជានៃវិទ្យាស្ថានគណិតវិទ្យា។ S.L. Soboleva SB RAS ប្រធាននាយកដ្ឋានភាសាវិទ្យាមូលដ្ឋាន និងអនុវត្ត វិទ្យាស្ថានសម្រាប់មនុស្សជាតិនៃសាកលវិទ្យាល័យ Novosibirsk State ។ បានបញ្ចប់ការសិក្សាពីនាយកដ្ឋានភាសាវិទ្យាគណិតវិទ្យា មហាវិទ្យាល័យមនុស្សសាស្ត្រទីក្រុង Novosibirsk សាកលវិទ្យាល័យរដ្ឋ.
ចំណាប់អារម្មណ៍ស្រាវជ្រាវ៖ មូលដ្ឋានគ្រឹះទស្សនវិជ្ជា និងវិធីសាស្រ្តនៃភាសាវិទ្យា បញ្ហាឡូជីខលសទ្ទានុក្រម និងការអនុវត្តនៃភាសាធម្មជាតិ មុខងារ គំរូគណិតវិទ្យាភាសាធម្មជាតិ ភាសាធម្មជាតិ និងភាសាផ្លូវការ។

Stukachev Alexey Ilyich
បេក្ខនារីរូបវិទ្យា និងគណិតវិទ្យា សាស្ត្រាចារ្យរង អ្នកស្រាវជ្រាវជាន់ខ្ពស់នៅវិទ្យាស្ថានគណិតវិទ្យា។ S.L. Soboleva SB RAS, សាស្ត្រាចារ្យរង, នាយកដ្ឋានគណិតវិទ្យាផ្តាច់មុខ និងព័ត៌មានវិទ្យា, មហាវិទ្យាល័យមេកានិច និងគណិតវិទ្យា, NSU, សាស្ត្រាចារ្យរង, នាយកដ្ឋានភាសាវិទ្យាមូលដ្ឋាន និងអនុវត្ត, វិទ្យាស្ថានសម្រាប់មនុស្សសាស្ត្រ, NSU
វិសាលភាពនៃចំណាប់អារម្មណ៍វិទ្យាសាស្ត្រ៖ តក្កវិជ្ជាគណិតវិទ្យា, ទ្រឹស្ដីដែលអាចគណនាបាន (ភាពអាចគណនាបានទូទៅ, សមត្ថភាពគណនាក្នុងសំណុំដែលអាចទទួលយកបាន, HF-computability), ទ្រឹស្ដីគំរូ ( គំរូស្ថាបនា, ការតំណាងប្រកបដោយប្រសិទ្ធភាពនៃប្រព័ន្ធ, កម្រិតនៃភាពតំណាង), ការវិភាគដែលអាចគណនាបាន។ ភាសាវិទ្យាគណិតវិទ្យាពាក្យ​គន្លឹះ៖ ន័យ​ផ្លូវ​ការ​, ន័យ​ម៉ុងតាក​, ន័យ​ចែក​ចាយ។

Barakhnin Vladimir Borisovich
អ្នកស្រាវជ្រាវនាំមុខនៃមន្ទីរពិសោធន៍ ធនធានព័ត៌មានវិទ្យាស្ថាន បច្ចេកវិទ្យាកុំព្យូទ័រ SB RAS សាស្រ្តាចារ្យនៃនាយកដ្ឋាន គំរូគណិតវិទ្យាមហាវិទ្យាល័យមេកានិក និងគណិតវិទ្យា NSU សាស្រ្តាចារ្យនៃនាយកដ្ឋានប្រព័ន្ធព័ត៌មាន និង ព័ត៌មានទូទៅមហាវិទ្យាល័យព័ត៌មានវិទ្យា សាកលវិទ្យាល័យរដ្ឋ Novosibirsk ។
ចំណាប់អារម្មណ៍ស្រាវជ្រាវ៖ ការកសាងគំរូនៃការចែកចាយ ប្រព័ន្ធព័ត៌មានការបង្កើតក្បួនដោះស្រាយសម្រាប់ដំណើរការឯកសារអត្ថបទពាក់កណ្តាលរចនាសម្ព័ន្ធ ស្វ័យប្រវត្តិកម្ម ការវិភាគស្មុគស្មាញអត្ថបទកំណាព្យ បញ្ហាវិធីសាស្រ្តនៃព័ត៌មានវិទ្យា។

Bruches Elena Pavlovna
និស្សិត​ក្រោយ​ឧត្តម​សិក្សា​នៃ​វិទ្យាស្ថាន​ប្រព័ន្ធ​ព័ត៌មានវិទ្យា​ដាក់​ឈ្មោះ​តាម។ A. P. Ershova SB RAS ជំនួយការនៃនាយកដ្ឋានភាសាវិទ្យាមូលដ្ឋាន និងអនុវត្តនៃវិទ្យាស្ថានសម្រាប់មនុស្សជាតិនៃសាកលវិទ្យាល័យ Novosibirsk State អ្នកជំនាញភាសាវិទ្យានៅក្រុមហ៊ុន "OnPositive" ។
ចំណាប់អារម្មណ៍ស្រាវជ្រាវ៖ ដំណើរការភាសាធម្មជាតិ ការរៀនម៉ាស៊ីន, បញ្ញាសិប្បនិម្មិត។

Pavlovsky Evgeny Nikolaevich
បេក្ខជននៃវិទ្យាសាស្ត្ររូបវិទ្យា និងគណិតវិទ្យា សមាជិកក្រុមប្រឹក្សាអ្នកវិទ្យាសាស្ត្រវ័យក្មេង និងអ្នកឯកទេស ក្រោមរដ្ឋាភិបាលនៃតំបន់ Novosibirsk សមាជិកក្រុមប្រឹក្សាអ្នកជំនាញនៃ Technopark នៃ Novosibirsk Akademgorodok ប្រធានគណៈកម្មាធិការរៀបចំសន្និសីទស៊ីបេរី ស្តីពីវិទ្យាសាស្ត្រទិន្នន័យ និង សន្និសីទវិស្វកម្ម។
គោលដៅវិជ្ជាជីវៈ៖ ការរៀបចំប្រព័ន្ធនៃវិធីសាស្រ្តក្នុងការរៀបចំតម្រូវការអាជីវកម្មជាផ្លូវការនៅក្នុងគម្រោងទិន្នន័យធំៗ។

Palchunov Dmitry Evgenievich
អ្នកស្រាវជ្រាវនាំមុខគេនៅវិទ្យាស្ថានគណិតវិទ្យា។ S. L. Soboleva SB RAS, ប្រធាននាយកដ្ឋានព័ត៌មានទូទៅ, NSU, ប្រធាននាយកដ្ឋាន "វិទ្យាស្ថានគណិតវិទ្យា និងព័ត៌មានដាច់ដោយឡែក", មហាវិទ្យាល័យមេកានិច និងគណិតវិទ្យា, NSU ។
ចំណាប់អារម្មណ៍នៃការស្រាវជ្រាវ៖ លទ្ធផលជាមូលដ្ឋានលើការសិក្សាអំពីពិជគណិតប៊ូលីនជាមួយនឹងឧត្តមគតិពិសេស (I-algebras) ត្រូវបានទទួល។

Sviridenko Dmitry Ivanovich
និយោជិតនៃវិទ្យាស្ថានគណិតវិទ្យានៃសាខាស៊ីបេរីនៃបណ្ឌិត្យសភាវិទ្យាសាស្ត្ររុស្ស៊ី និងសាកលវិទ្យាល័យរដ្ឋ Novosibirsk អ្នកជំនួញ អ្នករៀបចំ និងសហម្ចាស់ក្រុមហ៊ុនបច្ចេកវិទ្យាខ្ពស់ដែលប្រតិបត្តិការក្នុងវិស័យព័ត៌មាន ទំនាក់ទំនង និងបច្ចេកវិទ្យាឌីជីថល។ ចូលរួម​ក្នុង​ការ​ស្រាវ​ជ្រាវ​លើ​ការ​ធ្វើ​គំរូ​តាម​អត្ថន័យ​ដែល​ទទួល​បាន​មូលនិធិ​ដោយ​ជំនួយ​ពី​មូលនិធិ​វិទ្យាសាស្ត្រ​រុស្ស៊ី។
ចំណាប់អារម្មណ៍ស្រាវជ្រាវ៖ ទស្សនវិជ្ជា វិធីសាស្រ្ត តក្កវិជ្ជាគណិតវិទ្យាអនុវត្ត។ អ្នកនិពន្ធនៃគំនិតនិង ទ្រឹស្តីគណិតវិទ្យាការធ្វើគំរូតាមន័យធៀប បានដាក់ចេញរួមគ្នាជាមួយអ្នកសិក្សានៃបណ្ឌិត្យសភាវិទ្យាសាស្ត្ររុស្ស៊ី S.S. Goncharov និង Yu.L. Ershov ក្នុងទសវត្សរ៍ទី 80 នៃសតវត្សទីចុងក្រោយ។ នាពេលបច្ចុប្បន្ននេះ គាត់បន្តអភិវឌ្ឍយ៉ាងសកម្មនូវវិធីសាស្រ្ត និងទ្រឹស្តីគណិតវិទ្យានៃគោលគំនិតនេះ ហើយក៏បានចូលរួមនៅក្នុងការអនុវត្តនៃគោលគំនិតនេះផងដែរ។ តំបន់ផ្សេងៗ. ធ្វើការលើការបង្កើតវិធីសាស្រ្ត ទ្រឹស្តីគណិតវិទ្យា និងភាសានៃកិច្ចព្រមព្រៀង និងកិច្ចសន្យាឆ្លាតវៃ semantic អនុវត្តគំនិតនៃគំរូ semantic ទាក់ទងនឹង TRIZ និងផ្នែកផ្សេងទៀត។

Savostyanov Alexander Nikolaevich
អ្នកស្រាវជ្រាវឈានមុខគេនៅមន្ទីរពិសោធន៍នៃចិត្តវិទ្យាឌីផេរ៉ង់ស្យែលនៃវិទ្យាស្ថានស្រាវជ្រាវសរីរវិទ្យានិង ថ្នាំជាមូលដ្ឋាន, ប្រធានមន្ទីរពិសោធន៍នៃហ្សែនផ្លូវចិត្តនៃវិទ្យាស្ថាន Cytology និងហ្សែននៃសាខាស៊ីបេរីនៃបណ្ឌិត្យសភាវិទ្យាសាស្ត្ររុស្ស៊ី, សាស្រ្តាចារ្យនៃនាយកដ្ឋានព័ត៌មានទូទៅនៃមហាវិទ្យាល័យព័ត៌មានវិទ្យានៃសាកលវិទ្យាល័យរដ្ឋ Novosibirsk, សាស្រ្តាចារ្យនៃនាយកដ្ឋានមូលដ្ឋាន និងភាសាវិទ្យាអនុវត្ត វិទ្យាស្ថានមនុស្សធម៌ NSU
ចំណាប់អារម្មណ៍វិទ្យាសាស្ត្រពាក្យគន្លឹះ៖ neurophysiology, psychogenetics, neurolinguistics, វិធីសាស្រ្តនៃដំណើរការកុំព្យូទ័រនៃសញ្ញាជីវសាស្រ្ត។ ការស្រាវជ្រាវមានគោលបំណងកំណត់កត្តាហានិភ័យសម្រាប់ការកើត និងការអភិវឌ្ឍនៃរោគសាស្ត្រដែលមានឥទ្ធិពលលើមនុស្ស អាស្រ័យលើសង្គម និង លក្ខខណ្ឌអាកាសធាតុសកម្មភាពសំខាន់។ ជាផ្នែកមួយនៃការស្រាវជ្រាវ បេសកកម្មត្រូវបានអនុវត្តទៅកាន់តំបន់ផ្សេងៗនៃប្រទេសរុស្ស៊ី ( តំបន់ Novosibirsk, Tyva, Yakutia, Altai Republic) និង ប្រទេសជិតខាង(ម៉ុងហ្គោលី ចិន) ដើម្បីប្រមូល សម្ភារៈជីវសាស្រ្តនិងការប្រមូលផ្តុំនៃកំណត់ត្រា EEG នៅក្នុងផ្សេងៗ លក្ខខណ្ឌពិសោធន៍. គោលបំណងនៃការស្រាវជ្រាវគឺដើម្បីបង្កើតប្រព័ន្ធរោគវិនិច្ឆ័យដែលអនុញ្ញាតឱ្យវាយតម្លៃហានិភ័យនៃការរំលោភលើបទប្បញ្ញត្តិអារម្មណ៍នៃអាកប្បកិរិយារបស់មនុស្សក្រោមលក្ខខណ្ឌនៃភាពតានតឹងកើនឡើង។

ភាសាវិទ្យាកុំព្យូទ័រ (ក្រដាសតាមដានពីភាសាវិទ្យាកុំព្យូទ័រភាសាអង់គ្លេស) ជាផ្នែកមួយនៃភាសាវិទ្យាអនុវត្ត ដែលក្នុងនោះត្រូវសិក្សាភាសា និងយកគំរូតាមមុខងារនៃភាសាក្នុងលក្ខខណ្ឌ ស្ថានភាព និង តំបន់បញ្ហាអភិវឌ្ឍ និងប្រើប្រាស់ កម្មវិធីកុំព្យូទ័រ, បច្ចេកវិទ្យាកុំព្យូទ័រសម្រាប់រៀបចំ និងដំណើរការទិន្នន័យ។ ម្យ៉ាងវិញទៀតនេះគឺជាតំបន់នៃការអនុវត្តគំរូភាសាកុំព្យូទ័រក្នុងភាសាវិទ្យា និងមុខវិជ្ជាដែលពាក់ព័ន្ធ។ ដូចជាពិសេស ទិសដៅវិទ្យាសាស្ត្រភាសាវិទ្យាគណនាបានលេចចេញជារូបរាង ការសិក្សាអឺរ៉ុបនៅទសវត្សរ៍ឆ្នាំ 1960 ។ ដរាបណា គុណនាមភាសាអង់គ្លេស computational ក៏អាចបកប្រែថាជា "computational" ពាក្យ "computational linguistics" ក៏ត្រូវបានរកឃើញនៅក្នុងអក្សរសិល្ប៍ផងដែរ ទោះយ៉ាងណាក៏ដោយនៅក្នុង វិទ្យាសាស្ត្រក្នុងស្រុកគាត់ទទួលបានកាន់តែច្រើន អត្ថន័យតូចចង្អៀតខិតជិតគំនិតនៃ "ភាសាវិទ្យាបរិមាណ" ។

ជាញឹកញាប់ ភាសាវិទ្យាគណនាសំដៅលើពាក្យ "ភាសាវិទ្យាបរិមាណ" ដែលបង្ហាញពីទិសដៅអន្តរកម្មក្នុង ការស្រាវជ្រាវដែលបានអនុវត្តដែលជាកន្លែងដែលវិធីសាស្រ្តនៃការវិភាគបរិមាណ ឬស្ថិតិត្រូវបានប្រើជាឧបករណ៍សំខាន់សម្រាប់ការសិក្សាភាសា និងការនិយាយ។ ជួនកាល ភាសាវិទ្យាបរិមាណ (ឬបរិមាណ) គឺប្រឆាំងទៅនឹងភាសាវិទ្យារួមបញ្ចូលគ្នា។ ក្រោយមក តួនាទីលេចធ្លោត្រូវបានកាន់កាប់ដោយឧបករណ៍គណិតវិទ្យា "មិនបរិមាណ" - ទ្រឹស្តីកំណត់ តក្កវិជ្ជាគណិតវិទ្យា ទ្រឹស្តីនៃក្បួនដោះស្រាយ ។ល។ ចំណុចទ្រឹស្តីមើលការប្រើប្រាស់ វិធីសាស្រ្តស្ថិតិនៅក្នុងភាសាវិទ្យាអនុញ្ញាតឱ្យអ្នកបំពេញបន្ថែម គំរូរចនាសម្ព័ន្ធភាសាដែលមានសមាសធាតុ probabilistic ពោលគឺ បង្កើតគំរូរចនាសម្ព័ន្ធ - probabilistic ទ្រឹស្តីដែលមានសក្តានុពលពន្យល់យ៉ាងសំខាន់។ អេ តំបន់កម្មវិធីភាសាវិទ្យាបរិមាណត្រូវបានតំណាងជាដំបូងដោយការប្រើប្រាស់បំណែកនៃគំរូនេះដែលប្រើសម្រាប់ការត្រួតពិនិត្យភាសានៃមុខងារនៃភាសា ការឌិកូដអត្ថបទដែលបានអ៊ិនកូដ ការអនុញ្ញាត / គុណលក្ខណៈនៃអត្ថបទ។ល។

ពាក្យ "ភាសាវិទ្យាគណនា" និងបញ្ហានៃផ្នែកនេះជារឿយៗត្រូវបានផ្សារភ្ជាប់ជាមួយនឹងគំរូនៃការប្រាស្រ័យទាក់ទងគ្នានិងខាងលើទាំងអស់ - ជាមួយនឹងការផ្តល់អន្តរកម្មរបស់មនុស្សជាមួយនឹងកុំព្យូទ័រជាភាសាធម្មជាតិឬមានកម្រិត (សម្រាប់នេះ, ប្រព័ន្ធពិសេសដំណើរការភាសាធម្មជាតិ) ក៏ដូចជាទ្រឹស្តី និងការអនុវត្តនៃប្រព័ន្ធទាញយកព័ត៌មាន (IPS)។ ការធានាការប្រាស្រ័យទាក់ទងរវាងមនុស្សម្នាក់ និងកុំព្យូទ័រជាភាសាធម្មជាតិ ជួនកាលត្រូវបានតំណាងដោយពាក្យ "ដំណើរការភាសាធម្មជាតិ" (ការបកប្រែពី ជា​ភាសាអង់គ្លេសពាក្យ ដំណើរការភាសាធម្មជាតិ)។ ទិសដៅនៃភាសាវិទ្យាគណនានេះបានកើតឡើងនៅចុងទស្សវត្សរ៍ឆ្នាំ 1960 នៅបរទេស ហើយបានអភិវឌ្ឍនៅក្នុងវិន័យវិទ្យាសាស្ត្រ និងបច្ចេកវិទ្យាដែលហៅថា បញ្ញាសិប្បនិមិត្ត (ការងារដោយ R. Schenk, M. Lebovits, T. Winograd ។ល។)។ នៅក្នុងអត្ថន័យរបស់វា ឃ្លា "ដំណើរការភាសាធម្មជាតិ" គួរតែគ្របដណ្តប់គ្រប់វិស័យដែលកុំព្យូទ័រត្រូវបានប្រើប្រាស់ដើម្បីដំណើរការទិន្នន័យភាសា។ ទោះជាយ៉ាងណាក៏ដោយ នៅក្នុងការអនុវត្តជាក់ស្តែង ការយល់ដឹងកាន់តែតូចចង្អៀតនៃពាក្យនេះបានក្លាយទៅជាថេរ - ការអភិវឌ្ឍន៍នៃវិធីសាស្រ្ត បច្ចេកវិទ្យា និងប្រព័ន្ធជាក់លាក់ដែលធានាបាននូវការទំនាក់ទំនងរវាងមនុស្សម្នាក់ និងកុំព្យូទ័រជាភាសាធម្មជាតិ ឬមានកម្រិត។

ភាសាការគណនាក្នុងកម្រិតជាក់លាក់មួយ អាចរួមបញ្ចូលការងារនៅក្នុងវិស័យនៃការបង្កើតប្រព័ន្ធ hypertext ដែលត្រូវបានចាត់ទុកថាជា វិធីពិសេសអង្គការអត្ថបទ និងសូម្បីតែមូលដ្ឋាន ប្រភេទថ្មី។អត្ថបទដែលផ្ទុយពីលក្ខណៈសម្បត្តិជាច្រើនរបស់វាចំពោះអត្ថបទធម្មតាដែលបានបង្កើតឡើងនៅក្នុងប្រពៃណីនៃការបោះពុម្ព Gutenberg (សូមមើល Gutenberg) ។

ភាសា​កុំព្យូទ័រ​ក៏​រួម​បញ្ចូល​ទាំង​ការ​បកប្រែ​ដោយ​ស្វ័យ​ប្រវត្តិ​ផង​ដែរ។

នៅក្នុងក្របខណ្ឌនៃភាសាគណនា ទិសដៅថ្មីមួយបានលេចចេញមក ដែលត្រូវបានអភិវឌ្ឍយ៉ាងសកម្មតាំងពីទសវត្សរ៍ឆ្នាំ 1980 និង 90 - ភាសាវិទ្យា corpus ដែលជាកន្លែងដែល គោលការណ៍ទូទៅការកសាងសាជីវកម្មទិន្នន័យភាសា (ជាពិសេសអត្ថបទសាជីវកម្ម) ដោយប្រើទំនើប បច្ចេកវិទ្យា​កុំព្យូទ័រ. Text corpora គឺជាបណ្តុំនៃអត្ថបទដែលបានជ្រើសរើសជាពិសេសនៃសៀវភៅ ទស្សនាវដ្ដី កាសែត ។ល។ ផ្ទេរទៅប្រព័ន្ធផ្សព្វផ្សាយរបស់ម៉ាស៊ីន និងមានបំណងសម្រាប់ដំណើរការដោយស្វ័យប្រវត្តិ។ អត្ថបទមួយក្នុងចំនោម corpora ដំបូងត្រូវបានបង្កើតឡើងសម្រាប់ភាសាអង់គ្លេសអាមេរិកនៅសាកលវិទ្យាល័យ Brown (គេហៅថា Brown Corpus) ក្នុងឆ្នាំ 1962-63 ក្រោមការដឹកនាំរបស់ W. Francis ។ នៅប្រទេសរុស្ស៊ីតាំងពីដើមទសវត្សរ៍ឆ្នាំ 2000 វិទ្យាស្ថានភាសារុស្សីដាក់ឈ្មោះតាម V. V. Vinogradov នៃបណ្ឌិត្យសភាវិទ្យាសាស្ត្ររុស្ស៊ីកំពុងអភិវឌ្ឍ។ អង្គភាពជាតិនៃភាសារុស្សីដែលមានគំរូតំណាងនៃអត្ថបទជាភាសារុស្សីដែលមានបរិមាណការប្រើប្រាស់ពាក្យប្រហែល 100 លាន។ បន្ថែមពីលើការស្ថាបនាជាក់ស្តែងនៃទិន្នន័យសាជីវកម្ម ភាសាសាជីវកម្មត្រូវបានចូលរួមនៅក្នុងការបង្កើតឧបករណ៍កុំព្យូទ័រ (កម្មវិធីកុំព្យូទ័រ) ដែលត្រូវបានរចនាឡើងដើម្បីទាញយកព័ត៌មានផ្សេងៗពីអត្ថបទ corpora ។ តាមទស្សនៈរបស់អ្នកប្រើ តម្រូវការសម្រាប់ការតំណាង (ភាពជាតំណាង) ភាពពេញលេញ និងសេដ្ឋកិច្ចត្រូវបានដាក់លើសារជីវកម្មអត្ថបទ។

ភាសាកុំព្យូទ័រកំពុងអភិវឌ្ឍយ៉ាងសកម្មទាំងនៅក្នុងប្រទេសរុស្ស៊ី និងនៅបរទេស។ លំហូរនៃការបោះពុម្ពផ្សាយនៅក្នុងតំបន់នេះគឺខ្ពស់ណាស់។ លើកលែងតែ ការប្រមូលប្រធានបទនៅសហរដ្ឋអាមេរិកចាប់តាំងពីឆ្នាំ 1984 ទិនានុប្បវត្តិកុំព្យូទ័រភាសាវិទ្យាត្រូវបានបោះពុម្ពជារៀងរាល់ត្រីមាស។ អង្គការដ៏អស្ចារ្យនិង ការងារវិទ្យាសាស្ត្រត្រូវបានធ្វើឡើងដោយសមាគមសម្រាប់ភាសាវិទ្យាគណនា ដែលមានរចនាសម្ព័ន្ធក្នុងតំបន់ជុំវិញពិភពលោក (ជាពិសេសសាខាអឺរ៉ុប)។ រៀងរាល់ពីរឆ្នាំម្តង មានសន្និសីទអន្តរជាតិ COLINT (ក្នុងឆ្នាំ 2008 សន្និសីទត្រូវបានធ្វើឡើងនៅទីក្រុង Manchester)។ ទិសដៅសំខាន់ៗនៃភាសាវិទ្យាត្រូវបានពិភាក្សាផងដែរនៅក្នុងសន្និសីទអន្តរជាតិប្រចាំឆ្នាំ "ការសន្ទនា" ដែលរៀបចំដោយវិទ្យាស្ថានស្រាវជ្រាវបញ្ញាសិប្បនិម្មិតរុស្ស៊ី។ មហាវិទ្យាល័យ Philologyសាកលវិទ្យាល័យរដ្ឋម៉ូស្គូ Yandex និងអង្គការមួយចំនួនទៀត។ បញ្ហាពាក់ព័ន្ធក៏ត្រូវបានបង្ហាញយ៉ាងទូលំទូលាយនៅលើ សន្និសីទអន្តរជាតិនៅលើបញ្ញាសិប្បនិម្មិតនៃកម្រិតផ្សេងៗគ្នា។

Lit ។ : Zvegintsev V. A. ទ្រឹស្តីនិងភាសាវិទ្យាអនុវត្ត។ M. , 1968; Piotrovsky R.G., Bektaev K. B., Piotrovskaya A.A. ភាសាគណិតវិទ្យា។ M. , 1977; Gorodetsky B. Yu. បញ្ហាជាក់ស្តែងភាសាវិទ្យាដែលបានអនុវត្ត // ថ្មីនៅក្នុងភាសាបរទេស។ M. , 1983. លេខ។ ១២; Kibrik A.E. Applied linguistics // Kibrik A.E. អត្ថបទលើបញ្ហាទូទៅ និងអនុវត្តនៃភាសាវិទ្យា។ M. , 1992; Kennedy G. ការណែនាំអំពីភាសាវិទ្យា។ អិល ១៩៩៨; Bolshakov I.A., Gelbukh A. ភាសាវិទ្យាគណនា៖ គំរូ ធនធាន កម្មវិធី។ Mekh., 2004; ស្ថាប័នជាតិនៃភាសារុស្ស៊ី: 2003-2005 ។ M. , 2005; Baranov A.N. ការណែនាំអំពីភាសាវិទ្យា។ ទី 3 ed ។ M. , 2007; ភាសាវិទ្យាកុំព្យូទ័រ និងបច្ចេកវិទ្យាឆ្លាតវៃ។ M. , 2008. បញ្ហា។ ៧.

សេចក្តីផ្តើម

ភាសាវិទ្យាគណនាគឺជាអ្វី?

ភាសាវិទ្យាកុំព្យូទ័រ ទិសដៅក្នុងភាសាវិទ្យាដែលបានអនុវត្ត ផ្តោតលើការប្រើប្រាស់ឧបករណ៍កុំព្យូទ័រ-កម្មវិធី បច្ចេកវិទ្យាកុំព្យូទ័រសម្រាប់រៀបចំ និងដំណើរការទិន្នន័យ-សម្រាប់គំរូនៃដំណើរការនៃភាសាក្នុងលក្ខខណ្ឌជាក់លាក់ ស្ថានភាព បញ្ហា។ល។ ក៏ដូចជាវិសាលភាពទាំងមូល។ គំរូភាសាកុំព្យូទ័រក្នុងភាសាវិទ្យា និងមុខវិជ្ជាដែលពាក់ព័ន្ធ។ តាមពិតមានតែនៅក្នុង ករណីចុងក្រោយហើយនិយាយអំពី ភាសាវិទ្យាដែលបានអនុវត្តក្នុងន័យដ៏តឹងរឹង ចាប់តាំងពីការធ្វើគំរូកុំព្យូទ័រនៃភាសាក៏អាចចាត់ទុកថាជាវិស័យនៃការអនុវត្តវិទ្យាសាស្ត្រកុំព្យូទ័រ និងទ្រឹស្តីកម្មវិធីដើម្បីដោះស្រាយបញ្ហានៃវិទ្យាសាស្ត្រភាសា។ ទោះជាយ៉ាងណាក៏ដោយ នៅក្នុងការអនុវត្ត ស្ទើរតែគ្រប់អ្វីៗទាំងអស់ដែលទាក់ទងនឹងការប្រើប្រាស់កុំព្យូទ័រក្នុងភាសាវិទ្យាត្រូវបានហៅថាជាភាសាវិទ្យាគណនា។

ក្នុងនាមជាទិសដៅវិទ្យាសាស្ត្រពិសេស ភាសាគណនាបានបង្កើតឡើងនៅក្នុងទសវត្សរ៍ឆ្នាំ 1960 ។ ពាក្យរុស្ស៊ី "ភាសាវិទ្យាគណនា" គឺជាក្រដាសតាមដានពីភាសាកុំព្យូទ័រភាសាអង់គ្លេស។ ដោយសារគុណនាមការគណនាជាភាសារុស្សីក៏អាចបកប្រែថាជា "ការគណនា" ពាក្យ "ភាសាវិទ្យាគណនា" ក៏ត្រូវបានរកឃើញនៅក្នុងអក្សរសិល្ប៍ដែរ ប៉ុន្តែនៅក្នុងវិទ្យាសាស្ត្ររុស្ស៊ី វាមានអត្ថន័យតូចចង្អៀត ដោយចូលទៅជិតគោលគំនិតនៃ "ភាសាវិទ្យាបរិមាណ"។ លំហូរនៃការបោះពុម្ពផ្សាយនៅក្នុងតំបន់នេះគឺខ្ពស់ណាស់។ បន្ថែមពីលើការប្រមូលតាមប្រធានបទ ទិនានុប្បវត្តិភាសាវិទ្យាគណនាត្រូវបានបោះពុម្ពប្រចាំត្រីមាសនៅសហរដ្ឋអាមេរិក។ ការងាររៀបចំ និងវិទ្យាសាស្ត្រដ៏ធំមួយត្រូវបានអនុវត្តដោយសមាគមសម្រាប់ភាសាវិទ្យាគណនា ដែលមានរចនាសម្ព័ន្ធក្នុងតំបន់ (ជាពិសេសសាខាអឺរ៉ុប)។ រៀងរាល់ពីរឆ្នាំម្តង មានសន្និសីទអន្តរជាតិស្តីពីភាសាវិទ្យាគណនា - COLING ។ បញ្ហាដែលពាក់ព័ន្ធជាធម្មតាត្រូវបានបង្ហាញយ៉ាងទូលំទូលាយផងដែរនៅក្នុងសន្និសីទផ្សេងៗស្តីពីបញ្ញាសិប្បនិមិត្ត។

ភារកិច្ច

ភាសាវិទ្យាគណនា ទទួលយកបញ្ហាភាសាជាក់ស្តែងនៃការបង្កើតគំរូកុំព្យូទ័រនៃសកម្មភាពភាសា។ ភារកិច្ចរបស់វាគឺដើម្បីបង្កើតគំរូភាសាដែលត្រឹមត្រូវ និងពេញលេញជាងមុន និងក្បួនដោះស្រាយកម្រិតខ្ពស់បន្ថែមទៀតសម្រាប់ការវិភាគ និងការសំយោគ។

ទិសដៅសំខាន់ៗគឺ៖

1) អន្តរកម្មរវាងមនុស្សនិងកុំព្យូទ័រ៖ ការគ្រប់គ្រង - ភាសាសរសេរកម្មវិធី ការផ្ទេរព័ត៌មាន - ចំណុចប្រទាក់។

2) ធ្វើការជាមួយអត្ថបទ៖ ការធ្វើលិបិក្រម ការវិភាគ និងចំណាត់ថ្នាក់ ការកែសម្រួលដោយស្វ័យប្រវត្តិ (ការកែកំហុស) ការរកឃើញចំណេះដឹង ការបកប្រែម៉ាស៊ីន។

រឿង

ជំនាន់សាមញ្ញនៃសំណុំរងនៃភាសាអង់គ្លេសសម្រាប់ការចូលប្រើមូលដ្ឋានទិន្នន័យត្រូវបានផ្តល់ដោយប្រព័ន្ធអាមេរិកដំបូង LIFER (Language Interface Facility wich Elipsis and Recursion) ដែលបានបង្កើតឡើងក្នុងទសវត្សរ៍ទី 70 ។ បន្ទាប់ពីវា ប្រព័ន្ធដែលអាចបត់បែនបានផ្សេងទៀតបានបង្ហាញខ្លួននៅលើទីផ្សារកុំព្យូទ័រ ដោយផ្តល់នូវចំណុចប្រទាក់ភាសាធម្មជាតិដែលមានកម្រិតជាមួយកុំព្យូទ័រ។

នៅក្នុងទសវត្សរ៍ឆ្នាំ 1980 ក្រុមហ៊ុនមួយចំនួនត្រូវបានបង្កើតឡើងនៅក្នុងសហរដ្ឋអាមេរិកដែលចូលរួមក្នុងការអភិវឌ្ឍន៍ និងការលក់ចំណុចប្រទាក់ភាសាធម្មជាតិជាមួយនឹងប្រព័ន្ធទិន្នន័យ និងប្រព័ន្ធអ្នកជំនាញ។ នៅឆ្នាំ 1985 សាជីវកម្ម Semantec បានបង្ហាញកញ្ចប់កម្មវិធី Q&A បែបនេះ Carnegie Group បានផ្តល់កញ្ចប់ LanguageCraft ស្រដៀងគ្នា។

ការងារសកម្មកំពុងដំណើរការដើម្បីបង្កើតប្រព័ន្ធបកប្រែដោយស្វ័យប្រវត្តិ។ ប្រព័ន្ធបកប្រែដោយស្វ័យប្រវត្តិ SYSTRAN ដែលត្រូវបានបង្កើតឡើងក្រោមការដឹកនាំរបស់ D. Tom ដែលចាត់ចែងដោយកងទ័ពអាកាសសហរដ្ឋអាមេរិកបានរីករាលដាល។ ក្នុងអំឡុងឆ្នាំ ១៩៧៤-១៩៧៥។ ប្រព័ន្ធនេះត្រូវបានប្រើប្រាស់ដោយសមាគមអវកាសយានិក NASA ដើម្បីបកប្រែឯកសារសម្រាប់គម្រោង Apollo-Soyuz ។ សព្វ​ថ្ងៃ​នាង​បក​ប្រែ​ពី​ភាសា​ជា​ច្រើន​ប្រហែល​១០​ម៉ឺន​ទំព័រ​ក្នុង​មួយ​ឆ្នាំ។

នៅអឺរ៉ុប ការងារលើការបង្កើតប្រព័ន្ធបកប្រែកុំព្យូទ័រត្រូវបានជំរុញដោយការបង្កើតបណ្តាញព័ត៌មានអឺរ៉ុប (EURONET DIANA)។ នៅឆ្នាំ 1982 សហគមន៍សេដ្ឋកិច្ចអឺរ៉ុបបានប្រកាសបង្កើតកម្មវិធីអឺរ៉ុប EUROTRA គោលបំណងគឺដើម្បីបង្កើតប្រព័ន្ធមួយ។ ការបកប្រែកុំព្យូទ័រសម្រាប់​ទាំងអស់ ភាសាអឺរ៉ុប. ដំបូង គម្រោងនេះត្រូវបានប៉ាន់ប្រមាណថាមានចំនួន $12 លានដុល្លារ ហើយនៅឆ្នាំ 1987 អ្នកជំនាញបានកំណត់តម្លៃសរុបនៃគម្រោងនេះមានចំនួនជាង 160 លានដុល្លារ។

នៅក្នុងប្រទេសជប៉ុន ការស្រាវជ្រាវភាសាវិទ្យាគណនាត្រូវបានផ្តោតជុំវិញកម្មវិធីកុំព្យូទ័រជំនាន់ទីប្រាំទូទាំងប្រទេសដែលបានចាប់ផ្តើមនៅឆ្នាំ 1981 ។

មានគម្រោងយោធាមួយចំនួនដើម្បីបង្កើតចំណុចប្រទាក់មនុស្ស-ម៉ាស៊ីនជាភាសាធម្មជាតិ។ នៅសហរដ្ឋអាមេរិក ពួកគេត្រូវបានអនុវត្តជាចម្បងជាផ្នែកមួយនៃគំនិតផ្តួចផ្តើមកុំព្យូទ័រយុទ្ធសាស្ត្រ ដែលជាកម្មវិធីរយៈពេលដប់ឆ្នាំដែលត្រូវបានអនុម័តដោយក្រសួងការពារជាតិក្នុងឆ្នាំ 1983 ។ គោលដៅរបស់វាគឺដើម្បីបង្កើតជំនាន់ថ្មីនៃអាវុធ "ឆ្លាតវៃ" និងប្រព័ន្ធយោធាតាមលំដាប់លំដោយ។ ដើម្បីធានាបាននូវឧត្តមភាពបច្ចេកវិទ្យារយៈពេលវែងរបស់សហរដ្ឋអាមេរិក។

តាមធម្មជាតិ អ្នកជំនាញខាងបញ្ញាសិប្បនិមិត្ត ដែលចេះកុំព្យូទ័រ និងភាសាសរសេរកម្មវិធីបានល្អ បានកំណត់យ៉ាងស្វាហាប់អំពីការដោះស្រាយបញ្ហានៃការយល់ដឹងភាសាដោយប្រើវិធីផ្ទាល់ខ្លួនរបស់ពួកគេ។ មានការស្វែងរកក្បួនដោះស្រាយភាសាធម្មជាតិ។ កម្មវិធីយល់ភាសាស្មុគស្មាញត្រូវបានបង្កើតឡើងសម្រាប់តំបន់ពិសេសតូចចង្អៀត កម្មវិធីបកប្រែម៉ាស៊ីនមួយផ្នែកត្រូវបានអនុវត្ត និងមួយចំនួនផ្សេងទៀត។ ប៉ុន្តែ​មិនមាន​ការ​រីក​ចម្រើន​យ៉ាង​ដាច់​ខាត​ក្នុង​ការ​ដោះ​ស្រាយ​បញ្ហា​នៃ​ការ​យល់​ភាសា​នោះ​ទេ។ ភាសា​និង​មនុស្ស​មាន​ទំនាក់ទំនង​គ្នា​យ៉ាង​ខ្លាំង​ដែល​អ្នក​វិទ្យាសាស្ត្រ​ត្រូវ​ដោះស្រាយ​បញ្ហា​នៃ​ការ​យល់​ដឹង​ពិភពលោក​ដោយ​មនុស្ស។ ហើយនេះគឺជាអាណាចក្រនៃទស្សនវិជ្ជា។

គំនិតជាមូលដ្ឋាននៃភាសាវិទ្យា

ពាក្យ "ភាសាវិទ្យាគណនា" ជាធម្មតាសំដៅលើផ្នែកដ៏ធំទូលាយនៃការប្រើប្រាស់ឧបករណ៍កុំព្យូទ័រ-កម្មវិធី បច្ចេកវិទ្យាកុំព្យូទ័រសម្រាប់រៀបចំ និងដំណើរការទិន្នន័យ-ដើម្បីធ្វើជាគំរូដល់ដំណើរការនៃភាសាក្នុងលក្ខខណ្ឌជាក់លាក់ ស្ថានភាព បញ្ហា ក៏ដូចជាវិសាលភាព។ នៃគំរូភាសាកុំព្យូទ័រ។ តែនៅក្នុងភាសាវិទ្យា ប៉ុន្តែក៏មាននៅក្នុងមុខវិជ្ជាដែលពាក់ព័ន្ធផងដែរ។ តាមពិតទៅ មានតែនៅក្នុងករណីចុងក្រោយនេះទេ ដែលយើងកំពុងនិយាយអំពីភាសាវិទ្យាដែលបានអនុវត្តក្នុងន័យដ៏តឹងរឹង ចាប់តាំងពីការធ្វើគំរូភាសាកុំព្យូទ័រក៏អាចចាត់ទុកថាជាវិស័យនៃការអនុវត្តទ្រឹស្តីកម្មវិធី (វិទ្យាសាស្ត្រកុំព្យូទ័រ) ក្នុងវិស័យភាសាវិទ្យា។ ទោះជាយ៉ាងណាក៏ដោយ ការអនុវត្តទូទៅគឺបែបនោះ ដែលវិសាលភាពនៃភាសាវិទ្យាគណនាគ្របដណ្តប់ស្ទើរតែទាំងអស់ដែលទាក់ទងនឹងការប្រើប្រាស់កុំព្យូទ័រក្នុងភាសាវិទ្យា៖ "ពាក្យ "ភាសាវិទ្យាគណនា" កំណត់ទិសដៅទូទៅឆ្ពោះទៅរកការប្រើប្រាស់កុំព្យូទ័រដើម្បីដោះស្រាយបញ្ហាផ្សេងៗនៃវិទ្យាសាស្ត្រ និង ភារកិច្ចជាក់ស្តែងភ្ជាប់ជាមួយភាសា ដោយមិនកំណត់វិធីដោះស្រាយបញ្ហាទាំងនេះ។

ទិដ្ឋភាពស្ថាប័ននៃភាសាវិទ្យាគណនា. ក្នុងនាមជាទិសដៅវិទ្យាសាស្ត្រពិសេស ភាសាគណនាបានលេចចេញជារូបរាងនៅក្នុងទសវត្សរ៍ទី 60 ។ លំហូរនៃការបោះពុម្ពផ្សាយនៅក្នុងតំបន់នេះគឺខ្ពស់ណាស់។ បន្ថែមពីលើការប្រមូលតាមប្រធានបទ ទិនានុប្បវត្តិភាសាវិទ្យាគណនាត្រូវបានបោះពុម្ពជារៀងរាល់ត្រីមាសនៅសហរដ្ឋអាមេរិក។ ការងាររៀបចំ និងវិទ្យាសាស្ត្រដ៏ធំមួយត្រូវបានអនុវត្តដោយសមាគមសម្រាប់ភាសាវិទ្យាគណនា ដែលមានរចនាសម្ព័ន្ធក្នុងតំបន់ជុំវិញពិភពលោក (ជាពិសេសសាខាអឺរ៉ុប)។ រៀងរាល់ពីរឆ្នាំម្តង មានសន្និសីទអន្តរជាតិស្តីពីភាសាវិទ្យាគណនា - KOLING។ បញ្ហាពាក់ព័ន្ធក៏ត្រូវបានតំណាងយ៉ាងទូលំទូលាយនៅក្នុងសន្និសីទអន្តរជាតិស្តីពីបញ្ញាសិប្បនិមិត្តនៅកម្រិតផ្សេងៗ។

កញ្ចប់ឧបករណ៍ការយល់ដឹងនៃភាសាវិទ្យាគណនា

ភាសា​កុំព្យូទ័រ​ជា​ពិសេស វិន័យដែលបានអនុវត្តឈរចេញជាចម្បងដោយឧបករណ៍ - នោះគឺដោយការប្រើប្រាស់ គ្រឿងបរិក្ខារកុំព្យូទ័រដំណើរការទិន្នន័យភាសា។ ដោយសារកម្មវិធីកុំព្យូទ័រដែលយកគំរូតាមទិដ្ឋភាពមួយចំនួននៃមុខងារនៃភាសាអាចប្រើឧបករណ៍សរសេរកម្មវិធីផ្សេងៗ វាហាក់បីដូចជាមិនចាំបាច់និយាយអំពីភាសាទូទៅនោះទេ។ ទោះយ៉ាងណាក៏ដោយវាមិនមែនទេ។ មានគោលការណ៍ទូទៅ ការក្លែងធ្វើកុំព្យូទ័រការគិត ដែលតាមមធ្យោបាយមួយ ឬវិធីផ្សេងទៀត ត្រូវបានគេដឹងនៅក្នុងណាមួយ។ ម៉ូដែលកុំព្យូទ័រ. ភាសានេះគឺផ្អែកលើទ្រឹស្តីនៃចំណេះដឹងដែលបានបង្កើតឡើងនៅក្នុង បញ្ញាសិប្បនិម្មិតនិងបង្កើតជាសាខាសំខាន់នៃវិទ្យាសាស្ត្រការយល់ដឹង។

ទ្រឹស្ដីចំបងនៃទ្រឹស្ដីចំនេះដឹងចែងថា ការគិតគឺជាដំណើរការកែច្នៃ និងបង្កើតចំណេះដឹង។ "ចំណេះដឹង" ឬ "ចំណេះដឹង" ត្រូវបានគេចាត់ទុកថាជាប្រភេទដែលមិនបានកំណត់។ "ឧបករណ៍ដំណើរការ" ដែលដំណើរការចំណេះដឹងគឺ ប្រព័ន្ធនៃការយល់ដឹងមនុស្ស។ នៅក្នុង epistemology និងវិទ្យាសាស្ត្រការយល់ដឹង ចំណេះដឹងពីរប្រភេទសំខាន់ៗត្រូវបានសម្គាល់ - ប្រកាស ("ដឹងអ្វី") និងនីតិវិធី ("ដឹងពីរបៀប"2)) ។ ចំណេះដឹងអំពីសេចក្តីប្រកាសជាធម្មតាត្រូវបានបង្ហាញជាសំណុំនៃសំណើ សេចក្តីថ្លែងការណ៍អំពីអ្វីមួយ។ ឧទាហរណ៍ធម្មតា។ចំនេះដឹងនៃសេចក្តីប្រកាសអាចត្រូវបានចាត់ទុកថាជាការបកស្រាយនៃពាក្យធម្មតា។ វចនានុក្រមពន្យល់. ឧទហរណ៍ ពែងមួយ] - "ធុងផឹករាងមូលតូចមួយ ជាធម្មតាមានចំណុចទាញ ធ្វើពីប៉សឺឡែន ហ្វាយៀន។ល។"។ ចំនេះដឹងនៃសេចក្តីប្រកាសផ្តល់ប្រាក់កម្ចីដល់នីតិវិធីផ្ទៀងផ្ទាត់ក្នុងន័យ "ពិត-មិនពិត" ។ ចំណេះដឹងអំពីនីតិវិធីត្រូវបានបង្ហាញជាលំដាប់ (បញ្ជី) នៃប្រតិបត្តិការ សកម្មភាពដែលត្រូវអនុវត្ត។ នេះគឺជាមួយចំនួន ការណែនាំទូទៅអំពីសកម្មភាពក្នុងស្ថានភាពណាមួយ។ ឧទាហរណ៍ធម្មតានៃចំណេះដឹងអំពីនីតិវិធីគឺជាការណែនាំសម្រាប់ការប្រើប្រាស់ឧបករណ៍ប្រើប្រាស់ក្នុងផ្ទះ។

មិនដូចចំណេះដឹងផ្នែកប្រកាសទេ ចំណេះដឹងអំពីនីតិវិធីមិនអាចផ្ទៀងផ្ទាត់ថាពិតឬមិនពិតទេ។ ពួកគេអាចត្រូវបានវាយតម្លៃតែដោយជោគជ័យឬបរាជ័យនៃក្បួនដោះស្រាយ។

គោលគំនិតភាគច្រើននៃកញ្ចប់ឧបករណ៍នៃការយល់ដឹងនៃភាសាវិទ្យាគឺដូចគ្នាបេះបិទ៖ ពួកគេកំណត់ក្នុងពេលដំណាលគ្នានូវធាតុពិតមួយចំនួននៃប្រព័ន្ធការយល់ដឹងរបស់មនុស្ស និងវិធីតំណាងឱ្យអង្គភាពទាំងនេះនៅក្នុងភាសាលោហៈមួយចំនួន។ ម្យ៉ាង​ទៀត ធាតុ​នៃ​ភាសា​លោហធាតុ​មាន​ទិដ្ឋភាព​ខាង​វិញ្ញាណ និង​ជា​ឧបករណ៍។ Ontologically, ការបំបែកនៃចំណេះដឹងប្រកាស និងនីតិវិធីត្រូវគ្នាទៅនឹង ប្រភេទផ្សេងគ្នាចំណេះដឹងនៃប្រព័ន្ធយល់ដឹងរបស់មនុស្ស។ ដូច្នេះចំណេះដឹងអំពី មុខវិជ្ជាជាក់លាក់វត្ថុនៃការពិតត្រូវបានប្រកាសជាចម្បង ហើយសមត្ថភាពមុខងាររបស់មនុស្សក្នុងការដើរ រត់ បើកឡាន ត្រូវបានដឹងនៅក្នុងប្រព័ន្ធនៃការយល់ដឹងថាជាចំណេះដឹងតាមនីតិវិធី។ តាមឧបករណ៍ ចំណេះដឹង (ទាំងនីតិវិធី ontologically និង declarative) អាចត្រូវបានតំណាងជាសំណុំនៃការពិពណ៌នា ការពិពណ៌នា និងជាក្បួនដោះស្រាយ ការណែនាំមួយ។ ម្យ៉ាងវិញទៀត ចំណេះដឹងដែលប្រកាសអំពីវត្ថុនៃការពិត "តារាង" អាចត្រូវបានតំណាងតាមនីតិវិធីជាសំណុំនៃការណែនាំ ក្បួនដោះស្រាយសម្រាប់ការបង្កើតរបស់វា ការជួបប្រជុំគ្នា (= ទិដ្ឋភាពច្នៃប្រឌិតនៃចំណេះដឹងនីតិវិធី) ឬជាក្បួនដោះស្រាយសម្រាប់ការប្រើប្រាស់ធម្មតារបស់វា (= ទិដ្ឋភាពមុខងារចំណេះដឹងអំពីនីតិវិធី) ។ ក្នុងករណីទី 1 នេះអាចជាការណែនាំសម្រាប់ជាងឈើថ្មីថ្មោងហើយទីពីរការពិពណ៌នាអំពីលទ្ធភាពនៃតុការិយាល័យ។ ការសន្ទនាក៏ជាការពិតផងដែរ៖ ចំណេះដឹងអំពីនីតិវិធី ontologically អាចត្រូវបានតំណាងដោយប្រកាស។

វាទាមទារឱ្យមានការពិភាក្សាដាច់ដោយឡែកមួយថាតើចំណេះដឹងដែលប្រកាសអំពី ontologically អាចត្រូវបានតំណាងថាជានីតិវិធី, និងនីតិវិធី ontologically ណាមួយ - ជាការប្រកាស។ អ្នកស្រាវជ្រាវយល់ស្របថា ចំណេះដឹងប្រកាសណាមួយជាគោលការណ៍អាចត្រូវបានតំណាងតាមនីតិវិធី ទោះបីជានេះអាចប្រែទៅជាគ្មានសេដ្ឋកិច្ចសម្រាប់ប្រព័ន្ធការយល់ដឹងក៏ដោយ។ ការបញ្ច្រាសគឺស្ទើរតែមិនពិត។ ការពិតគឺថា ចំណេះដឹងផ្នែកប្រកាសគឺមានភាពច្បាស់លាស់ជាងនេះ វាងាយស្រួលសម្រាប់មនុស្សម្នាក់ក្នុងការយល់ជាងចំណេះដឹងតាមនីតិវិធី។ ផ្ទុយ​ទៅ​នឹង​ចំណេះ​ដឹង​ដែល​បាន​ប្រកាស ចំណេះ​ដឹង​អំពី​នីតិវិធី​គឺ​មាន​ន័យ​លើស​លុប។ ដូច្នេះ សមត្ថភាពភាសាជាចំណេះដឹងតាមនីតិវិធី លាក់កំបាំងពីមនុស្សម្នាក់ មិនត្រូវបានដឹងដោយគាត់។ ការប៉ុនប៉ងដើម្បីពន្យល់ពីយន្តការនៃមុខងារភាសានាំឱ្យខូចមុខងារ។ ជាឧទាហរណ៍ អ្នកឯកទេសក្នុងវិស័យ lexical semantics ដឹងជាឧទាហរណ៍ថា វិចារណកថារយៈពេលវែងដែលចាំបាច់ដើម្បីសិក្សាផែនការខ្លឹមសារនៃពាក្យ នាំឱ្យការពិតដែលថាអ្នកស្រាវជ្រាវបាត់បង់សមត្ថភាពបែងចែករវាងភាពត្រឹមត្រូវ និងផ្នែកខ្លះ។ ការប្រើប្រាស់ខុសពាក្យដែលបានវិភាគ។ ឧទាហរណ៍ផ្សេងទៀតអាចត្រូវបានដកស្រង់។ វាត្រូវបានគេស្គាល់ថាពីចំណុចនៃទិដ្ឋភាពនៃមេកានិចរាងកាយរបស់មនុស្សគឺ ប្រព័ន្ធស្មុគស្មាញប៉ោលអន្តរកម្មពីរ។

នៅក្នុងទ្រឹស្តីចំណេះដឹង ចំណេះដឹងត្រូវបានសិក្សា និងតំណាងដោយការប្រើប្រាស់ រចនាសម្ព័ន្ធផ្សេងៗចំណេះដឹង - ស៊ុម សេណារីយ៉ូ ផែនការ។ យោងតាមលោក M. Minsky "ស៊ុមគឺជារចនាសម្ព័ន្ធទិន្នន័យដែលបានរចនាឡើងដើម្បីតំណាងឱ្យស្ថានភាពជាក់ស្តែង" [Minskiy 1978, p.254] ។ លម្អិតបន្ថែមទៀត យើងអាចនិយាយបានថា ស៊ុមគឺជារចនាសម្ព័ន្ធគំនិតសម្រាប់តំណាងប្រកាសនៃចំនេះដឹងអំពីស្ថានភាពបង្រួបបង្រួមតាមរូបធាតុដែលមានលក្ខណៈអក្សរសាស្ត្រដែលមានរន្ធដោតភ្ជាប់គ្នាដោយទំនាក់ទំនងតាមន័យជាក់លាក់មួយចំនួន។ សម្រាប់​គោលបំណង​នៃ​ការ​បង្ហាញ ស៊ុម​មួយ​ត្រូវ​បាន​តំណាង​ជា​ញឹកញាប់​ជា​តារាង ដែល​ជា​ជួរ​ដេក​ដែល​បង្កើត​ជា​រន្ធ។ រន្ធដោតនីមួយៗមានឈ្មោះ និងខ្លឹមសាររបស់វា (សូមមើលតារាងទី 1)។

តារាងទី 1

បំណែកនៃស៊ុម "តារាង" នៅក្នុងទិដ្ឋភាពតារាង

អាស្រ័យលើ ភារកិច្ចជាក់លាក់រចនាសម្ព័ន្ធស៊ុមអាចមានភាពស្មុគស្មាញជាង។ ស៊ុមអាចរួមបញ្ចូលស៊ុមរងដែលបានដាក់ និងឯកសារយោងទៅស៊ុមផ្សេងទៀត។

ជំនួសឱ្យតារាង ទម្រង់តំណាងនៃការព្យាករណ៍ត្រូវបានប្រើជាញឹកញាប់។ ក្នុង​ករណី​នេះ ស៊ុម​គឺ​ជា​ទម្រង់​នៃ​ការព្យាករណ៍ ឬ​មុខងារ​ជាមួយ​អាគុយម៉ង់។ មានវិធីផ្សេងទៀតដើម្បីតំណាងឱ្យស៊ុមមួយ។ ឧទាហរណ៍វាអាចត្រូវបានតំណាងថាជា tuple ប្រភេទខាងក្រោម: ( (ឈ្មោះស៊ុម) (ឈ្មោះរន្ធ)) (តម្លៃរន្ធ,), ... , (ឈ្មោះរន្ធ n) (តម្លៃរន្ធ n)) ។

ជាធម្មតា ស៊ុមនៅក្នុងភាសាតំណាងចំណេះដឹងមានទម្រង់នេះ។

ដូចជាប្រភេទការយល់ដឹងផ្សេងទៀតនៃភាសាវិទ្យាគណនា គំនិតនៃស៊ុមគឺដូចគ្នាបេះបិទ។ Ontologically វាគឺជាផ្នែកមួយនៃប្រព័ន្ធនៃការយល់ដឹងរបស់មនុស្ស ហើយក្នុងន័យនេះ ស៊ុមអាចត្រូវបានប្រៀបធៀបជាមួយនឹងគោលគំនិតដូចជា gestalt, prototype, stereotype, scheme ។ នៅក្នុងចិត្តវិទ្យានៃការយល់ដឹង ប្រភេទទាំងនេះត្រូវបានពិចារណាយ៉ាងជាក់លាក់ពីទស្សនៈ ontological ។ ដូច្នេះ D. Norman បែងចែកវិធីសំខាន់ពីរនៃអត្ថិភាព និងការរៀបចំចំណេះដឹងនៅក្នុងប្រព័ន្ធការយល់ដឹងរបស់មនុស្ស - បណ្តាញ semantic និងគ្រោងការណ៍។ "គ្រោងការណ៍" គាត់បានសរសេរថា "ត្រូវបានរៀបចំជាកញ្ចប់នៃចំណេះដឹងដែលបានប្រមូលផ្តុំដើម្បីតំណាងឱ្យឯកតានៃចំណេះដឹងផ្ទាល់ខ្លួន។ គ្រោងការណ៍របស់ខ្ញុំសម្រាប់ Sam អាចមានព័ត៌មានដែលពិពណ៌នាអំពីគាត់។ លក្ខណៈរាងកាយសកម្មភាពរបស់វា និង បុគ្គលិកលក្ខណៈ. គ្រោងការណ៍នេះទាក់ទងទៅនឹងគ្រោងការណ៍ផ្សេងទៀតដែលពិពណ៌នាអំពីទិដ្ឋភាពផ្សេងទៀតរបស់វា" [Norman 1998, p.359] ។ ប្រសិនបើយើងយកផ្នែកខាងឧបករណ៍នៃប្រភេទស៊ុម នោះនេះគឺជារចនាសម្ព័ន្ធសម្រាប់ការប្រកាសតំណាងនៃចំណេះដឹងនៅក្នុងប្រព័ន្ធ AI ដែលមានស្រាប់។ ស៊ុមអាចបង្កើតបាន។ រចនាសម្ព័ន្ធស្មុគស្មាញចំណេះដឹង; ប្រព័ន្ធស៊ុមអនុញ្ញាតឱ្យមានឋានានុក្រម - ស៊ុមមួយអាចជាផ្នែកមួយនៃស៊ុមមួយផ្សេងទៀត។

នៅក្នុងលក្ខខណ្ឌនៃខ្លឹមសារ គំនិតនៃស៊ុមគឺមានភាពជិតស្និទ្ធនឹងប្រភេទនៃការបកស្រាយ។ ជាការពិតណាស់ រន្ធដោតគឺជា analogue នៃ valence ការបំពេញរន្ធដោតគឺជា analogue នៃ actant មួយ។ ភាពខុសគ្នាចំបងរវាងពួកគេគឺថាការបកស្រាយមានព័ត៌មានពាក់ព័ន្ធតែផ្នែកភាសាអំពីផែនការនៃខ្លឹមសារនៃពាក្យប៉ុណ្ណោះ ហើយស៊ុមទីមួយគឺមិនចាំបាច់ភ្ជាប់ជាមួយពាក្យនោះទេ ហើយទីពីររួមបញ្ចូលព័ត៌មានទាំងអស់ដែលទាក់ទងនឹងបញ្ហាដែលបានផ្តល់ឱ្យ។ ស្ថានភាព រួមទាំងភាសាក្រៅភាសា (ចំណេះដឹងអំពីពិភពលោក) ៣).

សេណារីយ៉ូ គឺជាក្របខណ្ឌគោលគំនិតសម្រាប់តំណាងនីតិវិធីនៃចំណេះដឹងអំពីស្ថានភាព ឬអាកប្បកិរិយាដែលបានកំណត់ទុកជាមុន។ ធាតុស្គ្រីបគឺជាជំហាននៃក្បួនដោះស្រាយ ឬការណែនាំ។ ជាធម្មតាមនុស្សនិយាយអំពី "សេណារីយ៉ូភោជនីយដ្ឋាន", "សេណារីយ៉ូការទិញ" ជាដើម។

ស៊ុមនេះក៏ត្រូវបានប្រើប្រាស់ដើមដំបូងសម្រាប់ការធ្វើបទបង្ហាញអំពីនីតិវិធី (សូមមើលពាក្យ "ស៊ុមនីតិវិធី") ប៉ុន្តែពាក្យ "សេណារីយ៉ូ" ឥឡូវនេះត្រូវបានប្រើប្រាស់ជាទូទៅក្នុងន័យនេះ។ សេណារីយ៉ូអាចត្រូវបានតំណាងមិនត្រឹមតែជាក្បួនដោះស្រាយប៉ុណ្ណោះទេប៉ុន្តែក៏ជាបណ្តាញផងដែរ ចំនុចកំពូលដែលត្រូវគ្នាទៅនឹងស្ថានភាពជាក់លាក់ ហើយអ័ក្សត្រូវគ្នាទៅនឹងការតភ្ជាប់រវាងស្ថានភាព។ រួមជាមួយនឹងគោលគំនិតនៃសេណារីយ៉ូមួយ អ្នកស្រាវជ្រាវខ្លះប្រើប្រភេទស្គ្រីបសម្រាប់ធ្វើគំរូកុំព្យូទ័រនៃភាពវៃឆ្លាត។ យោងតាមលោក R. Schenk ស្គ្រីបមួយត្រូវបានទទួលយកជាទូទៅ លំដាប់ល្បី បុព្វហេតុ. ឧទាហរណ៍៖ ស្វែងយល់ពីការសន្ទនា

នៅតាមផ្លូវវាហូរដូចធុង។

អ្នកនៅតែត្រូវទៅហាង: មិនមានអ្វីនៅក្នុងផ្ទះទេ - កាលពីម្សិលមិញភ្ញៀវបានបោសអ្វីៗទាំងអស់។

គឺផ្អែកលើតំណភ្ជាប់អត្ថន័យមិនច្បាស់លាស់ដូចជា "ប្រសិនបើ មេឃ​ភ្លៀងវាមិនគួរឱ្យចង់ទៅខាងក្រៅទេ ព្រោះអ្នកអាចឈឺ។ " ការតភ្ជាប់ទាំងនេះបង្កើតជាស្គ្រីប ដែលត្រូវបានប្រើប្រាស់ដោយអ្នកនិយាយដើមកំណើត ដើម្បីយល់ពីអាកប្បកិរិយានៃពាក្យសំដី និងមិនមែនពាក្យសម្ដីរបស់គ្នាទៅវិញទៅមក។

ជាលទ្ធផលនៃការអនុវត្តសេណារីយ៉ូទៅនឹងស្ថានភាពបញ្ហាជាក់លាក់មួយ ក ផែនការ) ប្លង់មេត្រូវបានប្រើដើម្បីតំណាងឱ្យចំណេះដឹងអំពីនីតិវិធី សកម្មភាពដែលអាចកើតមាននាំទៅរកសមិទ្ធិផល គោលបំណងជាក់លាក់. ផែនការមួយទាក់ទងនឹងគោលដៅទៅនឹងលំដាប់នៃសកម្មភាព។

អេ ករណីទូទៅផែនការនេះរួមមានលំដាប់នៃនីតិវិធីដែលផ្ទេរស្ថានភាពដំបូងនៃប្រព័ន្ធទៅរដ្ឋចុងក្រោយ ហើយនាំទៅដល់ការសម្រេចបាននូវគោលដៅរង និងគោលដៅជាក់លាក់មួយ។ នៅក្នុងប្រព័ន្ធ AI ផែនការកើតឡើងជាលទ្ធផលនៃសកម្មភាពធ្វើផែនការ ឬផែនការនៃម៉ូឌុលដែលត្រូវគ្នា - ម៉ូឌុលធ្វើផែនការ។ ដំណើរការធ្វើផែនការអាចផ្អែកលើការសម្របខ្លួននៃទិន្នន័យពីសេណារីយ៉ូមួយ ឬច្រើន ដែលដំណើរការដោយនីតិវិធីសាកល្បង ដើម្បីដោះស្រាយស្ថានភាពបញ្ហា។ ការអនុវត្តផែនការត្រូវបានអនុវត្តដោយម៉ូឌុលប្រតិបត្តិដែលគ្រប់គ្រងនីតិវិធីនៃការយល់ដឹង និង សកម្មភាពរាងកាយប្រព័ន្ធ។ ក្នុងករណីបឋមផែនការនៅក្នុង ប្រព័ន្ធបញ្ញាគឺជាលំដាប់សាមញ្ញនៃប្រតិបត្តិការ; នៅក្នុងកំណែស្មុគ្រស្មាញកាន់តែច្រើន ផែនការត្រូវបានភ្ជាប់ជាមួយប្រធានបទជាក់លាក់ ធនធាន សមត្ថភាព គោលដៅរបស់វា ព​ត៌​មាន​លំអិតអំពីស្ថានភាពមានបញ្ហា។ល។ ការលេចចេញនៃផែនការកើតឡើងនៅក្នុងដំណើរការនៃការទំនាក់ទំនងរវាងគំរូនៃពិភពលោក ដែលផ្នែកមួយត្រូវបានបង្កើតឡើងដោយសេណារីយ៉ូ ម៉ូឌុលផែនការ និងម៉ូឌុលប្រតិបត្តិ។

មិនដូចស្គ្រីបទេ ផែនការគឺអំពី ស្ថានភាពជាក់លាក់ជាអ្នកសំដែងជាក់លាក់ និងបន្តការសម្រេចបាននូវគោលដៅជាក់លាក់មួយ។ ជម្រើសនៃផែនការត្រូវបានគ្រប់គ្រងដោយធនធានរបស់អ្នកម៉ៅការ។ លទ្ធភាពនៃផែនការ - លក្ខខណ្ឌដែលត្រូវការជំនាន់របស់វានៅក្នុងប្រព័ន្ធនៃការយល់ដឹង ហើយលក្ខណៈនៃការពេញចិត្តគឺមិនអាចអនុវត្តបានចំពោះសេណារីយ៉ូនោះទេ។

មួយទៀត គំនិតសំខាន់- គំរូនៃពិភពលោក។ គំរូនៃពិភពលោកត្រូវបានយល់ជាទូទៅថាជាសំណុំនៃចំណេះដឹងអំពីពិភពលោកដែលបានរៀបចំតាមរបៀបជាក់លាក់មួយ ដោយនៅក្នុងប្រព័ន្ធនៃការយល់ដឹង ឬគំរូកុំព្យូទ័ររបស់វា។ នៅពីរបីទៀត។ ទិដ្ឋភាពទូទៅគំរូនៃពិភពលោកត្រូវបាននិយាយអំពីជាផ្នែកមួយនៃប្រព័ន្ធការយល់ដឹងដែលរក្សាទុកចំណេះដឹងអំពីរចនាសម្ព័ន្ធនៃពិភពលោក គំរូរបស់វា ។ កាន់តែទូលំទូលាយ សុន្ទរកថា។ នៅក្នុងដំណើរការនៃការយល់ដឹងអំពីសុន្ទរកថានោះ គំរូផ្លូវចិត្តរបស់វាត្រូវបានបង្កើតឡើង ដែលជាលទ្ធផលនៃអន្តរកម្មរវាងផែនការនៃខ្លឹមសារនៃអត្ថបទ និងចំណេះដឹងអំពីពិភពលោកដែលមាននៅក្នុងប្រធានបទនេះ [Johnson-Laird 1988, p. 237 et វគ្គ។] ការយល់ដឹងទីមួយ និងទីពីរត្រូវបានបញ្ចូលគ្នាជាញឹកញាប់។ នេះ​ជា​តួយ៉ាង​នៃ​អ្នក​ស្រាវជ្រាវ​ភាសា​ដែល​ធ្វើការ​ក្នុង​ផ្នែក​ភាសាវិទ្យា និង​វិទ្យាសាស្ត្រ​ការយល់ដឹង។

ទាក់ទងយ៉ាងជិតស្និទ្ធទៅនឹងប្រភេទនៃស៊ុមគឺជាគំនិតនៃឈុតមួយ។ ប្រភេទឈុតត្រូវបានប្រើប្រាស់ជាចម្បងនៅក្នុងអក្សរសិល្ប៍ជាការរចនានៃរចនាសម្ព័ន្ធគំនិតសម្រាប់ការតំណាងការប្រកាសនៃ actualized នៅក្នុង សកម្មភាពនិយាយនិងឧទ្ទិស ភាសាមានន័យ(និមិត្តសញ្ញា, សំណង់សំយោគ, ប្រភេទវេយ្យាករណ៍ល) ស្ថានភាព និងផ្នែករបស់ពួកគេ ៥). ដោយត្រូវបានផ្សារភ្ជាប់ជាមួយនឹងទម្រង់ភាសា ឈុតនេះត្រូវបានធ្វើបច្ចុប្បន្នភាពជាញឹកញាប់ ពាក្យជាក់លាក់ឬការបញ្ចេញមតិ។ នៅក្នុងវេយ្យាករណ៍គ្រោង (សូមមើលខាងក្រោម) ឈុតមួយលេចឡើងជាផ្នែកនៃវគ្គ ឬនិទានរឿង។ ឧទាហរណ៍ធម្មតា។ឈុតឆាក - សំណុំនៃគូបដែលប្រព័ន្ធ AI ធ្វើការជាមួយ ឈុតក្នុងរឿង និងអ្នកចូលរួមក្នុងសកម្មភាព។ល។ ក្នុង​បញ្ញា​សិប្បនិម្មិត ឈុតឆាក​ត្រូវ​បាន​ប្រើ​ក្នុង​ប្រព័ន្ធ​ទទួល​ស្គាល់​រូបភាព ព្រម​ទាំង​ក្នុង​កម្មវិធី​ដែល​ផ្តោត​លើ​ការ​ស្រាវជ្រាវ (ការវិភាគ ការ​ពិពណ៌នា) ស្ថានភាពបញ្ហា. គោលគំនិតនៃទិដ្ឋភាពមួយបានរីករាលដាលនៅក្នុងទ្រឹស្តីភាសាវិទ្យា ក៏ដូចជាក្នុងតក្កវិជ្ជា ជាពិសេសនៅក្នុងន័យន័យស្ថានការណ៍ ដែលអត្ថន័យ ធាតុ lexicalភ្ជាប់ដោយផ្ទាល់ទៅកន្លែងកើតហេតុ។