ច្បាប់ធម្មតានៃការចែកចាយប្រូបាប៊ីលីតេ។ ការវិភាគស្ថិតិនៃតម្លៃលេខ (ស្ថិតិមិនមែនប៉ារ៉ាម៉ែត្រ)

    តើធ្វើដូចម្តេចដើម្បីគ្រប់គ្រងហិរញ្ញវត្ថុនៃអាជីវកម្មរបស់អ្នកឱ្យបានត្រឹមត្រូវប្រសិនបើអ្នកមិនមែនជាអ្នកជំនាញក្នុងវិស័យវិភាគហិរញ្ញវត្ថុ - ការវិភាគហិរញ្ញវត្ថុ

    ការគ្រប់គ្រងហិរញ្ញវត្ថុ - ទំនាក់ទំនងហិរញ្ញវត្ថុរវាងមុខវិជ្ជា ការគ្រប់គ្រងហិរញ្ញវត្ថុនៅកម្រិតផ្សេងៗគ្នា ការគ្រប់គ្រងផលប័ត្រ វិធីសាស្រ្តនៃការគ្រប់គ្រងចលនានៃធនធានហិរញ្ញវត្ថុ - នេះមិនមែនជាបញ្ជីពេញលេញនៃប្រធានបទ " ការគ្រប់គ្រង​ហិរញ្ញវត្ថុ"

    ចូរនិយាយអំពីអ្វីដែលជា ការបង្វឹក? អ្នកខ្លះជឿថានេះជាម៉ាកយីហោ bourgeois ខ្លះទៀតថាវាជារបកគំហើញជាមួយនឹងអាជីវកម្មទំនើប។ ការបង្វឹកគឺជាសំណុំនៃច្បាប់សម្រាប់អាជីវកម្មជោគជ័យ ក៏ដូចជាសមត្ថភាពក្នុងការគ្រប់គ្រងច្បាប់ទាំងនេះឱ្យបានត្រឹមត្រូវ។

៤.១. តើ​ការ​ចែក​ចាយ​ការ​សង្កេត​ជា​ញឹក​ញាប់​ឬ​ទេ?

នៅក្នុងគំរូសេដ្ឋកិច្ច និងសេដ្ឋកិច្ច-គណិតវិទ្យាដែលប្រើ ជាពិសេសក្នុងការសិក្សា និងការបង្កើនប្រសិទ្ធភាពនៃដំណើរការទីផ្សារ និងការគ្រប់គ្រង ការគ្រប់គ្រងសហគ្រាស និងតំបន់ ភាពត្រឹមត្រូវ និងស្ថិរភាពនៃដំណើរការបច្ចេកវិជ្ជា បញ្ហានៃភាពជឿជាក់ សុវត្ថិភាព រួមទាំងសុវត្ថិភាពបរិស្ថាន ដំណើរការនៃបច្ចេកទេស។ ឧបករណ៍ និងវត្ថុ ការអភិវឌ្ឍន៍នៃតារាងអង្គការជារឿយៗអនុវត្តគោលគំនិត និងលទ្ធផលនៃទ្រឹស្តីប្រូបាប៊ីលីតេ និងស្ថិតិគណិតវិទ្យា។ ក្នុងករណីនេះ គ្រួសារប៉ារ៉ាម៉ែត្រមួយឬផ្សេងទៀតនៃការចែកចាយប្រូបាប៊ីលីតេត្រូវបានគេប្រើជាញឹកញាប់។ ការពេញនិយមបំផុតគឺការចែកចាយធម្មតា។ ការចែកចាយកំណត់ហេតុ-ធម្មតា ការចែកចាយអិចស្ប៉ូណង់ស្យែល ការចែកចាយហ្គាម៉ា ការចែកចាយ Weibull-Gnedenko ជាដើម ក៏ត្រូវបានប្រើប្រាស់ផងដែរ។

ជាក់ស្តែងវាតែងតែចាំបាច់ដើម្បីពិនិត្យមើលការអនុលោមតាមគំរូទៅនឹងការពិត។ មានសំណួរពីរ។ តើ​ការ​ចែកចាយ​ពិត​ខុស​ប្លែក​ពី​ការ​ប្រើ​ក្នុង​គំរូ​ឬ? តើភាពខុសគ្នានេះប៉ះពាល់ដល់ការសន្និដ្ឋានកម្រិតណា?

ខាងក្រោមនេះ ដោយប្រើឧទាហរណ៍នៃការចែកចាយធម្មតា និងវិធីសាស្រ្តសម្រាប់ការបដិសេធការសង្កេតខុសគ្នាខ្លាំង (outliers) ដោយផ្អែកលើវា វាត្រូវបានបង្ហាញថាការចែកចាយពិតប្រាកដស្ទើរតែតែងតែខុសគ្នាពីអ្វីដែលរួមបញ្ចូលនៅក្នុងគ្រួសារប៉ារ៉ាម៉ែត្របុរាណ និងគម្លាតដែលមានស្រាប់ពីគ្រួសារដែលបានផ្តល់ឱ្យ។ ធ្វើការសន្និដ្ឋានមិនត្រឹមត្រូវ ក្នុងករណីដែលកំពុងពិចារណាអំពីការបដិសេធដោយផ្អែកលើការប្រើប្រាស់គ្រួសារទាំងនេះ។

តើមានហេតុផលណាមួយដើម្បីសន្មតថាជាអាទិភាពនៃភាពធម្មតានៃលទ្ធផលរង្វាស់ទេ?

ជួនកាលវាត្រូវបានប្រកែកថានៅក្នុងករណីនៅពេលដែលកំហុសរង្វាស់ (ឬអថេរចៃដន្យផ្សេងទៀត) ត្រូវបានកំណត់ជាលទ្ធផលនៃសកម្មភាពប្រមូលផ្តុំនៃកត្តាតូចៗជាច្រើនបន្ទាប់មកដោយសារទ្រឹស្តីបទដែនកំណត់កណ្តាល (CLT) នៃទ្រឹស្តីប្រូបាប៊ីលីតេ តម្លៃនេះគឺ ប្រហាក់ប្រហែលល្អ (ដោយការចែកចាយ) ដោយអថេរចៃដន្យធម្មតា។ សេចក្តីថ្លែងការណ៍នេះជាការពិត ប្រសិនបើកត្តាតូចៗធ្វើសកម្មភាពបន្ថែម និងឯករាជ្យពីគ្នាទៅវិញទៅមក។ ប្រសិនបើពួកវាធ្វើសកម្មភាពពហុគុណ នោះដោយសារតែ CLT ដូចគ្នា វាចាំបាច់ក្នុងការប៉ាន់ស្មានដោយការចែកចាយកំណត់ហេតុធម្មតា។ នៅក្នុងបញ្ហាដែលបានអនុវត្ត ជាធម្មតាវាមិនអាចទៅរួចទេក្នុងការបញ្ជាក់ពីការបន្ថែមជាជាងការគុណនៃសកម្មភាពនៃកត្តាតូចៗ។ ប្រសិនបើការពឹងផ្អែកមានលក្ខណៈទូទៅ មិនត្រូវបានកាត់បន្ថយទៅជាទម្រង់បន្ថែម ឬពហុគុណទេ ហើយគ្មានហេតុផលដើម្បីទទួលយកគំរូដែលផ្តល់អិចស្ប៉ូណង់ស្យែល Weibull-Gnedenko ហ្គាម៉ា ឬការចែកចាយផ្សេងទៀតទេ ជាក់ស្តែងគ្មានអ្វីត្រូវបានគេដឹងអំពីការចែកចាយ អថេរចៃដន្យចុងក្រោយ លើកលែងតែលក្ខណៈសម្បត្តិក្នុងគណិតវិទ្យា ដូចជាភាពទៀងទាត់។

នៅពេលដំណើរការទិន្នន័យជាក់លាក់ ជួនកាលគេជឿថាកំហុសក្នុងការវាស់វែងមានការចែកចាយធម្មតា។ នៅលើការសន្មត់នៃភាពធម្មតា គំរូបុរាណនៃការតំរែតំរង់ ការបែកខ្ចាត់ខ្ចាយ ការវិភាគកត្តា គំរូម៉ែត្រត្រូនិចត្រូវបានបង្កើតឡើង ដែលនៅតែអាចរកឃើញទាំងនៅក្នុងឯកសារបទប្បញ្ញត្តិ និងបច្ចេកទេសក្នុងស្រុក និងក្នុងស្តង់ដារអន្តរជាតិ។ គំរូសម្រាប់ការគណនាកម្រិតអតិបរមាដែលអាចសម្រេចបាននៃលក្ខណៈជាក់លាក់ដែលប្រើក្នុងការរចនាប្រព័ន្ធសម្រាប់ធានាសុវត្ថិភាពនៃដំណើរការនៃរចនាសម្ព័ន្ធសេដ្ឋកិច្ច ឧបករណ៍បច្ចេកទេស និងវត្ថុគឺផ្អែកលើការសន្មត់ដូចគ្នា។ ទោះយ៉ាងណាក៏ដោយ មិនមានមូលដ្ឋានទ្រឹស្តីសម្រាប់ការសន្មត់បែបនេះទេ។ វាចាំបាច់ក្នុងការសិក្សាពិសោធន៍ការចែកចាយនៃកំហុស។

តើលទ្ធផលពិសោធន៍បង្ហាញអ្វីខ្លះ? សេចក្តីសង្ខេបដែលបានផ្តល់ឱ្យក្នុងអក្សរកាត់អនុញ្ញាតឱ្យយើងបញ្ជាក់ថាក្នុងករណីភាគច្រើនការចែកចាយកំហុសនៃការវាស់វែងខុសពីធម្មតា។ ដូច្នេះនៅវិទ្យាស្ថាន Machine-Electrotechnical Institute (Varna, Bulgaria) ការចែកចាយកំហុសក្នុងការក្រិតតាមខ្នាតសម្រាប់មាត្រដ្ឋាននៃឧបករណ៍វាស់អគ្គិសនីអាណាឡូកត្រូវបានសិក្សា។ ឧបករណ៍ដែលផលិតនៅប្រទេសឆេកូស្លូវ៉ាគីសហភាពសូវៀតនិងប៊ុលហ្គារីត្រូវបានសិក្សា។ ច្បាប់ចែកចាយកំហុសបានប្រែទៅជាដូចគ្នា។ វាមានដង់ស៊ីតេ

យើងបានវិភាគទិន្នន័យលើប៉ារ៉ាម៉ែត្រនៃការចែកចាយជាក់ស្តែងចំនួន 219 នៃកំហុស ដែលសិក្សាដោយអ្នកនិពន្ធផ្សេងៗគ្នា នៅពេលវាស់ទាំងបរិមាណអគ្គិសនី និងមិនមែនអគ្គិសនីជាមួយនឹងឧបករណ៍ជាច្រើនប្រភេទ (អគ្គិសនី)។ ជាលទ្ធផលនៃការសិក្សានេះវាបានប្រែក្លាយថាការចែកចាយ 111, i.e. ប្រហែល 50% ជាកម្មសិទ្ធិរបស់ថ្នាក់ចែកចាយដែលមានដង់ស៊ីតេ

តើប៉ារ៉ាម៉ែត្រដឺក្រេនៅឯណា; ខ - ការផ្លាស់ប្តូរប៉ារ៉ាម៉ែត្រ; - ប៉ារ៉ាម៉ែត្រមាត្រដ្ឋាន; - មុខងារហ្គាម៉ានៃអាគុយម៉ង់;

(សង់​ទី​ម៉ែ​ត។ ); 63 ការចែកចាយ, i.e. 30% មានដង់ស៊ីតេផ្ទៃរាបស្មើ ជាមួយនឹងជម្រាលដ៏វែង ទន់ភ្លន់ ហើយមិនអាចពិពណ៌នាថាជាធម្មតា ឬឧទាហរណ៍ និទស្សន្ត។ ការចែកចាយចំនួន 45 ដែលនៅសល់បានប្រែទៅជា bimodal ។

នៅក្នុងសៀវភៅរបស់អ្នកជំនាញខាងម៉ែត្រដ៏ល្បីល្បាញ prof ។ PV Novitsky បង្ហាញពីលទ្ធផលនៃការសិក្សាអំពីច្បាប់នៃការចែកចាយនៃប្រភេទផ្សេងៗនៃកំហុសរង្វាស់។ គាត់បានសិក្សាពីការចែកចាយកំហុសនៃឧបករណ៍អេឡិចត្រូនិចនៅលើស្នូល ឧបករណ៍អេឡិចត្រូនិកសម្រាប់វាស់សីតុណ្ហភាព និងកម្លាំង ឧបករណ៍ឌីជីថលជាមួយនឹងតុល្យភាពដោយដៃ។ បរិមាណនៃគំរូទិន្នន័យពិសោធន៍សម្រាប់គំរូនីមួយៗគឺ 100-400 ការអាន។ វាប្រែថាការចែកចាយ 46 ក្នុងចំណោម 47 គឺខុសគ្នាយ៉ាងខ្លាំងពីធម្មតា។ រូបរាងនៃការចែកចាយនៃកំហុសនៅក្នុង 25 ច្បាប់ចម្លងនៃវ៉ុលឌីជីថល Shch-1411 នៅ 10 ចំណុចនៃជួរត្រូវបានសិក្សា។ លទ្ធផលគឺស្រដៀងគ្នា។ ព័ត៌មានបន្ថែមមាននៅក្នុង monograph ។

មន្ទីរពិសោធន៍គណិតវិទ្យាអនុវត្តនៃសាកលវិទ្យាល័យរដ្ឋ Tartu បានវិភាគគំរូចំនួន 2,500 ពីបណ្ណសារនៃទិន្នន័យស្ថិតិពិតប្រាកដ។ ក្នុង 92% សម្មតិកម្មភាពធម្មតាត្រូវតែបដិសេធ។

ការពិពណ៌នាខាងលើនៃទិន្នន័យពិសោធន៍បង្ហាញថាកំហុសនៃការវាស់វែងនៅក្នុងករណីភាគច្រើនមានការចែកចាយដែលខុសពីធម្មតា។ ជាពិសេស នេះមានន័យថា កម្មវិធីភាគច្រើននៃការធ្វើតេស្ត t-test របស់សិស្ស ការវិភាគតំរែតំរង់បុរាណ និងវិធីសាស្រ្តស្ថិតិផ្សេងទៀតដែលផ្អែកលើទ្រឹស្តីធម្មតា គឺនិយាយយ៉ាងតឹងរ៉ឹង មិនមែនសមហេតុផលទេ ចាប់តាំងពី axiom មូលដ្ឋាននៃភាពធម្មតានៃការចែកចាយនៃចៃដន្យដែលត្រូវគ្នា។ អថេរ​គឺ​មិន​ត្រឹមត្រូវ។

ជាក់ស្តែង ដើម្បីបង្ហាញអំពីភាពត្រឹមត្រូវ ឬការផ្លាស់ប្តូរដោយសមហេតុផលនូវការអនុវត្តបច្ចុប្បន្ននៃការវិភាគទិន្នន័យស្ថិតិ ចាំបាច់ត្រូវសិក្សាពីលក្ខណៈសម្បត្តិនៃនីតិវិធីវិភាគទិន្នន័យនៅក្នុងកម្មវិធី "ខុសច្បាប់"។ ការសិក្សាអំពីនីតិវិធីនៃការបដិសេធបានបង្ហាញថាពួកគេមិនស្ថិតស្ថេរខ្លាំងចំពោះគម្លាតពីភាពធម្មតា ដូច្នេះហើយវាមិនត្រូវបានគេណែនាំឱ្យប្រើពួកវាសម្រាប់ដំណើរការទិន្នន័យពិតប្រាកដ (សូមមើលខាងក្រោម)។ ដូច្នេះ គេមិនអាចអះអាងបានទេថា នីតិវិធីដែលធ្វើឡើងតាមអំពើចិត្ត មានស្ថេរភាពប្រឆាំងនឹងការបង្វែរពីភាពប្រក្រតី។

ជួនកាលវាត្រូវបានណែនាំថាមុនពេលអនុវត្តឧទាហរណ៍ការធ្វើតេស្តរបស់សិស្សសម្រាប់ភាពដូចគ្នានៃគំរូពីរសូមពិនិត្យមើលភាពធម្មតា។ ទោះបីជាមានលក្ខណៈវិនិច្ឆ័យជាច្រើនសម្រាប់រឿងនេះក៏ដោយ ការធ្វើតេស្តសម្រាប់ភាពធម្មតាគឺជានីតិវិធីស្ថិតិដែលស្មុគស្មាញ និងប្រើប្រាស់ពេលវេលាច្រើនជាងការធ្វើតេស្តសម្រាប់ភាពដូចគ្នា (ទាំងស្ថិតិប្រភេទសិស្ស និងជាមួយនឹងការធ្វើតេស្តដែលមិនមែនជាប៉ារ៉ាម៉ែត្រ)។ ការសង្កេតមួយចំនួនធំគឺត្រូវបានទាមទារដើម្បីបង្កើតភាពធម្មតាដែលអាចទុកចិត្តបានគ្រប់គ្រាន់។ ដូច្នេះដើម្បីធានាថាមុខងារចែកចាយនៃលទ្ធផលនៃការសង្កេតខុសពីធម្មតាមួយចំនួនដោយមិនលើសពី 0.01 (សម្រាប់តម្លៃណាមួយនៃអាគុយម៉ង់) ប្រហែល 2500 ការសង្កេតត្រូវបានទាមទារ។ នៅក្នុងការសិក្សាផ្នែកសេដ្ឋកិច្ច បច្ចេកទេស ជីវវេជ្ជសាស្ត្រ និងការអនុវត្តផ្សេងៗទៀត ចំនួននៃការសង្កេតគឺតិចជាងគួរឱ្យកត់សម្គាល់។ នេះជាការពិតជាពិសេសសម្រាប់ទិន្នន័យដែលប្រើក្នុងការសិក្សាអំពីបញ្ហាទាក់ទងនឹងការធានាសុវត្ថិភាពនៃការដំណើរការនៃរចនាសម្ព័ន្ធសេដ្ឋកិច្ច និងវត្ថុបច្ចេកទេស។

ពេលខ្លះពួកគេព្យាយាមប្រើ CCT ដើម្បីប៉ាន់ស្មានការចែកចាយនៃកំហុសទៅធម្មតា រួមទាំងការបន្ថែមពិសេសនៅក្នុងគ្រោងការណ៍បច្ចេកវិទ្យានៃឧបករណ៍វាស់។ ចូរយើងវាយតម្លៃអត្ថប្រយោជន៍នៃវិធានការនេះ។ អនុញ្ញាតឱ្យ Z1 , Z2 ,…, Zk ជាអថេរបែងចែកចៃដន្យដោយឯករាជ្យជាមួយមុខងារចែកចាយ H = H(x) ដូចនេះ ពិចារណា

សូចនាករនៃភាពជិតទៅនឹងភាពធម្មតាដែលផ្តល់ដោយអ្នកបន្ថែមគឺ

វិសមភាពខាងស្ដាំនៅក្នុងទំនាក់ទំនងចុងក្រោយកើតឡើងពីការប៉ាន់ប្រមាណនៃថេរនៅក្នុងវិសមភាព Berry-Esseen ដែលទទួលបាននៅក្នុងសៀវភៅ និងមួយខាងឆ្វេងពីឧទាហរណ៍ក្នុងអក្សរកាត់នេះ។ សម្រាប់ច្បាប់ធម្មតា = 1.6 សម្រាប់ច្បាប់ឯកសណ្ឋាន = 1.3 សម្រាប់ច្បាប់ពីរចំណុច = 1 (នេះគឺជាចំណងទាបសម្រាប់ )។ ដូច្នេះ ដើម្បីធានាបានចម្ងាយ (នៅក្នុងម៉ែត្រ Kolmogorov) ទៅនឹងការចែកចាយធម្មតាមិនលើសពី 0.01 សម្រាប់ការចែកចាយ "មិនជោគជ័យ" យ៉ាងហោចណាស់ត្រូវការលក្ខខណ្ឌ k0 ដែល

នៅក្នុង adders ដែលប្រើជាទូទៅ ពាក្យគឺតូចជាងច្រើន។ ដោយការបង្រួមថ្នាក់នៃការចែកចាយដែលអាចធ្វើបាន H មួយអាចទទួលបានដូចដែលបានបង្ហាញក្នុងអក្សរកាត់ ការបង្រួបបង្រួមលឿនជាង ប៉ុន្តែនៅទីនេះទ្រឹស្តីមិនទាន់បញ្ចូលជាមួយការអនុវត្តនៅឡើយ។ លើសពីនេះទៀតវាមិនច្បាស់ទេថាតើភាពជិតស្និទ្ធនៃការចែកចាយទៅធម្មតា (នៅក្នុងម៉ែត្រជាក់លាក់មួយ) ក៏ធានានូវភាពជិតស្និទ្ធនៃការចែកចាយស្ថិតិដែលបានសាងសង់ពីអថេរចៃដន្យជាមួយនឹងការចែកចាយនេះទៅនឹងការចែកចាយស្ថិតិដែលត្រូវគ្នានឹងការសង្កេតធម្មតា។ ជាក់ស្តែង សម្រាប់ស្ថិតិជាក់លាក់នីមួយៗ ការសិក្សាទ្រឹស្តីពិសេសគឺត្រូវការជាចាំបាច់។ នេះគឺជាការសន្និដ្ឋានដែលអ្នកនិពន្ធនៃ monograph មកដល់។ នៅក្នុងបញ្ហាបដិសេធទាំងស្រុង ចម្លើយគឺ៖ "មិនផ្តល់" (សូមមើលខាងក្រោម)។

ចំណាំថាលទ្ធផលនៃការវាស់វែងពិតប្រាកដណាមួយត្រូវបានកត់ត្រាដោយប្រើចំនួនខ្ទង់ទសភាគកំណត់ ដែលជាធម្មតាតូច (2-5) ដូច្នេះវាត្រូវបានគេណែនាំឱ្យធ្វើគំរូទិន្នន័យពិតណាមួយដោយប្រើតែអថេរចៃដន្យដាច់ដោយឡែកដែលយកចំនួនកំណត់នៃតម្លៃ។ ការចែកចាយធម្មតាគឺគ្រាន់តែជាការប៉ាន់ស្មាននៃការចែកចាយពិតប្រាកដប៉ុណ្ណោះ។ ដូច្នេះឧទាហរណ៍ទិន្នន័យនៃការសិក្សាជាក់លាក់មួយដែលបានផ្តល់ឱ្យនៅក្នុងការងារយកតម្លៃពី 1.0 ដល់ 2.2, i.e. មានតម្លៃសរុបចំនួន 13 ។ វាធ្វើតាមគោលការណ៍ Dirichlet ដែលនៅចំណុចខ្លះមុខងារចែកចាយដែលបានសាងសង់យោងទៅតាមទិន្នន័យការងារខុសគ្នាពីមុខងារចែកចាយធម្មតាដែលនៅជិតបំផុតដោយយ៉ាងហោចណាស់ 1/26, i.e. ដោយ 0.04 ។ លើសពីនេះ វាច្បាស់ណាស់ថាសម្រាប់ការចែកចាយធម្មតានៃអថេរចៃដន្យ ប្រូបាប៊ីលីតេនៃការធ្លាក់ចូលទៅក្នុងសំណុំលេខទសភាគដាច់ដោយឡែកដែលមានលេខទសភាគដែលបានផ្តល់ឱ្យគឺ 0 ។

វាធ្វើតាមពីខាងលើដែលលទ្ធផលនៃការវាស់វែងនិងជាទូទៅទិន្នន័យស្ថិតិមានលក្ខណៈសម្បត្តិដែលនាំឱ្យការពិតដែលថាពួកគេគួរតែត្រូវបានយកគំរូតាមអថេរចៃដន្យជាមួយនឹងការចែកចាយដែលមានភាពខុសគ្នាច្រើនឬតិចជាងពីធម្មតា។ ក្នុងករណីភាគច្រើន ការចែកចាយមានភាពខុសប្លែកគ្នាយ៉ាងខ្លាំងពីការចែកចាយធម្មតា ម្យ៉ាងវិញទៀតការចែកចាយធម្មតាតាមមើលទៅអាចចាត់ទុកថាជាប្រភេទនៃការប្រហាក់ប្រហែល ប៉ុន្តែវាមិនដែលចៃដន្យពេញលេញនោះទេ។ នេះបង្កប់ន័យទាំងតម្រូវការក្នុងការសិក្សាអំពីលក្ខណៈសម្បត្តិនៃនីតិវិធីស្ថិតិបុរាណនៅក្នុងគំរូប្រូបាប៊ីលីកដែលមិនមែនជាបុរាណ (ស្រដៀងទៅនឹងអ្វីដែលបានធ្វើខាងក្រោមសម្រាប់លក្ខណៈវិនិច្ឆ័យរបស់សិស្ស) និងតម្រូវការដើម្បីអភិវឌ្ឍស្ថេរភាព (ដោយគិតគូរពីវត្តមាននៃគម្លាតពីភាពធម្មតា) និង nonparametric រួមទាំងនីតិវិធីដោយមិនមានការចែកចាយ ការណែនាំដ៏ធំទូលាយរបស់ពួកគេទៅក្នុងការអនុវត្តនៃដំណើរការទិន្នន័យស្ថិតិ។

ការពិចារណាដែលបានលុបចោលនៅទីនេះសម្រាប់គ្រួសារប៉ារ៉ាម៉ែត្រផ្សេងទៀតនាំឱ្យមានការសន្និដ្ឋានស្រដៀងគ្នា។ លទ្ធផលអាចត្រូវបានបង្កើតដូចខាងក្រោម។ ការចែកចាយទិន្នន័យពិតស្ទើរតែមិនដែលជាកម្មសិទ្ធិរបស់ក្រុមគ្រួសារប៉ារ៉ាម៉ែត្រជាក់លាក់ណាមួយឡើយ។ ការចែកចាយពិតប្រាកដតែងតែខុសពីការចែកចាយដែលរួមបញ្ចូលក្នុងគ្រួសារប៉ារ៉ាមេត។ ភាពខុសគ្នាអាចធំឬតូច ប៉ុន្តែវាតែងតែមាន។ ចូរយើងព្យាយាមស្វែងយល់ថាតើភាពខុសគ្នាទាំងនេះមានសារៈសំខាន់យ៉ាងណាសម្រាប់ការវិភាគសេដ្ឋកិច្ច។

រក្សា​រ​សិទ្ធ​គ្រប់យ៉ាង។ សម្ភារៈនៅលើគេហទំព័រនេះអាចប្រើប្រាស់បានតែជាមួយតំណភ្ជាប់ទៅកាន់គេហទំព័រនេះប៉ុណ្ណោះ។

អ័រឡូវ A.I. តើ​ការ​ចែក​ចាយ​ការ​សង្កេត​ជា​ញឹក​ញាប់​ឬ​ទេ? - ទស្សនាវដ្តី "មន្ទីរពិសោធន៍រោងចក្រ" ។ ១៩៩១ T.៥៧. លេខ 7 P.64-66 ។

តើ​ការ​ចែក​ចាយ​ការ​សង្កេត​ជា​ញឹក​ញាប់​ឬ​ទេ?

A.I.Orlov

លទ្ធផលនៃការវាស់វែងនិងជាទូទៅទិន្នន័យស្ថិតិមានលក្ខណៈសម្បត្តិដែលនាំឱ្យការពិតដែលថាពួកគេគួរតែត្រូវបានយកគំរូតាមអថេរចៃដន្យជាមួយនឹងការចែកចាយដែលខុសគ្នាច្រើនឬតិចពីធម្មតា។ ក្នុងករណីភាគច្រើន ការចែកចាយមានភាពខុសគ្នាខ្លាំងពីធម្មតា។ ក្នុងចំណោមអ្នកផ្សេងទៀត ការចែកចាយធម្មតាអាចត្រូវបានគេចាត់ទុកថាជាប្រភេទនៃការប្រហាក់ប្រហែល។ ប៉ុន្តែមិនដែលមានការប្រកួតល្អឥតខ្ចោះនោះទេ។ នេះបង្កប់ន័យទាំងតម្រូវការក្នុងការសិក្សាអំពីលក្ខណៈសម្បត្តិនៃនីតិវិធីស្ថិតិបុរាណនៅក្នុងគំរូប្រូបាប៊ីលីកដែលមិនមែនជាបុរាណ និងតម្រូវការក្នុងការអភិវឌ្ឍន៍ស្ថិរភាព (ដោយគិតគូរពីវត្តមាននៃគម្លាតពីភាពធម្មតា) និងមិនមែនប៉ារ៉ាម៉ែត្រ រួមទាំងនីតិវិធីមិនគិតថ្លៃចែកចាយ។ ការណែនាំអំពីការអនុវត្តនៃដំណើរការទិន្នន័យស្ថិតិ។

នៅក្នុងគំរូសេដ្ឋកិច្ច និងសេដ្ឋកិច្ច-គណិតវិទ្យាដែលប្រើ ជាពិសេសក្នុងការសិក្សា និងការបង្កើនប្រសិទ្ធភាពនៃដំណើរការទីផ្សារ និងការគ្រប់គ្រង ការគ្រប់គ្រងសហគ្រាស និងតំបន់ ភាពត្រឹមត្រូវ និងស្ថិរភាពនៃដំណើរការបច្ចេកវិជ្ជា បញ្ហានៃភាពជឿជាក់ សុវត្ថិភាព រួមទាំងសុវត្ថិភាពបរិស្ថាន ដំណើរការនៃបច្ចេកទេស។ ឧបករណ៍ និងវត្ថុ ការអភិវឌ្ឍន៍នៃតារាងអង្គការជារឿយៗអនុវត្តគោលគំនិត និងលទ្ធផលនៃទ្រឹស្តីប្រូបាប៊ីលីតេ និងស្ថិតិគណិតវិទ្យា។ ក្នុងករណីនេះ គ្រួសារប៉ារ៉ាម៉ែត្រមួយ ឬមួយផ្សេងទៀតនៃការចែកចាយប្រូបាប៊ីលីតេត្រូវបានគេប្រើជាញឹកញាប់។ ការពេញនិយមបំផុតគឺការចែកចាយធម្មតា។ ការចែកចាយកំណត់ហេតុ-ធម្មតា ការចែកចាយអិចស្ប៉ូណង់ស្យែល ការចែកចាយហ្គាម៉ា ការចែកចាយ Weibull-Gnedenko ជាដើម ក៏ត្រូវបានប្រើប្រាស់ផងដែរ។

ជាក់ស្តែងវាតែងតែចាំបាច់ដើម្បីពិនិត្យមើលការអនុលោមតាមគំរូទៅនឹងការពិត។ មានសំណួរពីរ។ តើ​ការ​ចែកចាយ​ពិត​ខុស​ប្លែក​ពី​ការ​ប្រើ​ក្នុង​គំរូ​ឬ? តើភាពខុសគ្នានេះប៉ះពាល់ដល់ការសន្និដ្ឋានកម្រិតណា?

ខាងក្រោមនេះ ដោយប្រើឧទាហរណ៍នៃការចែកចាយធម្មតា និងវិធីសាស្រ្តសម្រាប់ការបដិសេធការសង្កេតខុសគ្នាខ្លាំង (outliers) ដោយផ្អែកលើវា វាត្រូវបានបង្ហាញថាការចែកចាយពិតប្រាកដស្ទើរតែតែងតែខុសគ្នាពីអ្វីដែលរួមបញ្ចូលនៅក្នុងគ្រួសារប៉ារ៉ាម៉ែត្របុរាណ និងគម្លាតដែលមានស្រាប់ពីគ្រួសារដែលបានផ្តល់ឱ្យ។ ធ្វើការសន្និដ្ឋានមិនត្រឹមត្រូវ ក្នុងករណីដែលកំពុងពិចារណាអំពីការបដិសេធដោយផ្អែកលើការប្រើប្រាស់គ្រួសារទាំងនេះ។

តើមានហេតុផលណាមួយដើម្បីសន្មតថាជាអាទិភាពនៃភាពធម្មតានៃលទ្ធផលរង្វាស់ទេ?

ជួនកាលវាត្រូវបានប្រកែកថានៅក្នុងករណីនៅពេលដែលកំហុសរង្វាស់ (ឬអថេរចៃដន្យផ្សេងទៀត) ត្រូវបានកំណត់ជាលទ្ធផលនៃសកម្មភាពប្រមូលផ្តុំនៃកត្តាតូចៗជាច្រើនបន្ទាប់មកដោយសារទ្រឹស្តីបទដែនកំណត់កណ្តាល (CLT) នៃទ្រឹស្តីប្រូបាប៊ីលីតេ តម្លៃនេះគឺ ប្រហាក់ប្រហែលល្អ (ដោយការចែកចាយ) ដោយអថេរចៃដន្យធម្មតា។ សេចក្តីថ្លែងការណ៍នេះជាការពិត ប្រសិនបើកត្តាតូចៗធ្វើសកម្មភាពបន្ថែម និងឯករាជ្យពីគ្នាទៅវិញទៅមក។ ប្រសិនបើពួកវាធ្វើសកម្មភាពពហុគុណ នោះដោយសារតែ CLT ដូចគ្នា វាចាំបាច់ក្នុងការប៉ាន់ស្មានដោយការចែកចាយកំណត់ហេតុធម្មតា។ នៅក្នុងបញ្ហាដែលបានអនុវត្ត ជាធម្មតាវាមិនអាចទៅរួចទេក្នុងការបញ្ជាក់ពីការបន្ថែមជាជាងការគុណនៃសកម្មភាពនៃកត្តាតូចៗ។ ប្រសិនបើការពឹងផ្អែកមានលក្ខណៈទូទៅ មិនត្រូវបានកាត់បន្ថយទៅជាទម្រង់បន្ថែម ឬពហុគុណទេ ហើយគ្មានហេតុផលដើម្បីទទួលយកគំរូដែលផ្តល់អិចស្ប៉ូណង់ស្យែល Weibull-Gnedenko ហ្គាម៉ា ឬការចែកចាយផ្សេងទៀតទេ ជាក់ស្តែងគ្មានអ្វីត្រូវបានគេដឹងអំពីការចែកចាយ អថេរចៃដន្យចុងក្រោយ លើកលែងតែលក្ខណៈសម្បត្តិក្នុងគណិតវិទ្យា ដូចជាភាពទៀងទាត់។

នៅពេលដំណើរការទិន្នន័យជាក់លាក់ ជួនកាលគេជឿថាកំហុសក្នុងការវាស់វែងមានការចែកចាយធម្មតា។ នៅលើការសន្មត់នៃភាពធម្មតា គំរូបុរាណនៃការតំរែតំរង់ ការបែកខ្ចាត់ខ្ចាយ ការវិភាគកត្តា គំរូម៉ែត្រត្រូនិចត្រូវបានបង្កើតឡើង ដែលនៅតែអាចរកឃើញទាំងនៅក្នុងឯកសារបទប្បញ្ញត្តិ និងបច្ចេកទេសក្នុងស្រុក និងក្នុងស្តង់ដារអន្តរជាតិ។ គំរូសម្រាប់ការគណនាកម្រិតអតិបរមាដែលអាចសម្រេចបាននៃលក្ខណៈជាក់លាក់ដែលប្រើក្នុងការរចនាប្រព័ន្ធសម្រាប់ធានាសុវត្ថិភាពនៃដំណើរការនៃរចនាសម្ព័ន្ធសេដ្ឋកិច្ច ឧបករណ៍បច្ចេកទេស និងវត្ថុគឺផ្អែកលើការសន្មត់ដូចគ្នា។ ទោះយ៉ាងណាក៏ដោយ មិនមានមូលដ្ឋានទ្រឹស្តីសម្រាប់ការសន្មត់បែបនេះទេ។ វាចាំបាច់ក្នុងការសិក្សាពិសោធន៍ការចែកចាយនៃកំហុស។

តើលទ្ធផលពិសោធន៍បង្ហាញអ្វីខ្លះ? សេចក្តីសង្ខេបដែលបានផ្តល់ឱ្យក្នុងអក្សរកាត់អនុញ្ញាតឱ្យយើងបញ្ជាក់ថាក្នុងករណីភាគច្រើនការចែកចាយកំហុសនៃការវាស់វែងខុសពីធម្មតា។ ដូច្នេះនៅវិទ្យាស្ថាន Machine-Electrotechnical Institute (Varna, Bulgaria) ការចែកចាយកំហុសក្នុងការក្រិតតាមខ្នាតសម្រាប់មាត្រដ្ឋាននៃឧបករណ៍វាស់អគ្គិសនីអាណាឡូកត្រូវបានសិក្សា។ ឧបករណ៍ដែលផលិតនៅប្រទេសឆេកូស្លូវ៉ាគីសហភាពសូវៀតនិងប៊ុលហ្គារីត្រូវបានសិក្សា។ ច្បាប់ចែកចាយកំហុសបានប្រែទៅជាដូចគ្នា។ វាមានដង់ស៊ីតេ

យើងបានវិភាគទិន្នន័យលើប៉ារ៉ាម៉ែត្រនៃការចែកចាយជាក់ស្តែងចំនួន 219 នៃកំហុស ដែលសិក្សាដោយអ្នកនិពន្ធផ្សេងៗគ្នា នៅពេលវាស់បរិមាណអគ្គិសនី និងមិនមែនអគ្គិសនីជាមួយនឹងឧបករណ៍ជាច្រើនប្រភេទ (អគ្គិសនី)។ ជាលទ្ធផលនៃការសិក្សានេះវាបានប្រែក្លាយថាការចែកចាយ 111, i.e. ប្រហែល 50% ជាកម្មសិទ្ធិរបស់ថ្នាក់ចែកចាយដែលមានដង់ស៊ីតេ

តើប៉ារ៉ាម៉ែត្រដឺក្រេនៅឯណា; - ការផ្លាស់ប្តូរប៉ារ៉ាម៉ែត្រ; - ប៉ារ៉ាម៉ែត្រមាត្រដ្ឋាន; - អនុគមន៍ហ្គាម៉ានៃអាគុយម៉ង់;

(សង់​ទី​ម៉ែ​ត។ ); 63 ការចែកចាយ, i.e. 30% មានដង់ស៊ីតេផ្ទៃរាបស្មើ ជាមួយនឹងជម្រាលដ៏វែង ទន់ភ្លន់ ហើយមិនអាចពិពណ៌នាថាជាធម្មតា ឬឧទាហរណ៍ និទស្សន្ត។ ការចែកចាយចំនួន 45 ដែលនៅសល់បានប្រែទៅជា bimodal ។

នៅក្នុងសៀវភៅរបស់អ្នកជំនាញខាងម៉ែត្រដ៏ល្បីល្បាញ prof ។ PV Novitsky បង្ហាញពីលទ្ធផលនៃការសិក្សាអំពីច្បាប់នៃការចែកចាយនៃប្រភេទផ្សេងៗនៃកំហុសរង្វាស់។ គាត់បានសិក្សាពីការចែកចាយកំហុសនៃឧបករណ៍អេឡិចត្រូនិចនៅលើស្នូល ឧបករណ៍អេឡិចត្រូនិកសម្រាប់វាស់សីតុណ្ហភាព និងកម្លាំង ឧបករណ៍ឌីជីថលជាមួយនឹងតុល្យភាពដោយដៃ។ បរិមាណនៃគំរូទិន្នន័យពិសោធន៍សម្រាប់គំរូនីមួយៗគឺ 100-400 ការអាន។ វាប្រែថាការចែកចាយ 46 ក្នុងចំណោម 47 គឺខុសគ្នាយ៉ាងខ្លាំងពីធម្មតា។ រូបរាងនៃការចែកចាយនៃកំហុសនៅក្នុង 25 ច្បាប់ចម្លងនៃវ៉ុលឌីជីថល Shch-1411 នៅ 10 ចំណុចនៃជួរត្រូវបានសិក្សា។ លទ្ធផលគឺស្រដៀងគ្នា។ ព័ត៌មានបន្ថែមមាននៅក្នុង monograph ។

មន្ទីរពិសោធន៍គណិតវិទ្យាអនុវត្តនៃសាកលវិទ្យាល័យរដ្ឋ Tartu បានវិភាគគំរូចំនួន 2,500 ពីបណ្ណសារនៃទិន្នន័យស្ថិតិពិតប្រាកដ។ ក្នុង 92% សម្មតិកម្មភាពធម្មតាត្រូវតែបដិសេធ។

ការពិពណ៌នាខាងលើនៃទិន្នន័យពិសោធន៍បង្ហាញថាកំហុសនៃការវាស់វែងនៅក្នុងករណីភាគច្រើនមានការចែកចាយដែលខុសពីធម្មតា។ ជាពិសេស នេះមានន័យថា កម្មវិធីភាគច្រើននៃការធ្វើតេស្ត t-test របស់សិស្ស ការវិភាគតំរែតំរង់បុរាណ និងវិធីសាស្រ្តស្ថិតិផ្សេងទៀតដែលផ្អែកលើទ្រឹស្តីធម្មតា គឺនិយាយយ៉ាងតឹងរ៉ឹង មិនមែនសមហេតុផលទេ ចាប់តាំងពី axiom មូលដ្ឋាននៃភាពធម្មតានៃការចែកចាយនៃចៃដន្យដែលត្រូវគ្នា។ អថេរ​គឺ​មិន​ត្រឹមត្រូវ។

ជាក់ស្តែង ដើម្បីបង្ហាញអំពីភាពត្រឹមត្រូវ ឬការផ្លាស់ប្តូរដោយសមហេតុផលនូវការអនុវត្តបច្ចុប្បន្ននៃការវិភាគទិន្នន័យស្ថិតិ ចាំបាច់ត្រូវសិក្សាពីលក្ខណៈសម្បត្តិនៃនីតិវិធីវិភាគទិន្នន័យនៅក្នុងកម្មវិធី "ខុសច្បាប់"។ ការសិក្សាអំពីនីតិវិធីនៃការបដិសេធបានបង្ហាញថាពួកគេមិនស្ថិតស្ថេរខ្លាំងចំពោះគម្លាតពីភាពធម្មតា ដូច្នេះហើយវាមិនត្រូវបានគេណែនាំឱ្យប្រើពួកវាសម្រាប់ដំណើរការទិន្នន័យពិតប្រាកដ (សូមមើលខាងក្រោម)។ ដូច្នេះ គេមិនអាចអះអាងបានទេថា នីតិវិធីដែលធ្វើឡើងតាមអំពើចិត្ត មានស្ថេរភាពប្រឆាំងនឹងការបង្វែរពីភាពប្រក្រតី។

ជួនកាលវាត្រូវបានណែនាំថាមុនពេលអនុវត្តឧទាហរណ៍ការធ្វើតេស្តរបស់សិស្សសម្រាប់ភាពដូចគ្នានៃគំរូពីរសូមពិនិត្យមើលភាពធម្មតា។ ទោះបីជាមានលក្ខណៈវិនិច្ឆ័យជាច្រើនសម្រាប់រឿងនេះក៏ដោយ ការធ្វើតេស្តសម្រាប់ភាពធម្មតាគឺជានីតិវិធីស្ថិតិដែលស្មុគស្មាញ និងប្រើប្រាស់ពេលវេលាច្រើនជាងការធ្វើតេស្តសម្រាប់ភាពដូចគ្នា (ទាំងស្ថិតិប្រភេទសិស្ស និងជាមួយនឹងការធ្វើតេស្តដែលមិនមែនជាប៉ារ៉ាម៉ែត្រ)។ ការសង្កេតមួយចំនួនធំគឺត្រូវបានទាមទារដើម្បីបង្កើតភាពធម្មតាដែលអាចទុកចិត្តបានគ្រប់គ្រាន់។ ដូច្នេះដើម្បីធានាថាមុខងារចែកចាយនៃលទ្ធផលនៃការសង្កេតខុសពីធម្មតាមួយចំនួនដោយមិនលើសពី 0.01 (សម្រាប់តម្លៃណាមួយនៃអាគុយម៉ង់) ប្រហែល 2500 ការសង្កេតត្រូវបានទាមទារ។ នៅក្នុងការសិក្សាផ្នែកសេដ្ឋកិច្ច បច្ចេកទេស ជីវវេជ្ជសាស្ត្រ និងការអនុវត្តផ្សេងៗទៀត ចំនួននៃការសង្កេតគឺតិចជាងគួរឱ្យកត់សម្គាល់។ នេះជាការពិតជាពិសេសសម្រាប់ទិន្នន័យដែលប្រើក្នុងការសិក្សាអំពីបញ្ហាទាក់ទងនឹងការធានាសុវត្ថិភាពនៃការដំណើរការនៃរចនាសម្ព័ន្ធសេដ្ឋកិច្ច និងវត្ថុបច្ចេកទេស។

ពេលខ្លះពួកគេព្យាយាមប្រើ CCT ដើម្បីប៉ាន់ស្មានការចែកចាយនៃកំហុសទៅធម្មតា រួមទាំងការបន្ថែមពិសេសនៅក្នុងគ្រោងការណ៍បច្ចេកវិទ្យានៃឧបករណ៍វាស់។ ចូរយើងវាយតម្លៃអត្ថប្រយោជន៍នៃវិធានការនេះ។ អនុញ្ញាតឱ្យមាន Z 1 , Z 2 ,…, Z k- អថេរបែងចែកចៃដន្យដោយឯករាជ្យដែលមានមុខងារចែកចាយ H=(x) បែបនោះ ពិចារណា

សូចនាករនៃភាពជិតទៅនឹងភាពធម្មតាដែលផ្តល់ដោយអ្នកបន្ថែមគឺ

វិសមភាពខាងស្ដាំនៅក្នុងទំនាក់ទំនងចុងក្រោយកើតឡើងពីការប៉ាន់ប្រមាណនៃថេរនៅក្នុងវិសមភាព Berry-Esseen ដែលទទួលបាននៅក្នុងសៀវភៅ និងមួយខាងឆ្វេងពីឧទាហរណ៍ក្នុងអក្សរកាត់នេះ។ សម្រាប់ច្បាប់ធម្មតា = 1.6 សម្រាប់ច្បាប់ឯកសណ្ឋាន = 1.3 សម្រាប់ច្បាប់ពីរចំណុច = 1 (នេះគឺជាចំណងទាបសម្រាប់)។ ដូច្នេះដើម្បីធានាចម្ងាយ (នៅក្នុងម៉ែត្រ Kolmogorov) ទៅនឹងការចែកចាយធម្មតាមិនលើសពី 0.01 សម្រាប់ការចែកចាយ "មិនជោគជ័យ" យ៉ាងហោចណាស់ k 0 លក្ខខណ្ឌ, កន្លែងណា

នៅក្នុង adders ដែលប្រើជាទូទៅ ពាក្យគឺតូចជាងច្រើន។ បង្រួមថ្នាក់នៃការចែកចាយដែលអាចមាន មនុស្សម្នាក់អាចទទួលបាន ដូចដែលបានបង្ហាញក្នុងអក្សរកាត់ ដែលជាការបញ្ចូលគ្នាលឿនជាង ប៉ុន្តែនៅទីនេះ ទ្រឹស្តីមិនទាន់បញ្ចូលគ្នាជាមួយការអនុវត្តនៅឡើយ។ លើសពីនេះទៀតវាមិនច្បាស់ទេថាតើភាពជិតស្និទ្ធនៃការចែកចាយទៅធម្មតា (នៅក្នុងម៉ែត្រជាក់លាក់មួយ) ក៏ធានានូវភាពជិតស្និទ្ធនៃការចែកចាយស្ថិតិដែលបានសាងសង់ពីអថេរចៃដន្យជាមួយនឹងការចែកចាយនេះទៅនឹងការចែកចាយស្ថិតិដែលត្រូវគ្នានឹងការសង្កេតធម្មតា។ ជាក់ស្តែង សម្រាប់ស្ថិតិជាក់លាក់នីមួយៗ ការសិក្សាទ្រឹស្តីពិសេសគឺត្រូវការជាចាំបាច់។ នេះគឺជាការសន្និដ្ឋានដែលអ្នកនិពន្ធនៃ monograph មកដល់។ នៅក្នុងបញ្ហាបដិសេធទាំងស្រុង ចម្លើយគឺ៖ "មិនផ្តល់" (សូមមើលខាងក្រោម)។

ចំណាំថាលទ្ធផលនៃការវាស់វែងពិតប្រាកដណាមួយត្រូវបានកត់ត្រាដោយប្រើចំនួនខ្ទង់ទសភាគកំណត់ ដែលជាធម្មតាតូច (2-5) ដូច្នេះវាត្រូវបានគេណែនាំឱ្យធ្វើគំរូទិន្នន័យពិតណាមួយដោយប្រើតែអថេរចៃដន្យដាច់ដោយឡែកដែលយកចំនួនកំណត់នៃតម្លៃ។ ការចែកចាយធម្មតាគឺគ្រាន់តែជាការប៉ាន់ស្មាននៃការចែកចាយពិតប្រាកដប៉ុណ្ណោះ។ ដូច្នេះឧទាហរណ៍ទិន្នន័យនៃការសិក្សាជាក់លាក់មួយដែលបានផ្តល់ឱ្យនៅក្នុងការងារយកតម្លៃពី 1.0 ដល់ 2.2, i.e. មានតម្លៃសរុបចំនួន 13 ។ វាធ្វើតាមគោលការណ៍ Dirichlet ដែលនៅចំណុចខ្លះមុខងារចែកចាយដែលបានសាងសង់យោងទៅតាមទិន្នន័យការងារខុសគ្នាពីមុខងារចែកចាយធម្មតាដែលនៅជិតបំផុតដោយយ៉ាងហោចណាស់ 1/26, i.e. ដោយ 0.04 ។ លើសពីនេះ វាច្បាស់ណាស់ថាសម្រាប់ការចែកចាយធម្មតានៃអថេរចៃដន្យ ប្រូបាប៊ីលីតេនៃការធ្លាក់ចូលទៅក្នុងសំណុំលេខទសភាគដាច់ដោយឡែកដែលមានលេខទសភាគដែលបានផ្តល់ឱ្យគឺ 0 ។

វាធ្វើតាមពីខាងលើដែលលទ្ធផលនៃការវាស់វែងនិងជាទូទៅទិន្នន័យស្ថិតិមានលក្ខណៈសម្បត្តិដែលនាំឱ្យការពិតដែលថាពួកគេគួរតែត្រូវបានយកគំរូតាមអថេរចៃដន្យជាមួយនឹងការចែកចាយដែលមានភាពខុសគ្នាច្រើនឬតិចជាងពីធម្មតា។ ក្នុងករណីភាគច្រើន ការចែកចាយមានភាពខុសប្លែកគ្នាយ៉ាងខ្លាំងពីការចែកចាយធម្មតា ម្យ៉ាងវិញទៀតការចែកចាយធម្មតាតាមមើលទៅអាចចាត់ទុកថាជាប្រភេទនៃការប្រហាក់ប្រហែល ប៉ុន្តែវាមិនដែលចៃដន្យពេញលេញនោះទេ។ នេះបង្កប់ន័យទាំងតម្រូវការក្នុងការសិក្សាអំពីលក្ខណៈសម្បត្តិនៃនីតិវិធីស្ថិតិបុរាណនៅក្នុងគំរូប្រូបាប៊ីលីកដែលមិនមែនជាបុរាណ (ស្រដៀងទៅនឹងអ្វីដែលបានធ្វើខាងក្រោមសម្រាប់លក្ខណៈវិនិច្ឆ័យរបស់សិស្ស) និងតម្រូវការដើម្បីអភិវឌ្ឍស្ថេរភាព (ដោយគិតគូរពីវត្តមាននៃគម្លាតពីភាពធម្មតា) និង nonparametric រួមទាំងនីតិវិធីដោយមិនមានការចែកចាយ ការណែនាំដ៏ធំទូលាយរបស់ពួកគេទៅក្នុងការអនុវត្តនៃដំណើរការទិន្នន័យស្ថិតិ។

អក្សរសិល្ប៍

1. Novitsky P.V., Zograf I.A. ការប៉ាន់ប្រមាណនៃកំហុសនៅក្នុងលទ្ធផលនៃការវាស់វែង។ - L. : Energoatomizdat, 1985. - 248 ទំ។

2. Novitsky P.V. មូលដ្ឋានគ្រឹះនៃទ្រឹស្តីព័ត៌មាននៃឧបករណ៍វាស់។ - អិល។ : ថាមពល, 1968. - 248 ទំ។

3. Borovkov A.A. ទ្រឹស្តីប្រូបាប៊ីលីតេ។ - M. : Nauka, 1976. - 352 ទំ។

4. Petrov V.V. ផលបូកនៃអថេរចៃដន្យឯករាជ្យ។ - M. : Nauka, 1972. - 416 ទំ។

5. Zolotarev V.M. ទ្រឹស្តីទំនើបនៃការបូកសរុបនៃអថេរចៃដន្យឯករាជ្យ។ - M. : Nauka, 1986. - 416 ទំ។

6. Egorova L.A., Kharitonov Yu.S., Sokolovskaya L.V. // មន្ទីរពិសោធន៍រោងចក្រ។ - 1976. V.42 ។ លេខ 10 ។ ស ១២៣៧.

ពិចារណាអថេរចៃដន្យឯករាជ្យពីរ និងជាកម្មវត្ថុនៃច្បាប់ធម្មតា៖

, (12.6.1)

. (12.6.2)

វាតម្រូវឱ្យបង្កើតសមាសភាពនៃច្បាប់ទាំងនេះ ពោលគឺដើម្បីស្វែងរកច្បាប់ចែកចាយនៃបរិមាណ៖

យើងអនុវត្តរូបមន្តទូទៅ (12.5.3) សម្រាប់សមាសភាពនៃច្បាប់ចែកចាយ៖

. (12.6.3)

ប្រសិនបើយើងបើកតង្កៀបក្នុងនិទស្សន្តនៃអាំងតេក្រាល ហើយនាំយកពាក្យដូចៗគ្នា យើងទទួលបាន៖

,

;

;

.

ការជំនួសកន្សោមទាំងនេះទៅក្នុងរូបមន្ត (៩.១.៣) យើងបានជួបរួចហើយ៖

, (12.6.4)

បន្ទាប់ពីការផ្លាស់ប្តូរយើងទទួលបាន៖

, (12.6.5)

ហើយនេះមិនមែនជាច្បាប់ធម្មតាដែលមានមជ្ឈមណ្ឌលបែកខ្ញែកទេ។

និងគម្លាតស្តង់ដារ

. (12.6.7)

ការសន្និដ្ឋានដូចគ្នាអាចសម្រេចបានកាន់តែងាយស្រួល ដោយមានជំនួយពីហេតុផលគុណភាពខាងក្រោម។

ដោយមិនបើកតង្កៀប និងដោយមិនធ្វើការបំប្លែងនៅក្នុងអាំងតេក្រាល (12.6.3) យើងសន្និដ្ឋានភ្លាមៗថានិទស្សន្តគឺជាត្រីកោណមាត្រការ៉េទាក់ទងនឹងទម្រង់

,

ដែលតម្លៃមិនត្រូវបានរាប់បញ្ចូលក្នុងមេគុណទាល់តែសោះ វាត្រូវបានបញ្ចូលក្នុងមេគុណក្នុងដឺក្រេទីមួយ និងក្នុងមេគុណ - ការ៉េ។ ដោយគិតក្នុងចិត្ត និងអនុវត្តរូបមន្ត (12.6.4) យើងសន្និដ្ឋានថាមានអនុគមន៍អិចស្ប៉ូណង់ស្យែល និទស្សន្តដែលជាត្រីកោណមាត្រការ៉េទាក់ទងនឹង ហើយដង់ស៊ីតេនៃការចែកចាយនៃប្រភេទនេះត្រូវគ្នាទៅនឹងច្បាប់ធម្មតា។ ដូច្នេះ យើងឈានដល់ការសន្និដ្ឋានប្រកបដោយគុណភាពសុទ្ធសាធ៖ ច្បាប់នៃការចែកចាយបរិមាណត្រូវតែមានលក្ខណៈធម្មតា។

ដើម្បីស្វែងរកប៉ារ៉ាម៉ែត្រនៃច្បាប់នេះ - និង - យើងប្រើទ្រឹស្តីបទនៃការបន្ថែមនៃការរំពឹងទុកគណិតវិទ្យា និងទ្រឹស្តីបទនៃការបន្ថែមនៃការប្រែប្រួល។ នេះបើយោងតាមទ្រឹស្តីបទបន្ថែមនៃការរំពឹងទុកគណិតវិទ្យា

យោងទៅតាមទ្រឹស្តីបទបន្ថែមវ៉ារ្យង់

រូបមន្តពេលណា (12.6.7) ដូចខាងក្រោម។

ឆ្លងកាត់ពីគម្លាតស្តង់ដារទៅគម្លាតដែលប្រហែលជាសមាមាត្រទៅនឹងពួកវា យើងទទួលបាន៖

ដូច្នេះហើយ យើងបានឈានទៅដល់ក្បួនដូចខាងក្រោម៖ នៅពេលដែលច្បាប់ធម្មតាត្រូវបានផ្សំឡើង ច្បាប់ធម្មតាមួយត្រូវបានទទួលម្តងទៀត ហើយការរំពឹងទុក និងបំរែបំរួលតាមគណិតវិទ្យា (ឬគម្លាតប្រហែលការ៉េ) ត្រូវបានសង្ខេប។

ច្បាប់សមាសភាពសម្រាប់ច្បាប់ធម្មតាអាចត្រូវបានគេធ្វើជាទូទៅចំពោះករណីនៃចំនួនអថេរចៃដន្យឯករាជ្យ។

ប្រសិនបើមានអថេរចៃដន្យឯករាជ្យ៖

ជាកម្មវត្ថុនៃច្បាប់ធម្មតាជាមួយនឹងមជ្ឈមណ្ឌលរាយប៉ាយ

និងគម្លាតស្តង់ដារ

,

បន្ទាប់មកតម្លៃ

ក៏គោរពច្បាប់ធម្មតាជាមួយនឹងប៉ារ៉ាម៉ែត្រ

ជំនួសឱ្យរូបមន្ត (12.6.12) អ្នកអាចប្រើរូបមន្តសមមូល៖

ប្រសិនបើប្រព័ន្ធនៃអថេរចៃដន្យត្រូវបានចែកចាយយោងទៅតាមច្បាប់ធម្មតា ប៉ុន្តែបរិមាណគឺអាស្រ័យ នោះវាងាយស្រួលក្នុងការបញ្ជាក់ដូចពីមុន ដោយផ្អែកលើរូបមន្តទូទៅ (12.5.1) ដែលច្បាប់ចែកចាយបរិមាណ

ក៏មានច្បាប់ធម្មតាដែរ។ មជ្ឈមណ្ឌលរាយប៉ាយនៅតែត្រូវបានបន្ថែមដោយពិជគណិត ប៉ុន្តែសម្រាប់គម្លាតស្តង់ដារ ច្បាប់កាន់តែស្មុគស្មាញ៖

, (12.6.14)

តើមេគុណទំនាក់ទំនងនៃតម្លៃ និង .

នៅពេលបន្ថែមអថេរចៃដន្យអាស្រ័យជាច្រើន ដែលសរុបទាំងអស់របស់ពួកគេគោរពតាមច្បាប់ធម្មតា ច្បាប់ចែកចាយនៃផលបូកក៏ប្រែទៅជាធម្មតាជាមួយនឹងប៉ារ៉ាម៉ែត្រ

, (12.6.16)

ឬគម្លាតដែលអាចកើតមាន

, (12.6.17)

តើមេគុណជាប់ទាក់ទងគ្នានៃតម្លៃនៅឯណា ហើយការបូកសរុបពង្រីកដល់ការផ្សំជាគូផ្សេងៗគ្នានៃតម្លៃ។

យើងបានឃើញទ្រព្យសម្បត្តិដ៏សំខាន់នៃច្បាប់ធម្មតា៖ នៅពេលដែលច្បាប់ធម្មតាត្រូវបានបញ្ចូលគ្នា នោះច្បាប់មួយទៀតទទួលបានច្បាប់ធម្មតា។ នេះគឺជាអ្វីដែលគេហៅថា "ទ្រព្យសម្បត្តិស្ថេរភាព" ។ ច្បាប់នៃការចែកចាយត្រូវបានគេនិយាយថាមានស្ថេរភាព ប្រសិនបើដោយបង្កើតច្បាប់ពីរនៃប្រភេទនេះ ច្បាប់នៃប្រភេទដូចគ្នាត្រូវបានទទួលម្តងទៀត។ យើងបានបង្ហាញខាងលើថាច្បាប់ធម្មតាមានស្ថេរភាព។ ច្បាប់ចែកចាយតិចតួចណាស់ដែលមានទ្រព្យសម្បត្តិនៃស្ថេរភាព។ នៅក្នុងអត្ថបទមុន (ឧទាហរណ៍ទី 2) យើងបានធ្វើឱ្យប្រាកដថា ជាឧទាហរណ៍ ច្បាប់នៃដង់ស៊ីតេឯកសណ្ឋានគឺមិនស្ថិតស្ថេរ៖ នៅពេលបង្កើតច្បាប់ពីរនៃដង់ស៊ីតេឯកសណ្ឋាននៅក្នុងផ្នែកពី 0 ទៅ 1 យើងទទួលបានច្បាប់របស់ Simpson ។

ស្ថេរភាពនៃច្បាប់ធម្មតាគឺជាលក្ខខណ្ឌសំខាន់មួយសម្រាប់ការអនុវត្តយ៉ាងទូលំទូលាយនៅក្នុងការអនុវត្ត។ ទោះជាយ៉ាងណាក៏ដោយ ទ្រព្យសម្បត្តិនៃស្ថេរភាព បន្ថែមពីលើលក្ខណៈធម្មតា ក៏មានកម្មសិទ្ធិដោយច្បាប់ចែកចាយមួយចំនួនផ្សេងទៀត។ លក្ខណៈពិសេសមួយនៃច្បាប់ធម្មតាគឺថានៅពេលដែលចំនួនច្រើនគ្រប់គ្រាន់នៃច្បាប់ចែកចាយតាមអំពើចិត្តត្រូវបានផ្សំឡើង នោះច្បាប់សរុបប្រែទៅជាជិតនឹងច្បាប់ធម្មតាដោយមិនគិតពីអ្វីដែលច្បាប់ចែកចាយនៃលក្ខខណ្ឌនោះទេ។ ជាឧទាហរណ៍ នេះអាចត្រូវបានបង្ហាញដោយបង្កើតច្បាប់ចំនួនបីនៃដង់ស៊ីតេឯកសណ្ឋាននៅក្នុងផ្នែកពី 0 ដល់ 1។ លទ្ធផលនៃច្បាប់ចែកចាយត្រូវបានបង្ហាញក្នុងរូបភព។ ១២.៦.១. ដូចដែលអាចមើលឃើញពីគំនូរក្រាហ្វនៃមុខងារគឺស្រដៀងនឹងក្រាហ្វនៃច្បាប់ធម្មតា។

៤.១. តើ​ការ​ចែក​ចាយ​ការ​សង្កេត​ជា​ញឹក​ញាប់​ឬ​ទេ?

នៅក្នុងគំរូសេដ្ឋកិច្ច និងសេដ្ឋកិច្ច-គណិតវិទ្យាដែលប្រើ ជាពិសេសក្នុងការសិក្សា និងការបង្កើនប្រសិទ្ធភាពនៃដំណើរការទីផ្សារ និងការគ្រប់គ្រង ការគ្រប់គ្រងសហគ្រាស និងតំបន់ ភាពត្រឹមត្រូវ និងស្ថិរភាពនៃដំណើរការបច្ចេកវិជ្ជា បញ្ហានៃភាពជឿជាក់ សុវត្ថិភាព រួមទាំងសុវត្ថិភាពបរិស្ថាន ដំណើរការនៃបច្ចេកទេស។ ឧបករណ៍ និងវត្ថុ ការអភិវឌ្ឍន៍នៃតារាងអង្គការជារឿយៗអនុវត្តគោលគំនិត និងលទ្ធផលនៃទ្រឹស្តីប្រូបាប៊ីលីតេ និងស្ថិតិគណិតវិទ្យា។ ក្នុងករណីនេះ គ្រួសារប៉ារ៉ាម៉ែត្រជាក់លាក់នៃការចែកចាយប្រូបាប៊ីលីតេត្រូវបានប្រើជាញឹកញាប់។ ការពេញនិយមបំផុតគឺការចែកចាយធម្មតា។ ការចែកចាយកំណត់ហេតុ-ធម្មតា ការចែកចាយអិចស្ប៉ូណង់ស្យែល ការចែកចាយហ្គាម៉ា ការចែកចាយ Weibull-Gnedenko ជាដើម ក៏ត្រូវបានប្រើប្រាស់ផងដែរ។

ជាក់ស្តែងវាតែងតែចាំបាច់ដើម្បីពិនិត្យមើលការអនុលោមតាមគំរូទៅនឹងការពិត។ មានសំណួរពីរ។ តើ​ការ​ចែកចាយ​ពិត​ខុស​ប្លែក​ពី​ការ​ប្រើ​ក្នុង​គំរូ​ឬ? តើភាពខុសគ្នានេះប៉ះពាល់ដល់ការសន្និដ្ឋានកម្រិតណា?

ខាងក្រោមនេះ ដោយប្រើឧទាហរណ៍នៃការចែកចាយធម្មតា និងវិធីសាស្រ្តសម្រាប់ការបដិសេធការសង្កេតខុសគ្នាខ្លាំង (outliers) ដោយផ្អែកលើវា វាត្រូវបានបង្ហាញថាការចែកចាយពិតប្រាកដស្ទើរតែតែងតែខុសគ្នាពីអ្វីដែលរួមបញ្ចូលនៅក្នុងគ្រួសារប៉ារ៉ាម៉ែត្របុរាណ និងគម្លាតដែលមានស្រាប់ពីគ្រួសារដែលបានផ្តល់ឱ្យ។ ធ្វើការសន្និដ្ឋានមិនត្រឹមត្រូវ ក្នុងករណីដែលកំពុងពិចារណាអំពីការបដិសេធដោយផ្អែកលើការប្រើប្រាស់គ្រួសារទាំងនេះ។

តើមានហេតុផលណាមួយដើម្បីសន្មតថាជាអាទិភាពនៃភាពធម្មតានៃលទ្ធផលរង្វាស់ទេ?

ជួនកាលវាត្រូវបានប្រកែកថានៅក្នុងករណីនៅពេលដែលកំហុសរង្វាស់ (ឬអថេរចៃដន្យផ្សេងទៀត) ត្រូវបានកំណត់ជាលទ្ធផលនៃសកម្មភាពប្រមូលផ្តុំនៃកត្តាតូចៗជាច្រើនបន្ទាប់មកដោយសារទ្រឹស្តីបទដែនកំណត់កណ្តាល (CLT) នៃទ្រឹស្តីប្រូបាប៊ីលីតេ តម្លៃនេះគឺ ប្រហាក់ប្រហែលល្អ (ដោយការចែកចាយ) ដោយអថេរចៃដន្យធម្មតា។ សេចក្តីថ្លែងការណ៍នេះជាការពិត ប្រសិនបើកត្តាតូចៗធ្វើសកម្មភាពបន្ថែម និងឯករាជ្យពីគ្នាទៅវិញទៅមក។ ប្រសិនបើពួកវាធ្វើសកម្មភាពពហុគុណ នោះដោយសារតែ CLT ដូចគ្នា វាចាំបាច់ក្នុងការប៉ាន់ស្មានដោយការចែកចាយកំណត់ហេតុធម្មតា។ នៅក្នុងបញ្ហាដែលបានអនុវត្ត ជាធម្មតាវាមិនអាចទៅរួចទេក្នុងការបញ្ជាក់ពីការបន្ថែមជាជាងការគុណនៃសកម្មភាពនៃកត្តាតូចៗ។ ប្រសិនបើការពឹងផ្អែកមានលក្ខណៈទូទៅ មិនត្រូវបានកាត់បន្ថយទៅជាទម្រង់បន្ថែម ឬពហុគុណទេ ហើយគ្មានហេតុផលដើម្បីទទួលយកគំរូដែលផ្តល់អិចស្ប៉ូណង់ស្យែល Weibull-Gnedenko ហ្គាម៉ា ឬការចែកចាយផ្សេងទៀតទេ ជាក់ស្តែងគ្មានអ្វីត្រូវបានគេដឹងអំពីការចែកចាយ អថេរចៃដន្យចុងក្រោយ លើកលែងតែលក្ខណៈសម្បត្តិក្នុងគណិតវិទ្យា ដូចជាភាពទៀងទាត់។

នៅពេលដំណើរការទិន្នន័យជាក់លាក់ ជួនកាលគេជឿថាកំហុសក្នុងការវាស់វែងមានការចែកចាយធម្មតា។ នៅលើការសន្មត់នៃភាពធម្មតា គំរូបុរាណនៃការតំរែតំរង់ ការបែកខ្ចាត់ខ្ចាយ ការវិភាគកត្តា គំរូម៉ែត្រត្រូនិចត្រូវបានបង្កើតឡើង ដែលនៅតែអាចរកឃើញទាំងនៅក្នុងឯកសារបទប្បញ្ញត្តិ និងបច្ចេកទេសក្នុងស្រុក និងក្នុងស្តង់ដារអន្តរជាតិ។ គំរូសម្រាប់ការគណនាកម្រិតអតិបរមាដែលអាចសម្រេចបាននៃលក្ខណៈជាក់លាក់ដែលប្រើក្នុងការរចនាប្រព័ន្ធសម្រាប់ធានាសុវត្ថិភាពនៃដំណើរការនៃរចនាសម្ព័ន្ធសេដ្ឋកិច្ច ឧបករណ៍បច្ចេកទេស និងវត្ថុគឺផ្អែកលើការសន្មត់ដូចគ្នា។ ទោះយ៉ាងណាក៏ដោយ មិនមានមូលដ្ឋានទ្រឹស្តីសម្រាប់ការសន្មត់បែបនេះទេ។ វាចាំបាច់ក្នុងការសិក្សាពិសោធន៍ការចែកចាយនៃកំហុស។

តើលទ្ធផលពិសោធន៍បង្ហាញអ្វីខ្លះ? សេចក្តីសង្ខេបដែលបានផ្តល់ឱ្យក្នុងអក្សរកាត់អនុញ្ញាតឱ្យយើងបញ្ជាក់ថាក្នុងករណីភាគច្រើនការចែកចាយកំហុសនៃការវាស់វែងខុសពីធម្មតា។ ដូច្នេះនៅវិទ្យាស្ថាន Machine-Electrotechnical Institute (Varna, Bulgaria) ការចែកចាយកំហុសក្នុងការក្រិតតាមខ្នាតសម្រាប់មាត្រដ្ឋាននៃឧបករណ៍វាស់អគ្គិសនីអាណាឡូកត្រូវបានសិក្សា។ ឧបករណ៍ដែលផលិតនៅប្រទេសឆេកូស្លូវ៉ាគីសហភាពសូវៀតនិងប៊ុលហ្គារីត្រូវបានសិក្សា។ ច្បាប់ចែកចាយកំហុសបានប្រែទៅជាដូចគ្នា។ វាមានដង់ស៊ីតេ

យើងបានវិភាគទិន្នន័យលើប៉ារ៉ាម៉ែត្រនៃការចែកចាយជាក់ស្តែងចំនួន 219 នៃកំហុស ដែលសិក្សាដោយអ្នកនិពន្ធផ្សេងៗគ្នា នៅពេលវាស់បរិមាណអគ្គិសនី និងមិនមែនអគ្គិសនីជាមួយនឹងឧបករណ៍ជាច្រើនប្រភេទ (អគ្គិសនី)។ ជាលទ្ធផលនៃការសិក្សានេះវាបានប្រែក្លាយថាការចែកចាយ 111, i.e. ប្រហែល 50% ជាកម្មសិទ្ធិរបស់ថ្នាក់ចែកចាយដែលមានដង់ស៊ីតេ

តើប៉ារ៉ាម៉ែត្រដឺក្រេនៅឯណា; - ការផ្លាស់ប្តូរប៉ារ៉ាម៉ែត្រ; - ប៉ារ៉ាម៉ែត្រមាត្រដ្ឋាន; - មុខងារហ្គាម៉ានៃអាគុយម៉ង់;

(សង់​ទី​ម៉ែ​ត។ ); 63 ការចែកចាយ, i.e. 30% មានដង់ស៊ីតេផ្ទៃរាបស្មើ ជាមួយនឹងជម្រាលដ៏វែង ទន់ភ្លន់ ហើយមិនអាចពិពណ៌នាថាជាធម្មតា ឬឧទាហរណ៍ និទស្សន្ត។ ការចែកចាយចំនួន 45 ដែលនៅសល់បានប្រែទៅជា bimodal ។

នៅក្នុងសៀវភៅរបស់អ្នកជំនាញខាងម៉ែត្រដ៏ល្បីល្បាញ prof ។ PV Novitsky បង្ហាញពីលទ្ធផលនៃការសិក្សាអំពីច្បាប់នៃការចែកចាយនៃប្រភេទផ្សេងៗនៃកំហុសរង្វាស់។ គាត់បានសិក្សាពីការចែកចាយកំហុសនៃឧបករណ៍អេឡិចត្រូនិចនៅលើស្នូល ឧបករណ៍អេឡិចត្រូនិកសម្រាប់វាស់សីតុណ្ហភាព និងកម្លាំង ឧបករណ៍ឌីជីថលជាមួយនឹងតុល្យភាពដោយដៃ។ បរិមាណនៃគំរូទិន្នន័យពិសោធន៍សម្រាប់គំរូនីមួយៗគឺ 100-400 ការអាន។ វាប្រែថាការចែកចាយ 46 ក្នុងចំណោម 47 គឺខុសគ្នាយ៉ាងខ្លាំងពីធម្មតា។ រូបរាងនៃការចែកចាយនៃកំហុសនៅក្នុង 25 ច្បាប់ចម្លងនៃវ៉ុលឌីជីថល Shch-1411 នៅ 10 ចំណុចនៃជួរត្រូវបានសិក្សា។ លទ្ធផលគឺស្រដៀងគ្នា។ ព័ត៌មានបន្ថែមមាននៅក្នុង monograph ។

មន្ទីរពិសោធន៍គណិតវិទ្យាអនុវត្តនៃសាកលវិទ្យាល័យរដ្ឋ Tartu បានវិភាគគំរូចំនួន 2,500 ពីបណ្ណសារនៃទិន្នន័យស្ថិតិពិតប្រាកដ។ ក្នុង 92% សម្មតិកម្មភាពធម្មតាត្រូវតែបដិសេធ។

ការពិពណ៌នាខាងលើនៃទិន្នន័យពិសោធន៍បង្ហាញថាកំហុសនៃការវាស់វែងនៅក្នុងករណីភាគច្រើនមានការចែកចាយដែលខុសពីធម្មតា។ ជាពិសេស នេះមានន័យថា កម្មវិធីភាគច្រើននៃការធ្វើតេស្ត t-test របស់សិស្ស ការវិភាគតំរែតំរង់បុរាណ និងវិធីសាស្រ្តស្ថិតិផ្សេងទៀតដែលផ្អែកលើទ្រឹស្តីធម្មតា គឺនិយាយយ៉ាងតឹងរ៉ឹង មិនមែនសមហេតុផលទេ ចាប់តាំងពី axiom មូលដ្ឋាននៃភាពធម្មតានៃការចែកចាយនៃចៃដន្យដែលត្រូវគ្នា។ អថេរ​គឺ​មិន​ត្រឹមត្រូវ។

ជាក់ស្តែង ដើម្បីបង្ហាញអំពីភាពត្រឹមត្រូវ ឬការផ្លាស់ប្តូរដោយសមហេតុផលនូវការអនុវត្តបច្ចុប្បន្ននៃការវិភាគទិន្នន័យស្ថិតិ ចាំបាច់ត្រូវសិក្សាពីលក្ខណៈសម្បត្តិនៃនីតិវិធីវិភាគទិន្នន័យនៅក្នុងកម្មវិធី "ខុសច្បាប់"។ ការសិក្សាអំពីនីតិវិធីនៃការបដិសេធបានបង្ហាញថាពួកគេមិនស្ថិតស្ថេរខ្លាំងចំពោះគម្លាតពីភាពធម្មតា ដូច្នេះហើយវាមិនត្រូវបានគេណែនាំឱ្យប្រើពួកវាសម្រាប់ដំណើរការទិន្នន័យពិតប្រាកដ (សូមមើលខាងក្រោម)។ ដូច្នេះ គេមិនអាចអះអាងបានទេថា នីតិវិធីដែលធ្វើឡើងតាមអំពើចិត្ត មានស្ថេរភាពប្រឆាំងនឹងការបង្វែរពីភាពប្រក្រតី។

ពេលខ្លះវាត្រូវបានស្នើឡើងដើម្បីពិនិត្យមើលភាពធម្មតាមុនពេលអនុវត្ត ឧទាហរណ៍ ការធ្វើតេស្តរបស់សិស្សសម្រាប់ភាពដូចគ្នានៃគំរូពីរ។ ទោះបីជាមានលក្ខណៈវិនិច្ឆ័យជាច្រើនសម្រាប់រឿងនេះក៏ដោយ ការធ្វើតេស្តសម្រាប់ភាពធម្មតាគឺជានីតិវិធីស្ថិតិដែលស្មុគស្មាញ និងប្រើប្រាស់ពេលវេលាច្រើនជាងការធ្វើតេស្តសម្រាប់ភាពដូចគ្នា (ទាំងស្ថិតិប្រភេទសិស្ស និងជាមួយនឹងការធ្វើតេស្តដែលមិនមែនជាប៉ារ៉ាម៉ែត្រ)។ ការសង្កេតមួយចំនួនធំគឺត្រូវបានទាមទារដើម្បីបង្កើតភាពធម្មតាដែលអាចទុកចិត្តបានគ្រប់គ្រាន់។ ដូច្នេះដើម្បីធានាថាមុខងារចែកចាយនៃលទ្ធផលនៃការសង្កេតខុសពីធម្មតាមួយចំនួនមិនលើសពី 0.01 (សម្រាប់តម្លៃណាមួយនៃអាគុយម៉ង់) ប្រហែល 2500 ការសង្កេតត្រូវបានទាមទារ។ នៅក្នុងការសិក្សាផ្នែកសេដ្ឋកិច្ច បច្ចេកទេស ជីវវេជ្ជសាស្ត្រ និងការអនុវត្តផ្សេងៗទៀត ចំនួននៃការសង្កេតគឺតិចជាងគួរឱ្យកត់សម្គាល់។ នេះជាការពិតជាពិសេសសម្រាប់ទិន្នន័យដែលប្រើក្នុងការសិក្សាអំពីបញ្ហាទាក់ទងនឹងការធានាសុវត្ថិភាពនៃការដំណើរការនៃរចនាសម្ព័ន្ធសេដ្ឋកិច្ច និងវត្ថុបច្ចេកទេស។

ពេលខ្លះពួកគេព្យាយាមប្រើ CCT ដើម្បីប៉ាន់ស្មានការចែកចាយនៃកំហុសទៅធម្មតា រួមទាំងការបន្ថែមពិសេសនៅក្នុងគ្រោងការណ៍បច្ចេកវិទ្យានៃឧបករណ៍វាស់។ ចូរយើងវាយតម្លៃអត្ថប្រយោជន៍នៃវិធានការនេះ។ អនុញ្ញាតឱ្យមាន Z 1 , Z 2 ,…, Z ក- អថេរបែងចែកចៃដន្យដោយឯករាជ្យដែលមានមុខងារចែកចាយ H = H(x)បែបនោះ ពិចារណា

សូចនាករនៃភាពជិតទៅនឹងភាពធម្មតាដែលផ្តល់ដោយអ្នកបន្ថែមគឺ

វិសមភាពខាងស្ដាំនៅក្នុងទំនាក់ទំនងចុងក្រោយកើតឡើងពីការប៉ាន់ប្រមាណនៃថេរនៅក្នុងវិសមភាព Berry-Esseen ដែលទទួលបាននៅក្នុងសៀវភៅ និងមួយខាងឆ្វេងពីឧទាហរណ៍ក្នុងអក្សរកាត់នេះ។ សម្រាប់ច្បាប់ធម្មតា = 1.6 សម្រាប់ច្បាប់ឯកសណ្ឋាន = 1.3 សម្រាប់ច្បាប់ពីរចំណុច = 1 (នេះគឺជាចំណងទាបសម្រាប់ )។ ដូច្នេះដើម្បីធានាចម្ងាយ (នៅក្នុងម៉ែត្រ Kolmogorov) ទៅនឹងការចែកចាយធម្មតាមិនលើសពី 0.01 សម្រាប់ការចែកចាយ "មិនជោគជ័យ" យ៉ាងហោចណាស់ k ០លក្ខខណ្ឌ, កន្លែងណា

នៅក្នុង adders ដែលប្រើជាទូទៅ ពាក្យគឺតូចជាងច្រើន។ បង្រួមថ្នាក់នៃការចែកចាយដែលអាចមាន មនុស្សម្នាក់អាចទទួលបាន ដូចដែលបានបង្ហាញក្នុងអក្សរកាត់ ដែលជាការបញ្ចូលគ្នាលឿនជាង ប៉ុន្តែនៅទីនេះ ទ្រឹស្តីមិនទាន់បញ្ចូលគ្នាជាមួយការអនុវត្តនៅឡើយ។ លើសពីនេះទៀតវាមិនច្បាស់ទេថាតើភាពជិតស្និទ្ធនៃការចែកចាយទៅធម្មតា (នៅក្នុងម៉ែត្រជាក់លាក់មួយ) ក៏ធានានូវភាពជិតស្និទ្ធនៃការចែកចាយស្ថិតិដែលបានសាងសង់ពីអថេរចៃដន្យជាមួយនឹងការចែកចាយនេះទៅនឹងការចែកចាយស្ថិតិដែលត្រូវគ្នានឹងការសង្កេតធម្មតា។ ជាក់ស្តែង សម្រាប់ស្ថិតិជាក់លាក់នីមួយៗ ការសិក្សាទ្រឹស្តីពិសេសគឺត្រូវការជាចាំបាច់។ នេះគឺជាការសន្និដ្ឋានដែលអ្នកនិពន្ធនៃ monograph មកដល់។ នៅក្នុងបញ្ហាបដិសេធទាំងស្រុង ចម្លើយគឺ៖ "មិនផ្តល់" (សូមមើលខាងក្រោម)។

ចំណាំថាលទ្ធផលនៃការវាស់វែងពិតប្រាកដណាមួយត្រូវបានកត់ត្រាដោយប្រើចំនួនខ្ទង់ទសភាគកំណត់ ដែលជាធម្មតាតូច (2-5) ដូច្នេះវាត្រូវបានគេណែនាំឱ្យធ្វើគំរូទិន្នន័យពិតណាមួយដោយប្រើតែអថេរចៃដន្យដាច់ដោយឡែកដែលយកចំនួនកំណត់នៃតម្លៃ។ ការចែកចាយធម្មតាគឺគ្រាន់តែជាការប៉ាន់ស្មាននៃការចែកចាយពិតប្រាកដប៉ុណ្ណោះ។ ដូច្នេះឧទាហរណ៍ទិន្នន័យនៃការសិក្សាជាក់លាក់មួយដែលបានផ្តល់ឱ្យនៅក្នុងការងារយកតម្លៃពី 1.0 ដល់ 2.2, i.e. មានតម្លៃសរុបចំនួន 13 ។ វាធ្វើតាមគោលការណ៍ Dirichlet ដែលនៅចំណុចខ្លះមុខងារចែកចាយដែលបានសាងសង់យោងទៅតាមទិន្នន័យការងារខុសគ្នាពីមុខងារចែកចាយធម្មតាដែលនៅជិតបំផុតដោយយ៉ាងហោចណាស់ 1/26, i.e. ដោយ 0.04 ។ លើសពីនេះ វាច្បាស់ណាស់ថាសម្រាប់ការចែកចាយធម្មតានៃអថេរចៃដន្យ ប្រូបាប៊ីលីតេនៃការធ្លាក់ចូលទៅក្នុងសំណុំលេខទសភាគដាច់ដោយឡែកដែលមានលេខទសភាគដែលបានផ្តល់ឱ្យគឺ 0 ។

វាធ្វើតាមពីខាងលើដែលលទ្ធផលនៃការវាស់វែងនិងជាទូទៅទិន្នន័យស្ថិតិមានលក្ខណៈសម្បត្តិដែលនាំឱ្យការពិតដែលថាពួកគេគួរតែត្រូវបានយកគំរូតាមអថេរចៃដន្យជាមួយនឹងការចែកចាយដែលមានភាពខុសគ្នាច្រើនឬតិចជាងពីធម្មតា។ ក្នុងករណីភាគច្រើន ការចែកចាយមានភាពខុសប្លែកគ្នាយ៉ាងខ្លាំងពីការចែកចាយធម្មតា ម្យ៉ាងវិញទៀតការចែកចាយធម្មតាតាមមើលទៅអាចចាត់ទុកថាជាប្រភេទនៃការប្រហាក់ប្រហែល ប៉ុន្តែវាមិនដែលចៃដន្យពេញលេញនោះទេ។ នេះបង្កប់ន័យទាំងតម្រូវការក្នុងការសិក្សាអំពីលក្ខណៈសម្បត្តិនៃនីតិវិធីស្ថិតិបុរាណនៅក្នុងគំរូប្រូបាប៊ីលីកដែលមិនមែនជាបុរាណ (ស្រដៀងទៅនឹងអ្វីដែលបានធ្វើខាងក្រោមសម្រាប់លក្ខណៈវិនិច្ឆ័យរបស់សិស្ស) និងតម្រូវការដើម្បីអភិវឌ្ឍស្ថេរភាព (ដោយគិតគូរពីវត្តមាននៃគម្លាតពីភាពធម្មតា) និង nonparametric រួមទាំងនីតិវិធីដោយមិនមានការចែកចាយ ការណែនាំដ៏ធំទូលាយរបស់ពួកគេទៅក្នុងការអនុវត្តនៃដំណើរការទិន្នន័យស្ថិតិ។

ការពិចារណាដែលបានលុបចោលនៅទីនេះសម្រាប់គ្រួសារប៉ារ៉ាម៉ែត្រផ្សេងទៀតនាំឱ្យមានការសន្និដ្ឋានស្រដៀងគ្នា។ លទ្ធផលអាចត្រូវបានបង្កើតដូចខាងក្រោម។ ការចែកចាយទិន្នន័យពិតស្ទើរតែមិនដែលជាកម្មសិទ្ធិរបស់ក្រុមគ្រួសារប៉ារ៉ាម៉ែត្រជាក់លាក់ណាមួយឡើយ។ ការចែកចាយពិតប្រាកដតែងតែខុសពីការចែកចាយដែលរួមបញ្ចូលក្នុងគ្រួសារប៉ារ៉ាមេត។ ភាពខុសគ្នាអាចធំឬតូច ប៉ុន្តែវាតែងតែមាន។ ចូរយើងព្យាយាមស្វែងយល់ថាតើភាពខុសគ្នាទាំងនេះមានសារៈសំខាន់យ៉ាងណាសម្រាប់ការវិភាគសេដ្ឋកិច្ច។

នៅក្នុងទ្រឹស្តីប្រូបាប៊ីលីតេ និងស្ថិតិគណិតវិទ្យា ក្រុមគ្រួសារប៉ារ៉ាមេតផ្សេងៗនៃការចែកចាយអថេរចៃដន្យលេខត្រូវបានពិចារណា។ ពោលគឺក្រុមគ្រួសារនៃការចែកចាយធម្មតា លោការីតធម្មតា និទស្សន្ត ការបែងចែកហ្គាម៉ា ការចែកចាយ Weibull-Gnedenko ជាដើម។ ពួកគេទាំងអស់គឺអាស្រ័យលើប៉ារ៉ាម៉ែត្រមួយ ពីរ ឬបី។ ដូច្នេះ ដើម្បីពណ៌នាឱ្យបានពេញលេញអំពីការចែកចាយ វាគ្រប់គ្រាន់ដើម្បីដឹង ឬប៉ាន់ស្មានចំនួនមួយ ពីរ ឬបី។ មានផាសុកភាពណាស់។ ដូច្នេះទ្រឹស្តីប៉ារ៉ាម៉ែត្រនៃស្ថិតិគណិតវិទ្យាត្រូវបានបង្កើតឡើងយ៉ាងទូលំទូលាយដែលក្នុងនោះវាត្រូវបានគេសន្មត់ថាការចែកចាយលទ្ធផលនៃការសង្កេតជាកម្មសិទ្ធិរបស់គ្រួសារប៉ារ៉ាម៉ែត្រមួយឬផ្សេងទៀត។

ជាអកុសល គ្រួសារប៉ារ៉ាម៉ែត្រមាននៅក្នុងគំនិតរបស់អ្នកនិពន្ធសៀវភៅសិក្សាអំពីទ្រឹស្តីប្រូបាប៊ីលីតេ និងស្ថិតិគណិតវិទ្យាប៉ុណ្ណោះ។ ពួកគេមិនមាននៅក្នុងជីវិតពិតទេ។ ដូច្នេះ econometrics ប្រើជាចម្បងវិធីសាស្រ្តមិនមែន parametric ដែលក្នុងនោះការចែកចាយលទ្ធផលនៃការសង្កេតអាចមានទម្រង់បំពាន។

ដំបូង ដោយប្រើឧទាហរណ៍នៃការចែកចាយធម្មតា យើងនឹងពិភាក្សាលម្អិតបន្ថែមទៀតអំពីភាពមិនអាចទៅរួចនៃការប្រើប្រាស់ជាក់ស្តែងនៃគ្រួសារប៉ារ៉ាមេត ដើម្បីពិពណ៌នាអំពីការចែកចាយទិន្នន័យសេដ្ឋកិច្ចជាក់លាក់។ បន្ទាប់មកយើងនឹងវិភាគវិធីសាស្រ្តប៉ារ៉ាម៉ែត្រសម្រាប់ការបដិសេធការសង្កេតខាងក្រៅនិងបង្ហាញពីភាពមិនអាចទៅរួចនៃការប្រើប្រាស់ជាក់ស្តែងនៃវិធីសាស្រ្តមួយចំនួននៃស្ថិតិប៉ារ៉ាមេត ភាពខុសឆ្គងនៃការសន្និដ្ឋានដែលពួកគេនាំទៅដល់។ បន្ទាប់មកយើងនឹងវិភាគវិធីសាស្រ្តដែលមិនមែនជាប៉ារ៉ាម៉ែត្រនៃការប៉ាន់ប្រមាណទំនុកចិត្តនៃលក្ខណៈសំខាន់នៃអថេរចៃដន្យលេខ - ការរំពឹងទុកគណិតវិទ្យា មធ្យម វ៉ារ្យង់ គម្លាតស្តង់ដារ។ មេគុណ​នៃ​ការ​បំ​រែ​បំ​រួល. ការបង្រៀននឹងបញ្ចប់ជាមួយនឹងវិធីសាស្រ្តសម្រាប់ពិនិត្យមើលភាពដូចគ្នានៃគំរូពីរ ឯករាជ្យ ឬពាក់ព័ន្ធ។

តើ​ការ​ចែក​ចាយ​ការ​សង្កេត​ជា​ញឹក​ញាប់​ឬ​ទេ?

នៅក្នុងគំរូសេដ្ឋកិច្ច និងសេដ្ឋកិច្ច-គណិតវិទ្យាដែលប្រើ ជាពិសេសក្នុងការសិក្សា និងការបង្កើនប្រសិទ្ធភាពនៃដំណើរការទីផ្សារ និងការគ្រប់គ្រង ការគ្រប់គ្រងសហគ្រាស និងតំបន់ ភាពត្រឹមត្រូវ និងស្ថិរភាពនៃដំណើរការបច្ចេកវិជ្ជា បញ្ហានៃភាពជឿជាក់ សុវត្ថិភាព រួមទាំងសុវត្ថិភាពបរិស្ថាន ដំណើរការនៃបច្ចេកទេស។ ឧបករណ៍ និងវត្ថុ ការអភិវឌ្ឍន៍នៃតារាងអង្គការជារឿយៗអនុវត្តគោលគំនិត និងលទ្ធផលនៃទ្រឹស្តីប្រូបាប៊ីលីតេ និងស្ថិតិគណិតវិទ្យា។ ក្នុងករណីនេះ គ្រួសារប៉ារ៉ាម៉ែត្រមួយ ឬមួយផ្សេងទៀតនៃការចែកចាយប្រូបាប៊ីលីតេត្រូវបានគេប្រើជាញឹកញាប់។ ពេញនិយមបំផុត។ ការចែកចាយធម្មតា។. ក៏ប្រើលោការីតផងដែរ។ ការចែកចាយធម្មតា។ការចែកចាយអិចស្ប៉ូណង់ស្យែល ការចែកចាយហ្គាម៉ា ការចែកចាយ Weibull-Gnedenko ។ល។

ជាក់ស្តែងវាតែងតែចាំបាច់ដើម្បីពិនិត្យមើលការអនុលោមតាមគំរូទៅនឹងការពិត។ មានសំណួរពីរ។ តើ​ការ​ចែកចាយ​ពិត​ខុស​ប្លែក​ពី​ការ​ប្រើ​ក្នុង​គំរូ​ឬ? តើភាពខុសគ្នានេះប៉ះពាល់ដល់ការសន្និដ្ឋានកម្រិតណា?

ខាងក្រោមនេះ ដោយប្រើឧទាហរណ៍នៃការចែកចាយធម្មតា និងវិធីសាស្រ្តសម្រាប់ការបដិសេធការសង្កេតខុសគ្នាខ្លាំង (outliers) ដោយផ្អែកលើវា វាត្រូវបានបង្ហាញថាការចែកចាយពិតប្រាកដស្ទើរតែតែងតែខុសគ្នាពីអ្វីដែលរួមបញ្ចូលនៅក្នុងគ្រួសារប៉ារ៉ាម៉ែត្របុរាណ និងគម្លាតដែលមានស្រាប់ពីគ្រួសារដែលបានផ្តល់ឱ្យ។ ធ្វើការសន្និដ្ឋានមិនត្រឹមត្រូវ ក្នុងករណីដែលកំពុងពិចារណាអំពីការបដិសេធដោយផ្អែកលើការប្រើប្រាស់គ្រួសារទាំងនេះ។

តើមានហេតុផលណាមួយដើម្បីសន្មតថាជាអាទិភាពនៃភាពធម្មតានៃលទ្ធផលរង្វាស់ទេ?

ជួនកាលវាត្រូវបានប្រកែកថាក្នុងករណីដែលការវាស់វែងមានកំហុស (ឬផ្សេងទៀត។ តម្លៃចៃដន្យ) ត្រូវបានកំណត់ជាលទ្ធផលនៃសកម្មភាពរួមបញ្ចូលគ្នានៃកត្តាតូចៗជាច្រើន បន្ទាប់មកដោយគុណធម៌នៃទ្រឹស្តីបទដែនកំណត់កណ្តាល (CLT) នៃទ្រឹស្តីប្រូបាប៊ីលីតេ តម្លៃនេះត្រូវបានប៉ាន់ប្រមាណយ៉ាងល្អ (ដោយការចែកចាយ) ដោយអថេរចៃដន្យធម្មតា។ សេចក្តីថ្លែងការណ៍នេះជាការពិត ប្រសិនបើកត្តាតូចៗធ្វើសកម្មភាពបន្ថែម និងឯករាជ្យពីគ្នាទៅវិញទៅមក។ ប្រសិនបើពួកវាធ្វើសកម្មភាពពហុគុណ នោះដោយសារតែ CLT ដូចគ្នា វាចាំបាច់ក្នុងការប៉ាន់ស្មានដោយការចែកចាយកំណត់ហេតុធម្មតា។ នៅក្នុងបញ្ហាដែលបានអនុវត្ត ជាធម្មតាវាមិនអាចទៅរួចទេក្នុងការបញ្ជាក់ពីការបន្ថែមជាជាងការគុណនៃសកម្មភាពនៃកត្តាតូចៗ។ ប្រសិនបើការពឹងផ្អែកមានលក្ខណៈទូទៅ មិនត្រូវបានកាត់បន្ថយទៅជាទម្រង់បន្ថែម ឬពហុគុណទេ ហើយគ្មានហេតុផលដើម្បីទទួលយកគំរូដែលផ្តល់អិចស្ប៉ូណង់ស្យែល Weibull-Gnedenko ហ្គាម៉ា ឬការចែកចាយផ្សេងទៀតទេ ជាក់ស្តែងគ្មានអ្វីត្រូវបានគេដឹងអំពីការចែកចាយ អថេរចៃដន្យចុងក្រោយ លើកលែងតែលក្ខណៈសម្បត្តិក្នុងគណិតវិទ្យា ដូចជាភាពទៀងទាត់។

នៅពេលដំណើរការទិន្នន័យជាក់លាក់ ជួនកាលគេជឿថាមានកំហុសក្នុងការវាស់វែង ការចែកចាយធម្មតា។. នៅលើការសន្មត់នៃភាពធម្មតា, គំរូបុរាណនៃការតំរែតំរង់, ការបែកខ្ញែក, ការវិភាគកត្តាគំរូ metrological ដែលនៅតែត្រូវបានរកឃើញទាំងនៅក្នុងឯកសារបទដ្ឋាន និងបច្ចេកទេសក្នុងស្រុក និងក្នុងស្តង់ដារអន្តរជាតិ។ គំរូសម្រាប់ការគណនាកម្រិតអតិបរមាដែលអាចសម្រេចបាននៃលក្ខណៈជាក់លាក់ដែលប្រើក្នុងការរចនាប្រព័ន្ធសម្រាប់ធានាសុវត្ថិភាពនៃដំណើរការនៃរចនាសម្ព័ន្ធសេដ្ឋកិច្ច ឧបករណ៍បច្ចេកទេស និងវត្ថុគឺផ្អែកលើការសន្មត់ដូចគ្នា។ ទោះយ៉ាងណាក៏ដោយ មិនមានមូលដ្ឋានទ្រឹស្តីសម្រាប់ការសន្មត់បែបនេះទេ។ វាចាំបាច់ក្នុងការសិក្សាពិសោធន៍ការចែកចាយនៃកំហុស។

តើលទ្ធផលពិសោធន៍បង្ហាញអ្វីខ្លះ? សេចក្តីសង្ខេបដែលបានផ្តល់ឱ្យក្នុងអក្សរកាត់អនុញ្ញាតឱ្យយើងបញ្ជាក់ថាក្នុងករណីភាគច្រើនការចែកចាយកំហុសនៃការវាស់វែងខុសពីធម្មតា។ ដូច្នេះនៅវិទ្យាស្ថាន Machine-Electrotechnical Institute (Varna, Bulgaria) ការចែកចាយកំហុសក្នុងការក្រិតតាមខ្នាតសម្រាប់មាត្រដ្ឋាននៃឧបករណ៍វាស់អគ្គិសនីអាណាឡូកត្រូវបានសិក្សា។ ឧបករណ៍ដែលផលិតនៅប្រទេសឆេកូស្លូវ៉ាគីសហភាពសូវៀតនិងប៊ុលហ្គារីត្រូវបានសិក្សា។ ច្បាប់ចែកចាយកំហុសបានប្រែទៅជាដូចគ្នា។ វាមានដង់ស៊ីតេ

យើងបានវិភាគទិន្នន័យលើប៉ារ៉ាម៉ែត្រនៃការចែកចាយជាក់ស្តែងចំនួន 219 នៃកំហុស ដែលសិក្សាដោយអ្នកនិពន្ធផ្សេងៗគ្នា នៅពេលវាស់បរិមាណអគ្គិសនី និងមិនមែនអគ្គិសនីជាមួយនឹងឧបករណ៍ជាច្រើនប្រភេទ (អគ្គិសនី)។ ជាលទ្ធផលនៃការសិក្សានេះវាបានប្រែក្លាយថាការចែកចាយ 111, i.e. ប្រហែល 50% ជាកម្មសិទ្ធិរបស់ថ្នាក់ចែកចាយដែលមានដង់ស៊ីតេ

តើប៉ារ៉ាម៉ែត្រដឺក្រេនៅឯណា; - ការផ្លាស់ប្តូរប៉ារ៉ាម៉ែត្រ; - ប៉ារ៉ាម៉ែត្រមាត្រដ្ឋាន; - មុខងារហ្គាម៉ានៃអាគុយម៉ង់;

មន្ទីរពិសោធន៍គណិតវិទ្យាអនុវត្តនៃសាកលវិទ្យាល័យរដ្ឋ Tartu បានវិភាគគំរូចំនួន 2,500 ពីបណ្ណសារនៃទិន្នន័យស្ថិតិពិតប្រាកដ។ ក្នុង 92% សម្មតិកម្មភាពធម្មតាត្រូវតែបដិសេធ។

ការពិពណ៌នាខាងលើនៃទិន្នន័យពិសោធន៍បង្ហាញថាកំហុសនៃការវាស់វែងនៅក្នុងករណីភាគច្រើនមានការចែកចាយដែលខុសពីធម្មតា។ នេះមានន័យថាជាពិសេសថាកម្មវិធីភាគច្រើននៃ t-test របស់សិស្សដែលជាបុរាណ ការវិភាគតំរែតំរង់និងវិធីសាស្រ្តស្ថិតិផ្សេងទៀតដោយផ្អែកលើទ្រឹស្តីធម្មតា ការនិយាយយ៉ាងតឹងរ៉ឹងគឺមិនសមហេតុផលទេ ចាប់តាំងពី axiom នៃភាពធម្មតានៃការចែកចាយនៃអថេរចៃដន្យដែលត្រូវគ្នាដែលស្ថិតនៅក្រោមពួកវាគឺមិនត្រឹមត្រូវ។

ជាក់ស្តែង ដើម្បីបង្ហាញអំពីភាពត្រឹមត្រូវ ឬការផ្លាស់ប្តូរដោយសមហេតុផលនូវការអនុវត្តបច្ចុប្បន្ននៃការវិភាគទិន្នន័យស្ថិតិ ចាំបាច់ត្រូវសិក្សាពីលក្ខណៈសម្បត្តិនៃនីតិវិធីវិភាគទិន្នន័យនៅក្នុងកម្មវិធី "ខុសច្បាប់"។ ការសិក្សាអំពីនីតិវិធីនៃការបដិសេធបានបង្ហាញថាពួកគេមិនស្ថិតស្ថេរខ្លាំងចំពោះគម្លាតពីភាពធម្មតា ដូច្នេះហើយវាមិនត្រូវបានគេណែនាំឱ្យប្រើពួកវាសម្រាប់ដំណើរការទិន្នន័យពិតប្រាកដ (សូមមើលខាងក្រោម)។ ដូច្នេះ គេមិនអាចអះអាងបានទេថា នីតិវិធីដែលធ្វើឡើងតាមអំពើចិត្ត មានស្ថេរភាពប្រឆាំងនឹងការបង្វែរពីភាពប្រក្រតី។

ជួនកាលវាត្រូវបានណែនាំថាមុនពេលអនុវត្តឧទាហរណ៍ការធ្វើតេស្តរបស់សិស្សសម្រាប់ភាពដូចគ្នានៃគំរូពីរសូមពិនិត្យមើលភាពធម្មតា។ ទោះបីជាមានលក្ខណៈវិនិច្ឆ័យជាច្រើនសម្រាប់រឿងនេះក៏ដោយ ការធ្វើតេស្តសម្រាប់ភាពធម្មតាគឺជានីតិវិធីស្ថិតិដែលស្មុគស្មាញ និងប្រើប្រាស់ពេលវេលាច្រើនជាងការធ្វើតេស្តសម្រាប់ភាពដូចគ្នា (ទាំងស្ថិតិប្រភេទសិស្ស និងជាមួយនឹងការធ្វើតេស្តដែលមិនមែនជាប៉ារ៉ាម៉ែត្រ)។ ការសង្កេតមួយចំនួនធំគឺត្រូវបានទាមទារដើម្បីបង្កើតភាពធម្មតាដែលអាចទុកចិត្តបានគ្រប់គ្រាន់។ ដូច្នេះដើម្បីធានាថាមុខងារចែកចាយនៃលទ្ធផលនៃការសង្កេតខុសពីធម្មតាមួយចំនួនមិនលើសពី 0.01 (សម្រាប់តម្លៃណាមួយនៃអាគុយម៉ង់) ប្រហែល 2500 ការសង្កេតត្រូវបានទាមទារ។ នៅក្នុងការសិក្សាផ្នែកសេដ្ឋកិច្ច បច្ចេកទេស ជីវវេជ្ជសាស្ត្រ និងការអនុវត្តផ្សេងៗទៀត ចំនួននៃការសង្កេតគឺតិចជាងគួរឱ្យកត់សម្គាល់។ នេះជាការពិតជាពិសេសសម្រាប់ទិន្នន័យដែលប្រើក្នុងការសិក្សាអំពីបញ្ហាទាក់ទងនឹងការធានាសុវត្ថិភាពនៃការដំណើរការនៃរចនាសម្ព័ន្ធសេដ្ឋកិច្ច និងវត្ថុបច្ចេកទេស។

ពេលខ្លះពួកគេព្យាយាមប្រើ CCT ដើម្បីប៉ាន់ស្មានការចែកចាយនៃកំហុសទៅធម្មតា រួមទាំងការបន្ថែមពិសេសនៅក្នុងគ្រោងការណ៍បច្ចេកវិទ្យានៃឧបករណ៍វាស់។ ចូរយើងវាយតម្លៃអត្ថប្រយោជន៍នៃវិធានការនេះ។ អនុញ្ញាតឱ្យអថេរបែងចែកចៃដន្យដោយឯករាជ្យជាមួយមុខងារចែកចាយ បែបនោះ ពិចារណា

សូចនាករនៃភាពជិតទៅនឹងភាពធម្មតាដែលផ្តល់ដោយអ្នកបន្ថែមគឺ

វិសមភាពខាងស្ដាំនៅក្នុងទំនាក់ទំនងចុងក្រោយកើតឡើងពីការប៉ាន់ប្រមាណនៃថេរនៅក្នុងវិសមភាព Berry-Esseen ដែលទទួលបាននៅក្នុងសៀវភៅ និងមួយខាងឆ្វេងពីឧទាហរណ៍ក្នុងអក្សរកាត់នេះ។ សម្រាប់ ច្បាប់ធម្មតា។, សម្រាប់ឯកសណ្ឋាន , សម្រាប់ចំណុចពីរ (នេះគឺជាចំណងទាបសម្រាប់ ). ដូច្នេះ ដើម្បីធានាបានចម្ងាយ (នៅក្នុងម៉ែត្រ Kolmogorov) ទៅនឹងការចែកចាយធម្មតាមិនលើសពី 0.01 សម្រាប់ការចែកចាយ "មិនជោគជ័យ" យ៉ាងហោចណាស់ត្រូវការលក្ខខណ្ឌ ដែលប្រូបាប៊ីលីតេនៃការធ្លាក់ចូលទៅក្នុងសំណុំលេខទសភាគដាច់ពីគ្នាជាមួយនឹងចំនួនដែលបានផ្តល់ឱ្យ។ ខ្ទង់ទសភាគស្មើនឹង 0 ។

វាធ្វើតាមពីខាងលើដែលលទ្ធផលនៃការវាស់វែងនិងជាទូទៅទិន្នន័យស្ថិតិមានលក្ខណៈសម្បត្តិដែលនាំឱ្យការពិតដែលថាពួកគេគួរតែត្រូវបានយកគំរូតាមអថេរចៃដន្យជាមួយនឹងការចែកចាយដែលមានភាពខុសគ្នាច្រើនឬតិចជាងពីធម្មតា។ ក្នុងករណីភាគច្រើន ការចែកចាយមានភាពខុសប្លែកគ្នាយ៉ាងខ្លាំងពីការចែកចាយធម្មតា ម្យ៉ាងវិញទៀតការចែកចាយធម្មតាតាមមើលទៅអាចត្រូវបានគេចាត់ទុកថាជាប្រភេទនៃការប្រហាក់ប្រហែល ប៉ុន្តែវាមិនដែលចៃដន្យពេញលេញនោះទេ។ នេះបង្កប់ន័យទាំងតម្រូវការក្នុងការសិក្សាអំពីលក្ខណៈសម្បត្តិនៃនីតិវិធីស្ថិតិបុរាណក្នុងទម្រង់មិនបុរាណ គំរូប្រូបាប៊ីលីតេ(ស្រដៀងទៅនឹងអ្វីដែលត្រូវបានធ្វើខាងក្រោមសម្រាប់ការធ្វើតេស្ត t-test របស់សិស្ស) និងតម្រូវការក្នុងការអភិវឌ្ឍស្ថិរភាព (ដោយគិតគូរពីវត្តមាននៃគម្លាតពីភាពធម្មតា) និងមិនមែនប៉ារ៉ាម៉ែត្រ រួមទាំងនីតិវិធីដោយមិនមានការចែកចាយ ការណែនាំដ៏ធំទូលាយរបស់ពួកគេទៅក្នុងការអនុវត្តស្ថិតិ ដំណើរការទិន្នន័យ។

ការពិចារណាដែលបានលុបចោលនៅទីនេះសម្រាប់គ្រួសារប៉ារ៉ាម៉ែត្រផ្សេងទៀតនាំឱ្យមានការសន្និដ្ឋានស្រដៀងគ្នា។ លទ្ធផលអាចត្រូវបានបង្កើតដូចខាងក្រោម។ ការចែកចាយទិន្នន័យពិតស្ទើរតែមិនដែលជាកម្មសិទ្ធិរបស់ក្រុមគ្រួសារប៉ារ៉ាម៉ែត្រជាក់លាក់ណាមួយឡើយ។ ការចែកចាយពិតប្រាកដតែងតែខុសពីការចែកចាយដែលរួមបញ្ចូលក្នុងគ្រួសារប៉ារ៉ាមេត។ ភាពខុសគ្នាអាចធំឬតូច ប៉ុន្តែវាតែងតែមាន។ ចូរយើងព្យាយាមស្វែងយល់ថាតើភាពខុសគ្នាទាំងនេះមានសារៈសំខាន់យ៉ាងណាសម្រាប់ការវិភាគសេដ្ឋកិច្ច។