របៀបកំណត់កម្រិតនៃសារៈសំខាន់នៅក្នុងការធ្វើតេស្ត Pearson ។ ការដោះស្រាយបញ្ហាសម្រាប់ការសាកល្បងសម្មតិកម្មស្ថិតិ

គោលបំណងនៃលក្ខណៈវិនិច្ឆ័យ χ 2 - លក្ខណៈវិនិច្ឆ័យរបស់ Pearson លក្ខណៈវិនិច្ឆ័យ χ 2 ត្រូវបានប្រើសម្រាប់គោលបំណងពីរ: 1) ដើម្បីប្រៀបធៀបការចែកចាយជាក់ស្តែងនៃលក្ខណៈជាមួយនឹងទ្រឹស្ដីមួយ - ឯកសណ្ឋានធម្មតាឬមួយចំនួនផ្សេងទៀត; 2) ដើម្បីប្រៀបធៀបការចែកចាយជាក់ស្តែងពីរ បី ឬច្រើននៃលក្ខណៈពិសេសដូចគ្នា។ ការពិពណ៌នាអំពីលក្ខណៈវិនិច្ឆ័យ លក្ខណៈវិនិច្ឆ័យ χ 2 ឆ្លើយសំណួរថាតើតម្លៃផ្សេងគ្នានៃលក្ខណៈពិសេសកើតឡើងជាមួយនឹងប្រេកង់ដូចគ្នានៅក្នុងការចែកចាយជាក់ស្តែង និងទ្រឹស្តី ឬនៅក្នុងការចែកចាយជាក់ស្តែងពីរឬច្រើន។ អត្ថប្រយោជន៍នៃវិធីសាស្រ្តគឺថាវាអនុញ្ញាតឱ្យប្រៀបធៀបការចែកចាយនៃលក្ខណៈពិសេសដែលបានបង្ហាញនៅក្នុងមាត្រដ្ឋានណាមួយដោយចាប់ផ្តើមពីមាត្រដ្ឋាននៃឈ្មោះ។ ក្នុងករណីសាមញ្ញបំផុតនៃការចែកចាយជំនួស "បាទ - ទេ", "អនុញ្ញាតឱ្យរៀបការ - មិនអនុញ្ញាតឱ្យរៀបការ", "ដោះស្រាយបញ្ហា - មិនបានដោះស្រាយបញ្ហា" ជាដើម យើងអាចអនុវត្តលក្ខណៈវិនិច្ឆ័យ χ 2 រួចហើយ។ ភាពខុសគ្នាកាន់តែច្រើនរវាងការចែកចាយដែលអាចប្រៀបធៀបបាន នោះតម្លៃជាក់ស្តែងនៃ χ 2 កាន់តែធំ។ ការគណនាដោយស្វ័យប្រវត្តិនៃ χ 2 - លក្ខណៈវិនិច្ឆ័យរបស់ Pearson ដើម្បីគណនាដោយស្វ័យប្រវត្តិ χ 2 - លក្ខណៈវិនិច្ឆ័យរបស់ Pearson វាចាំបាច់ត្រូវអនុវត្តពីរជំហាន៖ ជំហានទី 1. បញ្ជាក់ចំនួននៃការចែកចាយជាក់ស្តែង (ពី 1 ដល់ 10); ជំហានទី 2. បញ្ចូលប្រេកង់ជាក់ស្តែងនៅក្នុងតារាង; ជំហានទី 3. ទទួលបានចម្លើយ។

អត្ថប្រយោជន៍នៃលក្ខណៈវិនិច្ឆ័យ Pearson គឺភាពជាសកលរបស់វា៖ វាអាចត្រូវបានប្រើដើម្បីសាកល្បងសម្មតិកម្មអំពីច្បាប់ចែកចាយផ្សេងៗ។

1. សាកល្បងសម្មតិកម្មនៃការចែកចាយធម្មតា។

អនុញ្ញាតឱ្យទទួលបានគំរូនៃទំហំធំគ្រប់គ្រាន់ ទំជាមួយនឹងតម្លៃវ៉ារ្យ៉ង់ផ្សេងៗគ្នាជាច្រើន។ ដើម្បីភាពងាយស្រួលនៃដំណើរការរបស់វា យើងបែងចែកចន្លោះពេលពីតូចបំផុតទៅធំបំផុតនៃតម្លៃនៃវ៉ារ្យ៉ង់ដោយ ផ្នែកស្មើគ្នា ហើយយើងនឹងសន្មត់ថាតម្លៃនៃជម្រើសដែលធ្លាក់ក្នុងចន្លោះពេលនីមួយៗគឺប្រហែលស្មើនឹងចំនួនដែលបញ្ជាក់ពាក់កណ្តាលនៃចន្លោះពេល។ ដោយបានរាប់ចំនួនជម្រើសដែលបានធ្លាក់ទៅក្នុងចន្លោះពេលនីមួយៗ យើងនឹងបង្កើតអ្វីដែលគេហៅថាជាក្រុមគំរូ៖

ជម្រើស……….. X 1 X 2 … x s

ប្រេកង់…………… ទំ 1 ទំ 2 … n s ,

កន្លែងណា x ខ្ញុំគឺជាតម្លៃនៃចំណុចកណ្តាលនៃចន្លោះពេល និង n ខ្ញុំគឺជាចំនួនជម្រើសដែលរួមបញ្ចូលក្នុង ខ្ញុំចន្លោះពេលទី (ប្រេកង់ជាក់ស្តែង) ។



ដោយផ្អែកលើទិន្នន័យដែលទទួលបាន វាគឺអាចធ្វើទៅបានដើម្បីគណនាមធ្យមគំរូ និងគម្លាតគំរូគំរូ σ ខ. ចូរយើងពិនិត្យមើលការសន្មត់ថាប្រជាជនទូទៅត្រូវបានចែកចាយដោយយោងទៅតាមច្បាប់ធម្មតាដែលមានប៉ារ៉ាម៉ែត្រ (X) = , (X) = ។ បន្ទាប់មកអ្នកអាចរកឃើញចំនួនលេខពីគំរូបរិមាណ ទំដែលគួរតែស្ថិតនៅក្នុងចន្លោះពេលនីមួយៗក្រោមការសន្មត់នេះ (នោះគឺប្រេកង់ទ្រឹស្តី)។ ដើម្បីធ្វើដូចនេះដោយប្រើតារាងតម្លៃនៃមុខងារ Laplace យើងរកឃើញប្រូបាប៊ីលីតេនៃការវាយ ខ្ញុំ- ចន្លោះពេល៖

,

កន្លែងណា មួយ ខ្ញុំនិង b i- ព្រំដែន ខ្ញុំ- ចន្លោះពេល។ ការគុណប្រូបាប៊ីលីតេលទ្ធផលដោយទំហំគំរូ n យើងរកឃើញប្រេកង់ទ្រឹស្តី៖ p i = n p i.គោលបំណងរបស់យើងគឺដើម្បីប្រៀបធៀបប្រេកង់ជាក់ស្តែង និងទ្រឹស្តី ដែលជាការពិតណាស់ ខុសគ្នាពីគ្នាទៅវិញទៅមក ហើយរកមើលថាតើភាពខុសគ្នាទាំងនេះមិនសំខាន់ ឬអត់ មិនត្រូវបង្ហាញសម្មតិកម្មនៃការចែកចាយធម្មតានៃអថេរចៃដន្យដែលកំពុងសិក្សា ឬតើវាដូច្នេះទេ ធំដែលពួកគេផ្ទុយនឹងសម្មតិកម្មនេះ។ ចំពោះបញ្ហានេះ លក្ខណៈវិនិច្ឆ័យមួយត្រូវបានប្រើក្នុងទម្រង់ជាអថេរចៃដន្យ

. (20.1)

អត្ថន័យរបស់វាគឺជាក់ស្តែង៖ ផ្នែកត្រូវបានសង្ខេបឡើង ដែលជាការ៉េនៃគម្លាតនៃប្រេកង់ជាក់ស្តែងពីទ្រឹស្តីបទពីប្រេកង់ទ្រឹស្តីដែលត្រូវគ្នា។ វាអាចត្រូវបានបង្ហាញថា ដោយមិនគិតពីច្បាប់ចែកចាយពិតប្រាកដនៃប្រជាជនទូទៅ ច្បាប់ចែកចាយនៃអថេរចៃដន្យ (20.1) មានទំនោរទៅនឹងច្បាប់ចែកចាយ (សូមមើលការបង្រៀន 12) ជាមួយនឹងចំនួនដឺក្រេនៃសេរីភាព។ k = s - 1 – rកន្លែងណា rគឺជាចំនួនប៉ារ៉ាម៉ែត្រនៃការចែកចាយប៉ាន់ស្មានដែលបានប៉ាន់ស្មានពីទិន្នន័យគំរូ។ ការចែកចាយធម្មតាត្រូវបានកំណត់លក្ខណៈដោយប៉ារ៉ាម៉ែត្រពីរដូច្នេះ k = s - 3. សម្រាប់លក្ខណៈវិនិច្ឆ័យដែលបានជ្រើសរើស តំបន់សំខាន់ខាងស្ដាំត្រូវបានសាងសង់ ដែលកំណត់ដោយលក្ខខណ្ឌ

(20.2)

កន្លែងណា α - កម្រិតសារៈសំខាន់។ ដូច្នេះ តំបន់សំខាន់ត្រូវបានផ្តល់ដោយវិសមភាព និងតំបន់ទទួលយកនៃសម្មតិកម្មគឺ .

ដូច្នេះ ដើម្បីសាកល្បងសម្មតិកម្ម null 0: ចំនួនប្រជាជនត្រូវបានចែកចាយជាធម្មតា - អ្នកត្រូវគណនាតម្លៃដែលបានសង្កេតនៃលក្ខណៈវិនិច្ឆ័យពីគំរូ:

, (20.1`)

ហើយយោងទៅតាមតារាងនៃចំណុចសំខាន់នៃការចែកចាយ χ 2 ស្វែងរកចំណុចសំខាន់ដោយប្រើតម្លៃដែលគេស្គាល់នៃ α និង k = s - 3. ប្រសិនបើ - សម្មតិកម្ម null ត្រូវបានទទួលយក ប្រសិនបើវាត្រូវបានបដិសេធ។

2. ការសាកល្បងសម្មតិកម្មនៃការចែកចាយឯកសណ្ឋាន។

នៅពេលប្រើការធ្វើតេស្ត Pearson ដើម្បីសាកល្បងសម្មតិកម្មនៃការចែកចាយឯកសណ្ឋាននៃប្រជាជនទូទៅជាមួយនឹងដង់ស៊ីតេប្រូបាប៊ីលីតេសន្មត់

វាចាំបាច់ ដោយបានគណនាតម្លៃពីគំរូដែលមាន ដើម្បីប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រ និង យោងតាមរូបមន្ត៖

កន្លែងណា ក*និង ខ*- ការប៉ាន់ស្មាន និង . ជាការពិតសម្រាប់ការចែកចាយឯកសណ្ឋាន (X) = , ពីកន្លែងដែលអ្នកអាចទទួលបានប្រព័ន្ធសម្រាប់កំណត់ ក*និង *: , ដំណោះស្រាយគឺកន្សោម (20.3) ។

បន្ទាប់មកសន្មតថា អ្នកអាចរកឃើញប្រេកង់ទ្រឹស្តីដោយប្រើរូបមន្ត

នៅទីនេះ គឺជាចំនួនចន្លោះពេលដែលគំរូត្រូវបានបែងចែក។

តម្លៃដែលបានសង្កេតនៃលក្ខណៈវិនិច្ឆ័យ Pearson ត្រូវបានគណនាដោយរូបមន្ត (20.1`) ហើយតម្លៃសំខាន់ត្រូវបានគណនាពីតារាងដោយគិតគូរពីការពិតដែលថាចំនួនដឺក្រេនៃសេរីភាព k = s - 3. បន្ទាប់ពីនោះ ព្រំប្រទល់នៃតំបន់សំខាន់ត្រូវបានកំណត់ដូចគ្នាទៅនឹងការសាកល្បងសម្មតិកម្មនៃការចែកចាយធម្មតា។

3. ការសាកល្បងសម្មតិកម្មអំពីការចែកចាយអិចស្ប៉ូណង់ស្យែល។

ក្នុងករណីនេះ ការបែងចែកគំរូដែលមានស្រាប់ទៅជាចន្លោះពេលស្មើគ្នា យើងពិចារណាពីលំដាប់នៃជម្រើសដែលស្មើគ្នាពីគ្នាទៅវិញទៅមក (យើងសន្មត់ថាជម្រើសទាំងអស់ដែលធ្លាក់ចូលទៅក្នុង ខ្ញុំ-th interval យកតម្លៃដែលស្របគ្នាជាមួយពាក់កណ្តាលរបស់វា) និងប្រេកង់ដែលត្រូវគ្នា។ n ខ្ញុំ(ចំនួននៃជម្រើសគំរូរួមបញ្ចូលក្នុង ខ្ញុំ- ចន្លោះពេល) ។ យើងគណនាពីទិន្នន័យទាំងនេះ ហើយយកជាការប៉ាន់ស្មាននៃប៉ារ៉ាម៉ែត្រ λ តម្លៃ។ បន្ទាប់មកប្រេកង់ទ្រឹស្តីត្រូវបានគណនាដោយរូបមន្ត

បន្ទាប់មកតម្លៃដែលបានសង្កេត និងសំខាន់នៃលក្ខណៈវិនិច្ឆ័យ Pearson ត្រូវបានប្រៀបធៀបដោយគិតគូរថាចំនួនដឺក្រេនៃសេរីភាព k = s - 2.

ពិចារណាកម្មវិធីនៅក្នុងMSEXCELការធ្វើតេស្ត chi-square របស់ Pearson សម្រាប់សាកល្បងសម្មតិកម្មសាមញ្ញ។

បន្ទាប់ពីទទួលបានទិន្នន័យពិសោធន៍ (ឧទាហរណ៍នៅពេលដែលមានមួយចំនួន គំរូ) ជាធម្មតាច្បាប់នៃការចែកចាយត្រូវបានជ្រើសរើសដែលពិពណ៌នាល្អបំផុតអំពីអថេរចៃដន្យដែលតំណាងដោយអ្វីដែលផ្តល់ឱ្យ គំរូ. ការពិនិត្យមើលថាតើទិន្នន័យពិសោធន៍ត្រូវបានពិពណ៌នាដោយច្បាប់ចែកចាយទ្រឹស្តីដែលបានជ្រើសរើសល្អប៉ុណ្ណា ត្រូវបានអនុវត្តដោយប្រើ លក្ខណៈវិនិច្ឆ័យយល់ព្រម. សម្មតិកម្ម nullជាធម្មតាមានសម្មតិកម្មមួយដែលថាការចែកចាយនៃអថេរចៃដន្យគឺស្មើនឹងច្បាប់ទ្រឹស្តីមួយចំនួន។

តោះមើលកម្មវិធីដំបូង Pearson's good-of-fit test X 2 (chi-square)ទាក់ទងទៅនឹងសម្មតិកម្មសាមញ្ញ (ប៉ារ៉ាម៉ែត្រនៃការបែងចែកទ្រឹស្តីត្រូវបានគេសន្មត់ថាត្រូវបានគេស្គាល់) ។ បន្ទាប់មក - នៅពេលដែលមានតែទម្រង់ចែកចាយប៉ុណ្ណោះដែលត្រូវបានបញ្ជាក់ និងប៉ារ៉ាម៉ែត្រនៃការចែកចាយនេះ និងតម្លៃ ស្ថិតិ X 2 ត្រូវបានប៉ាន់ប្រមាណ / គណនាដោយផ្អែកលើមូលដ្ឋានដូចគ្នា។ គំរូ.

ចំណាំ៖ នៅក្នុងអក្សរសិល្ប៍ភាសាអង់គ្លេស នីតិវិធីនៃការដាក់ពាក្យ ការធ្វើតេស្តភាពសមសួនរបស់ Pearson X 2 មានឈ្មោះ ភាពល្អរបស់ chi-square នៃការធ្វើតេស្តសម.

រំលឹកឡើងវិញនូវនីតិវិធីសម្រាប់ការធ្វើតេស្តសម្មតិកម្ម៖

  • ផ្អែកលើ គំរូតម្លៃត្រូវបានគណនា ស្ថិតិដែលត្រូវនឹងប្រភេទនៃសម្មតិកម្មដែលកំពុងត្រូវបានសាកល្បង។ ឧទាហរណ៍ដើម្បីប្រើ t- ស្ថិតិ(ប្រសិនបើមិនស្គាល់);
  • ប្រធានបទនៃការពិត សម្មតិកម្ម null, ការចែកចាយនេះ។ ស្ថិតិស្គាល់ និងអាចប្រើដើម្បីគណនាប្រូបាប៊ីលីតេ (ឧទាហរណ៍ សម្រាប់ t- ស្ថិតិវា);
  • គណនាដោយផ្អែកលើ គំរូអត្ថន័យ ស្ថិតិប្រៀបធៀបជាមួយតម្លៃសំខាន់សម្រាប់តម្លៃដែលបានផ្តល់ឱ្យ ();
  • សម្មតិកម្ម nullបដិសេធប្រសិនបើតម្លៃ ស្ថិតិធំជាងសំខាន់ (ឬប្រសិនបើប្រូបាប៊ីលីតេនៃការទទួលបានតម្លៃនេះ។ ស្ថិតិ() តិច កម្រិតសារៈសំខាន់ដែលជាវិធីសាស្រ្តសមមូល)។

តោះចំណាយ ការធ្វើតេស្តសម្មតិកម្មសម្រាប់ការចែកចាយផ្សេងៗគ្នា។

ករណីដាច់ដោយឡែក

ឧបមាថាមនុស្សពីរនាក់កំពុងលេងគ្រាប់ឡុកឡាក់។ អ្នកលេងម្នាក់ៗមានគ្រាប់ឡុកឡាក់ផ្ទាល់ខ្លួន។ អ្នកលេងប្តូរវេនរមៀលគ្រាប់ឡុកឡាក់ 3 គ្រាប់ក្នុងពេលតែមួយ។ ជុំនីមួយៗត្រូវបានឈ្នះដោយអ្នកដែលរមៀលប្រាំមួយបន្ថែមទៀតក្នុងពេលតែមួយ។ លទ្ធផលត្រូវបានកត់ត្រា។ អ្នកលេងម្នាក់បន្ទាប់ពី 100 ជុំមានការសង្ស័យថាឆ្អឹងរបស់គូប្រជែងរបស់គាត់មិនស៊ីមេទ្រីទេព្រោះ។ ជារឿយៗគាត់ឈ្នះ (ជារឿយៗបោះប្រាំមួយ) ។ លោក​បាន​សម្រេច​ចិត្ត​វិភាគ​ថា​តើ​ចំនួន​នៃ​លទ្ធផល​របស់​គូប្រកួត​ទំនង​ជា​មាន​កម្រិត​ណា។

ចំណាំ៖ ដោយសារតែ គ្រាប់ឡុកឡាក់ 3 បន្ទាប់មកអ្នកអាចរមៀល 0 ក្នុងពេលតែមួយ។ មួយ; 2 ឬ 3 sixes, i.e. អថេរចៃដន្យអាចយក 4 តម្លៃ។

តាមទ្រឹស្ដីប្រូបាប៊ីលីតេ យើងដឹងថាប្រសិនបើគូបមានភាពស៊ីមេទ្រី នោះប្រូបាប៊ីលីតេនៃចំនួនប្រាំមួយដែលធ្លាក់ចេញមកគឺគោរពតាម។ ដូច្នេះបន្ទាប់ពី 100 ជុំ ប្រេកង់នៃប្រាំមួយអាចត្រូវបានគណនាដោយប្រើរូបមន្ត
=BINOM.DIST(A7,3,1/6,FALSE)*100

រូបមន្តសន្មតថាក្រឡា ក៧ មានលេខដែលត្រូវគ្នានៃចំនួនធ្លាក់ចុះចំនួនប្រាំមួយក្នុងមួយជុំ។

ចំណាំ៖ ការគណនាត្រូវបានផ្តល់ឱ្យក្នុង ឧទាហរណ៍ឯកសារនៅលើសន្លឹកដាច់.

សម្រាប់ការប្រៀបធៀប បានសង្កេត(សង្កេត) និង ប្រេកង់ទ្រឹស្តី(រំពឹងទុក) ងាយស្រួលប្រើ។

ជាមួយនឹងគម្លាតយ៉ាងសំខាន់នៃប្រេកង់ដែលបានសង្កេតពីការចែកចាយទ្រឹស្តី។ សម្មតិកម្ម nullអំពីការចែកចាយអថេរចៃដន្យដោយយោងទៅតាមច្បាប់ទ្រឹស្តី គួរតែត្រូវបានបដិសេធ។ នោះគឺប្រសិនបើគ្រាប់ឡុកឡាក់របស់គូប្រជែងមិនស៊ីមេទ្រី នោះប្រេកង់ដែលបានសង្កេតនឹងមាន "ខុសគ្នាខ្លាំង" ពី ការចែកចាយ binomial.

ក្នុងករណីរបស់យើងនៅ glance ដំបូង ប្រេកង់គឺជិតស្និទ្ធណាស់ហើយវាពិបាកក្នុងការទាញការសន្និដ្ឋានដែលមិនច្បាស់លាស់ដោយគ្មានការគណនា។ អាចអនុវត្តបាន។ ការធ្វើតេស្តភាពសមសួនរបស់ Pearson X 2ដូច្នេះជំនួសឱ្យសេចក្តីថ្លែងការណ៍ប្រធានបទ "ខុសគ្នាយ៉ាងសំខាន់" ដែលអាចត្រូវបានធ្វើឡើងដោយផ្អែកលើការប្រៀបធៀប អ៊ីស្តូក្រាមប្រើសេចក្តីថ្លែងការណ៍ត្រឹមត្រូវតាមគណិតវិទ្យា។

ចូរយើងប្រើការពិតដែលថា ច្បាប់នៃចំនួនធំប្រេកង់សង្កេត (សង្កេត) ជាមួយនឹងការកើនឡើងបរិមាណ គំរូ n ទំនោរទៅនឹងប្រូបាប៊ីលីតេដែលត្រូវគ្នានឹងច្បាប់ទ្រឹស្តី (ក្នុងករណីរបស់យើង ច្បាប់ binomial) ក្នុងករណីរបស់យើង ទំហំគំរូ n គឺ 100 ។

សូមណែនាំ សាកល្បង ស្ថិតិដែលយើងសម្គាល់ដោយ X 2:

ដែល O l គឺជាប្រេកង់សង្កេតនៃព្រឹត្តិការណ៍ដែលអថេរចៃដន្យបានយកតម្លៃដែលអាចទទួលយកបានជាក់លាក់ E l គឺជាប្រេកង់ទ្រឹស្តីដែលត្រូវគ្នា (រំពឹងទុក) ។ L គឺជាចំនួននៃតម្លៃដែលអថេរចៃដន្យអាចយក (ក្នុងករណីរបស់យើងវាស្មើនឹង 4) ។

ដូចដែលអាចមើលឃើញពីរូបមន្តនេះ។ ស្ថិតិគឺជារង្វាស់នៃភាពស្និទ្ធស្នាលនៃប្រេកង់ដែលបានសង្កេតទៅនឹងទ្រឹស្តីបទ i.e. វាអាចត្រូវបានប្រើដើម្បីប៉ាន់ប្រមាណ "ចម្ងាយ" រវាងប្រេកង់ទាំងនេះ។ ប្រសិនបើផលបូកនៃ "ចម្ងាយ" ទាំងនេះគឺ "ធំពេក" នោះប្រេកង់ទាំងនេះគឺ "ខុសគ្នាខ្លាំង" ។ វាច្បាស់ណាស់ថាប្រសិនបើគូបរបស់យើងស៊ីមេទ្រី (ឧទាហរណ៍អាចអនុវត្តបាន។ ច្បាប់ binomial) បន្ទាប់មកប្រូបាប៊ីលីតេដែលផលបូកនៃ "ចម្ងាយ" នឹង "ធំពេក" នឹងតូច។ ដើម្បីគណនាប្រូបាប៊ីលីតេនេះ យើងត្រូវដឹងពីការចែកចាយ ស្ថិតិ X 2 ( ស្ថិតិ X 2 គណនាដោយផ្អែកលើចៃដន្យ គំរូដូច្នេះ វា​គឺ​ជា​អថេរ​ចៃដន្យ ហើយ​ដូច្នេះ​មាន​របស់​វា​ផ្ទាល់ ការចែកចាយប្រូបាប៊ីលីតេ).

ពីអាណាឡូកពហុវិមាត្រ ទ្រឹស្តីបទអាំងតេក្រាល Moivre-Laplaceវាត្រូវបានគេស្គាល់ថាសម្រាប់ n->∞ អថេរចៃដន្យរបស់យើង X 2 គឺ asymptotically ជាមួយ L - 1 ដឺក្រេនៃសេរីភាព។

ដូច្នេះប្រសិនបើតម្លៃដែលបានគណនា ស្ថិតិ X 2 (ផលបូកនៃ "ចម្ងាយ" រវាងប្រេកង់) នឹងលើសពីតម្លៃកំណត់ជាក់លាក់ នោះយើងនឹងមានហេតុផលដើម្បីបដិសេធ សម្មតិកម្ម null. ដូចនៅក្នុងការត្រួតពិនិត្យ សម្មតិកម្មប៉ារ៉ាម៉ែត្រ, តម្លៃកំណត់ត្រូវបានកំណត់តាមរយៈ កម្រិតសារៈសំខាន់. ប្រសិនបើប្រូបាប៊ីលីតេដែលស្ថិតិ X 2 នឹងយកតម្លៃតិចជាង ឬស្មើទៅនឹងការគណនា ( ទំ- អត្ថន័យ) នឹងតិចជាង កម្រិតសារៈសំខាន់បន្ទាប់មក សម្មតិកម្ម nullអាចត្រូវបានបដិសេធ។

ក្នុងករណីរបស់យើងតម្លៃស្ថិតិគឺ 22.757 ។ ប្រូបាប៊ីលីតេដែលស្ថិតិ X 2 នឹងយកតម្លៃធំជាង ឬស្មើ 22.757 គឺតូចណាស់ (0.000045) ហើយអាចគណនាបានដោយប្រើរូបមន្ត
=XI2.DIST.PX(22,757;4-1)
=XI2.TEST(បានសង្កេត; រំពឹងទុក)

ចំណាំ៖ អនុគមន៍ CH2.TEST() ត្រូវបានរចនាឡើងជាពិសេសដើម្បីសាកល្បងទំនាក់ទំនងរវាងអថេរប្រភេទពីរ (សូមមើល )។

ប្រូបាប៊ីលីតេនៃ 0.000045 គឺតិចជាងធម្មតា។ កម្រិតសារៈសំខាន់ 0.05. ដូច្នេះ អ្នកលេង​មាន​ហេតុផល​គ្រប់​យ៉ាង​ដើម្បី​សង្ស័យ​គូប្រកួត​របស់ខ្លួន​ថា​មិន​ស្មោះត្រង់ ( សម្មតិកម្ម nullអំពីភាពស្មោះត្រង់របស់គាត់ត្រូវបានបដិសេធ) ។

នៅពេលអនុវត្ត លក្ខណៈវិនិច្ឆ័យ X 2ត្រូវតែយកចិត្តទុកដាក់ដើម្បីធានាថាបរិមាណ គំរូ n មានទំហំធំល្មម បើមិនដូច្នេះទេ ការប៉ាន់ស្មាននៃការចែកចាយនឹងមិនត្រឹមត្រូវទេ។ ស្ថិតិ X 2. ជាធម្មតាវាត្រូវបានគេចាត់ទុកថាសម្រាប់នេះ វាគ្រប់គ្រាន់ហើយដែលប្រេកង់សង្កេត (សង្កេត) ធំជាង 5 ។ ប្រសិនបើនេះមិនមែនជាករណីទេ នោះប្រេកង់ទាបត្រូវបានបញ្ចូលគ្នាជាមួយ ឬភ្ជាប់ជាមួយប្រេកង់ផ្សេងទៀត ហើយតម្លៃរួមបញ្ចូលគ្នាត្រូវបានផ្តល់សរុប។ ប្រូបាប៊ីលីតេ ហើយតាមនោះ ចំនួនដឺក្រេនៃសេរីភាពថយចុះ X 2 - ការចែកចាយ.

ដើម្បីបង្កើនគុណភាពនៃកម្មវិធី លក្ខណៈវិនិច្ឆ័យ X 2() ចាំបាច់ត្រូវកាត់បន្ថយចន្លោះពេលចែក (បង្កើន L ហើយតាមនោះ បង្កើនចំនួន កម្រិតនៃសេរីភាព) ទោះយ៉ាងណាក៏ដោយ វាត្រូវបានរារាំងដោយការរឹតបន្តឹងលើចំនួននៃការសង្កេតដែលធ្លាក់ទៅក្នុងចន្លោះពេលនីមួយៗ (d.b.>5)។

ករណីបន្ត

ការធ្វើតេស្តភាពសមសួនរបស់ Pearson X 2 អាចត្រូវបានអនុវត្តតាមរបៀបដូចគ្នាក្នុងករណី .

ពិចារណាខ្លះ គំរូដែល​មាន​តម្លៃ ២០០។ សម្មតិកម្មគ្មានន័យបញ្ជាក់ថា គំរូធ្វើពី។

ចំណាំ៖ អថេរចៃដន្យនៅក្នុង ឯកសារគំរូនៅលើសន្លឹកបន្តបង្កើតដោយប្រើរូបមន្ត =NORM.ST.INV(RAND()). ដូច្នេះតម្លៃថ្មី។ គំរូត្រូវបានបង្កើតរាល់ពេលដែលសន្លឹកត្រូវបានគណនាឡើងវិញ។

ថាតើសំណុំទិន្នន័យដែលមានគឺគ្រប់គ្រាន់ឬអត់ អាចត្រូវបានវាយតម្លៃដោយមើលឃើញ។

ដូចដែលអ្នកអាចមើលឃើញពីដ្យាក្រាមតម្លៃគំរូសមនឹងល្អនៅតាមបណ្តោយបន្ទាត់ត្រង់។ ទោះយ៉ាងណាក៏ដោយដូចជាសម្រាប់ ការធ្វើតេស្តសម្មតិកម្មអាចអនុវត្តបាន។ Pearson's good-of-fit test X 2 ។

ដើម្បីធ្វើដូចនេះយើងបែងចែកជួរនៃបំរែបំរួលនៃអថេរចៃដន្យទៅជាចន្លោះពេលជាមួយនឹងជំហាននៃ 0.5 ។ ចូរយើងគណនាប្រេកង់សង្កេត និងទ្រឹស្តី។ យើងគណនាប្រេកង់សង្កេតដោយប្រើអនុគមន៍ FREQUENCY() និងទ្រឹស្តី - ដោយប្រើមុខងារ NORM.ST.DIST() ។

ចំណាំ៖ សម្រាប់ ករណីដាច់វាចាំបាច់ក្នុងការធានាថា គំរូមានទំហំធំណាស់ ហើយតម្លៃច្រើនជាង 5 បានធ្លាក់ក្នុងចន្លោះពេល។

គណនាស្ថិតិ X 2 ហើយប្រៀបធៀបវាជាមួយនឹងតម្លៃសំខាន់សម្រាប់ការផ្តល់ឱ្យ កម្រិតសារៈសំខាន់(0.05) ។ ដោយសារតែ យើងបែងចែកជួរនៃបំរែបំរួលនៃអថេរចៃដន្យទៅជា 10 ចន្លោះពេល បន្ទាប់មកចំនួនដឺក្រេនៃសេរីភាពគឺ 9។ តម្លៃសំខាន់អាចត្រូវបានគណនាដោយរូបមន្ត
\u003d XI2.INV.RH (0.05; 9) ឬ
\u003d XI2.OBR (1-0.05; 9)

តារាងខាងលើបង្ហាញថាតម្លៃស្ថិតិគឺ 8.19 ដែលខ្ពស់ជាងគួរឱ្យកត់សម្គាល់ រិះគន់សម្មតិកម្ម nullមិនត្រូវបានបដិសេធទេ។

ខាង​ក្រោម​គឺ​នៅ​លើ​មួយ​ណា គំរូសន្មតថាជាតម្លៃមិនទំនង និងនៅលើមូលដ្ឋាននៃ លក្ខណៈវិនិច្ឆ័យ ការយល់ព្រមរបស់ Pearson X 2សម្មតិកម្ម null ត្រូវបានច្រានចោល (ទោះបីជាការពិតដែលថាតម្លៃចៃដន្យត្រូវបានបង្កើតដោយប្រើរូបមន្ត =NORM.ST.INV(RAND())ការផ្តល់ គំរូពី ការចែកចាយធម្មតា។).

សម្មតិកម្មគ្មានន័យច្រានចោល បើទោះជាមើលឃើញថាទិន្នន័យគឺនៅជិតបន្ទាត់ត្រង់។

ជាឧទាហរណ៍ ចូរយើងយកផងដែរ។ គំរូពី U (-3; 3) ។ ក្នុងករណីនេះសូម្បីតែពីក្រាហ្វវាច្បាស់ណាស់។ សម្មតិកម្ម nullត្រូវតែត្រូវបានបដិសេធ។

លក្ខណៈវិនិច្ឆ័យ ការយល់ព្រមរបស់ Pearson X 2បញ្ជាក់​ផង​ដែរ​ សម្មតិកម្ម nullត្រូវតែត្រូវបានបដិសេធ។

ក្នុងករណីខ្លះ អ្នកស្រាវជ្រាវមិនដឹងជាមុនដោយច្បាប់ណាដែលតម្លៃដែលបានសង្កេតឃើញនៃលក្ខណៈដែលកំពុងសិក្សាត្រូវបានចែកចាយ។ ប៉ុន្តែគាត់ប្រហែលជាមានហេតុផលគ្រប់គ្រាន់ដើម្បីសន្មតថាការចែកចាយគឺស្ថិតនៅក្រោមច្បាប់មួយ ឬមួយផ្សេងទៀត ឧទាហរណ៍ ធម្មតា ឬឯកសណ្ឋាន។ ក្នុងករណីនេះ សម្មតិកម្មស្ថិតិសំខាន់ៗ និងជំនួសនៃទម្រង់ខាងក្រោមត្រូវបានដាក់ទៅមុខ៖

    0: ការចែកចាយនៃលក្ខណៈពិសេសដែលបានសង្កេតគឺស្ថិតនៅក្រោមច្បាប់នៃការចែកចាយ ,

    1: ការចែកចាយនៃលក្ខណៈពិសេសដែលបានសង្កេតខុសគ្នាពី ;

កន្លែងណា ច្បាប់ចែកចាយមួយ ឬមួយផ្សេងទៀតអាចធ្វើសកម្មភាព៖ ធម្មតា ឯកសណ្ឋាន អិចស្ប៉ូណង់ស្យែល។ល។

ការធ្វើតេស្តសម្មតិកម្មអំពីច្បាប់នៃការចែកចាយដែលបានស្នើឡើងត្រូវបានអនុវត្តដោយប្រើលក្ខណៈវិនិច្ឆ័យដែលហៅថាភាពល្អនៃសម។ មានលក្ខណៈវិនិច្ឆ័យទទួលយកជាច្រើន។ លក្ខណៈសកលបំផុតនៃពួកគេគឺ Pearson's - លក្ខណៈវិនិច្ឆ័យព្រោះវាអាចអនុវត្តបានចំពោះប្រភេទនៃការចែកចាយណាមួយ។

- លក្ខណៈវិនិច្ឆ័យរបស់ Pearson

ជាធម្មតា ប្រេកង់ជាក់ស្តែង និងទ្រឹស្តីខុសគ្នា។ តើ​ភាព​ខុស​គ្នា​ចៃដន្យ​ឬ? លក្ខណៈវិនិច្ឆ័យ Pearson ឆ្លើយសំណួរនេះ ទោះជាយ៉ាងណាក៏ដោយ ដូចជាលក្ខណៈវិនិច្ឆ័យស្ថិតិណាមួយ វាមិនបង្ហាញពីសុពលភាពនៃសម្មតិកម្មក្នុងន័យគណិតវិទ្យាយ៉ាងតឹងរឹងនោះទេ ប៉ុន្តែគ្រាន់តែបង្កើតការព្រមព្រៀងឬការមិនយល់ស្របជាមួយទិន្នន័យសង្កេតក្នុងកម្រិតនៃសារៈសំខាន់ជាក់លាក់ប៉ុណ្ណោះ។

ដូច្នេះ អនុញ្ញាតឱ្យការចែកចាយស្ថិតិនៃតម្លៃលក្ខណៈពិសេសត្រូវបានទទួលពីគំរូបរិមាណ ដែលតម្លៃលក្ខណៈដែលបានសង្កេតគឺជាប្រេកង់ដែលត្រូវគ្នា៖

ខ្លឹមសារនៃលក្ខណៈវិនិច្ឆ័យ Pearson គឺត្រូវគណនាលក្ខណៈវិនិច្ឆ័យតាមរូបមន្តខាងក្រោម៖

កន្លែងណាជាចំនួនខ្ទង់នៃតម្លៃដែលបានសង្កេត និងជាប្រេកង់ទ្រឹស្តីនៃតម្លៃដែលត្រូវគ្នា។

វាច្បាស់ណាស់ថាភាពខុសគ្នាតូចជាង ការចែកចាយជាក់ស្តែងគឺកាន់តែខិតជិតទៅនឹងលក្ខណៈជាក់ស្តែង ដូច្នេះតម្លៃនៃលក្ខណៈវិនិច្ឆ័យកាន់តែតូច វាអាចនិយាយបានថាការចែកចាយជាក់ស្តែង និងទ្រឹស្តីគឺស្ថិតនៅក្រោមច្បាប់ដូចគ្នា។

ក្បួនដោះស្រាយលក្ខណៈវិនិច្ឆ័យរបស់ Pearson

ក្បួនដោះស្រាយលក្ខណៈវិនិច្ឆ័យ Pearson គឺសាមញ្ញ និងមានជំហានដូចខាងក្រោមៈ

ដូច្នេះ សកម្មភាពមិនសំខាន់តែមួយគត់នៅក្នុងក្បួនដោះស្រាយនេះគឺការកំណត់នៃប្រេកង់ទ្រឹស្តី។ ជាការពិតណាស់ពួកគេពឹងផ្អែកលើច្បាប់នៃការចែកចាយដូច្នេះ - សម្រាប់ច្បាប់ផ្សេងគ្នាត្រូវបានកំណត់ខុសគ្នា។

លក្ខណៈវិនិច្ឆ័យនៃកិច្ចព្រមព្រៀងសម្រាប់ការសាកល្បងសម្មតិកម្មអំពីច្បាប់ចែកចាយនៃអថេរចៃដន្យដែលកំពុងសិក្សា។ នៅក្នុងបញ្ហាជាក់ស្តែងជាច្រើន ច្បាប់ចែកចាយពិតប្រាកដមិនត្រូវបានគេដឹង។ ដូច្នេះសម្មតិកម្មមួយត្រូវបានដាក់ចេញអំពីការឆ្លើយឆ្លងនៃច្បាប់ជាក់ស្តែងដែលមានស្រាប់ ដែលត្រូវបានបង្កើតឡើងនៅលើការសង្កេត។ ចំពោះទ្រឹស្តីមួយចំនួន។ សម្មតិកម្មនេះទាមទារឱ្យមានការធ្វើតេស្តស្ថិតិ លទ្ធផលនឹងបញ្ជាក់ ឬបដិសេធ។

អនុញ្ញាតឱ្យ X ជាអថេរចៃដន្យដែលកំពុងសិក្សា។ វាត្រូវបានទាមទារដើម្បីសាកល្បងសម្មតិកម្ម H 0 ដែលអថេរចៃដន្យនេះគោរពច្បាប់ចែកចាយ F(x) ។ ដើម្បីធ្វើដូច្នេះបាន ចាំបាច់ត្រូវធ្វើគំរូនៃ n ការសង្កេតឯករាជ្យ ហើយប្រើវាដើម្បីបង្កើតច្បាប់ចែកចាយជាក់ស្តែង F "(x) ។ ការពេញនិយមបំផុតគឺភាពល្អនៃ chi-square របស់ K. Pearson ។

វាគណនាស្ថិតិ chi-square៖

,

ដែល N គឺជាចំនួនចន្លោះពេលយោងទៅតាមច្បាប់នៃការចែកចាយជាក់ស្តែងត្រូវបានបង្កើតឡើង (ចំនួនជួរឈរនៃអ៊ីស្តូក្រាមដែលត្រូវគ្នា) i គឺជាចំនួននៃចន្លោះពេល p t i គឺជាប្រូបាប៊ីលីតេដែលតម្លៃនៃអថេរចៃដន្យនឹងធ្លាក់ចូលទៅក្នុង ចន្លោះពេល i-th សម្រាប់ច្បាប់ចែកចាយទ្រឹស្តី p e i គឺជាប្រូបាប៊ីលីតេដែលតម្លៃនៃអថេរចៃដន្យនឹងធ្លាក់ចូលទៅក្នុងចន្លោះពេល i សម្រាប់ច្បាប់ចែកចាយជាក់ស្តែង។ វាត្រូវតែគោរពតាមការចែកចាយ chi-square ។

ប្រសិនបើតម្លៃដែលបានគណនានៃស្ថិតិលើសពីបរិមាណចែកចាយ chi-square ជាមួយនឹង k-p-1 ដឺក្រេនៃសេរីភាពសម្រាប់កម្រិតសារៈសំខាន់ដែលបានផ្តល់ឱ្យនោះ សម្មតិកម្ម H 0 ត្រូវបានបដិសេធ។ បើមិនដូច្នេះទេ វាត្រូវបានទទួលយកនៅកម្រិតសារៈសំខាន់ដែលបានផ្តល់ឱ្យ។ នៅទីនេះ k គឺជា ចំនួននៃការសង្កេត p គឺជាចំនួនប៉ារ៉ាម៉ែត្រប៉ាន់ស្មាននៃច្បាប់ចែកចាយ។

Pearson អនុញ្ញាតឱ្យអ្នកសាកល្បងការចែកចាយជាក់ស្តែង និងទ្រឹស្តី (ឬការចែកចាយជាក់ស្តែងផ្សេងទៀត) នៃលក្ខណៈពិសេសមួយ។ លក្ខណៈវិនិច្ឆ័យនេះត្រូវបានអនុវត្តជាចម្បងនៅក្នុងករណីពីរ៖

ដើម្បីប្រៀបធៀបការចែកចាយជាក់ស្តែងនៃលក្ខណៈជាមួយនឹងការចែកចាយទ្រឹស្តី (ធម្មតា និទស្សន្ត ឯកសណ្ឋាន ឬច្បាប់មួយចំនួនផ្សេងទៀត);

ដើម្បីប្រៀបធៀបការចែកចាយជាក់ស្តែងពីរនៃលក្ខណៈដូចគ្នា។

គំនិតនៃវិធីសាស្រ្តគឺដើម្បីកំណត់កម្រិតនៃភាពខុសគ្នានៃប្រេកង់ដែលត្រូវគ្នា n i និង ; ភាពខុសគ្នានេះកាន់តែធំ តម្លៃកាន់តែធំ

ទំហំគំរូត្រូវតែមានយ៉ាងហោចណាស់ 50 ហើយផលបូកនៃប្រេកង់ត្រូវតែស្មើគ្នា

សម្មតិកម្មគ្មានន័យ H 0 = (ការចែកចាយពីរអនុវត្តមិនខុសគ្នាពីគ្នាទៅវិញទៅមក); សម្មតិកម្មជំនួស - H 1 = (ភាពខុសគ្នារវាងការបែងចែកគឺសំខាន់) ។

នេះគឺជាគ្រោងការណ៍សម្រាប់អនុវត្តលក្ខណៈវិនិច្ឆ័យសម្រាប់ការប្រៀបធៀបការចែកចាយជាក់ស្តែងពីរ៖

លក្ខណៈវិនិច្ឆ័យ - លក្ខណៈវិនិច្ឆ័យស្ថិតិសម្រាប់សាកល្បងសម្មតិកម្មដែលអថេរចៃដន្យដែលបានសង្កេតឃើញគោរពតាមច្បាប់ចែកចាយទ្រឹស្តីមួយចំនួន។


អាស្រ័យលើតម្លៃនៃលក្ខណៈវិនិច្ឆ័យ សម្មតិកម្មអាចត្រូវបានទទួលយក ឬបដិសេធ៖

§ , សម្មតិកម្មត្រូវបានបំពេញ។

§ (ធ្លាក់ចូលទៅក្នុង "កន្ទុយ" ខាងឆ្វេងនៃការចែកចាយ) ។ ដូច្នេះ​តម្លៃ​ទ្រឹស្តី​និង​ការ​អនុវត្ត​គឺ​មាន​ភាព​ជិត​ស្និទ្ធ​ណាស់។ ឧទាហរណ៍ ប្រសិនបើម៉ាស៊ីនបង្កើតលេខចៃដន្យត្រូវបានពិនិត្យដែលបង្កើតលេខ n ពីផ្នែកមួយ ហើយសម្មតិកម្មគឺ៖ គំរូត្រូវបានចែកចាយស្មើៗគ្នា នោះម៉ាស៊ីនភ្លើងមិនអាចត្រូវបានគេហៅថាចៃដន្យទេ (សម្មតិកម្មចៃដន្យមិនពេញចិត្ត) ដោយសារតែ គំរូត្រូវបានចែកចាយស្មើៗគ្នាពេក ប៉ុន្តែសម្មតិកម្មគឺពេញចិត្ត។

§ (ធ្លាក់ចូលទៅក្នុង "កន្ទុយ" ខាងស្តាំនៃការចែកចាយ) សម្មតិកម្មត្រូវបានច្រានចោល។

និយមន័យ៖ អនុញ្ញាតឱ្យអថេរ X ត្រូវបានផ្តល់ឱ្យ។

សម្មតិកម្ម៖ ជាមួយ។ ក្នុង X គោរពច្បាប់នៃការចែកចាយ។

ដើម្បីសាកល្បងសម្មតិកម្ម សូមពិចារណាគំរូមួយដែលមានការសង្កេតឯករាជ្យរបស់ r.v. X: ។ ដោយផ្អែកលើគំរូ យើងបង្កើតការចែកចាយជាក់ស្តែងនៃ r.v. X. ការប្រៀបធៀបការចែកចាយជាក់ស្តែង និងទ្រឹស្តី (សន្មត់ក្នុងសម្មតិកម្ម) ត្រូវបានអនុវត្តដោយប្រើមុខងារដែលបានជ្រើសរើសពិសេស - លក្ខណៈវិនិច្ឆ័យនៃគុណសម្បត្តិ។ ពិចារណាការធ្វើតេស្តភាពសមសួនរបស់ Pearson (លក្ខណៈវិនិច្ឆ័យ):

សម្មតិកម្ម: X n ត្រូវបានបង្កើតដោយអនុគមន៍។

ចែកជា k ចន្លោះពេលមិនត្រួតស៊ីគ្នា។ ;

ទុកជាចំនួននៃការសង្កេតក្នុងចន្លោះ j-th៖ ;

ប្រូបាប៊ីលីតេនៃការសង្កេតដែលធ្លាក់ចូលទៅក្នុងចន្លោះ j-th នៅពេលដែលសម្មតិកម្មត្រូវបានបំពេញ។

- ចំនួននៃការទស្សនាដែលរំពឹងទុកក្នុងចន្លោះ j-th;

ស្ថិតិ៖ - ការចែកចាយ Chi-squared ជាមួយ k-1 ដឺក្រេនៃសេរីភាព។

លក្ខណៈវិនិច្ឆ័យគឺខុសលើគំរូដែលមានព្រឹត្តិការណ៍ប្រេកង់ទាប (កម្រ)។ បញ្ហានេះអាចត្រូវបានដោះស្រាយដោយការបោះបង់ព្រឹត្តិការណ៍ដែលមានប្រេកង់ទាប ឬដោយការរួមបញ្ចូលពួកវាជាមួយព្រឹត្តិការណ៍ផ្សេងទៀត។ វិធីសាស្ត្រនេះត្រូវបានគេហៅថាការកែតម្រូវរបស់ Yates ។

Pearson's goodness-of-fit test (χ 2) ត្រូវបានប្រើដើម្បីសាកល្បងសម្មតិកម្មដែលការចែកចាយជាក់ស្តែងត្រូវគ្នាទៅនឹងការចែកចាយទ្រឹស្តីដែលរំពឹងទុក F(x) ជាមួយនឹងទំហំគំរូធំ (n ≥ 100)។ លក្ខណៈវិនិច្ឆ័យអាចអនុវត្តបានសម្រាប់ប្រភេទមុខងារណាមួយ F(x) សូម្បីតែតម្លៃមិនស្គាល់នៃប៉ារ៉ាម៉ែត្ររបស់វា ដែលជាធម្មតាកើតឡើងនៅពេលវិភាគលទ្ធផលនៃការធ្វើតេស្តមេកានិច។ នេះគឺជាកន្លែងដែលភាពបត់បែនរបស់វាស្ថិតនៅ។

ការប្រើប្រាស់លក្ខណៈវិនិច្ឆ័យ χ 2 ពាក់ព័ន្ធនឹងការបែងចែកជួរនៃការប្រែប្រួលគំរូទៅជាចន្លោះពេល និងកំណត់ចំនួននៃការសង្កេត (ប្រេកង់) n j សម្រាប់នីមួយៗនៃ អ៊ីចន្លោះពេល។ សម្រាប់ភាពងាយស្រួលនៃការប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រចែកចាយ ចន្លោះពេលត្រូវបានជ្រើសរើសឱ្យមានប្រវែងដូចគ្នា។

ចំនួនចន្លោះពេលអាស្រ័យលើទំហំគំរូ។ ជាធម្មតាត្រូវបានទទួលយក: នៅ n = 100 អ៊ី= 10 ÷ 15, នៅ n = 200 អ៊ី= 15 ÷ 20, នៅ n = 400 អ៊ី= 25 ÷ 30, នៅ n = 1000 អ៊ី= 35 ÷ 40 ។

ចន្លោះពេលដែលមានការសង្កេតតិចជាងប្រាំត្រូវបានផ្សំជាមួយអ្នកជិតខាង។ ទោះយ៉ាងណាក៏ដោយ ប្រសិនបើចំនួនចន្លោះពេលបែបនេះតិចជាង 20% នៃចំនួនសរុបរបស់ពួកគេ ចន្លោះពេលដែលមានប្រេកង់ n j ≥ 2 ត្រូវបានអនុញ្ញាត។

ស្ថិតិតេស្ត Pearson គឺជាតម្លៃ
, (3.91)
ដែល p j គឺជាប្រូបាប៊ីលីតេដែលអថេរចៃដន្យដែលកំពុងសិក្សាធ្លាក់ចូលទៅក្នុងចន្លោះ j-th ដែលគណនាដោយអនុលោមតាមច្បាប់ចែកចាយសម្មតិកម្ម F(x) ។ នៅពេលគណនាប្រូបាប៊ីលីតេ p j អ្នកត្រូវចាំថា ស៊ុមខាងឆ្វេងនៃចន្លោះពេលដំបូង និងស៊ុមខាងស្តាំនៃចុងក្រោយត្រូវតែស្របគ្នាជាមួយនឹងព្រំដែននៃតំបន់នៃតម្លៃដែលអាចធ្វើបាននៃអថេរចៃដន្យ។ ឧទាហរណ៍ ជាមួយធម្មតា ការចែកចាយ ចន្លោះពេលដំបូងពង្រីកដល់ -∞ និងចុងក្រោយ - ទៅ +∞ ។

សម្មតិកម្មគ្មានន័យអំពីការអនុលោមតាមការចែកចាយគំរូជាមួយនឹងច្បាប់ទ្រឹស្តី F(x) ត្រូវបានពិនិត្យដោយប្រៀបធៀបតម្លៃដែលបានគណនាដោយរូបមន្ត (3.91) ជាមួយនឹងតម្លៃសំខាន់ χ 2 α ដែលបានរកឃើញពីតារាង។ កម្មវិធី VI សម្រាប់កម្រិតសារៈសំខាន់ α និងចំនួនដឺក្រេនៃសេរីភាព k = អ៊ី 1 - ម - 1. នៅទីនេះ អ៊ី 1 - ចំនួននៃចន្លោះពេលបន្ទាប់ពីការបញ្ចូលគ្នា; m គឺជាចំនួនប៉ារ៉ាម៉ែត្រប៉ាន់ស្មានពីគំរូដែលបានពិចារណា។ ប្រសិនបើវិសមភាព
χ 2 ≤ χ 2 α (3.92)
បន្ទាប់មកសម្មតិកម្មគ្មានន័យមិនត្រូវបានច្រានចោលទេ។ ប្រសិនបើវិសមភាពដែលបានបញ្ជាក់មិនត្រូវបានគេសង្កេតឃើញ សម្មតិកម្មជំនួសត្រូវបានទទួលយកថាគំរូនេះជាកម្មសិទ្ធិរបស់ការបែងចែកមិនស្គាល់។

គុណវិបត្តិនៃការធ្វើតេស្តភាពស័ក្តិសមរបស់ Pearson គឺការបាត់បង់ព័ត៌មានដំបូងមួយចំនួនដែលទាក់ទងនឹងតម្រូវការក្នុងការដាក់ជាក្រុមលទ្ធផលសង្កេតទៅជាចន្លោះពេល និងរួមបញ្ចូលគ្នារវាងចន្លោះពេលនីមួយៗជាមួយនឹងការសង្កេតមួយចំនួនតូច។ ក្នុងន័យនេះ វាត្រូវបានណែនាំឱ្យបន្ថែម ការផ្ទៀងផ្ទាត់ការឆ្លើយឆ្លងនៃការចែកចាយតាមលក្ខណៈវិនិច្ឆ័យ χ 2 ជាមួយនឹងលក្ខណៈវិនិច្ឆ័យផ្សេងទៀត។ នេះគឺជាការចាំបាច់ជាពិសេសជាមួយនឹងគំរូបរិមាណតិចតួច (n ≈ 100) ។

តារាងបង្ហាញតម្លៃសំខាន់នៃការចែកចាយ chi-squared ជាមួយនឹងចំនួនដឺក្រេនៃសេរីភាព។ តម្លៃដែលចង់បានគឺនៅចំនុចប្រសព្វនៃជួរឈរជាមួយនឹងតម្លៃប្រូបាប៊ីលីតេដែលត្រូវគ្នា និងជួរដេកដែលមានចំនួនដឺក្រេនៃសេរីភាព។ ឧទាហរណ៍ តម្លៃសំខាន់នៃការចែកចាយ chi-squared ដែលមាន 4 ដឺក្រេនៃសេរីភាពសម្រាប់ប្រូបាប៊ីលីតេនៃ 0.25 គឺ 5.38527 ។ នេះមានន័យថាតំបន់ដែលស្ថិតនៅក្រោមខ្សែកោងដង់ស៊ីតេនៃការចែកចាយ chi-squared ដែលមាន 4 ដឺក្រេនៃសេរីភាពនៅខាងស្តាំតម្លៃនៃ 5.38527 គឺ 0.25 ។

លក្ខណៈវិនិច្ឆ័យរបស់ Pearson សម្រាប់ការធ្វើតេស្តសម្មតិកម្មអំពីទម្រង់នៃច្បាប់នៃការចែកចាយអថេរចៃដន្យមួយ។ ការសាកល្បងសម្មតិកម្មអំពីការចែកចាយធម្មតា អិចស្ប៉ូណង់ស្យែល និងឯកសណ្ឋានដោយលក្ខណៈវិនិច្ឆ័យ Pearson ។ លក្ខណៈវិនិច្ឆ័យរបស់ Kolmogorov ។ វិធីសាស្រ្តប្រហាក់ប្រហែលសម្រាប់ពិនិត្យមើលភាពធម្មតានៃការចែកចាយដែលភ្ជាប់ជាមួយនឹងការប៉ាន់ប្រមាណនៃមេគុណនៃការ skewness និង kurtosis ។

នៅក្នុងការបង្រៀនមុន សម្មតិកម្មត្រូវបានពិចារណា ដែលច្បាប់នៃការចែកចាយប្រជាជនទូទៅត្រូវបានគេសន្មត់ថាត្រូវបានគេស្គាល់។ ឥឡូវនេះ ចូរយើងសាកល្បងសម្មតិកម្មអំពីច្បាប់ដែលបានស្នើឡើងនៃការចែកចាយដែលមិនស្គាល់ នោះគឺយើងនឹងសាកល្បងសម្មតិកម្មទទេដែលចំនួនប្រជាជនត្រូវបានចែកចាយដោយយោងទៅតាមច្បាប់ដែលគេស្គាល់មួយចំនួន។ ជាធម្មតា ការធ្វើតេស្តស្ថិតិសម្រាប់ការធ្វើតេស្តសម្មតិកម្មបែបនេះត្រូវបានគេហៅថា ការធ្វើតេស្តភាពសមសួន។

អត្ថប្រយោជន៍នៃលក្ខណៈវិនិច្ឆ័យ Pearson គឺភាពជាសកលរបស់វា៖ វាអាចត្រូវបានប្រើដើម្បីសាកល្បងសម្មតិកម្មអំពីច្បាប់ចែកចាយផ្សេងៗ។

1. សាកល្បងសម្មតិកម្មនៃការចែកចាយធម្មតា។

អនុញ្ញាតឱ្យទទួលបានគំរូនៃទំហំធំគ្រប់គ្រាន់ ទំជាមួយនឹងជម្រើសអត្ថន័យផ្សេងគ្នាជាច្រើន។ ដើម្បីភាពងាយស្រួលនៃដំណើរការរបស់វា យើងបែងចែកចន្លោះពេលពីតូចបំផុតទៅធំបំផុតនៃតម្លៃនៃវ៉ារ្យ៉ង់ដោយ ផ្នែកស្មើគ្នា ហើយយើងនឹងសន្មត់ថាតម្លៃនៃ vari

ស្រមោច​ធ្លាក់​ចូល​ក្នុង​ចន្លោះ​ពេល​នីមួយៗ​គឺ​ប្រហែល​ស្មើ​នឹង​ចំនួន​ដែល​បញ្ជាក់​ចន្លោះ​កណ្តាល។ ដោយបានរាប់ចំនួនជម្រើសដែលបានធ្លាក់ទៅក្នុងចន្លោះពេលនីមួយៗ យើងនឹងបង្កើតអ្វីដែលគេហៅថាជាក្រុមគំរូ៖

ជម្រើស X 1 X 2 x s

ប្រេកង់ ទំ 1 ទំ 2 n s ,

កន្លែងណា x ខ្ញុំគឺជាតម្លៃនៃចំណុចកណ្តាលនៃចន្លោះពេល និង n ខ្ញុំ- ចំនួនជម្រើសដែលបានរួមបញ្ចូល ខ្ញុំចន្លោះពេលទី (ប្រេកង់ជាក់ស្តែង) ។

ដោយផ្អែកលើទិន្នន័យដែលទទួលបាន វាគឺអាចធ្វើទៅបានដើម្បីគណនាមធ្យមគំរូ និងគម្លាតគំរូគំរូ σ ខ. ចូរយើងពិនិត្យមើលការសន្មត់ថាប្រជាជនទូទៅត្រូវបានចែកចាយដោយយោងទៅតាមច្បាប់ធម្មតាដែលមានប៉ារ៉ាម៉ែត្រ (X) = , (X) = ។ បន្ទាប់មកអ្នកអាចរកឃើញចំនួនលេខពីគំរូបរិមាណ ទំដែលគួរតែស្ថិតនៅក្នុងចន្លោះពេលនីមួយៗក្រោមការសន្មត់នេះ (នោះគឺប្រេកង់ទ្រឹស្តី)។ ដើម្បីធ្វើដូចនេះដោយប្រើតារាងតម្លៃនៃមុខងារ Laplace យើងរកឃើញប្រូបាប៊ីលីតេនៃការវាយ ខ្ញុំ- ចន្លោះពេល៖

,

កន្លែងណា មួយ ខ្ញុំនិង b i- ព្រំដែន ខ្ញុំ- ចន្លោះពេល។ ការគុណប្រូបាប៊ីលីតេលទ្ធផលដោយទំហំគំរូ n យើងរកឃើញប្រេកង់ទ្រឹស្តី៖ p i \u003d n? p i. គោលដៅរបស់យើងគឺដើម្បីប្រៀបធៀបប្រេកង់ជាក់ស្តែង និងទ្រឹស្តី ដែលជាការពិតណាស់ ខុសគ្នាពីគ្នាទៅវិញទៅមក ហើយរកមើលថាតើភាពខុសគ្នាទាំងនេះមិនសំខាន់ ឬអត់ មិនត្រូវបង្ហាញសម្មតិកម្មនៃការចែកចាយធម្មតានៃអថេរចៃដន្យដែលកំពុងសិក្សា ឬតើវាមានទំហំធំដូច្នេះទេ។ ថាពួកគេផ្ទុយនឹងសម្មតិកម្មនេះ។ ចំពោះបញ្ហានេះ លក្ខណៈវិនិច្ឆ័យមួយត្រូវបានប្រើក្នុងទម្រង់ជាអថេរចៃដន្យ

. (20.1)

អត្ថន័យរបស់វាគឺជាក់ស្តែង៖ ផ្នែកត្រូវបានសង្ខេបឡើង ដែលជាការ៉េនៃគម្លាតនៃប្រេកង់ជាក់ស្តែងពីទ្រឹស្តីបទពីប្រេកង់ទ្រឹស្តីដែលត្រូវគ្នា។ វាអាចត្រូវបានបង្ហាញថា ដោយមិនគិតពីច្បាប់ចែកចាយពិតប្រាកដនៃប្រជាជនទូទៅ ច្បាប់ចែកចាយនៃអថេរចៃដន្យ (20.1) មានទំនោរទៅនឹងច្បាប់ចែកចាយ (សូមមើលការបង្រៀន 12) ជាមួយនឹងចំនួនដឺក្រេនៃសេរីភាព។ k=s- 1 - rកន្លែងណា r- ចំនួនប៉ារ៉ាម៉ែត្រនៃការចែកចាយប៉ាន់ស្មាន ប៉ាន់ស្មានពីទិន្នន័យគំរូ។ ការចែកចាយធម្មតាត្រូវបានកំណត់លក្ខណៈដោយប៉ារ៉ាម៉ែត្រពីរដូច្នេះ k=s- 3. សម្រាប់លក្ខណៈវិនិច្ឆ័យដែលបានជ្រើសរើស តំបន់សំខាន់ខាងស្ដាំត្រូវបានសាងសង់ ដែលកំណត់ដោយលក្ខខណ្ឌ


(20.2)

កន្លែងណា α - កម្រិតសារៈសំខាន់។ ដូច្នេះ តំបន់សំខាន់ត្រូវបានផ្តល់ដោយវិសមភាព និងតំបន់ទទួលយកនៃសម្មតិកម្មគឺ .

ដូច្នេះ ដើម្បីសាកល្បងសម្មតិកម្ម null 0: ចំនួនប្រជាជនត្រូវបានចែកចាយជាធម្មតា - អ្នកត្រូវគណនាតម្លៃដែលបានសង្កេតនៃលក្ខណៈវិនិច្ឆ័យពីគំរូ:

, (20.1`)

ហើយយោងទៅតាមតារាងនៃចំណុចសំខាន់នៃការចែកចាយ χ 2 ស្វែងរកចំណុចសំខាន់ដោយប្រើតម្លៃដែលគេស្គាល់នៃ α និង k=s- 3. ប្រសិនបើ - សម្មតិកម្ម null ត្រូវបានទទួលយក ប្រសិនបើវាត្រូវបានបដិសេធ។

2. ការសាកល្បងសម្មតិកម្មនៃការចែកចាយឯកសណ្ឋាន។

នៅពេលប្រើលក្ខណៈវិនិច្ឆ័យ Pearson ដើម្បីសាកល្បងសម្មតិកម្មនៃការចែកចាយឯកសណ្ឋាននៃប្រជាជនទូទៅជាមួយនឹងដង់ស៊ីតេប្រូបាប៊ីលីតេដែលរំពឹងទុក

វាចាំបាច់ ដោយបានគណនាតម្លៃពីគំរូដែលមាន ដើម្បីប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រ និង យោងតាមរូបមន្ត៖

កន្លែងណា ក*និង ខ*- ការប៉ាន់ស្មាន និង . ជាការពិតសម្រាប់ការចែកចាយឯកសណ្ឋាន (X) = , ពីកន្លែងដែលអ្នកអាចទទួលបានប្រព័ន្ធសម្រាប់កំណត់ ក*និង *: , ដំណោះស្រាយគឺកន្សោម (20.3) ។

បន្ទាប់មកសន្មតថា អ្នកអាចរកឃើញប្រេកង់ទ្រឹស្តីដោយប្រើរូបមន្ត

នៅទីនេះ គឺជាចំនួនចន្លោះពេលដែលគំរូត្រូវបានបែងចែក។

តម្លៃដែលបានសង្កេតនៃលក្ខណៈវិនិច្ឆ័យ Pearson ត្រូវបានគណនាដោយរូបមន្ត (20.1`) ហើយតម្លៃសំខាន់ត្រូវបានគណនាពីតារាងដោយគិតគូរពីការពិតដែលថាចំនួនដឺក្រេនៃសេរីភាព k=s- 3. បន្ទាប់ពីនោះ ព្រំប្រទល់នៃតំបន់សំខាន់ត្រូវបានកំណត់ដូចគ្នាទៅនឹងការសាកល្បងសម្មតិកម្មនៃការចែកចាយធម្មតា។

3. ការសាកល្បងសម្មតិកម្មអំពីការចែកចាយអិចស្ប៉ូណង់ស្យែល។

ក្នុងករណីនេះ ការបែងចែកគំរូដែលមានស្រាប់ទៅជាចន្លោះពេលស្មើគ្នា យើងពិចារណាពីលំដាប់នៃជម្រើសដែលស្មើគ្នាពីគ្នាទៅវិញទៅមក (យើងសន្មត់ថាជម្រើសទាំងអស់ដែលធ្លាក់ចូលទៅក្នុង ខ្ញុំ-th interval យកតម្លៃដែលស្របគ្នាជាមួយពាក់កណ្តាលរបស់វា) និងប្រេកង់ដែលត្រូវគ្នា។ n ខ្ញុំ(ចំនួននៃជម្រើសគំរូរួមបញ្ចូលក្នុង ខ្ញុំ- ចន្លោះពេល) ។ យើងគណនាពីទិន្នន័យទាំងនេះ ហើយយកជាការប៉ាន់ស្មាននៃប៉ារ៉ាម៉ែត្រ λ តម្លៃ។ បន្ទាប់មកប្រេកង់ទ្រឹស្តីត្រូវបានគណនាដោយរូបមន្ត

បន្ទាប់មកតម្លៃដែលបានសង្កេត និងសំខាន់នៃលក្ខណៈវិនិច្ឆ័យ Pearson ត្រូវបានប្រៀបធៀបដោយគិតគូរថាចំនួនដឺក្រេនៃសេរីភាព k=s- 2.