|
អត្ថប្រយោជន៍នៃលក្ខណៈវិនិច្ឆ័យ Pearson គឺភាពជាសកលរបស់វា៖ វាអាចត្រូវបានប្រើដើម្បីសាកល្បងសម្មតិកម្មអំពីច្បាប់ចែកចាយផ្សេងៗ។
1. សាកល្បងសម្មតិកម្មនៃការចែកចាយធម្មតា។
អនុញ្ញាតឱ្យទទួលបានគំរូនៃទំហំធំគ្រប់គ្រាន់ ទំជាមួយនឹងតម្លៃវ៉ារ្យ៉ង់ផ្សេងៗគ្នាជាច្រើន។ ដើម្បីភាពងាយស្រួលនៃដំណើរការរបស់វា យើងបែងចែកចន្លោះពេលពីតូចបំផុតទៅធំបំផុតនៃតម្លៃនៃវ៉ារ្យ៉ង់ដោយ សផ្នែកស្មើគ្នា ហើយយើងនឹងសន្មត់ថាតម្លៃនៃជម្រើសដែលធ្លាក់ក្នុងចន្លោះពេលនីមួយៗគឺប្រហែលស្មើនឹងចំនួនដែលបញ្ជាក់ពាក់កណ្តាលនៃចន្លោះពេល។ ដោយបានរាប់ចំនួនជម្រើសដែលបានធ្លាក់ទៅក្នុងចន្លោះពេលនីមួយៗ យើងនឹងបង្កើតអ្វីដែលគេហៅថាជាក្រុមគំរូ៖
ជម្រើស……….. X 1 X 2 … x s
ប្រេកង់…………… ទំ 1 ទំ 2 … n s ,
កន្លែងណា x ខ្ញុំគឺជាតម្លៃនៃចំណុចកណ្តាលនៃចន្លោះពេល និង n ខ្ញុំគឺជាចំនួនជម្រើសដែលរួមបញ្ចូលក្នុង ខ្ញុំចន្លោះពេលទី (ប្រេកង់ជាក់ស្តែង) ។
ដោយផ្អែកលើទិន្នន័យដែលទទួលបាន វាគឺអាចធ្វើទៅបានដើម្បីគណនាមធ្យមគំរូ និងគម្លាតគំរូគំរូ σ ខ. ចូរយើងពិនិត្យមើលការសន្មត់ថាប្រជាជនទូទៅត្រូវបានចែកចាយដោយយោងទៅតាមច្បាប់ធម្មតាដែលមានប៉ារ៉ាម៉ែត្រ ម(X) = , ឃ(X) = ។ បន្ទាប់មកអ្នកអាចរកឃើញចំនួនលេខពីគំរូបរិមាណ ទំដែលគួរតែស្ថិតនៅក្នុងចន្លោះពេលនីមួយៗក្រោមការសន្មត់នេះ (នោះគឺប្រេកង់ទ្រឹស្តី)។ ដើម្បីធ្វើដូចនេះដោយប្រើតារាងតម្លៃនៃមុខងារ Laplace យើងរកឃើញប្រូបាប៊ីលីតេនៃការវាយ ខ្ញុំ- ចន្លោះពេល៖
,
កន្លែងណា មួយ ខ្ញុំនិង b i- ព្រំដែន ខ្ញុំ- ចន្លោះពេល។ ការគុណប្រូបាប៊ីលីតេលទ្ធផលដោយទំហំគំរូ n យើងរកឃើញប្រេកង់ទ្រឹស្តី៖ p i = n p i.គោលបំណងរបស់យើងគឺដើម្បីប្រៀបធៀបប្រេកង់ជាក់ស្តែង និងទ្រឹស្តី ដែលជាការពិតណាស់ ខុសគ្នាពីគ្នាទៅវិញទៅមក ហើយរកមើលថាតើភាពខុសគ្នាទាំងនេះមិនសំខាន់ ឬអត់ មិនត្រូវបង្ហាញសម្មតិកម្មនៃការចែកចាយធម្មតានៃអថេរចៃដន្យដែលកំពុងសិក្សា ឬតើវាដូច្នេះទេ ធំដែលពួកគេផ្ទុយនឹងសម្មតិកម្មនេះ។ ចំពោះបញ្ហានេះ លក្ខណៈវិនិច្ឆ័យមួយត្រូវបានប្រើក្នុងទម្រង់ជាអថេរចៃដន្យ
. (20.1)
អត្ថន័យរបស់វាគឺជាក់ស្តែង៖ ផ្នែកត្រូវបានសង្ខេបឡើង ដែលជាការ៉េនៃគម្លាតនៃប្រេកង់ជាក់ស្តែងពីទ្រឹស្តីបទពីប្រេកង់ទ្រឹស្តីដែលត្រូវគ្នា។ វាអាចត្រូវបានបង្ហាញថា ដោយមិនគិតពីច្បាប់ចែកចាយពិតប្រាកដនៃប្រជាជនទូទៅ ច្បាប់ចែកចាយនៃអថេរចៃដន្យ (20.1) មានទំនោរទៅនឹងច្បាប់ចែកចាយ (សូមមើលការបង្រៀន 12) ជាមួយនឹងចំនួនដឺក្រេនៃសេរីភាព។ k = s - 1 – rកន្លែងណា rគឺជាចំនួនប៉ារ៉ាម៉ែត្រនៃការចែកចាយប៉ាន់ស្មានដែលបានប៉ាន់ស្មានពីទិន្នន័យគំរូ។ ការចែកចាយធម្មតាត្រូវបានកំណត់លក្ខណៈដោយប៉ារ៉ាម៉ែត្រពីរដូច្នេះ k = s - 3. សម្រាប់លក្ខណៈវិនិច្ឆ័យដែលបានជ្រើសរើស តំបន់សំខាន់ខាងស្ដាំត្រូវបានសាងសង់ ដែលកំណត់ដោយលក្ខខណ្ឌ
(20.2)
កន្លែងណា α - កម្រិតសារៈសំខាន់។ ដូច្នេះ តំបន់សំខាន់ត្រូវបានផ្តល់ដោយវិសមភាព និងតំបន់ទទួលយកនៃសម្មតិកម្មគឺ .
ដូច្នេះ ដើម្បីសាកល្បងសម្មតិកម្ម null ហ 0: ចំនួនប្រជាជនត្រូវបានចែកចាយជាធម្មតា - អ្នកត្រូវគណនាតម្លៃដែលបានសង្កេតនៃលក្ខណៈវិនិច្ឆ័យពីគំរូ:
, (20.1`)
ហើយយោងទៅតាមតារាងនៃចំណុចសំខាន់នៃការចែកចាយ χ 2 ស្វែងរកចំណុចសំខាន់ដោយប្រើតម្លៃដែលគេស្គាល់នៃ α និង k = s - 3. ប្រសិនបើ - សម្មតិកម្ម null ត្រូវបានទទួលយក ប្រសិនបើវាត្រូវបានបដិសេធ។
2. ការសាកល្បងសម្មតិកម្មនៃការចែកចាយឯកសណ្ឋាន។
នៅពេលប្រើការធ្វើតេស្ត Pearson ដើម្បីសាកល្បងសម្មតិកម្មនៃការចែកចាយឯកសណ្ឋាននៃប្រជាជនទូទៅជាមួយនឹងដង់ស៊ីតេប្រូបាប៊ីលីតេសន្មត់
វាចាំបាច់ ដោយបានគណនាតម្លៃពីគំរូដែលមាន ដើម្បីប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រ កនិង ខយោងតាមរូបមន្ត៖
កន្លែងណា ក*និង ខ*- ការប៉ាន់ស្មាន កនិង ខ. ជាការពិតសម្រាប់ការចែកចាយឯកសណ្ឋាន ម(X) = , ពីកន្លែងដែលអ្នកអាចទទួលបានប្រព័ន្ធសម្រាប់កំណត់ ក*និង ខ*: , ដំណោះស្រាយគឺកន្សោម (20.3) ។
បន្ទាប់មកសន្មតថា អ្នកអាចរកឃើញប្រេកង់ទ្រឹស្តីដោយប្រើរូបមន្ត
នៅទីនេះ សគឺជាចំនួនចន្លោះពេលដែលគំរូត្រូវបានបែងចែក។
តម្លៃដែលបានសង្កេតនៃលក្ខណៈវិនិច្ឆ័យ Pearson ត្រូវបានគណនាដោយរូបមន្ត (20.1`) ហើយតម្លៃសំខាន់ត្រូវបានគណនាពីតារាងដោយគិតគូរពីការពិតដែលថាចំនួនដឺក្រេនៃសេរីភាព k = s - 3. បន្ទាប់ពីនោះ ព្រំប្រទល់នៃតំបន់សំខាន់ត្រូវបានកំណត់ដូចគ្នាទៅនឹងការសាកល្បងសម្មតិកម្មនៃការចែកចាយធម្មតា។
3. ការសាកល្បងសម្មតិកម្មអំពីការចែកចាយអិចស្ប៉ូណង់ស្យែល។
ក្នុងករណីនេះ ការបែងចែកគំរូដែលមានស្រាប់ទៅជាចន្លោះពេលស្មើគ្នា យើងពិចារណាពីលំដាប់នៃជម្រើសដែលស្មើគ្នាពីគ្នាទៅវិញទៅមក (យើងសន្មត់ថាជម្រើសទាំងអស់ដែលធ្លាក់ចូលទៅក្នុង ខ្ញុំ-th interval យកតម្លៃដែលស្របគ្នាជាមួយពាក់កណ្តាលរបស់វា) និងប្រេកង់ដែលត្រូវគ្នា។ n ខ្ញុំ(ចំនួននៃជម្រើសគំរូរួមបញ្ចូលក្នុង ខ្ញុំ- ចន្លោះពេល) ។ យើងគណនាពីទិន្នន័យទាំងនេះ ហើយយកជាការប៉ាន់ស្មាននៃប៉ារ៉ាម៉ែត្រ λ តម្លៃ។ បន្ទាប់មកប្រេកង់ទ្រឹស្តីត្រូវបានគណនាដោយរូបមន្ត
បន្ទាប់មកតម្លៃដែលបានសង្កេត និងសំខាន់នៃលក្ខណៈវិនិច្ឆ័យ Pearson ត្រូវបានប្រៀបធៀបដោយគិតគូរថាចំនួនដឺក្រេនៃសេរីភាព k = s - 2.
ពិចារណាកម្មវិធីនៅក្នុងMSEXCELការធ្វើតេស្ត chi-square របស់ Pearson សម្រាប់សាកល្បងសម្មតិកម្មសាមញ្ញ។
បន្ទាប់ពីទទួលបានទិន្នន័យពិសោធន៍ (ឧទាហរណ៍នៅពេលដែលមានមួយចំនួន គំរូ) ជាធម្មតាច្បាប់នៃការចែកចាយត្រូវបានជ្រើសរើសដែលពិពណ៌នាល្អបំផុតអំពីអថេរចៃដន្យដែលតំណាងដោយអ្វីដែលផ្តល់ឱ្យ គំរូ. ការពិនិត្យមើលថាតើទិន្នន័យពិសោធន៍ត្រូវបានពិពណ៌នាដោយច្បាប់ចែកចាយទ្រឹស្តីដែលបានជ្រើសរើសល្អប៉ុណ្ណា ត្រូវបានអនុវត្តដោយប្រើ លក្ខណៈវិនិច្ឆ័យយល់ព្រម. សម្មតិកម្ម nullជាធម្មតាមានសម្មតិកម្មមួយដែលថាការចែកចាយនៃអថេរចៃដន្យគឺស្មើនឹងច្បាប់ទ្រឹស្តីមួយចំនួន។
តោះមើលកម្មវិធីដំបូង Pearson's good-of-fit test X 2 (chi-square)ទាក់ទងទៅនឹងសម្មតិកម្មសាមញ្ញ (ប៉ារ៉ាម៉ែត្រនៃការបែងចែកទ្រឹស្តីត្រូវបានគេសន្មត់ថាត្រូវបានគេស្គាល់) ។ បន្ទាប់មក - នៅពេលដែលមានតែទម្រង់ចែកចាយប៉ុណ្ណោះដែលត្រូវបានបញ្ជាក់ និងប៉ារ៉ាម៉ែត្រនៃការចែកចាយនេះ និងតម្លៃ ស្ថិតិ X 2 ត្រូវបានប៉ាន់ប្រមាណ / គណនាដោយផ្អែកលើមូលដ្ឋានដូចគ្នា។ គំរូ.
ចំណាំ៖ នៅក្នុងអក្សរសិល្ប៍ភាសាអង់គ្លេស នីតិវិធីនៃការដាក់ពាក្យ ការធ្វើតេស្តភាពសមសួនរបស់ Pearson X 2 មានឈ្មោះ ភាពល្អរបស់ chi-square នៃការធ្វើតេស្តសម.
រំលឹកឡើងវិញនូវនីតិវិធីសម្រាប់ការធ្វើតេស្តសម្មតិកម្ម៖
- ផ្អែកលើ គំរូតម្លៃត្រូវបានគណនា ស្ថិតិដែលត្រូវនឹងប្រភេទនៃសម្មតិកម្មដែលកំពុងត្រូវបានសាកល្បង។ ឧទាហរណ៍ដើម្បីប្រើ t- ស្ថិតិ(ប្រសិនបើមិនស្គាល់);
- ប្រធានបទនៃការពិត សម្មតិកម្ម null, ការចែកចាយនេះ។ ស្ថិតិស្គាល់ និងអាចប្រើដើម្បីគណនាប្រូបាប៊ីលីតេ (ឧទាហរណ៍ សម្រាប់ t- ស្ថិតិវា);
- គណនាដោយផ្អែកលើ គំរូអត្ថន័យ ស្ថិតិប្រៀបធៀបជាមួយតម្លៃសំខាន់សម្រាប់តម្លៃដែលបានផ្តល់ឱ្យ ();
- សម្មតិកម្ម nullបដិសេធប្រសិនបើតម្លៃ ស្ថិតិធំជាងសំខាន់ (ឬប្រសិនបើប្រូបាប៊ីលីតេនៃការទទួលបានតម្លៃនេះ។ ស្ថិតិ() តិច កម្រិតសារៈសំខាន់ដែលជាវិធីសាស្រ្តសមមូល)។
តោះចំណាយ ការធ្វើតេស្តសម្មតិកម្មសម្រាប់ការចែកចាយផ្សេងៗគ្នា។
ករណីដាច់ដោយឡែក
ឧបមាថាមនុស្សពីរនាក់កំពុងលេងគ្រាប់ឡុកឡាក់។ អ្នកលេងម្នាក់ៗមានគ្រាប់ឡុកឡាក់ផ្ទាល់ខ្លួន។ អ្នកលេងប្តូរវេនរមៀលគ្រាប់ឡុកឡាក់ 3 គ្រាប់ក្នុងពេលតែមួយ។ ជុំនីមួយៗត្រូវបានឈ្នះដោយអ្នកដែលរមៀលប្រាំមួយបន្ថែមទៀតក្នុងពេលតែមួយ។ លទ្ធផលត្រូវបានកត់ត្រា។ អ្នកលេងម្នាក់បន្ទាប់ពី 100 ជុំមានការសង្ស័យថាឆ្អឹងរបស់គូប្រជែងរបស់គាត់មិនស៊ីមេទ្រីទេព្រោះ។ ជារឿយៗគាត់ឈ្នះ (ជារឿយៗបោះប្រាំមួយ) ។ លោកបានសម្រេចចិត្តវិភាគថាតើចំនួននៃលទ្ធផលរបស់គូប្រកួតទំនងជាមានកម្រិតណា។
ចំណាំ៖ ដោយសារតែ គ្រាប់ឡុកឡាក់ 3 បន្ទាប់មកអ្នកអាចរមៀល 0 ក្នុងពេលតែមួយ។ មួយ; 2 ឬ 3 sixes, i.e. អថេរចៃដន្យអាចយក 4 តម្លៃ។
តាមទ្រឹស្ដីប្រូបាប៊ីលីតេ យើងដឹងថាប្រសិនបើគូបមានភាពស៊ីមេទ្រី នោះប្រូបាប៊ីលីតេនៃចំនួនប្រាំមួយដែលធ្លាក់ចេញមកគឺគោរពតាម។ ដូច្នេះបន្ទាប់ពី 100 ជុំ ប្រេកង់នៃប្រាំមួយអាចត្រូវបានគណនាដោយប្រើរូបមន្ត
=BINOM.DIST(A7,3,1/6,FALSE)*100
រូបមន្តសន្មតថាក្រឡា ក៧ មានលេខដែលត្រូវគ្នានៃចំនួនធ្លាក់ចុះចំនួនប្រាំមួយក្នុងមួយជុំ។
ចំណាំ៖ ការគណនាត្រូវបានផ្តល់ឱ្យក្នុង ឧទាហរណ៍ឯកសារនៅលើសន្លឹកដាច់.
សម្រាប់ការប្រៀបធៀប បានសង្កេត(សង្កេត) និង ប្រេកង់ទ្រឹស្តី(រំពឹងទុក) ងាយស្រួលប្រើ។
ជាមួយនឹងគម្លាតយ៉ាងសំខាន់នៃប្រេកង់ដែលបានសង្កេតពីការចែកចាយទ្រឹស្តី។ សម្មតិកម្ម nullអំពីការចែកចាយអថេរចៃដន្យដោយយោងទៅតាមច្បាប់ទ្រឹស្តី គួរតែត្រូវបានបដិសេធ។ នោះគឺប្រសិនបើគ្រាប់ឡុកឡាក់របស់គូប្រជែងមិនស៊ីមេទ្រី នោះប្រេកង់ដែលបានសង្កេតនឹងមាន "ខុសគ្នាខ្លាំង" ពី ការចែកចាយ binomial.
ក្នុងករណីរបស់យើងនៅ glance ដំបូង ប្រេកង់គឺជិតស្និទ្ធណាស់ហើយវាពិបាកក្នុងការទាញការសន្និដ្ឋានដែលមិនច្បាស់លាស់ដោយគ្មានការគណនា។ អាចអនុវត្តបាន។ ការធ្វើតេស្តភាពសមសួនរបស់ Pearson X 2ដូច្នេះជំនួសឱ្យសេចក្តីថ្លែងការណ៍ប្រធានបទ "ខុសគ្នាយ៉ាងសំខាន់" ដែលអាចត្រូវបានធ្វើឡើងដោយផ្អែកលើការប្រៀបធៀប អ៊ីស្តូក្រាមប្រើសេចក្តីថ្លែងការណ៍ត្រឹមត្រូវតាមគណិតវិទ្យា។
ចូរយើងប្រើការពិតដែលថា ច្បាប់នៃចំនួនធំប្រេកង់សង្កេត (សង្កេត) ជាមួយនឹងការកើនឡើងបរិមាណ គំរូ n ទំនោរទៅនឹងប្រូបាប៊ីលីតេដែលត្រូវគ្នានឹងច្បាប់ទ្រឹស្តី (ក្នុងករណីរបស់យើង ច្បាប់ binomial) ក្នុងករណីរបស់យើង ទំហំគំរូ n គឺ 100 ។
សូមណែនាំ សាកល្បង ស្ថិតិដែលយើងសម្គាល់ដោយ X 2:
ដែល O l គឺជាប្រេកង់សង្កេតនៃព្រឹត្តិការណ៍ដែលអថេរចៃដន្យបានយកតម្លៃដែលអាចទទួលយកបានជាក់លាក់ E l គឺជាប្រេកង់ទ្រឹស្តីដែលត្រូវគ្នា (រំពឹងទុក) ។ L គឺជាចំនួននៃតម្លៃដែលអថេរចៃដន្យអាចយក (ក្នុងករណីរបស់យើងវាស្មើនឹង 4) ។
ដូចដែលអាចមើលឃើញពីរូបមន្តនេះ។ ស្ថិតិគឺជារង្វាស់នៃភាពស្និទ្ធស្នាលនៃប្រេកង់ដែលបានសង្កេតទៅនឹងទ្រឹស្តីបទ i.e. វាអាចត្រូវបានប្រើដើម្បីប៉ាន់ប្រមាណ "ចម្ងាយ" រវាងប្រេកង់ទាំងនេះ។ ប្រសិនបើផលបូកនៃ "ចម្ងាយ" ទាំងនេះគឺ "ធំពេក" នោះប្រេកង់ទាំងនេះគឺ "ខុសគ្នាខ្លាំង" ។ វាច្បាស់ណាស់ថាប្រសិនបើគូបរបស់យើងស៊ីមេទ្រី (ឧទាហរណ៍អាចអនុវត្តបាន។ ច្បាប់ binomial) បន្ទាប់មកប្រូបាប៊ីលីតេដែលផលបូកនៃ "ចម្ងាយ" នឹង "ធំពេក" នឹងតូច។ ដើម្បីគណនាប្រូបាប៊ីលីតេនេះ យើងត្រូវដឹងពីការចែកចាយ ស្ថិតិ X 2 ( ស្ថិតិ X 2 គណនាដោយផ្អែកលើចៃដន្យ គំរូដូច្នេះ វាគឺជាអថេរចៃដន្យ ហើយដូច្នេះមានរបស់វាផ្ទាល់ ការចែកចាយប្រូបាប៊ីលីតេ).
ពីអាណាឡូកពហុវិមាត្រ ទ្រឹស្តីបទអាំងតេក្រាល Moivre-Laplaceវាត្រូវបានគេស្គាល់ថាសម្រាប់ n->∞ អថេរចៃដន្យរបស់យើង X 2 គឺ asymptotically ជាមួយ L - 1 ដឺក្រេនៃសេរីភាព។
ដូច្នេះប្រសិនបើតម្លៃដែលបានគណនា ស្ថិតិ X 2 (ផលបូកនៃ "ចម្ងាយ" រវាងប្រេកង់) នឹងលើសពីតម្លៃកំណត់ជាក់លាក់ នោះយើងនឹងមានហេតុផលដើម្បីបដិសេធ សម្មតិកម្ម null. ដូចនៅក្នុងការត្រួតពិនិត្យ សម្មតិកម្មប៉ារ៉ាម៉ែត្រ, តម្លៃកំណត់ត្រូវបានកំណត់តាមរយៈ កម្រិតសារៈសំខាន់. ប្រសិនបើប្រូបាប៊ីលីតេដែលស្ថិតិ X 2 នឹងយកតម្លៃតិចជាង ឬស្មើទៅនឹងការគណនា ( ទំ- អត្ថន័យ) នឹងតិចជាង កម្រិតសារៈសំខាន់បន្ទាប់មក សម្មតិកម្ម nullអាចត្រូវបានបដិសេធ។
ក្នុងករណីរបស់យើងតម្លៃស្ថិតិគឺ 22.757 ។ ប្រូបាប៊ីលីតេដែលស្ថិតិ X 2 នឹងយកតម្លៃធំជាង ឬស្មើ 22.757 គឺតូចណាស់ (0.000045) ហើយអាចគណនាបានដោយប្រើរូបមន្ត
=XI2.DIST.PX(22,757;4-1)ឬ
=XI2.TEST(បានសង្កេត; រំពឹងទុក)
ចំណាំ៖ អនុគមន៍ CH2.TEST() ត្រូវបានរចនាឡើងជាពិសេសដើម្បីសាកល្បងទំនាក់ទំនងរវាងអថេរប្រភេទពីរ (សូមមើល )។
ប្រូបាប៊ីលីតេនៃ 0.000045 គឺតិចជាងធម្មតា។ កម្រិតសារៈសំខាន់ 0.05. ដូច្នេះ អ្នកលេងមានហេតុផលគ្រប់យ៉ាងដើម្បីសង្ស័យគូប្រកួតរបស់ខ្លួនថាមិនស្មោះត្រង់ ( សម្មតិកម្ម nullអំពីភាពស្មោះត្រង់របស់គាត់ត្រូវបានបដិសេធ) ។
នៅពេលអនុវត្ត លក្ខណៈវិនិច្ឆ័យ X 2ត្រូវតែយកចិត្តទុកដាក់ដើម្បីធានាថាបរិមាណ គំរូ n មានទំហំធំល្មម បើមិនដូច្នេះទេ ការប៉ាន់ស្មាននៃការចែកចាយនឹងមិនត្រឹមត្រូវទេ។ ស្ថិតិ X 2. ជាធម្មតាវាត្រូវបានគេចាត់ទុកថាសម្រាប់នេះ វាគ្រប់គ្រាន់ហើយដែលប្រេកង់សង្កេត (សង្កេត) ធំជាង 5 ។ ប្រសិនបើនេះមិនមែនជាករណីទេ នោះប្រេកង់ទាបត្រូវបានបញ្ចូលគ្នាជាមួយ ឬភ្ជាប់ជាមួយប្រេកង់ផ្សេងទៀត ហើយតម្លៃរួមបញ្ចូលគ្នាត្រូវបានផ្តល់សរុប។ ប្រូបាប៊ីលីតេ ហើយតាមនោះ ចំនួនដឺក្រេនៃសេរីភាពថយចុះ X 2 - ការចែកចាយ.
ដើម្បីបង្កើនគុណភាពនៃកម្មវិធី លក្ខណៈវិនិច្ឆ័យ X 2() ចាំបាច់ត្រូវកាត់បន្ថយចន្លោះពេលចែក (បង្កើន L ហើយតាមនោះ បង្កើនចំនួន កម្រិតនៃសេរីភាព) ទោះយ៉ាងណាក៏ដោយ វាត្រូវបានរារាំងដោយការរឹតបន្តឹងលើចំនួននៃការសង្កេតដែលធ្លាក់ទៅក្នុងចន្លោះពេលនីមួយៗ (d.b.>5)។
ករណីបន្ត
ការធ្វើតេស្តភាពសមសួនរបស់ Pearson X 2 អាចត្រូវបានអនុវត្តតាមរបៀបដូចគ្នាក្នុងករណី .
ពិចារណាខ្លះ គំរូដែលមានតម្លៃ ២០០។ សម្មតិកម្មគ្មានន័យបញ្ជាក់ថា គំរូធ្វើពី។
ចំណាំ៖ អថេរចៃដន្យនៅក្នុង ឯកសារគំរូនៅលើសន្លឹកបន្តបង្កើតដោយប្រើរូបមន្ត =NORM.ST.INV(RAND()). ដូច្នេះតម្លៃថ្មី។ គំរូត្រូវបានបង្កើតរាល់ពេលដែលសន្លឹកត្រូវបានគណនាឡើងវិញ។
ថាតើសំណុំទិន្នន័យដែលមានគឺគ្រប់គ្រាន់ឬអត់ អាចត្រូវបានវាយតម្លៃដោយមើលឃើញ។
ដូចដែលអ្នកអាចមើលឃើញពីដ្យាក្រាមតម្លៃគំរូសមនឹងល្អនៅតាមបណ្តោយបន្ទាត់ត្រង់។ ទោះយ៉ាងណាក៏ដោយដូចជាសម្រាប់ ការធ្វើតេស្តសម្មតិកម្មអាចអនុវត្តបាន។ Pearson's good-of-fit test X 2 ។
ដើម្បីធ្វើដូចនេះយើងបែងចែកជួរនៃបំរែបំរួលនៃអថេរចៃដន្យទៅជាចន្លោះពេលជាមួយនឹងជំហាននៃ 0.5 ។ ចូរយើងគណនាប្រេកង់សង្កេត និងទ្រឹស្តី។ យើងគណនាប្រេកង់សង្កេតដោយប្រើអនុគមន៍ FREQUENCY() និងទ្រឹស្តី - ដោយប្រើមុខងារ NORM.ST.DIST() ។
ចំណាំ៖ សម្រាប់ ករណីដាច់វាចាំបាច់ក្នុងការធានាថា គំរូមានទំហំធំណាស់ ហើយតម្លៃច្រើនជាង 5 បានធ្លាក់ក្នុងចន្លោះពេល។
គណនាស្ថិតិ X 2 ហើយប្រៀបធៀបវាជាមួយនឹងតម្លៃសំខាន់សម្រាប់ការផ្តល់ឱ្យ កម្រិតសារៈសំខាន់(0.05) ។ ដោយសារតែ យើងបែងចែកជួរនៃបំរែបំរួលនៃអថេរចៃដន្យទៅជា 10 ចន្លោះពេល បន្ទាប់មកចំនួនដឺក្រេនៃសេរីភាពគឺ 9។ តម្លៃសំខាន់អាចត្រូវបានគណនាដោយរូបមន្ត
\u003d XI2.INV.RH (0.05; 9) ឬ
\u003d XI2.OBR (1-0.05; 9)
តារាងខាងលើបង្ហាញថាតម្លៃស្ថិតិគឺ 8.19 ដែលខ្ពស់ជាងគួរឱ្យកត់សម្គាល់ រិះគន់ – សម្មតិកម្ម nullមិនត្រូវបានបដិសេធទេ។
ខាងក្រោមគឺនៅលើមួយណា គំរូសន្មតថាជាតម្លៃមិនទំនង និងនៅលើមូលដ្ឋាននៃ លក្ខណៈវិនិច្ឆ័យ ការយល់ព្រមរបស់ Pearson X 2សម្មតិកម្ម null ត្រូវបានច្រានចោល (ទោះបីជាការពិតដែលថាតម្លៃចៃដន្យត្រូវបានបង្កើតដោយប្រើរូបមន្ត =NORM.ST.INV(RAND())ការផ្តល់ គំរូពី ការចែកចាយធម្មតា។).
សម្មតិកម្មគ្មានន័យច្រានចោល បើទោះជាមើលឃើញថាទិន្នន័យគឺនៅជិតបន្ទាត់ត្រង់។
ជាឧទាហរណ៍ ចូរយើងយកផងដែរ។ គំរូពី U (-3; 3) ។ ក្នុងករណីនេះសូម្បីតែពីក្រាហ្វវាច្បាស់ណាស់។ សម្មតិកម្ម nullត្រូវតែត្រូវបានបដិសេធ។
លក្ខណៈវិនិច្ឆ័យ ការយល់ព្រមរបស់ Pearson X 2បញ្ជាក់ផងដែរ សម្មតិកម្ម nullត្រូវតែត្រូវបានបដិសេធ។
ក្នុងករណីខ្លះ អ្នកស្រាវជ្រាវមិនដឹងជាមុនដោយច្បាប់ណាដែលតម្លៃដែលបានសង្កេតឃើញនៃលក្ខណៈដែលកំពុងសិក្សាត្រូវបានចែកចាយ។ ប៉ុន្តែគាត់ប្រហែលជាមានហេតុផលគ្រប់គ្រាន់ដើម្បីសន្មតថាការចែកចាយគឺស្ថិតនៅក្រោមច្បាប់មួយ ឬមួយផ្សេងទៀត ឧទាហរណ៍ ធម្មតា ឬឯកសណ្ឋាន។ ក្នុងករណីនេះ សម្មតិកម្មស្ថិតិសំខាន់ៗ និងជំនួសនៃទម្រង់ខាងក្រោមត្រូវបានដាក់ទៅមុខ៖
ហ 0: ការចែកចាយនៃលក្ខណៈពិសេសដែលបានសង្កេតគឺស្ថិតនៅក្រោមច្បាប់នៃការចែកចាយ ក,
ហ 1: ការចែកចាយនៃលក្ខណៈពិសេសដែលបានសង្កេតខុសគ្នាពី ក;
កន្លែងណា កច្បាប់ចែកចាយមួយ ឬមួយផ្សេងទៀតអាចធ្វើសកម្មភាព៖ ធម្មតា ឯកសណ្ឋាន អិចស្ប៉ូណង់ស្យែល។ល។
ការធ្វើតេស្តសម្មតិកម្មអំពីច្បាប់នៃការចែកចាយដែលបានស្នើឡើងត្រូវបានអនុវត្តដោយប្រើលក្ខណៈវិនិច្ឆ័យដែលហៅថាភាពល្អនៃសម។ មានលក្ខណៈវិនិច្ឆ័យទទួលយកជាច្រើន។ លក្ខណៈសកលបំផុតនៃពួកគេគឺ Pearson's - លក្ខណៈវិនិច្ឆ័យព្រោះវាអាចអនុវត្តបានចំពោះប្រភេទនៃការចែកចាយណាមួយ។
- លក្ខណៈវិនិច្ឆ័យរបស់ Pearson
ជាធម្មតា ប្រេកង់ជាក់ស្តែង និងទ្រឹស្តីខុសគ្នា។ តើភាពខុសគ្នាចៃដន្យឬ? លក្ខណៈវិនិច្ឆ័យ Pearson ឆ្លើយសំណួរនេះ ទោះជាយ៉ាងណាក៏ដោយ ដូចជាលក្ខណៈវិនិច្ឆ័យស្ថិតិណាមួយ វាមិនបង្ហាញពីសុពលភាពនៃសម្មតិកម្មក្នុងន័យគណិតវិទ្យាយ៉ាងតឹងរឹងនោះទេ ប៉ុន្តែគ្រាន់តែបង្កើតការព្រមព្រៀងឬការមិនយល់ស្របជាមួយទិន្នន័យសង្កេតក្នុងកម្រិតនៃសារៈសំខាន់ជាក់លាក់ប៉ុណ្ណោះ។
ដូច្នេះ អនុញ្ញាតឱ្យការចែកចាយស្ថិតិនៃតម្លៃលក្ខណៈពិសេសត្រូវបានទទួលពីគំរូបរិមាណ ដែលតម្លៃលក្ខណៈដែលបានសង្កេតគឺជាប្រេកង់ដែលត្រូវគ្នា៖
ខ្លឹមសារនៃលក្ខណៈវិនិច្ឆ័យ Pearson គឺត្រូវគណនាលក្ខណៈវិនិច្ឆ័យតាមរូបមន្តខាងក្រោម៖
កន្លែងណាជាចំនួនខ្ទង់នៃតម្លៃដែលបានសង្កេត និងជាប្រេកង់ទ្រឹស្តីនៃតម្លៃដែលត្រូវគ្នា។
វាច្បាស់ណាស់ថាភាពខុសគ្នាតូចជាង ការចែកចាយជាក់ស្តែងគឺកាន់តែខិតជិតទៅនឹងលក្ខណៈជាក់ស្តែង ដូច្នេះតម្លៃនៃលក្ខណៈវិនិច្ឆ័យកាន់តែតូច វាអាចនិយាយបានថាការចែកចាយជាក់ស្តែង និងទ្រឹស្តីគឺស្ថិតនៅក្រោមច្បាប់ដូចគ្នា។
ក្បួនដោះស្រាយលក្ខណៈវិនិច្ឆ័យរបស់ Pearson
ក្បួនដោះស្រាយលក្ខណៈវិនិច្ឆ័យ Pearson គឺសាមញ្ញ និងមានជំហានដូចខាងក្រោមៈ
ដូច្នេះ សកម្មភាពមិនសំខាន់តែមួយគត់នៅក្នុងក្បួនដោះស្រាយនេះគឺការកំណត់នៃប្រេកង់ទ្រឹស្តី។ ជាការពិតណាស់ពួកគេពឹងផ្អែកលើច្បាប់នៃការចែកចាយដូច្នេះ - សម្រាប់ច្បាប់ផ្សេងគ្នាត្រូវបានកំណត់ខុសគ្នា។
លក្ខណៈវិនិច្ឆ័យនៃកិច្ចព្រមព្រៀងសម្រាប់ការសាកល្បងសម្មតិកម្មអំពីច្បាប់ចែកចាយនៃអថេរចៃដន្យដែលកំពុងសិក្សា។ នៅក្នុងបញ្ហាជាក់ស្តែងជាច្រើន ច្បាប់ចែកចាយពិតប្រាកដមិនត្រូវបានគេដឹង។ ដូច្នេះសម្មតិកម្មមួយត្រូវបានដាក់ចេញអំពីការឆ្លើយឆ្លងនៃច្បាប់ជាក់ស្តែងដែលមានស្រាប់ ដែលត្រូវបានបង្កើតឡើងនៅលើការសង្កេត។ ចំពោះទ្រឹស្តីមួយចំនួន។ សម្មតិកម្មនេះទាមទារឱ្យមានការធ្វើតេស្តស្ថិតិ លទ្ធផលនឹងបញ្ជាក់ ឬបដិសេធ។
អនុញ្ញាតឱ្យ X ជាអថេរចៃដន្យដែលកំពុងសិក្សា។ វាត្រូវបានទាមទារដើម្បីសាកល្បងសម្មតិកម្ម H 0 ដែលអថេរចៃដន្យនេះគោរពច្បាប់ចែកចាយ F(x) ។ ដើម្បីធ្វើដូច្នេះបាន ចាំបាច់ត្រូវធ្វើគំរូនៃ n ការសង្កេតឯករាជ្យ ហើយប្រើវាដើម្បីបង្កើតច្បាប់ចែកចាយជាក់ស្តែង F "(x) ។ ការពេញនិយមបំផុតគឺភាពល្អនៃ chi-square របស់ K. Pearson ។
វាគណនាស្ថិតិ chi-square៖
,
ដែល N គឺជាចំនួនចន្លោះពេលយោងទៅតាមច្បាប់នៃការចែកចាយជាក់ស្តែងត្រូវបានបង្កើតឡើង (ចំនួនជួរឈរនៃអ៊ីស្តូក្រាមដែលត្រូវគ្នា) i គឺជាចំនួននៃចន្លោះពេល p t i គឺជាប្រូបាប៊ីលីតេដែលតម្លៃនៃអថេរចៃដន្យនឹងធ្លាក់ចូលទៅក្នុង ចន្លោះពេល i-th សម្រាប់ច្បាប់ចែកចាយទ្រឹស្តី p e i គឺជាប្រូបាប៊ីលីតេដែលតម្លៃនៃអថេរចៃដន្យនឹងធ្លាក់ចូលទៅក្នុងចន្លោះពេល i សម្រាប់ច្បាប់ចែកចាយជាក់ស្តែង។ វាត្រូវតែគោរពតាមការចែកចាយ chi-square ។
ប្រសិនបើតម្លៃដែលបានគណនានៃស្ថិតិលើសពីបរិមាណចែកចាយ chi-square ជាមួយនឹង k-p-1 ដឺក្រេនៃសេរីភាពសម្រាប់កម្រិតសារៈសំខាន់ដែលបានផ្តល់ឱ្យនោះ សម្មតិកម្ម H 0 ត្រូវបានបដិសេធ។ បើមិនដូច្នេះទេ វាត្រូវបានទទួលយកនៅកម្រិតសារៈសំខាន់ដែលបានផ្តល់ឱ្យ។ នៅទីនេះ k គឺជា ចំនួននៃការសង្កេត p គឺជាចំនួនប៉ារ៉ាម៉ែត្រប៉ាន់ស្មាននៃច្បាប់ចែកចាយ។
Pearson អនុញ្ញាតឱ្យអ្នកសាកល្បងការចែកចាយជាក់ស្តែង និងទ្រឹស្តី (ឬការចែកចាយជាក់ស្តែងផ្សេងទៀត) នៃលក្ខណៈពិសេសមួយ។ លក្ខណៈវិនិច្ឆ័យនេះត្រូវបានអនុវត្តជាចម្បងនៅក្នុងករណីពីរ៖
ដើម្បីប្រៀបធៀបការចែកចាយជាក់ស្តែងនៃលក្ខណៈជាមួយនឹងការចែកចាយទ្រឹស្តី (ធម្មតា និទស្សន្ត ឯកសណ្ឋាន ឬច្បាប់មួយចំនួនផ្សេងទៀត);
ដើម្បីប្រៀបធៀបការចែកចាយជាក់ស្តែងពីរនៃលក្ខណៈដូចគ្នា។
គំនិតនៃវិធីសាស្រ្តគឺដើម្បីកំណត់កម្រិតនៃភាពខុសគ្នានៃប្រេកង់ដែលត្រូវគ្នា n i និង ; ភាពខុសគ្នានេះកាន់តែធំ តម្លៃកាន់តែធំ
ទំហំគំរូត្រូវតែមានយ៉ាងហោចណាស់ 50 ហើយផលបូកនៃប្រេកង់ត្រូវតែស្មើគ្នា
សម្មតិកម្មគ្មានន័យ H 0 = (ការចែកចាយពីរអនុវត្តមិនខុសគ្នាពីគ្នាទៅវិញទៅមក); សម្មតិកម្មជំនួស - H 1 = (ភាពខុសគ្នារវាងការបែងចែកគឺសំខាន់) ។
នេះគឺជាគ្រោងការណ៍សម្រាប់អនុវត្តលក្ខណៈវិនិច្ឆ័យសម្រាប់ការប្រៀបធៀបការចែកចាយជាក់ស្តែងពីរ៖
លក្ខណៈវិនិច្ឆ័យ - លក្ខណៈវិនិច្ឆ័យស្ថិតិសម្រាប់សាកល្បងសម្មតិកម្មដែលអថេរចៃដន្យដែលបានសង្កេតឃើញគោរពតាមច្បាប់ចែកចាយទ្រឹស្តីមួយចំនួន។
អាស្រ័យលើតម្លៃនៃលក្ខណៈវិនិច្ឆ័យ សម្មតិកម្មអាចត្រូវបានទទួលយក ឬបដិសេធ៖
§ , សម្មតិកម្មត្រូវបានបំពេញ។
§ (ធ្លាក់ចូលទៅក្នុង "កន្ទុយ" ខាងឆ្វេងនៃការចែកចាយ) ។ ដូច្នេះតម្លៃទ្រឹស្តីនិងការអនុវត្តគឺមានភាពជិតស្និទ្ធណាស់។ ឧទាហរណ៍ ប្រសិនបើម៉ាស៊ីនបង្កើតលេខចៃដន្យត្រូវបានពិនិត្យដែលបង្កើតលេខ n ពីផ្នែកមួយ ហើយសម្មតិកម្មគឺ៖ គំរូត្រូវបានចែកចាយស្មើៗគ្នា នោះម៉ាស៊ីនភ្លើងមិនអាចត្រូវបានគេហៅថាចៃដន្យទេ (សម្មតិកម្មចៃដន្យមិនពេញចិត្ត) ដោយសារតែ គំរូត្រូវបានចែកចាយស្មើៗគ្នាពេក ប៉ុន្តែសម្មតិកម្មគឺពេញចិត្ត។
§ (ធ្លាក់ចូលទៅក្នុង "កន្ទុយ" ខាងស្តាំនៃការចែកចាយ) សម្មតិកម្មត្រូវបានច្រានចោល។
និយមន័យ៖ អនុញ្ញាតឱ្យអថេរ X ត្រូវបានផ្តល់ឱ្យ។
សម្មតិកម្ម៖ ជាមួយ។ ក្នុង X គោរពច្បាប់នៃការចែកចាយ។
ដើម្បីសាកល្បងសម្មតិកម្ម សូមពិចារណាគំរូមួយដែលមានការសង្កេតឯករាជ្យរបស់ r.v. X: ។ ដោយផ្អែកលើគំរូ យើងបង្កើតការចែកចាយជាក់ស្តែងនៃ r.v. X. ការប្រៀបធៀបការចែកចាយជាក់ស្តែង និងទ្រឹស្តី (សន្មត់ក្នុងសម្មតិកម្ម) ត្រូវបានអនុវត្តដោយប្រើមុខងារដែលបានជ្រើសរើសពិសេស - លក្ខណៈវិនិច្ឆ័យនៃគុណសម្បត្តិ។ ពិចារណាការធ្វើតេស្តភាពសមសួនរបស់ Pearson (លក្ខណៈវិនិច្ឆ័យ):
សម្មតិកម្ម: X n ត្រូវបានបង្កើតដោយអនុគមន៍។
ចែកជា k ចន្លោះពេលមិនត្រួតស៊ីគ្នា។ ;
ទុកជាចំនួននៃការសង្កេតក្នុងចន្លោះ j-th៖ ;
ប្រូបាប៊ីលីតេនៃការសង្កេតដែលធ្លាក់ចូលទៅក្នុងចន្លោះ j-th នៅពេលដែលសម្មតិកម្មត្រូវបានបំពេញ។
- ចំនួននៃការទស្សនាដែលរំពឹងទុកក្នុងចន្លោះ j-th;
ស្ថិតិ៖ - ការចែកចាយ Chi-squared ជាមួយ k-1 ដឺក្រេនៃសេរីភាព។
លក្ខណៈវិនិច្ឆ័យគឺខុសលើគំរូដែលមានព្រឹត្តិការណ៍ប្រេកង់ទាប (កម្រ)។ បញ្ហានេះអាចត្រូវបានដោះស្រាយដោយការបោះបង់ព្រឹត្តិការណ៍ដែលមានប្រេកង់ទាប ឬដោយការរួមបញ្ចូលពួកវាជាមួយព្រឹត្តិការណ៍ផ្សេងទៀត។ វិធីសាស្ត្រនេះត្រូវបានគេហៅថាការកែតម្រូវរបស់ Yates ។
Pearson's goodness-of-fit test (χ 2) ត្រូវបានប្រើដើម្បីសាកល្បងសម្មតិកម្មដែលការចែកចាយជាក់ស្តែងត្រូវគ្នាទៅនឹងការចែកចាយទ្រឹស្តីដែលរំពឹងទុក F(x) ជាមួយនឹងទំហំគំរូធំ (n ≥ 100)។ លក្ខណៈវិនិច្ឆ័យអាចអនុវត្តបានសម្រាប់ប្រភេទមុខងារណាមួយ F(x) សូម្បីតែតម្លៃមិនស្គាល់នៃប៉ារ៉ាម៉ែត្ររបស់វា ដែលជាធម្មតាកើតឡើងនៅពេលវិភាគលទ្ធផលនៃការធ្វើតេស្តមេកានិច។ នេះគឺជាកន្លែងដែលភាពបត់បែនរបស់វាស្ថិតនៅ។
ការប្រើប្រាស់លក្ខណៈវិនិច្ឆ័យ χ 2 ពាក់ព័ន្ធនឹងការបែងចែកជួរនៃការប្រែប្រួលគំរូទៅជាចន្លោះពេល និងកំណត់ចំនួននៃការសង្កេត (ប្រេកង់) n j សម្រាប់នីមួយៗនៃ អ៊ីចន្លោះពេល។ សម្រាប់ភាពងាយស្រួលនៃការប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រចែកចាយ ចន្លោះពេលត្រូវបានជ្រើសរើសឱ្យមានប្រវែងដូចគ្នា។
ចំនួនចន្លោះពេលអាស្រ័យលើទំហំគំរូ។ ជាធម្មតាត្រូវបានទទួលយក: នៅ n = 100 អ៊ី= 10 ÷ 15, នៅ n = 200 អ៊ី= 15 ÷ 20, នៅ n = 400 អ៊ី= 25 ÷ 30, នៅ n = 1000 អ៊ី= 35 ÷ 40 ។
ចន្លោះពេលដែលមានការសង្កេតតិចជាងប្រាំត្រូវបានផ្សំជាមួយអ្នកជិតខាង។ ទោះយ៉ាងណាក៏ដោយ ប្រសិនបើចំនួនចន្លោះពេលបែបនេះតិចជាង 20% នៃចំនួនសរុបរបស់ពួកគេ ចន្លោះពេលដែលមានប្រេកង់ n j ≥ 2 ត្រូវបានអនុញ្ញាត។
ស្ថិតិតេស្ត Pearson គឺជាតម្លៃ
, (3.91)
ដែល p j គឺជាប្រូបាប៊ីលីតេដែលអថេរចៃដន្យដែលកំពុងសិក្សាធ្លាក់ចូលទៅក្នុងចន្លោះ j-th ដែលគណនាដោយអនុលោមតាមច្បាប់ចែកចាយសម្មតិកម្ម F(x) ។ នៅពេលគណនាប្រូបាប៊ីលីតេ p j អ្នកត្រូវចាំថា ស៊ុមខាងឆ្វេងនៃចន្លោះពេលដំបូង និងស៊ុមខាងស្តាំនៃចុងក្រោយត្រូវតែស្របគ្នាជាមួយនឹងព្រំដែននៃតំបន់នៃតម្លៃដែលអាចធ្វើបាននៃអថេរចៃដន្យ។ ឧទាហរណ៍ ជាមួយធម្មតា ការចែកចាយ ចន្លោះពេលដំបូងពង្រីកដល់ -∞ និងចុងក្រោយ - ទៅ +∞ ។
សម្មតិកម្មគ្មានន័យអំពីការអនុលោមតាមការចែកចាយគំរូជាមួយនឹងច្បាប់ទ្រឹស្តី F(x) ត្រូវបានពិនិត្យដោយប្រៀបធៀបតម្លៃដែលបានគណនាដោយរូបមន្ត (3.91) ជាមួយនឹងតម្លៃសំខាន់ χ 2 α ដែលបានរកឃើញពីតារាង។ កម្មវិធី VI សម្រាប់កម្រិតសារៈសំខាន់ α និងចំនួនដឺក្រេនៃសេរីភាព k = អ៊ី 1 - ម - 1. នៅទីនេះ អ៊ី 1 - ចំនួននៃចន្លោះពេលបន្ទាប់ពីការបញ្ចូលគ្នា; m គឺជាចំនួនប៉ារ៉ាម៉ែត្រប៉ាន់ស្មានពីគំរូដែលបានពិចារណា។ ប្រសិនបើវិសមភាព
χ 2 ≤ χ 2 α (3.92)
បន្ទាប់មកសម្មតិកម្មគ្មានន័យមិនត្រូវបានច្រានចោលទេ។ ប្រសិនបើវិសមភាពដែលបានបញ្ជាក់មិនត្រូវបានគេសង្កេតឃើញ សម្មតិកម្មជំនួសត្រូវបានទទួលយកថាគំរូនេះជាកម្មសិទ្ធិរបស់ការបែងចែកមិនស្គាល់។
គុណវិបត្តិនៃការធ្វើតេស្តភាពស័ក្តិសមរបស់ Pearson គឺការបាត់បង់ព័ត៌មានដំបូងមួយចំនួនដែលទាក់ទងនឹងតម្រូវការក្នុងការដាក់ជាក្រុមលទ្ធផលសង្កេតទៅជាចន្លោះពេល និងរួមបញ្ចូលគ្នារវាងចន្លោះពេលនីមួយៗជាមួយនឹងការសង្កេតមួយចំនួនតូច។ ក្នុងន័យនេះ វាត្រូវបានណែនាំឱ្យបន្ថែម ការផ្ទៀងផ្ទាត់ការឆ្លើយឆ្លងនៃការចែកចាយតាមលក្ខណៈវិនិច្ឆ័យ χ 2 ជាមួយនឹងលក្ខណៈវិនិច្ឆ័យផ្សេងទៀត។ នេះគឺជាការចាំបាច់ជាពិសេសជាមួយនឹងគំរូបរិមាណតិចតួច (n ≈ 100) ។
តារាងបង្ហាញតម្លៃសំខាន់នៃការចែកចាយ chi-squared ជាមួយនឹងចំនួនដឺក្រេនៃសេរីភាព។ តម្លៃដែលចង់បានគឺនៅចំនុចប្រសព្វនៃជួរឈរជាមួយនឹងតម្លៃប្រូបាប៊ីលីតេដែលត្រូវគ្នា និងជួរដេកដែលមានចំនួនដឺក្រេនៃសេរីភាព។ ឧទាហរណ៍ តម្លៃសំខាន់នៃការចែកចាយ chi-squared ដែលមាន 4 ដឺក្រេនៃសេរីភាពសម្រាប់ប្រូបាប៊ីលីតេនៃ 0.25 គឺ 5.38527 ។ នេះមានន័យថាតំបន់ដែលស្ថិតនៅក្រោមខ្សែកោងដង់ស៊ីតេនៃការចែកចាយ chi-squared ដែលមាន 4 ដឺក្រេនៃសេរីភាពនៅខាងស្តាំតម្លៃនៃ 5.38527 គឺ 0.25 ។
លក្ខណៈវិនិច្ឆ័យរបស់ Pearson សម្រាប់ការធ្វើតេស្តសម្មតិកម្មអំពីទម្រង់នៃច្បាប់នៃការចែកចាយអថេរចៃដន្យមួយ។ ការសាកល្បងសម្មតិកម្មអំពីការចែកចាយធម្មតា អិចស្ប៉ូណង់ស្យែល និងឯកសណ្ឋានដោយលក្ខណៈវិនិច្ឆ័យ Pearson ។ លក្ខណៈវិនិច្ឆ័យរបស់ Kolmogorov ។ វិធីសាស្រ្តប្រហាក់ប្រហែលសម្រាប់ពិនិត្យមើលភាពធម្មតានៃការចែកចាយដែលភ្ជាប់ជាមួយនឹងការប៉ាន់ប្រមាណនៃមេគុណនៃការ skewness និង kurtosis ។
នៅក្នុងការបង្រៀនមុន សម្មតិកម្មត្រូវបានពិចារណា ដែលច្បាប់នៃការចែកចាយប្រជាជនទូទៅត្រូវបានគេសន្មត់ថាត្រូវបានគេស្គាល់។ ឥឡូវនេះ ចូរយើងសាកល្បងសម្មតិកម្មអំពីច្បាប់ដែលបានស្នើឡើងនៃការចែកចាយដែលមិនស្គាល់ នោះគឺយើងនឹងសាកល្បងសម្មតិកម្មទទេដែលចំនួនប្រជាជនត្រូវបានចែកចាយដោយយោងទៅតាមច្បាប់ដែលគេស្គាល់មួយចំនួន។ ជាធម្មតា ការធ្វើតេស្តស្ថិតិសម្រាប់ការធ្វើតេស្តសម្មតិកម្មបែបនេះត្រូវបានគេហៅថា ការធ្វើតេស្តភាពសមសួន។
អត្ថប្រយោជន៍នៃលក្ខណៈវិនិច្ឆ័យ Pearson គឺភាពជាសកលរបស់វា៖ វាអាចត្រូវបានប្រើដើម្បីសាកល្បងសម្មតិកម្មអំពីច្បាប់ចែកចាយផ្សេងៗ។
1. សាកល្បងសម្មតិកម្មនៃការចែកចាយធម្មតា។
អនុញ្ញាតឱ្យទទួលបានគំរូនៃទំហំធំគ្រប់គ្រាន់ ទំជាមួយនឹងជម្រើសអត្ថន័យផ្សេងគ្នាជាច្រើន។ ដើម្បីភាពងាយស្រួលនៃដំណើរការរបស់វា យើងបែងចែកចន្លោះពេលពីតូចបំផុតទៅធំបំផុតនៃតម្លៃនៃវ៉ារ្យ៉ង់ដោយ សផ្នែកស្មើគ្នា ហើយយើងនឹងសន្មត់ថាតម្លៃនៃ vari
ស្រមោចធ្លាក់ចូលក្នុងចន្លោះពេលនីមួយៗគឺប្រហែលស្មើនឹងចំនួនដែលបញ្ជាក់ចន្លោះកណ្តាល។ ដោយបានរាប់ចំនួនជម្រើសដែលបានធ្លាក់ទៅក្នុងចន្លោះពេលនីមួយៗ យើងនឹងបង្កើតអ្វីដែលគេហៅថាជាក្រុមគំរូ៖
ជម្រើស X 1 X 2 x s
ប្រេកង់ ទំ 1 ទំ 2 n s ,
កន្លែងណា x ខ្ញុំគឺជាតម្លៃនៃចំណុចកណ្តាលនៃចន្លោះពេល និង n ខ្ញុំ- ចំនួនជម្រើសដែលបានរួមបញ្ចូល ខ្ញុំចន្លោះពេលទី (ប្រេកង់ជាក់ស្តែង) ។
ដោយផ្អែកលើទិន្នន័យដែលទទួលបាន វាគឺអាចធ្វើទៅបានដើម្បីគណនាមធ្យមគំរូ និងគម្លាតគំរូគំរូ σ ខ. ចូរយើងពិនិត្យមើលការសន្មត់ថាប្រជាជនទូទៅត្រូវបានចែកចាយដោយយោងទៅតាមច្បាប់ធម្មតាដែលមានប៉ារ៉ាម៉ែត្រ ម(X) = , ឃ(X) = ។ បន្ទាប់មកអ្នកអាចរកឃើញចំនួនលេខពីគំរូបរិមាណ ទំដែលគួរតែស្ថិតនៅក្នុងចន្លោះពេលនីមួយៗក្រោមការសន្មត់នេះ (នោះគឺប្រេកង់ទ្រឹស្តី)។ ដើម្បីធ្វើដូចនេះដោយប្រើតារាងតម្លៃនៃមុខងារ Laplace យើងរកឃើញប្រូបាប៊ីលីតេនៃការវាយ ខ្ញុំ- ចន្លោះពេល៖
,
កន្លែងណា មួយ ខ្ញុំនិង b i- ព្រំដែន ខ្ញុំ- ចន្លោះពេល។ ការគុណប្រូបាប៊ីលីតេលទ្ធផលដោយទំហំគំរូ n យើងរកឃើញប្រេកង់ទ្រឹស្តី៖ p i \u003d n? p i. គោលដៅរបស់យើងគឺដើម្បីប្រៀបធៀបប្រេកង់ជាក់ស្តែង និងទ្រឹស្តី ដែលជាការពិតណាស់ ខុសគ្នាពីគ្នាទៅវិញទៅមក ហើយរកមើលថាតើភាពខុសគ្នាទាំងនេះមិនសំខាន់ ឬអត់ មិនត្រូវបង្ហាញសម្មតិកម្មនៃការចែកចាយធម្មតានៃអថេរចៃដន្យដែលកំពុងសិក្សា ឬតើវាមានទំហំធំដូច្នេះទេ។ ថាពួកគេផ្ទុយនឹងសម្មតិកម្មនេះ។ ចំពោះបញ្ហានេះ លក្ខណៈវិនិច្ឆ័យមួយត្រូវបានប្រើក្នុងទម្រង់ជាអថេរចៃដន្យ
. (20.1)
អត្ថន័យរបស់វាគឺជាក់ស្តែង៖ ផ្នែកត្រូវបានសង្ខេបឡើង ដែលជាការ៉េនៃគម្លាតនៃប្រេកង់ជាក់ស្តែងពីទ្រឹស្តីបទពីប្រេកង់ទ្រឹស្តីដែលត្រូវគ្នា។ វាអាចត្រូវបានបង្ហាញថា ដោយមិនគិតពីច្បាប់ចែកចាយពិតប្រាកដនៃប្រជាជនទូទៅ ច្បាប់ចែកចាយនៃអថេរចៃដន្យ (20.1) មានទំនោរទៅនឹងច្បាប់ចែកចាយ (សូមមើលការបង្រៀន 12) ជាមួយនឹងចំនួនដឺក្រេនៃសេរីភាព។ k=s- 1 - rកន្លែងណា r- ចំនួនប៉ារ៉ាម៉ែត្រនៃការចែកចាយប៉ាន់ស្មាន ប៉ាន់ស្មានពីទិន្នន័យគំរូ។ ការចែកចាយធម្មតាត្រូវបានកំណត់លក្ខណៈដោយប៉ារ៉ាម៉ែត្រពីរដូច្នេះ k=s- 3. សម្រាប់លក្ខណៈវិនិច្ឆ័យដែលបានជ្រើសរើស តំបន់សំខាន់ខាងស្ដាំត្រូវបានសាងសង់ ដែលកំណត់ដោយលក្ខខណ្ឌ
(20.2)
កន្លែងណា α - កម្រិតសារៈសំខាន់។ ដូច្នេះ តំបន់សំខាន់ត្រូវបានផ្តល់ដោយវិសមភាព និងតំបន់ទទួលយកនៃសម្មតិកម្មគឺ .
ដូច្នេះ ដើម្បីសាកល្បងសម្មតិកម្ម null ហ 0: ចំនួនប្រជាជនត្រូវបានចែកចាយជាធម្មតា - អ្នកត្រូវគណនាតម្លៃដែលបានសង្កេតនៃលក្ខណៈវិនិច្ឆ័យពីគំរូ:
, (20.1`)
ហើយយោងទៅតាមតារាងនៃចំណុចសំខាន់នៃការចែកចាយ χ 2 ស្វែងរកចំណុចសំខាន់ដោយប្រើតម្លៃដែលគេស្គាល់នៃ α និង k=s- 3. ប្រសិនបើ - សម្មតិកម្ម null ត្រូវបានទទួលយក ប្រសិនបើវាត្រូវបានបដិសេធ។
2. ការសាកល្បងសម្មតិកម្មនៃការចែកចាយឯកសណ្ឋាន។
នៅពេលប្រើលក្ខណៈវិនិច្ឆ័យ Pearson ដើម្បីសាកល្បងសម្មតិកម្មនៃការចែកចាយឯកសណ្ឋាននៃប្រជាជនទូទៅជាមួយនឹងដង់ស៊ីតេប្រូបាប៊ីលីតេដែលរំពឹងទុក
វាចាំបាច់ ដោយបានគណនាតម្លៃពីគំរូដែលមាន ដើម្បីប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រ កនិង ខយោងតាមរូបមន្ត៖
កន្លែងណា ក*និង ខ*- ការប៉ាន់ស្មាន កនិង ខ. ជាការពិតសម្រាប់ការចែកចាយឯកសណ្ឋាន ម(X) = , ពីកន្លែងដែលអ្នកអាចទទួលបានប្រព័ន្ធសម្រាប់កំណត់ ក*និង ខ*: , ដំណោះស្រាយគឺកន្សោម (20.3) ។
បន្ទាប់មកសន្មតថា អ្នកអាចរកឃើញប្រេកង់ទ្រឹស្តីដោយប្រើរូបមន្ត
នៅទីនេះ សគឺជាចំនួនចន្លោះពេលដែលគំរូត្រូវបានបែងចែក។
តម្លៃដែលបានសង្កេតនៃលក្ខណៈវិនិច្ឆ័យ Pearson ត្រូវបានគណនាដោយរូបមន្ត (20.1`) ហើយតម្លៃសំខាន់ត្រូវបានគណនាពីតារាងដោយគិតគូរពីការពិតដែលថាចំនួនដឺក្រេនៃសេរីភាព k=s- 3. បន្ទាប់ពីនោះ ព្រំប្រទល់នៃតំបន់សំខាន់ត្រូវបានកំណត់ដូចគ្នាទៅនឹងការសាកល្បងសម្មតិកម្មនៃការចែកចាយធម្មតា។
3. ការសាកល្បងសម្មតិកម្មអំពីការចែកចាយអិចស្ប៉ូណង់ស្យែល។
ក្នុងករណីនេះ ការបែងចែកគំរូដែលមានស្រាប់ទៅជាចន្លោះពេលស្មើគ្នា យើងពិចារណាពីលំដាប់នៃជម្រើសដែលស្មើគ្នាពីគ្នាទៅវិញទៅមក (យើងសន្មត់ថាជម្រើសទាំងអស់ដែលធ្លាក់ចូលទៅក្នុង ខ្ញុំ-th interval យកតម្លៃដែលស្របគ្នាជាមួយពាក់កណ្តាលរបស់វា) និងប្រេកង់ដែលត្រូវគ្នា។ n ខ្ញុំ(ចំនួននៃជម្រើសគំរូរួមបញ្ចូលក្នុង ខ្ញុំ- ចន្លោះពេល) ។ យើងគណនាពីទិន្នន័យទាំងនេះ ហើយយកជាការប៉ាន់ស្មាននៃប៉ារ៉ាម៉ែត្រ λ តម្លៃ។ បន្ទាប់មកប្រេកង់ទ្រឹស្តីត្រូវបានគណនាដោយរូបមន្ត
បន្ទាប់មកតម្លៃដែលបានសង្កេត និងសំខាន់នៃលក្ខណៈវិនិច្ឆ័យ Pearson ត្រូវបានប្រៀបធៀបដោយគិតគូរថាចំនួនដឺក្រេនៃសេរីភាព k=s- 2.