សារៈសំខាន់ស្ថិតិនៃភាពខុសគ្នារវាងគំរូ។ សារៈសំខាន់ស្ថិតិ

សារៈសំខាន់ស្ថិតិឬកម្រិត p-សារៈសំខាន់ - លទ្ធផលតេស្តចម្បង

សម្មតិកម្មស្ថិតិ។ និយាយ ភាសាបច្ចេកទេសគឺជាប្រូបាប៊ីលីតេនៃការទទួលបាន

លទ្ធផល ការសិក្សាគំរូបានផ្តល់ថាជាការពិតសម្រាប់ឧត្តមសេនីយ៍

កំណត់, សម្មតិកម្មទទេគឺពិត - នោះគឺមិនមានទំនាក់ទំនងទេ។ នៅក្នុងពាក្យផ្សេងទៀត, នេះ។

ប្រូបាប៊ីលីតេដែលទំនាក់ទំនងដែលបានរកឃើញគឺចៃដន្យ និងមិនមែនជាទ្រព្យសម្បត្តិ

សរុប។ យ៉ាងពិតប្រាកដ សារៈសំខាន់ស្ថិតិ, p- កម្រិតសារៈសំខាន់គឺ

បរិមាណភាពជឿជាក់នៃការតភ្ជាប់៖ ប្រូបាប៊ីលីតេនេះកាន់តែទាប ការតភ្ជាប់កាន់តែគួរឱ្យទុកចិត្ត។

ឧបមាថានៅពេលប្រៀបធៀបមធ្យោបាយគំរូពីរតម្លៃនៃកម្រិតត្រូវបានទទួល

សារៈសំខាន់ស្ថិតិ p=0.05 ។ នេះមានន័យថាការសាកល្បងសម្មតិកម្មស្ថិតិអំពី

សមភាពនៃមធ្យោបាយនៅក្នុងប្រជាជនទូទៅបានបង្ហាញថាប្រសិនបើវាជាការពិត នោះប្រូបាប៊ីលីតេ

ការកើតឡើងចៃដន្យនៃភាពខុសគ្នាដែលបានរកឃើញគឺមិនលើសពី 5% ។ នៅក្នុងពាក្យផ្សេងទៀតប្រសិនបើ

សំណាកពីរត្រូវបានទាញម្តងហើយម្តងទៀតពីប្រជាជនទូទៅដូចគ្នា បន្ទាប់មកក្នុង 1 នៃ

20 ករណីនឹងបង្ហាញពីភាពខុសគ្នាដូចគ្នា ឬធំជាងរវាងមធ្យោបាយនៃគំរូទាំងនេះ។

នោះគឺមានឱកាស 5% ដែលភាពខុសគ្នាដែលបានរកឃើញគឺចៃដន្យ។

តួអក្សរ និងមិនមែនជាកម្មសិទ្ធិរបស់សរុបទេ។

នៅក្នុងទំនាក់ទំនងមួយ។ សម្មតិកម្មវិទ្យាសាស្ត្រកម្រិតនៃសារៈសំខាន់ស្ថិតិគឺជាបរិមាណ

សូចនាករនៃកម្រិតនៃការមិនទុកចិត្តនៅក្នុងការសន្និដ្ឋានអំពីវត្តមាននៃការតភ្ជាប់ដែលបានគណនាពីលទ្ធផល

ការជ្រើសរើស, ការធ្វើតេស្តជាក់ស្តែងនៃសម្មតិកម្មនេះ។ ម៉េច តម្លៃតិចកម្រិត p ខ្ពស់ជាង

សារៈសំខាន់ស្ថិតិនៃលទ្ធផលនៃការសិក្សាដោយបញ្ជាក់ពីសម្មតិកម្មវិទ្យាសាស្ត្រ។

វាមានប្រយោជន៍ក្នុងការដឹងពីអ្វីដែលមានឥទ្ធិពលលើកម្រិតនៃសារៈសំខាន់។ កម្រិតសារៈសំខាន់ របស់ផ្សេងទៀតស្មើគ្នា

ខាងលើ (តម្លៃ p-ទាប) ប្រសិនបើ៖

ទំហំនៃការតភ្ជាប់ (ភាពខុសគ្នា) គឺធំជាង;

ភាពប្រែប្រួលនៃលក្ខណៈគឺតិចជាង;

ទំហំគំរូគឺធំជាង។

ឯកតោភាគីនេះគឺជាការធ្វើតេស្តសារៈសំខាន់ពីរកន្ទុយ

ប្រសិនបើគោលបំណងនៃការសិក្សាគឺដើម្បីបង្ហាញពីភាពខុសគ្នារវាងប៉ារ៉ាម៉ែត្រនៃទូទៅទាំងពីរ

ការប្រមូលផ្ដុំដែលត្រូវនឹងលក្ខខណ្ឌធម្មជាតិផ្សេងៗរបស់វា ( ស្ថានភាពរស់នៅ,

អាយុនៃមុខវិជ្ជា។ល។) ជារឿយៗ គេមិនដឹងថាតើប៉ារ៉ាម៉ែត្រណាមួយនឹងធំជាង និង

តើមួយណាតូចជាង។

ឧទាហរណ៍ ប្រសិនបើអ្នកចាប់អារម្មណ៍លើភាពប្រែប្រួលនៃលទ្ធផលនៅក្នុងការគ្រប់គ្រង និង

ក្រុមពិសោធន៍, បន្ទាប់មក, ជាក្បួន, មិនមានទំនុកចិត្តលើសញ្ញានៃភាពខុសគ្នារវាងការប្រែប្រួលឬ

គម្លាតស្តង់ដារនៃលទ្ធផលធៀបនឹងការប្រែប្រួលដែលត្រូវបានប៉ាន់ស្មាន។ ក្នុងករណីនេះ

សម្មតិកម្ម null គឺថា វ៉ារ្យង់គឺស្មើគ្នា ហើយគោលដៅនៃការសិក្សាគឺ

បញ្ជាក់ផ្ទុយ, i.e. មានភាពខុសគ្នារវាងភាពខុសគ្នា។ ក្នុងពេលជាមួយគ្នានេះវាត្រូវបានអនុញ្ញាត

ភាពខុសគ្នាអាចជាសញ្ញាណាមួយ។ សម្មតិកម្មបែបនេះត្រូវបានគេហៅថាទ្វេភាគី។

ប៉ុន្តែពេលខ្លះភារកិច្ចគឺដើម្បីបញ្ជាក់ការកើនឡើងឬថយចុះនៅក្នុងប៉ារ៉ាម៉ែត្រមួយ;

ឧទាហរណ៍, លទ្ធផលជាមធ្យមខ្ពស់ជាងនៅក្នុងក្រុមពិសោធន៍ជាងក្រុមត្រួតពិនិត្យ។ ត្រង់ណា

វាមិនត្រូវបានអនុញ្ញាតទៀតទេដែលភាពខុសគ្នាអាចជាសញ្ញាផ្សេងគ្នា។ សម្មតិកម្មបែបនេះត្រូវបានគេហៅថា

ឯកតោភាគី។

ការធ្វើតេស្តសារៈសំខាន់ដែលប្រើដើម្បីសាកល្បងសម្មតិកម្មពីរភាគីត្រូវបានគេហៅថា

ទ្វេភាគី និងសម្រាប់ឯកតោភាគី - ឯកតោភាគី។

សំណួរកើតឡើងថាតើលក្ខណៈវិនិច្ឆ័យណាមួយគួរតែត្រូវបានជ្រើសរើសនៅក្នុងករណីជាក់លាក់មួយ។ ចម្លើយ

សំណួរនេះគឺហួសពីផ្លូវការ វិធីសាស្រ្តស្ថិតិនិងទាំងស្រុង

អាស្រ័យលើគោលបំណងនៃការសិក្សា។ ក្នុងករណីណាក៏ដោយគួរតែជ្រើសរើសលក្ខណៈវិនិច្ឆ័យមួយ ឬមួយផ្សេងទៀត

ធ្វើការពិសោធន៍ដោយផ្អែកលើការវិភាគទិន្នន័យពិសោធន៍ ព្រោះនេះអាច

នាំឱ្យមានការសន្និដ្ឋានខុស។ ប្រសិនបើមុនពេលពិសោធន៍វាត្រូវបានសន្មត់ថាមានភាពខុសគ្នា

ប៉ារ៉ាម៉ែត្រប្រៀបធៀបអាចមានទាំងវិជ្ជមាន និងអវិជ្ជមាន វាដូចខាងក្រោម

កម្រិតនៃសារៈសំខាន់នៅក្នុងស្ថិតិគឺ សូចនាករសំខាន់ឆ្លុះបញ្ចាំងពីកម្រិតនៃភាពជឿជាក់លើភាពត្រឹមត្រូវ ការពិតនៃទិន្នន័យដែលទទួលបាន (ព្យាករណ៍)។ គំនិតនេះត្រូវបានគេប្រើយ៉ាងទូលំទូលាយនៅក្នុង វិស័យផ្សេងៗ៖ ពីការកាន់ ការស្រាវជ្រាវសង្គមវិទ្យាដល់ការធ្វើតេស្តស្ថិតិនៃសម្មតិកម្មវិទ្យាសាស្ត្រ។

និយមន័យ

កម្រិតនៃសារៈសំខាន់ស្ថិតិ (ឬលទ្ធផលស្ថិតិ) បង្ហាញពីអ្វីដែលជាប្រូបាប៊ីលីតេនៃការកើតឡើងដោយចៃដន្យនៃសូចនាករដែលបានសិក្សា។ សារៈសំខាន់ស្ថិតិទូទៅនៃបាតុភូតត្រូវបានបង្ហាញដោយតម្លៃ p (កម្រិត p) ។ នៅក្នុងការពិសោធន៍ ឬការសង្កេតណាមួយ វាមានលទ្ធភាពដែលទិន្នន័យដែលទទួលបានកើតឡើងដោយសារតែកំហុសឆ្គងគំរូ។ នេះជាការពិតជាពិសេសសម្រាប់សង្គមវិទ្យា។

នោះគឺជាតម្លៃមួយគឺមានសារៈសំខាន់ជាស្ថិតិ ដែលប្រូបាប៊ីលីតេនៃការកើតឡើងដោយចៃដន្យគឺតូចបំផុត ឬមាននិន្នាការទៅខ្លាំងបំផុត។ ភាពខ្លាំងនៅក្នុងបរិបទនេះគឺកម្រិតនៃគម្លាតនៃស្ថិតិពីសម្មតិកម្មគ្មានន័យ (សម្មតិកម្មដែលត្រូវបានសាកល្បងសម្រាប់ភាពស៊ីសង្វាក់គ្នាជាមួយនឹងទិន្នន័យគំរូដែលទទួលបាន)។ អេ ការអនុវត្តវិទ្យាសាស្ត្រកម្រិតសារៈសំខាន់ត្រូវបានជ្រើសរើសមុនពេលប្រមូលទិន្នន័យ ហើយតាមក្បួនមេគុណរបស់វាគឺ 0.05 (5%) ។ សម្រាប់ប្រព័ន្ធដែលវាសំខាន់ តម្លៃពិតប្រាកដសូចនាករនេះអាចមាន 0.01 (1%) ឬតិចជាងនេះ។

ផ្ទៃខាងក្រោយ

គោលគំនិតនៃកម្រិតសារៈសំខាន់ត្រូវបានណែនាំដោយអ្នកស្ថិតិជនជាតិអង់គ្លេស និងជាអ្នកជំនាញពន្ធុវិទ្យា Ronald Fisher ក្នុងឆ្នាំ 1925 នៅពេលដែលគាត់កំពុងបង្កើតវិធីសាស្រ្តសម្រាប់ការធ្វើតេស្ត។ សម្មតិកម្មស្ថិតិ. នៅពេលវិភាគដំណើរការណាមួយ មានប្រូបាប៊ីលីតេជាក់លាក់នៃបាតុភូតជាក់លាក់។ ភាពលំបាកកើតឡើងនៅពេលធ្វើការជាមួយភាគរយតូច (ឬមិនច្បាស់) នៃប្រូបាបដែលស្ថិតនៅក្រោមគំនិតនៃ "កំហុសរង្វាស់" ។

នៅពេលធ្វើការជាមួយស្ថិតិដែលមិនជាក់លាក់គ្រប់គ្រាន់ដើម្បីធ្វើតេស្ត អ្នកវិទ្យាសាស្ត្រត្រូវប្រឈមមុខនឹងបញ្ហានៃសម្មតិកម្មទទេ ដែល "រារាំង" ប្រតិបត្តិការជាមួយនឹងតម្លៃតូច។ Fisher បានស្នើឡើងសម្រាប់ប្រព័ន្ធបែបនេះដើម្បីកំណត់ប្រូបាប៊ីលីតេនៃព្រឹត្តិការណ៍នៅ 5% (0.05) ជាការកាត់ចេញគំរូដ៏ងាយស្រួលដែលអនុញ្ញាតឱ្យមនុស្សម្នាក់បដិសេធសម្មតិកម្មទទេនៅក្នុងការគណនា។

សេចក្តីផ្តើមនៃមេគុណថេរ

នៅឆ្នាំ 1933 អ្នកវិទ្យាសាស្ត្រ Jerzy Neumann និង Egon Pearson នៅក្នុងឯកសាររបស់ពួកគេបានផ្តល់អនុសាសន៍ឱ្យកំណត់កម្រិតសារៈសំខាន់ជាក់លាក់មួយជាមុន (មុនពេលប្រមូលទិន្នន័យ)។ ឧទាហរណ៍នៃការប្រើប្រាស់ច្បាប់ទាំងនេះអាចមើលឃើញយ៉ាងច្បាស់ក្នុងអំឡុងពេលបោះឆ្នោត។ ឧបមាថាមានបេក្ខជនពីររូប ដែលម្នាក់ពេញនិយមខ្លាំង ហើយម្នាក់ទៀតមិនសូវស្គាល់។ វាច្បាស់ណាស់ថាបេក្ខជនទីមួយនឹងឈ្នះការបោះឆ្នោត ហើយឱកាសទីពីរមានទំនោរទៅសូន្យ។ ខិតខំ - ប៉ុន្តែមិនស្មើភាពគ្នា៖ តែងតែមានលទ្ធភាពនៃមហាអំណាច ព័ត៍មានដ៏រំជួលចិត្ត ការសម្រេចចិត្តដែលមិនរំពឹងទុកដែលអាចផ្លាស់ប្តូរលទ្ធផលបោះឆ្នោតដែលបានព្យាករណ៍។

Neumann និង Pearson បានយល់ស្របថាកម្រិតសារៈសំខាន់ដែលបានស្នើឡើងរបស់ Fisher គឺ 0.05 (តំណាងដោយនិមិត្តសញ្ញា α) គឺងាយស្រួលបំផុត។ ទោះជាយ៉ាងណាក៏ដោយ Fischer ខ្លួនឯងក្នុងឆ្នាំ 1956 បានជំទាស់នឹងការជួសជុលតម្លៃនេះ។ គាត់ជឿថាកម្រិតនៃ α គួរតែត្រូវបានកំណត់ស្របតាមកាលៈទេសៈជាក់លាក់។ ឧទាហរណ៍នៅក្នុងរូបវិទ្យាភាគល្អិតវាគឺ 0.01 ។

p-តម្លៃ

ពាក្យ p-value ត្រូវបានប្រើប្រាស់ដំបូងដោយ Brownlee ក្នុងឆ្នាំ 1960។ p-level (p-value) គឺជាសូចនាករដែលមាននៅក្នុង ទំនាក់ទំនងបញ្ច្រាសលើសុពលភាពនៃលទ្ធផល។ តម្លៃ p-value ខ្ពស់បំផុតត្រូវគ្នាទៅនឹងកម្រិតនៃភាពជឿជាក់ទាបបំផុតក្នុងទំនាក់ទំនងគំរូរវាងអថេរ។

តម្លៃនេះឆ្លុះបញ្ចាំងពីប្រូបាប៊ីលីតេនៃកំហុសដែលទាក់ទងនឹងការបកស្រាយលទ្ធផល។ សន្មត់ p-value = 0.05 (1/20) ។ វាបង្ហាញពីឱកាសប្រាំភាគរយដែលទំនាក់ទំនងរវាងអថេរដែលរកឃើញក្នុងគំរូគ្រាន់តែជាលក្ខណៈចៃដន្យនៃគំរូប៉ុណ្ណោះ។ នោះគឺប្រសិនបើការពឹងផ្អែកនេះគឺអវត្តមាន នោះជាមួយនឹងការពិសោធន៍ស្រដៀងគ្នាជាច្រើន ជាមធ្យមក្នុងរាល់ការសិក្សាទីម្ភៃ មនុស្សម្នាក់អាចរំពឹងថានឹងមានការពឹងផ្អែកដូចគ្នា ឬច្រើនជាងនេះរវាងអថេរ។ ជាញឹកញាប់កម្រិត p ត្រូវបានចាត់ទុកថាជា "រឹម" នៃកម្រិតកំហុស។

ដោយវិធីនេះ p-value ប្រហែលជាមិនឆ្លុះបញ្ចាំងទេ។ ការញៀនពិតប្រាកដរវាងអថេរ ប៉ុន្តែបង្ហាញតែតម្លៃមធ្យមមួយចំនួននៅក្នុងការសន្មត់ប៉ុណ្ណោះ។ ជាពិសេសការវិភាគចុងក្រោយនៃទិន្នន័យក៏នឹងអាស្រ័យលើតម្លៃដែលបានជ្រើសរើសផងដែរ។ មេគុណដែលបានផ្តល់ឱ្យ. ជាមួយនឹងកម្រិត p = 0.05 នឹងមានលទ្ធផលមួយចំនួន ហើយជាមួយនឹងមេគុណស្មើនឹង 0.01 ផ្សេងទៀត។

ការធ្វើតេស្តសម្មតិកម្មស្ថិតិ

កម្រិតនៃសារៈសំខាន់ស្ថិតិមានសារៈសំខាន់ជាពិសេសនៅពេលធ្វើតេស្តសម្មតិកម្ម។ ឧទាហរណ៍ នៅពេលគណនាការធ្វើតេស្តពីរផ្នែក តំបន់បដិសេធត្រូវបានបែងចែកស្មើគ្នានៅចុងទាំងពីរនៃការចែកចាយគំរូ (ទាក់ទងទៅនឹងសូន្យកូអរដោណេ) ហើយការពិតនៃទិន្នន័យដែលទទួលបានត្រូវបានគណនា។

ឧបមាថាខណៈពេលកំពុងត្រួតពិនិត្យដំណើរការជាក់លាក់មួយ (បាតុភូត) វាបានប្រែក្លាយថាព័ត៌មានស្ថិតិថ្មីបង្ហាញពី ការផ្លាស់ប្តូរតូចទាក់ទងទៅនឹងតម្លៃពីមុន។ ទន្ទឹមនឹងនេះ ភាពខុសគ្នានៃលទ្ធផលគឺតូច មិនជាក់ស្តែង ប៉ុន្តែមានសារៈសំខាន់សម្រាប់ការសិក្សា។ អ្នកឯកទេសប្រឈមមុខនឹងបញ្ហា៖ តើការផ្លាស់ប្តូរពិតជាកើតឡើងមែន ឬជាកំហុសគំរូ (ភាពមិនត្រឹមត្រូវនៃការវាស់វែង)?

ក្នុងករណីនេះ សម្មតិកម្មទុកជាមោឃៈត្រូវបានអនុវត្ត ឬច្រានចោល (អ្វីគ្រប់យ៉ាងត្រូវបានសរសេរចេញជាកំហុស ឬការផ្លាស់ប្តូរនៅក្នុងប្រព័ន្ធត្រូវបានទទួលស្គាល់ថាជាការសម្រេចបាន)។ ដំណើរការនៃការដោះស្រាយបញ្ហាគឺផ្អែកលើសមាមាត្រនៃសារៈសំខាន់ស្ថិតិទូទៅ (p-value) និងកម្រិតនៃសារៈសំខាន់ (α) ។ ប្រសិនបើកម្រិត p< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

តម្លៃដែលបានប្រើ

កម្រិតនៃសារៈសំខាន់អាស្រ័យលើសម្ភារៈដែលបានវិភាគ។ នៅក្នុងការអនុវត្ត តម្លៃថេរខាងក្រោមត្រូវបានប្រើ៖

α = 0.1 (ឬ 10%);
α = 0.05 (ឬ 5%);
α = 0.01 (ឬ 1%);
α = 0.001 (ឬ 0.1%) ។

ការគណនាកាន់តែត្រឹមត្រូវត្រូវបានទាមទារ មេគុណ α កាន់តែតូចត្រូវបានប្រើប្រាស់។ តាមធម្មជាតិ ការព្យាករណ៍ស្ថិតិក្នុងរូបវិទ្យា គីមីវិទ្យា ឱសថ និងពន្ធុវិទ្យា ទាមទារភាពត្រឹមត្រូវជាងផ្នែកវិទ្យាសាស្ត្រនយោបាយ និងសង្គមវិទ្យា។

កម្រិតសារៈសំខាន់នៅក្នុងតំបន់ជាក់លាក់

នៅក្នុងវិស័យដែលមានភាពជាក់លាក់ខ្ពស់ដូចជារូបវិទ្យាភាគល្អិត និងការផលិត សារៈសំខាន់ស្ថិតិជារឿយៗត្រូវបានបង្ហាញជាសមាមាត្រនៃគម្លាតស្តង់ដារ (កំណត់ដោយមេគុណ sigma - σ) ដែលទាក់ទងទៅនឹង ការចែកចាយធម្មតា។ប្រូបាប៊ីលីតេ (ការចែកចាយ Gaussian) ។ σ គឺជាសូចនាករស្ថិតិដែលកំណត់ការបែកខ្ញែកនៃតម្លៃនៃបរិមាណជាក់លាក់មួយទាក់ទងទៅនឹង ការរំពឹងទុកគណិតវិទ្យា. ប្រើដើម្បីរៀបចំផែនការប្រូបាប៊ីលីតេនៃព្រឹត្តិការណ៍។

អាស្រ័យលើវិស័យចំណេះដឹង មេគុណ σ ប្រែប្រួលយ៉ាងខ្លាំង។ ជាឧទាហរណ៍ នៅពេលទស្សន៍ទាយអត្ថិភាពរបស់ Higgs boson ប៉ារ៉ាម៉ែត្រ σ គឺស្មើនឹងប្រាំ (σ=5) ដែលត្រូវនឹងតំបន់ p-value=1/3.5 លាន។

ប្រសិទ្ធភាព

វាត្រូវតែត្រូវបានយកមកពិចារណាថាមេគុណ α និង p-value មិនមែនជាលក្ខណៈជាក់លាក់ទេ។ ទោះបីជាកម្រិតនៃសារៈសំខាន់នៅក្នុងស្ថិតិនៃបាតុភូតដែលកំពុងសិក្សាក៏ដោយ វាមិនមែនជាមូលដ្ឋានគ្មានលក្ខខណ្ឌសម្រាប់ការទទួលយកសម្មតិកម្មនោះទេ។ ឧទាហរណ៍ តម្លៃនៃ α កាន់តែតូច ឱកាសកាន់តែច្រើនដែលសម្មតិកម្មត្រូវបានបង្កើតឡើងមានសារៈសំខាន់។ ទោះយ៉ាងណាក៏ដោយមានហានិភ័យនៃកំហុសដែលកាត់បន្ថយអំណាចស្ថិតិ (សារៈសំខាន់) នៃការសិក្សា។

អ្នកស្រាវជ្រាវដែលផ្តោតទាំងស្រុងលើស្ថិតិ លទ្ធផលប្រកបដោយអត្ថន័យអាចទាញការសន្និដ្ឋានខុស។ ក្នុងពេលជាមួយគ្នានេះ វាជាការលំបាកក្នុងការត្រួតពិនិត្យការងាររបស់ពួកគេពីរដង ដោយសារពួកគេអនុវត្តការសន្មត់ (ដែលតាមពិតទៅគឺជាតម្លៃនៃ α និង p-value)។ ដូច្នេះវាត្រូវបានផ្ដល់អនុសាសន៍ជានិច្ចរួមជាមួយនឹងការគណនានៃសារៈសំខាន់ស្ថិតិដើម្បីកំណត់សូចនាករមួយផ្សេងទៀត - ទំហំនៃឥទ្ធិពលស្ថិតិ។ ទំហំបែបផែនគឺជារង្វាស់បរិមាណនៃកម្លាំងនៃឥទ្ធិពលមួយ។

ស្ថិតិគឺជាផ្នែកសំខាន់នៃជីវិត។ មនុស្សប្រឈមមុខនឹងវាគ្រប់ទីកន្លែង។ ដោយផ្អែកលើស្ថិតិ ការសន្និដ្ឋានត្រូវបានគូរអំពីកន្លែង និងជំងឺអ្វីជារឿងធម្មតា តម្រូវការអ្វីបន្ថែមទៀតនៅក្នុងតំបន់ជាក់លាក់មួយ ឬក្នុងចំណោមផ្នែកជាក់លាក់នៃចំនួនប្រជាជន។ សូម្បីតែការសាងសង់ក៏ផ្អែកលើ កម្មវិធីនយោបាយបេក្ខជនសម្រាប់រដ្ឋាភិបាល។ ពួកវាក៏ត្រូវបានប្រើដោយខ្សែសង្វាក់លក់រាយនៅពេលទិញទំនិញ ហើយអ្នកផលិតត្រូវបានណែនាំដោយទិន្នន័យទាំងនេះនៅក្នុងសំណើរបស់ពួកគេ។

ស្ថិតិលេង តួនាទីសំខាន់នៅក្នុងជីវិតនៃសង្គម និងប៉ះពាល់ដល់សមាជិកម្នាក់ៗរបស់ខ្លួន សូម្បីតែក្នុងរឿងតូចតាចក៏ដោយ។ ឧទាហរណ៍ ប្រសិនបើដោយ មនុស្សភាគច្រើនចូលចិត្ត ពណ៌ងងឹតនៅក្នុងសម្លៀកបំពាក់នៅក្នុងទីក្រុង ឬតំបន់ណាមួយ វានឹងពិបាកខ្លាំងណាស់ក្នុងការស្វែងរកអាវភ្លៀងពណ៌លឿងភ្លឺជាមួយនឹងការបោះពុម្ពផ្កានៅក្នុងហាងក្នុងស្រុក។ ប៉ុន្តែតើបរិមាណអ្វីខ្លះដែលបង្កើតបានជាទិន្នន័យទាំងនេះដែលមានឥទ្ធិពលបែបនេះ? ឧទាហរណ៍ តើអ្វីទៅជា«ស្ថិតិសំខាន់»? តើនិយមន័យនេះមានន័យដូចម្តេច?

តើវាគឺជាអ្វី?

ស្ថិតិជាវិទ្យាសាស្ត្រត្រូវបានបង្កើតឡើងដោយការរួមបញ្ចូលគ្នា ទំហំផ្សេងគ្នានិងគំនិត។ មួយក្នុងចំណោមពួកគេគឺជាគំនិតនៃ "សារៈសំខាន់ស្ថិតិ" ។ នេះគឺជាឈ្មោះនៃតម្លៃ អថេរប្រូបាប៊ីលីតេនៃការកើតឡើងនៃសូចនាករផ្សេងទៀតដែលមានការធ្វេសប្រហែស។

ជាឧទាហរណ៍ មនុស្ស 9 នាក់ក្នុងចំណោម 10 នាក់ពាក់ស្បែកជើងកៅស៊ូនៅលើជើងរបស់ពួកគេក្នុងអំឡុងពេល ដើរពេលព្រឹកសម្រាប់ផ្សិតនៅក្នុង ព្រៃរដូវស្លឹកឈើជ្រុះបន្ទាប់ពីយប់ភ្លៀងមួយ។ ប្រូបាប៊ីលីតេដែលនៅចំណុចខ្លះ 8 នៃពួកគេដាក់នៅលើផ្ទាំងក្រណាត់ moccasins គឺមានការធ្វេសប្រហែស។ ដូច្នេះនៅក្នុងនេះ។ ឧទាហរណ៍ជាក់លាក់លេខ 9 គឺជាតម្លៃដែលត្រូវបានគេហៅថា "សារៈសំខាន់ស្ថិតិ" ។

អ៊ីចឹងបើយើងអភិវឌ្ឍបន្ថែមលើចំណុចខាងលើ ឧទាហរណ៍ជាក់ស្តែងហាងលក់ស្បែកជើងកំពុងទិញនៅចុងបញ្ចប់ រដូវក្ដៅស្បែកជើងកវែងកៅស៊ូមានចំនួនច្រើនជាងពេលផ្សេងទៀតនៃឆ្នាំ។ បាទ តម្លៃ សារៈសំខាន់ស្ថិតិមានឥទ្ធិពលលើជីវិតប្រចាំថ្ងៃ។

ជាការពិតណាស់នៅក្នុងការគណនាស្មុគ្រស្មាញឧទាហរណ៍នៅពេលទស្សន៍ទាយការរីករាលដាលនៃមេរោគ។ លេខធំអថេរ។ ប៉ុន្តែខ្លឹមសារសំខាន់នៃការកំណត់សូចនាករសំខាន់នៃទិន្នន័យស្ថិតិគឺស្រដៀងគ្នា ដោយមិនគិតពីភាពស្មុគស្មាញនៃការគណនា និងចំនួននៃតម្លៃមិនថេរ។

តើវាត្រូវបានគណនាយ៉ាងដូចម្តេច?

ប្រើនៅពេលគណនាតម្លៃនៃសូចនាករ "សារៈសំខាន់ស្ថិតិ" នៃសមីការ។ នោះគឺវាអាចប្រកែកបានថានៅក្នុងករណីនេះអ្វីគ្រប់យ៉ាងត្រូវបានសម្រេចដោយគណិតវិទ្យា។ ដោយច្រើនបំផុត ជម្រើសសាមញ្ញការគណនាគឺជាខ្សែសង្វាក់ ប្រតិបត្តិការគណិតវិទ្យាដែលរួមបញ្ចូលប៉ារ៉ាម៉ែត្រដូចខាងក្រោមៈ

លទ្ធផលពីរប្រភេទដែលទទួលបានពីការស្ទង់មតិ ឬការសិក្សាទិន្នន័យគោលបំណង ឧទាហរណ៍ ចំនួនទឹកប្រាក់ដែលការទិញត្រូវបានធ្វើឡើង តំណាងដោយ a និង b;
សូចនាករសម្រាប់ក្រុមទាំងពីរ - n;
តម្លៃនៃចំណែកនៃគំរូរួមបញ្ចូលគ្នា - ទំ;
គំនិតនៃ "កំហុសស្តង់ដារ" - អេស។

ជំហានបន្ទាប់គឺដើម្បីកំណត់សូចនាករការធ្វើតេស្តទាំងមូល - t តម្លៃរបស់វាត្រូវបានប្រៀបធៀបជាមួយលេខ 1.96 ។ 1.96 គឺជាតម្លៃមធ្យមដែលតំណាងឱ្យជួរ 95% យោងទៅតាមការចែកចាយ t របស់សិស្ស។

សំណួរជារឿយៗកើតឡើងថាតើអ្វីជាភាពខុសគ្នារវាងតម្លៃនៃ n និង p ។ nuance នេះងាយស្រួលបញ្ជាក់ជាមួយឧទាហរណ៍មួយ។ ឧបមាថា សារៈសំខាន់ស្ថិតិនៃភាពស្មោះត្រង់ចំពោះផលិតផល ឬម៉ាកណាមួយរបស់បុរស និងស្ត្រីត្រូវបានគណនា។

ក្នុងករណីនេះ អក្សរនឹងធ្វើតាមដូចខាងក្រោម៖

n គឺជាចំនួនអ្នកឆ្លើយសំណួរ;
p - ចំនួននៃការពេញចិត្តនឹងផលិតផល។

ចំនួនស្ត្រីដែលត្រូវបានសម្ភាសន៍ក្នុងករណីនេះនឹងត្រូវបានកំណត់ថាជា n1 ។ ដូច្នោះហើយបុរស - n2 ។ តម្លៃដូចគ្នានឹងមានលេខ "1" និង "2" នៅនិមិត្តសញ្ញាទំ។

ការប្រៀបធៀបសូចនាករតេស្តជាមួយនឹងតម្លៃមធ្យមនៃតារាងគណនារបស់សិស្សក្លាយជាអ្វីដែលគេហៅថា "សារៈសំខាន់ស្ថិតិ" ។

តើការផ្ទៀងផ្ទាត់មានន័យដូចម្តេច?

លទ្ធផលនៃការគណនាគណិតវិទ្យាណាមួយអាចត្រូវបានពិនិត្យជានិច្ច វាត្រូវបានបង្រៀនដល់កុមារសូម្បីតែក្នុង បឋមសិក្សា. វាជាឡូជីខលក្នុងការសន្មត់ថាចាប់តាំងពីសូចនាករស្ថិតិត្រូវបានកំណត់ដោយប្រើខ្សែសង្វាក់នៃការគណនាបន្ទាប់មកពួកគេត្រូវបានត្រួតពិនិត្យ។

ទោះជាយ៉ាងណាក៏ដោយ ការធ្វើតេស្តសម្រាប់សារៈសំខាន់ស្ថិតិមិនមែនគ្រាន់តែជាគណិតវិទ្យាប៉ុណ្ណោះទេ។ ស្ថិតិទាក់ទងនឹង បរិមាណដ៏ច្រើន។អថេរ និងប្រូបាប៊ីលីតេផ្សេងៗ ដែលមិនតែងតែអាចទទួលយកបានក្នុងការគណនា។ នោះគឺប្រសិនបើយើងត្រលប់ទៅឧទាហរណ៍ដែលបានផ្តល់ឱ្យនៅដើមអត្ថបទជាមួយ ស្បែកជើងកៅស៊ូបន្ទាប់មកការសាងសង់ឡូជីខលនៃទិន្នន័យស្ថិតិដែលអ្នកទិញទំនិញសម្រាប់ហាងនឹងពឹងផ្អែកលើ អាចត្រូវបានរំខានដោយអាកាសធាតុស្ងួត និងក្តៅ ដែលមិនមែនជាលក្ខណៈធម្មតាសម្រាប់រដូវស្លឹកឈើជ្រុះ។ ជាលទ្ធផលនៃបាតុភូតនេះចំនួនអ្នកទិញស្បែកជើងកៅស៊ូនឹងថយចុះហើយហាងលក់ទំនិញនឹងទទួលរងការខាតបង់។ ប្រមើលមើលអាកាសធាតុខុសប្រក្រតី រូបមន្តគណិតវិទ្យាជាការពិតណាស់មិនអាច។ ពេលវេលានេះត្រូវបានគេហៅថា - "កំហុស" ។

វាច្បាស់ណាស់ប្រូបាប៊ីលីតេនៃកំហុសបែបនេះដែលការត្រួតពិនិត្យកម្រិតនៃសារៈសំខាន់ដែលបានគណនាយកទៅក្នុងគណនី។ វាយកទៅក្នុងគណនីទាំងសូចនាករដែលបានគណនា និងកម្រិតសារៈសំខាន់ដែលទទួលយក ក៏ដូចជាបរិមាណដែលហៅថាសម្មតិកម្មធម្មតា។

តើកម្រិតនៃសារៈសំខាន់គឺជាអ្វី?

គំនិតនៃ "កម្រិត" ត្រូវបានរួមបញ្ចូលនៅក្នុងលក្ខណៈវិនិច្ឆ័យចម្បងសម្រាប់សារៈសំខាន់ស្ថិតិ។ វាត្រូវបានប្រើក្នុងស្ថិតិអនុវត្ត និងជាក់ស្តែង។ នេះគឺជាប្រភេទនៃបរិមាណដែលគិតគូរពីប្រូបាប៊ីលីតេ គម្លាតដែលអាចកើតមានឬកំហុស។

កម្រិតគឺផ្អែកលើការកំណត់អត្តសញ្ញាណនៃភាពខុសគ្នានៅក្នុងគំរូដែលត្រៀមរួចជាស្រេច វាអនុញ្ញាតឱ្យអ្នកបង្កើតសារៈសំខាន់របស់ពួកគេ ឬផ្ទុយទៅវិញភាពចៃដន្យ។ គំនិតនេះមិនត្រឹមតែមានអត្ថន័យឌីជីថលប៉ុណ្ណោះទេ ប៉ុន្តែក៏មានការបកស្រាយប្លែកៗរបស់ពួកគេផងដែរ។ ពួកគេពន្យល់ពីរបៀបយល់ពីតម្លៃ ហើយកម្រិតខ្លួនឯងត្រូវបានកំណត់ដោយការប្រៀបធៀបលទ្ធផលជាមួយនឹងសន្ទស្សន៍មធ្យម នេះបង្ហាញពីកម្រិតនៃភាពជឿជាក់នៃភាពខុសគ្នា។

ដូច្នេះគោលគំនិតនៃកម្រិតមួយអាចត្រូវបានបង្ហាញយ៉ាងសាមញ្ញ - វាគឺជាសូចនាករនៃកំហុសដែលអាចទទួលយកបាន ដែលអាចទទួលយកបាន ឬកំហុសក្នុងការសន្និដ្ឋានដែលទាញចេញពីទិន្នន័យស្ថិតិដែលទទួលបាន។

តើកម្រិតសំខាន់អ្វីត្រូវបានប្រើ?

សារៈសំខាន់ស្ថិតិនៃមេគុណប្រូបាប៊ីលីតេនៃកំហុសក្នុងការអនុវត្តគឺផ្អែកលើកម្រិតមូលដ្ឋានចំនួនបី។

កម្រិតទីមួយគឺជាកម្រិតដែលតម្លៃគឺ 5% ។ នោះគឺប្រូបាប៊ីលីតេនៃកំហុសមិនលើសពីកម្រិតសារៈសំខាន់ 5% ទេ។ នេះមានន័យថា ទំនុកចិត្តលើភាពគ្មានកំហុស និងភាពមិនអាចកាត់ថ្លៃបាននៃការសន្និដ្ឋានដែលបានធ្វើឡើងដោយផ្អែកលើទិន្នន័យស្រាវជ្រាវស្ថិតិគឺ 95% ។

កម្រិតទីពីរគឺកម្រិត 1% ។ ដូច្នោះហើយតួលេខនេះមានន័យថាមនុស្សម្នាក់អាចត្រូវបានដឹកនាំដោយទិន្នន័យដែលទទួលបានក្នុងអំឡុងពេលគណនាស្ថិតិដោយមានទំនុកចិត្ត 99% ។

កម្រិតទីបីគឺ 0.1% ។ ជាមួយនឹងតម្លៃនេះ ប្រូបាប៊ីលីតេនៃកំហុសគឺស្មើនឹងប្រភាគនៃភាគរយ ដែលមានន័យថា កំហុសត្រូវបានលុបចោលជាក់ស្តែង។

តើអ្វីជាសម្មតិកម្មនៅក្នុងស្ថិតិ?

កំហុសជាគោលគំនិតត្រូវបានបែងចែកជាពីរផ្នែកទាក់ទងនឹងការទទួលយកឬការបដិសេធនៃសម្មតិកម្មទទេ។ សម្មតិកម្មគឺជាគំនិតមួយដែលយោងទៅតាមនិយមន័យ សំណុំនៃទិន្នន័យ ឬសេចក្តីថ្លែងការណ៍ផ្សេងទៀតត្រូវបានលាក់។ នោះគឺជាការពិពណ៌នា ការចែកចាយប្រូបាប៊ីលីតេអ្វីមួយដែលទាក់ទងទៅនឹងប្រធានបទនៃគណនេយ្យស្ថិតិ។

មានសម្មតិកម្មពីរក្នុងការគណនាសាមញ្ញ - សូន្យ និងជំនួស។ ភាពខុសគ្នារវាងពួកគេគឺថាសម្មតិកម្មទទេគឺផ្អែកលើគំនិតដែលថាមិនមានភាពខុសគ្នាជាមូលដ្ឋានរវាងគំរូដែលពាក់ព័ន្ធនឹងការកំណត់សារៈសំខាន់ស្ថិតិ ហើយជម្រើសជំនួសគឺផ្ទុយស្រឡះពីវា។ I.e សម្មតិកម្មជំនួសដោយផ្អែកលើវត្តមាននៃភាពខុសគ្នាយ៉ាងសំខាន់នៅក្នុងគំរូទាំងនេះ។

តើមានកំហុសអ្វីខ្លះ?

កំហុសជាគោលគំនិតក្នុងស្ថិតិគឺអាស្រ័យដោយផ្ទាល់ទៅលើការទទួលយកសម្មតិកម្មមួយឬមួយផ្សេងទៀតថាជាការពិត។ ពួកគេអាចបែងចែកជាពីរទិស ឬប្រភេទ៖

ប្រភេទទីមួយគឺដោយសារតែការទទួលយកសម្មតិកម្មគ្មានន័យ ដែលប្រែទៅជាមិនត្រឹមត្រូវ។
ទីពីរគឺបណ្តាលមកពីការធ្វើតាមជម្រើស។

ប្រភេទនៃកំហុសទីមួយត្រូវបានគេហៅថា false positive ហើយជារឿងធម្មតានៅក្នុងគ្រប់វិស័យដែលស្ថិតិត្រូវបានប្រើប្រាស់។ ដូច្នោះហើយកំហុសនៃប្រភេទទីពីរត្រូវបានគេហៅថាអវិជ្ជមានមិនពិត។

ហេតុអ្វីបានជាការតំរែតំរង់មានសារៈសំខាន់នៅក្នុងស្ថិតិ?

សារៈសំខាន់ស្ថិតិនៃការតំរែតំរង់គឺថាវាអាចត្រូវបានប្រើដើម្បីកំណត់ថាតើគំរូដែលបានគណនាលើមូលដ្ឋានទិន្នន័យគឺពិតប្រាកដ។ ភាពអាស្រ័យផ្សេងៗ; អនុញ្ញាតឱ្យអ្នកកំណត់អត្តសញ្ញាណភាពគ្រប់គ្រាន់ ឬកង្វះកត្តាសម្រាប់គណនេយ្យ និងការសន្និដ្ឋាន។

តម្លៃតំរែតំរង់ត្រូវបានកំណត់ដោយការប្រៀបធៀបលទ្ធផលជាមួយនឹងទិន្នន័យដែលបានរាយក្នុងតារាង Fisher ។ ឬប្រើការវិភាគនៃភាពខុសគ្នា។ សារៈសំខាន់សូចនាករតំរែតំរង់មានភាពស្មុគស្មាញ ការសិក្សាស្ថិតិនិងការគណនាដែលពាក់ព័ន្ធ មួយចំនួនធំនៃអថេរ ទិន្នន័យចៃដន្យ និងការផ្លាស់ប្តូរទំនង។

សារៈសំខាន់ស្ថិតិ

លទ្ធផលដែលទទួលបានដោយប្រើនីតិវិធីស្រាវជ្រាវជាក់លាក់មួយត្រូវបានគេហៅថា ស្ថិតិសំខាន់ប្រសិនបើប្រូបាប៊ីលីតេនៃការកើតឡើងដោយចៃដន្យរបស់ពួកគេគឺតូចណាស់។ គំនិតនេះអាចត្រូវបានបង្ហាញដោយឧទាហរណ៍នៃការបោះកាក់។ ឧបមាថាកាក់មួយត្រូវបានបង្វិល 30 ដង; វាបានឡើងក្បាល 17 ដង និង 13 ដងវាឡើងកន្ទុយ។ ធ្វើវា សំខាន់តើនេះជាគម្លាតពីលទ្ធផលដែលរំពឹងទុក (ក្បាល ១៥ និង ១៥ កន្ទុយ) ឬនេះជាការចៃដន្យ? ជាឧទាហរណ៍ ដើម្បីឆ្លើយសំណួរនេះ អ្នកអាចបោះកាក់ដូចគ្នាជាច្រើនដង 30 ដងក្នុងមួយជួរ ហើយនៅពេលជាមួយគ្នានោះត្រូវកត់ចំណាំថាតើសមាមាត្រនៃក្បាល និងកន្ទុយប៉ុន្មានដងស្មើនឹង 17:13 ត្រូវបានធ្វើម្តងទៀត។ ការវិភាគស្ថិតិជួយយើងពីដំណើរការដ៏ធុញទ្រាន់នេះ។ ដោយមានជំនួយរបស់វា បន្ទាប់ពីការបោះកាក់ចំនួន 30 ដំបូង គេអាចប៉ាន់ប្រមាណចំនួនដែលអាចកើតមានដោយចៃដន្យនៃ 17 ក្បាល និង 13 កន្ទុយ។ ការប៉ាន់ប្រមាណបែបនេះត្រូវបានគេហៅថាសេចក្តីថ្លែងការណ៍ប្រូបាប៊ីលីតេ។

អេ អក្សរសិល្ប៍វិទ្យាសាស្ត្រនៅក្នុងសេចក្តីថ្លែងការណ៍នៃចិត្តវិទ្យានៃអង្គការឧស្សាហកម្ម - ប្រូបាប៊ីលីកនៅក្នុង ទម្រង់គណិតវិទ្យាតំណាងដោយកន្សោម រ(ប្រូបាប៊ីលីតេ)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (រ< 0.01) ។ ការពិតនេះគឺមានសារៈសំខាន់សម្រាប់ការយល់ដឹងអំពីអក្សរសិល្ប៍ ប៉ុន្តែមិនគួរត្រូវបានយកទៅមានន័យថា វាគ្មានន័យទេក្នុងការធ្វើការសង្កេតដែលមិនស្របតាមស្តង់ដារទាំងនេះ។ អ្វីដែលហៅថាលទ្ធផលស្រាវជ្រាវមិនសំខាន់ (ការសង្កេតដែលអាចទទួលបានដោយចៃដន្យ ច្រើនទៀតមួយ ឬប្រាំដងក្នុងចំណោម 100) អាចមានប្រយោជន៍ខ្លាំងណាស់សម្រាប់ការកំណត់អត្តសញ្ញាណនិន្នាការ និងជាការណែនាំសម្រាប់ការស្រាវជ្រាវនាពេលអនាគត។

វាគួរតែត្រូវបានគេកត់សម្គាល់ផងដែរថាមិនមែនអ្នកចិត្តសាស្រ្តទាំងអស់យល់ស្របជាមួយនឹងស្តង់ដារ និងនីតិវិធីប្រពៃណី (ឧទាហរណ៍ Cohen, 1994; Sauley & Bedeian, 1989)។ បញ្ហាដែលទាក់ទងនឹងការវាស់វែងគឺខ្លួនឯង ប្រធានបទដ៏សំខាន់ការងាររបស់អ្នកស្រាវជ្រាវជាច្រើនដែលសិក្សាពីភាពត្រឹមត្រូវនៃវិធីសាស្រ្តវាស់វែង និងតម្រូវការជាមុនដែលជាមូលដ្ឋាន វិធីសាស្រ្តដែលមានស្រាប់និងស្តង់ដារ ក៏ដូចជាការអភិវឌ្ឍវេជ្ជបណ្ឌិត និងឧបករណ៍ថ្មីៗ។ ប្រហែលជាពេលខ្លះនៅពេលអនាគត ការស្រាវជ្រាវនៅក្នុងអំណាចនេះនឹងនាំឱ្យមានការផ្លាស់ប្តូរស្តង់ដារប្រពៃណីសម្រាប់ការវាយតម្លៃសារៈសំខាន់ស្ថិតិ ហើយការផ្លាស់ប្តូរទាំងនេះនឹងទទួលបានការទទួលយកជាសកល។ (ជំពូកទី 5 នៃសមាគមចិត្តសាស្រ្តអាមេរិកប្រមូលផ្តុំអ្នកចិត្តសាស្រ្តដែលមានជំនាញក្នុងការសិក្សាការវាយតម្លៃ ការវាស់វែង និងស្ថិតិ។ )

នៅក្នុងរបាយការណ៍ស្រាវជ្រាវ សេចក្តីថ្លែងការណ៍ប្រូបាប៊ីលីតេដូចជា រ< 0.05, ដោយសារតែមួយចំនួន ស្ថិតិនោះគឺជាចំនួនដែលត្រូវបានទទួលជាលទ្ធផលនៃសំណុំជាក់លាក់នៃដំណើរការគណនាគណិតវិទ្យា។ ការបញ្ជាក់អំពីប្រូបាប៊ីលីតេត្រូវបានទទួលដោយការប្រៀបធៀបស្ថិតិទាំងនេះជាមួយនឹងទិន្នន័យពីតារាងពិសេសដែលត្រូវបានបោះពុម្ពសម្រាប់គោលបំណងនេះ។ នៅក្នុងអង្គភាពឧស្សាហកម្ម ការស្រាវជ្រាវផ្លូវចិត្តស្ថិតិដែលជួបប្រទះញឹកញាប់ដូចជា r, F, t, r>(អាន "ឈីការ៉េ") និង រ(អាន "ច្រើន។ R") ។ក្នុងករណីនីមួយៗស្ថិតិ (លេខមួយ) ដែលទទួលបានពីការវិភាគនៃស៊េរីនៃការសង្កេតអាចប្រៀបធៀបជាមួយលេខពីតារាងដែលបានបោះពុម្ព។ បន្ទាប់ពីនោះ គេអាចបង្កើតសេចក្តីថ្លែងការណ៍ប្រូបាប៊ីលីតេអំពីប្រូបាប៊ីលីតេនៃការទទួលបានលេខនេះដោយចៃដន្យ ពោលគឺដើម្បីធ្វើការសន្និដ្ឋានអំពីសារៈសំខាន់នៃការសង្កេត។

ដើម្បីយល់ពីការសិក្សាដែលបានពិពណ៌នានៅក្នុងសៀវភៅនេះ វាគ្រប់គ្រាន់ដើម្បីឱ្យមានការយល់ដឹងច្បាស់លាស់អំពីគោលគំនិតនៃសារៈសំខាន់ស្ថិតិ ហើយមិនចាំបាច់ដឹងពីរបៀបដែលស្ថិតិដែលបានរៀបរាប់ខាងលើត្រូវបានគណនានោះទេ។ ទោះយ៉ាងណាក៏ដោយ វានឹងមានប្រយោជន៍ក្នុងការពិភាក្សាពីការសន្មត់មួយដែលបង្កប់នូវដំណើរការទាំងអស់នេះ។ នេះគឺជាការសន្មតថាអថេរដែលបានសង្កេតទាំងអស់ត្រូវបានចែកចាយប្រហែល ច្បាប់ធម្មតា។. លើសពីនេះ នៅពេលអានរបាយការណ៍ស្តីពីការស្រាវជ្រាវចិត្តសាស្ត្រនៃស្ថាប័នឧស្សាហកម្ម គំនិតចំនួនបីទៀតជារឿយៗកើតឡើងដែលដើរតួនាទីយ៉ាងសំខាន់ - ទីមួយ ទំនាក់ទំនង និង ទំនាក់ទំនងទីពីរ អថេរកំណត់/ទស្សន៍ទាយ និង "ANOVA" ( ការវិភាគនៃភាពខុសគ្នា) ទីបី ក្រុមនៃវិធីសាស្រ្តស្ថិតិនៅក្រោម ឈ្មោះទូទៅ"ការវិភាគមេតា" ។

ការធ្វើតេស្តសម្មតិកម្មត្រូវបានអនុវត្តដោយប្រើការវិភាគស្ថិតិ។ សារៈសំខាន់ស្ថិតិត្រូវបានរកឃើញដោយប្រើ P-value ដែលត្រូវនឹងប្រូបាប៊ីលីតេ ព្រឹត្តិការណ៍នេះ។នៅក្រោមការសន្មត់ថាសេចក្តីថ្លែងការណ៍មួយចំនួន (សម្មតិកម្មទទេ) គឺពិត។ ប្រសិនបើតម្លៃ P តិចជាងកម្រិតនៃសារៈសំខាន់ស្ថិតិ (ជាធម្មតា 0.05) អ្នកពិសោធន៍អាចសន្និដ្ឋានដោយសុវត្ថិភាពថាសម្មតិកម្មទទេគឺមិនពិត ហើយបន្តទៅពិចារណាសម្មតិកម្មជំនួស។ ដោយប្រើតេស្ត t-test របស់សិស្ស អ្នកអាចគណនាតម្លៃ P និងកំណត់សារៈសំខាន់សម្រាប់សំណុំទិន្នន័យពីរ។

ជំហាន

ផ្នែកទី 1

រៀបចំការពិសោធន៍

កំណត់សម្មតិកម្មរបស់អ្នក។ជំហានដំបូងក្នុងការវាយតម្លៃសារៈសំខាន់ស្ថិតិគឺជ្រើសរើសសំណួរដែលអ្នកចង់ឆ្លើយ ហើយបង្កើតសម្មតិកម្ម។ សម្មតិកម្មគឺជាសេចក្តីថ្លែងការណ៍អំពីទិន្នន័យពិសោធន៍ ការចែកចាយ និងលក្ខណៈសម្បត្តិរបស់វា។ សម្រាប់ការពិសោធន៍ណាមួយ មានទាំងសម្មតិកម្មជាមោឃៈ និងសម្មតិកម្មជំនួស។ និយាយជាទូទៅ អ្នកនឹងត្រូវប្រៀបធៀបសំណុំទិន្នន័យពីរដើម្បីកំណត់ថាតើពួកវាដូចគ្នា ឬខុសគ្នា។

សម្មតិកម្មគ្មានន័យ (H 0) ជាធម្មតាចែងថាមិនមានភាពខុសគ្នារវាងសំណុំទិន្នន័យទាំងពីរទេ។ ឧទាហរណ៍៖ សិស្សដែលអានសម្ភារៈមុនថ្នាក់មិនបានពិន្ទុខ្ពស់ជាងនេះទេ។
សម្មតិកម្មជំនួស (H a) គឺផ្ទុយពីសម្មតិកម្ម null និងជាសេចក្តីថ្លែងការណ៍ដែលត្រូវការបញ្ជាក់ជាមួយនឹងទិន្នន័យពិសោធន៍។ ឧទាហរណ៍៖ សិស្សដែលអានសម្ភារៈមុនថ្នាក់ទទួលបានពិន្ទុខ្ពស់ជាង។

កំណត់កម្រិតសារៈសំខាន់ដើម្បីកំណត់ថាតើការចែកចាយទិន្នន័យត្រូវមានភាពខុសគ្នាពីកម្រិតធម្មតាប៉ុណ្ណា ដើម្បីចាត់ទុកថាជាលទ្ធផលដ៏សំខាន់។ កម្រិតសារៈសំខាន់ (ហៅផងដែរថា α (\\ ទម្រង់បង្ហាញ \\ អាល់ហ្វា)-level) គឺជាកម្រិតដែលអ្នកកំណត់សម្រាប់សារៈសំខាន់ស្ថិតិ។ ប្រសិនបើតម្លៃ P តិចជាង ឬស្មើនឹងកម្រិតសារៈសំខាន់ នោះទិន្នន័យត្រូវបានចាត់ទុកថាមានសារៈសំខាន់ជាស្ថិតិ។
- តាមក្បួនកម្រិតនៃសារៈសំខាន់ (តម្លៃ α (\\ ទម្រង់បង្ហាញ \\ អាល់ហ្វា)) ត្រូវបានគេយកស្មើនឹង 0.05 ដែលក្នុងករណីនេះប្រូបាប៊ីលីតេនៃការរកឃើញភាពខុសគ្នាចៃដន្យរវាងសំណុំទិន្នន័យផ្សេងគ្នាគឺត្រឹមតែ 5% ប៉ុណ្ណោះ។
- កម្រិតខ្ពស់នៃសារៈសំខាន់ (ហើយតាមនោះ p-value តិច) លទ្ធផលកាន់តែគួរឱ្យទុកចិត្ត។
- ប្រសិនបើអ្នកចង់បានលទ្ធផលដែលគួរឱ្យទុកចិត្តជាងមុន សូមទម្លាក់តម្លៃ P មកត្រឹម 0.01 ។ ជាធម្មតាតម្លៃ P ទាបត្រូវបានប្រើក្នុងផលិតកម្មនៅពេលដែលវាចាំបាច់ដើម្បីរកមើលពិការភាពនៅក្នុងផលិតផល។ ក្នុងករណីនេះ ភាពស្មោះត្រង់ខ្ពស់គឺត្រូវបានទាមទារដើម្បីធានាថាគ្រប់ផ្នែកទាំងអស់ដំណើរការដូចការរំពឹងទុក។
- សម្រាប់ការពិសោធន៍សម្មតិកម្មភាគច្រើន កម្រិតសារៈសំខាន់នៃ 0.05 គឺគ្រប់គ្រាន់។
សម្រេចចិត្តថាតើលក្ខខណ្ឌណាមួយដែលអ្នកនឹងប្រើ៖ម្ខាងឬពីរចំហៀង។ ការសន្មត់មួយនៅក្នុងការធ្វើតេស្ត t របស់សិស្សគឺថាទិន្នន័យត្រូវបានចែកចាយជាធម្មតា។ ការចែកចាយធម្មតាគឺជាខ្សែកោងរាងកណ្តឹងជាមួយ ចំនួនអតិបរមាលទ្ធផលនៅកណ្តាលខ្សែកោង។ តេស្ត T-test របស់សិស្សគឺ វិធីសាស្រ្តគណិតវិទ្យាសុពលភាពទិន្នន័យ ដែលអនុញ្ញាតឱ្យអ្នកកំណត់ថាតើទិន្នន័យធ្លាក់នៅខាងក្រៅការចែកចាយធម្មតា (ច្រើន តិច ឬនៅក្នុង "កន្ទុយ" នៃខ្សែកោង)។
- ប្រសិនបើអ្នកមិនប្រាកដថាតើទិន្នន័យខាងលើឬខាងក្រោម ក្រុមត្រួតពិនិត្យតម្លៃ ប្រើការសាកល្បងពីរកន្ទុយ។ នេះនឹងអនុញ្ញាតឱ្យអ្នកកំណត់សារៈសំខាន់ក្នុងទិសដៅទាំងពីរ។
- ប្រសិនបើអ្នកដឹងថាក្នុងទិសដៅណាដែលទិន្នន័យអាចនឹងធ្លាក់នៅខាងក្រៅការចែកចាយធម្មតា សូមប្រើការសាកល្បងមួយកន្ទុយ។ នៅក្នុងឧទាហរណ៍ខាងលើ យើងរំពឹងថាថ្នាក់របស់សិស្សនឹងកើនឡើង ដូច្នេះការធ្វើតេស្តមួយកន្ទុយអាចត្រូវបានប្រើ។
កំណត់ទំហំគំរូដោយប្រើថាមពលស្ថិតិ។អំណាចស្ថិតិនៃការសិក្សាគឺជាប្រូបាប៊ីលីតេដែលទំហំគំរូដែលបានផ្តល់ឱ្យនឹងបង្កើតលទ្ធផលរំពឹងទុក។ កម្រិតថាមពលទូទៅ (ឬβ) គឺ 80% ។ ការវិភាគថាមពលដោយគ្មានទិន្នន័យពីមុនអាចមានភាពលំបាក ពីព្រោះព័ត៌មានមួយចំនួនត្រូវបានទាមទារអំពីមធ្យោបាយដែលរំពឹងទុកនៅក្នុងសំណុំទិន្នន័យនីមួយៗ និងគម្លាតស្តង់ដាររបស់វា។ ប្រើម៉ាស៊ីនគណនាថាមពលស្ថិតិតាមអ៊ីនធឺណិតដើម្បីកំណត់ទំហំគំរូល្អបំផុតសម្រាប់ទិន្នន័យរបស់អ្នក។
- ជាធម្មតា អ្នកស្រាវជ្រាវធ្វើការសិក្សាសាកល្បងតូចមួយដែលផ្តល់ទិន្នន័យសម្រាប់ការវិភាគថាមពល និងកំណត់ទំហំគំរូដែលត្រូវការសម្រាប់ការសិក្សាធំជាង និងពេញលេញជាងនេះ។
- ប្រសិនបើអ្នកមិនមានឱកាសធ្វើការសិក្សាសាកល្បងទេ សូមព្យាយាមប៉ាន់ប្រមាណតម្លៃមធ្យមដែលអាចធ្វើទៅបានដោយផ្អែកលើទិន្នន័យអក្សរសិល្ប៍ និងលទ្ធផលរបស់មនុស្សផ្សេងទៀត។ វាអាចជួយអ្នកកំណត់ទំហំគំរូល្អបំផុត។
ផ្នែកទី 2
គណនា គម្លាតស្តង់ដារ
1. សរសេររូបមន្តសម្រាប់គម្លាតស្តង់ដារ។គម្លាតស្តង់ដារបង្ហាញពីទំហំនៃការរីករាលដាលនៃទិន្នន័យ។ វាអនុញ្ញាតឱ្យអ្នកសន្និដ្ឋានពីរបៀបបិទទិន្នន័យដែលទទួលបាននៅលើគំរូជាក់លាក់មួយ។ នៅ glance ដំបូង រូបមន្តហាក់ដូចជាស្មុគស្មាញ ប៉ុន្តែការពន្យល់ខាងក្រោមនឹងជួយអ្នកឱ្យយល់ពីវា។ រូបមន្តមាន ទិដ្ឋភាពបន្ទាប់: s = √∑((x i − µ) 2 /(N − 1))។
  - s - គម្លាតស្តង់ដារ;
  - សញ្ញា ∑ បង្ហាញថាទិន្នន័យទាំងអស់ដែលទទួលបានក្នុងគំរូគួរតែត្រូវបានបន្ថែម។
  - x i ត្រូវគ្នានឹងតម្លៃ i-th នោះគឺជាលទ្ធផលដាច់ដោយឡែកដែលទទួលបាន។
  - µ គឺជាតម្លៃមធ្យមសម្រាប់ក្រុមនេះ;
  - ន- ចំនួនសរុបទិន្នន័យនៅក្នុងគំរូ។
2. ស្វែងរកមធ្យមភាគក្នុងក្រុមនីមួយៗ។ដើម្បីគណនាគម្លាតស្តង់ដារ ជាដំបូងអ្នកត្រូវតែស្វែងរកមធ្យមសម្រាប់ក្រុមសិក្សានីមួយៗ។ តម្លៃមធ្យមត្រូវបានចង្អុលបង្ហាញ អក្សរក្រិកµ (ម) ។ ដើម្បីស្វែងរកមធ្យម គ្រាន់តែបន្ថែមតម្លៃលទ្ធផលទាំងអស់ ហើយបែងចែកវាដោយចំនួនទិន្នន័យ (ទំហំគំរូ)។
  - ឧទាហរណ៍ដើម្បីស្វែងរក ថ្នាក់មធ្យមនៅក្នុងក្រុមសិស្សដែលសិក្សាសម្ភារៈមុនថ្នាក់ សូមពិចារណាលើសំណុំទិន្នន័យតូចមួយ។ សម្រាប់ភាពសាមញ្ញ យើងប្រើសំណុំនៃប្រាំចំណុច៖ 90, 91, 85, 83 និង 94 ។
  - ចូរបន្ថែមតម្លៃទាំងអស់ជាមួយគ្នា៖ 90 + 91 + 85 + 83 + 94 = 443 ។
  - ចែកផលបូកដោយចំនួនតម្លៃ N = 5: 443/5 = 88.6 ។
  - ដូច្នេះតម្លៃមធ្យមសម្រាប់ក្រុមនេះគឺ 88.6 ។
3. ដកតម្លៃនីមួយៗដែលទទួលបានពីមធ្យមភាគ។ ជំហានបន្ទាប់គឺត្រូវគណនាភាពខុសគ្នា (x i - µ) ។ ដើម្បីធ្វើដូចនេះដកពីអ្វីដែលបានរកឃើញ ទំហំមធ្យមតម្លៃនីមួយៗដែលទទួលបាន។ ក្នុងឧទាហរណ៍របស់យើង យើងត្រូវស្វែងរកភាពខុសគ្នាចំនួនប្រាំ៖
  - (90 - 88.6), (91 - 88.6), (85 - 88.6), (83 - 88.6) និង (94 - 88.6) ។
  - ជាលទ្ធផលយើងទទួលបាន តម្លៃខាងក្រោម៖ 1.4, 2.4, -3.6, -5.6 និង 5.4 ។
4. ការ៉េតម្លៃនីមួយៗដែលទទួលបាន ហើយបន្ថែមពួកវាជាមួយគ្នា។បរិមាណនីមួយៗដែលទើបតែរកឃើញគួរតែជាការ៉េ។ ទាំងអស់នឹងបាត់នៅជំហាននេះ។ តម្លៃអវិជ្ជមាន. ប្រសិនបើបន្ទាប់ពីជំហាននេះអ្នកមាន លេខអវិជ្ជមានបន្ទាប់មកអ្នកភ្លេចដាក់ការ៉េ។
  - ឧទាហរណ៍របស់យើង យើងទទួលបាន 1.96, 5.76, 12.96, 31.36 និង 29.16។
  - យើងបន្ថែមតម្លៃដែលទទួលបាន៖ 1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2 ។
5. ចែកដោយទំហំគំរូដក 1 ។នៅក្នុងរូបមន្តផលបូកត្រូវបានបែងចែកដោយ N - 1 ដោយសារតែការពិតដែលថាយើងមិនយកទៅក្នុងគណនី ប្រជាជនទូទៅប៉ុន្តែយើងយកគំរូសិស្សទាំងអស់មកវាយតម្លៃ។
  - ដក៖ N − 1 = 5 − 1 = 4
  - ចែក: 81.2/4 = 20.3
6. ស្រង់ចេញ ឫសការេ. បន្ទាប់ពីចែកផលបូកដោយទំហំគំរូដកមួយ យកឫសការ៉េនៃតម្លៃដែលបានរកឃើញ។ នេះគឺជាជំហានចុងក្រោយក្នុងការគណនាគម្លាតស្តង់ដារ។ មានកម្មវិធីស្ថិតិដែលបន្ទាប់ពីបញ្ចូលទិន្នន័យដំបូងអនុវត្តការគណនាចាំបាច់ទាំងអស់។
  - ក្នុងឧទាហរណ៍របស់យើង គម្លាតស្តង់ដារនៃសញ្ញាសម្គាល់របស់សិស្សទាំងនោះដែលអានសម្ភារៈមុនថ្នាក់គឺ s = √20.3 = 4.51 ។
  ផ្នែកទី 3
  កំណត់សារៈសំខាន់
  1. គណនាភាពខុសគ្នារវាងក្រុមទិន្នន័យទាំងពីរ។រហូតមកដល់ជំហាននេះ យើងបានពិចារណាឧទាហរណ៍សម្រាប់ក្រុមទិន្នន័យតែមួយប៉ុណ្ណោះ។ ប្រសិនបើអ្នកចង់ប្រៀបធៀបក្រុមពីរ ច្បាស់ណាស់អ្នកគួរតែយកទិន្នន័យសម្រាប់ក្រុមទាំងពីរ។ គណនាគម្លាតស្តង់ដារសម្រាប់ក្រុមទីពីរនៃទិន្នន័យ ហើយបន្ទាប់មកស្វែងរកភាពខុសគ្នារវាងក្រុមទាំងពីរ ក្រុមពិសោធន៍. ការបែកខ្ចាត់ខ្ចាយត្រូវបានគណនាដោយប្រើរូបមន្តដូចខាងក្រោមៈ s d = √((s 1 / N 1) + (s 2 / N 2)) ។

វិបផតថលសម្រាប់សិស្ស។ ការបណ្តុះបណ្តាលខ្លួនឯង