ម៉ាទ្រីសនៃមេគុណជាប់ទាក់ទងជាគូបង្ហាញ។ និយមន័យនៃមេគុណទំនាក់ទំនងច្រើនក្នុង MS Excel

កត្តា Collinear គឺ...

និង collinear ។

4. នៅក្នុងគំរូតំរែតំរង់ច្រើន កត្តាកំណត់នៃម៉ាទ្រីសនៃមេគុណទំនាក់ទំនងដែលបានផ្គូផ្គងរវាងកត្តា និងជិតដល់សូន្យ។ នេះមានន័យថាកត្តា និង ... គឺជាកត្តាពហុជួរ។

5. សម្រាប់គំរូសេដ្ឋកិច្ចនៃសមីការតំរែតំរង់លីនេអ៊ែរ មេទ្រីសនៃមេគុណទំនាក់ទំនងលីនេអ៊ែរដែលបានផ្គូផ្គង ( yគឺជាអថេរអាស្រ័យ; x (1),x (2), x (3), x(4)- អថេរឯករាជ្យ)៖


Collinear (ទាក់ទងយ៉ាងជិតស្និទ្ធ) អថេរឯករាជ្យ (ពន្យល់) មិន​មែនx(2)និង x(3)

1. បានផ្តល់តារាងនៃទិន្នន័យដំបូងសម្រាប់ការកសាងគំរូតំរែតំរង់សេដ្ឋកិច្ច៖

អថេរអត់ចេះសោះ មិន​មែន

បទពិសោធន៍​ការងារ

ផលិតភាពការងារ

2. នៅពេលសិក្សាពីការពឹងផ្អែកនៃការប្រើប្រាស់សាច់លើកម្រិតប្រាក់ចំណូល និងភេទរបស់អ្នកប្រើប្រាស់ យើងអាចណែនាំ...

ប្រើអថេរអត់ចេះសោះ - ភេទរបស់អ្នកប្រើប្រាស់

ចែកចំនួនប្រជាជនជាពីរ៖ សម្រាប់អ្នកប្រើប្រាស់ជាស្ត្រី និងអ្នកប្រើប្រាស់បុរស

3. យើងសិក្សាពីភាពអាស្រ័យនៃតម្លៃផ្ទះល្វែង ( នៅ) ពីតំបន់រស់នៅរបស់នាង ( X) និងប្រភេទផ្ទះ។ គំរូនេះរួមបញ្ចូលទាំងអថេរអត់ចេះសោះដែលឆ្លុះបញ្ចាំងពីប្រភេទផ្ទះដែលបានពិចារណាដូចជា៖ monolithic, panel, brick ។ សមីការតំរែតំរង់ត្រូវបានទទួល៖ ,
កន្លែងណា ,
សមីការតំរែតំរង់ជាពិសេសសម្រាប់ឥដ្ឋ និង monolithic គឺ ...

សម្រាប់ប្រភេទផ្ទះឥដ្ឋ

សម្រាប់ផ្ទះប្រភេទ monolithic

4. នៅពេលវិភាគសហគ្រាសឧស្សាហកម្មនៅក្នុងតំបន់ចំនួនបី (សាធារណរដ្ឋ Mari El សាធារណរដ្ឋ Chuvashia សាធារណរដ្ឋ Tatarstan) សមីការតំរែតំរង់ពិសេសចំនួនបីត្រូវបានបង្កើតឡើង៖

សម្រាប់សាធារណរដ្ឋ Mari El;

សម្រាប់សាធារណរដ្ឋ Chuvashia;

សម្រាប់សាធារណរដ្ឋតាតាស្តង់។

ចង្អុលបង្ហាញប្រភេទនៃអថេរអត់ចេះសោះ និងសមីការជាមួយអថេរអត់ចេះសោះ ដែលធ្វើអោយសមីការតំរែតំរង់ជាក់លាក់បី។

5. នៅក្នុង econometrics, a dummy variable ត្រូវបានចាត់ទុកថាជា...

variable ដែលយកតម្លៃ 0 និង 1

ការពណ៌នាក្នុងន័យបរិមាណ ជាសញ្ញាគុណភាព

1. សម្រាប់គំរូតំរែតំរង់នៃការពឹងផ្អែកនៃប្រាក់ចំណូលជាមធ្យមក្នុងមនុស្សម្នាក់ៗនៃចំនួនប្រជាជន (រូប្លិង, នៅ) នៃបរិមាណនៃផលិតផលក្នុងតំបន់សរុប (ពាន់រូប្លិ៍។ x ១) និងអត្រាគ្មានការងារធ្វើនៅក្នុងប្រធានបទ (%, x ២) សមីការត្រូវបានទទួល។ តម្លៃនៃមេគុណតំរែតំរង់សម្រាប់អថេរ x ២បង្ហាញថាជាមួយនឹងការផ្លាស់ប្តូរអត្រាគ្មានការងារធ្វើ 1% ប្រាក់ចំណូលជាមធ្យមសម្រាប់មនុស្សម្នាក់គឺ ______ rubles ជាមួយនឹងតម្លៃថេរនៃផលិតផលក្នុងស្រុកសរុប។

នឹងប្តូរទៅ (-1.67)

2. នៅក្នុងសមីការតំរែតំរង់ជួរលីនេអ៊ែរ៖ តើថ្លៃដើមនៃទ្រព្យសកម្មថេរ (ពាន់រូប្លិ៍); - ចំនួនបុគ្គលិក (រាប់ពាន់នាក់); y- ប៉ារ៉ាម៉ែត្របរិមាណផលិតកម្មឧស្សាហកម្ម (ពាន់រូប្លិ៍) ជាមួយនឹងអថេរ x ១ស្មើនឹង 10.8 មានន័យថាជាមួយនឹងការកើនឡើងនៃបរិមាណនៃទ្រព្យសកម្មថេរដោយ _____ បរិមាណផលិតកម្មឧស្សាហកម្មគឺ _____ ជាមួយនឹងចំនួននិយោជិតថេរ។


សម្រាប់ 1 ពាន់រូប្លិ៍។ ... នឹងកើនឡើង 10.8 ពាន់រូប្លិ៍។

3. វាត្រូវបានគេដឹងថាសមាមាត្រនៃបំរែបំរួលសំណល់នៃអថេរអាស្រ័យនៅក្នុងវ៉ារ្យង់សរុបរបស់វាគឺ 0.2 ។ បន្ទាប់មកតម្លៃនៃមេគុណនៃការកំណត់គឺ ... 0.8

4. គំរូសេដ្ឋកិច្ចត្រូវបានបង្កើតឡើងសម្រាប់ការពឹងផ្អែកនៃប្រាក់ចំណេញលើការលក់ឯកតាផលិតកម្ម (ជូត។ , នៅ) លើចំនួនដើមទុនធ្វើការរបស់សហគ្រាស (ពាន់រូប្លិ៍។ x ១) . ជាលទ្ធផលប្រាក់ចំណេញជាមធ្យមពីការលក់ដែលមិនអាស្រ័យលើបរិមាណនៃដើមទុនធ្វើការរបស់សហគ្រាសគឺ _____ rubles ។ ១០.៧៥

5. ស្ថិតិ F ត្រូវបានគណនាជាសមាមាត្រនៃ ______ បំរែបំរួល ______ ទៅ _______ បំរែបំរួលដែលត្រូវបានគណនាក្នុងមួយដឺក្រេនៃសេរីភាព។ Factorial ... សំណល់

1. សម្រាប់គំរូសេដ្ឋកិច្ចនៃសមីការតំរែតំរង់ កំហុសគំរូត្រូវបានកំណត់ថាជា ______ រវាងតម្លៃពិតនៃអថេរអាស្រ័យ និងតម្លៃដែលបានគណនារបស់វា។ ភាពខុសគ្នា

2. តម្លៃត្រូវបានគេហៅថា ...សមាសធាតុចៃដន្យ

3. នៅក្នុងគំរូ econometric នៃសមីការតំរែតំរង់ គម្លាតនៃតម្លៃជាក់ស្តែងនៃអថេរអាស្រ័យពីតម្លៃដែលបានគណនារបស់វាកំណត់លក្ខណៈ ... កំហុសគំរូ

4. វាត្រូវបានគេដឹងថាសមាមាត្រនៃបំរែបំរួលដែលបានពន្យល់នៅក្នុងវ៉ារ្យង់សរុបគឺ 0.2 ។ បន្ទាប់មកតម្លៃនៃមេគុណនៃការកំណត់គឺ ... 0.2

5. ជាមួយនឹងវិធីសាស្រ្តការេតិចបំផុត ប៉ារ៉ាម៉ែត្រនៃសមីការនៃតំរែតំរង់លីនេអ៊ែរដែលបានផ្គូផ្គង ត្រូវបានកំណត់ពីលក្ខខណ្ឌ ______ សំណល់។បង្រួមអប្បបរមាផលបូកនៃការ៉េ

1. ដើម្បីរកមើលការជាប់ទាក់ទងគ្នាដោយស្វ័យប្រវត្តិនៅក្នុងសំណល់ សូមប្រើ...

ស្ថិតិ Durbin-Watson

2. វាត្រូវបានគេដឹងថាមេគុណនៃ autocorrelation នៃសំណល់នៃលំដាប់ទីមួយស្មើ -0.3 ។ បានផ្តល់ផងដែរនូវតម្លៃសំខាន់នៃស្ថិតិ Durbin-Watson សម្រាប់ចំនួនប៉ារ៉ាម៉ែត្រដែលបានផ្តល់ឱ្យដោយមិនស្គាល់ និងចំនួននៃការសង្កេត , . យោងតាមលក្ខណៈទាំងនេះយើងអាចសន្និដ្ឋានថា ... មិនមានការជាប់ទាក់ទងគ្នាដោយស្វ័យប្រវត្តិនៃសំណល់

ដំបូងចូលទៅក្នុងគំរូ នៅរួមបញ្ចូលសមាសធាតុសំខាន់ៗទាំងអស់ (តម្លៃដែលបានគណនាត្រូវបានចង្អុលបង្ហាញនៅក្នុងតង្កៀប t- លក្ខណៈវិនិច្ឆ័យ)៖

គុណភាពនៃគំរូត្រូវបានកំណត់លក្ខណៈដោយ: មេគុណច្រើននៃការកំណត់ r= 0.517, កំហុសប្រហាក់ប្រហែលដែលទាក់ទងជាមធ្យម = 10.4%, បំរែបំរួលសំណល់ ស២= 1.79 និង obs = 121. នៅក្នុងទិដ្ឋភាពនៃការពិតដែលថា obs > cr = 2.85 នៅ α = 0.05, v1 = 6, v2= 14, សមីការតំរែតំរង់គឺសំខាន់ ហើយយ៉ាងហោចណាស់មួយនៃមេគុណតំរែតំរង់ - β 1 , β 2 , β 3 , β 4 - គឺមិនស្មើនឹងសូន្យ។

ប្រសិនបើសារៈសំខាន់នៃសមីការតំរែតំរង់ (សម្មតិកម្ម H 0:β 1 = β 2 = β 3 = β 4 = 0 ត្រូវបានពិនិត្យនៅ α = 0.05 បន្ទាប់មកសារៈសំខាន់នៃមេគុណតំរែតំរង់ i.e. សម្មតិកម្ម H0៖ β j = 0 (j= 1, 2, 3, 4) គួរតែត្រូវបានពិនិត្យនៅកម្រិតសារៈសំខាន់ធំជាង 0.05 ឧទាហរណ៍នៅ α = ០.១. បន្ទាប់មកសម្រាប់ α = 0.1, v= 14 តម្លៃ t kr = 1.76 និងសំខាន់ដូចខាងក្រោមពីសមីការ (53.41) គឺជាមេគុណតំរែតំរង់ β 1 , β 2 , β 3 ។

ដោយពិចារណាថាសមាសធាតុសំខាន់ៗមិនជាប់ទាក់ទងគ្នា យើងអាចដកមេគុណមិនសំខាន់ទាំងអស់ចេញពីសមីការភ្លាមៗ ហើយសមីការនឹងយកទម្រង់

(53.42)

ការប្រៀបធៀបសមីការ (53.41) និង (53.42) យើងឃើញថាការលុបបំបាត់សមាសធាតុសំខាន់ៗដែលមិនសំខាន់ f4និង f5, មិនប៉ះពាល់ដល់តម្លៃនៃមេគុណនៃសមីការ b 0 = 9,52, b 1 = 0,93, b 2 = 0.66 និងដែលត្រូវគ្នា។ tj (j = 0, 1, 2, 3).

នេះគឺដោយសារតែសមាសធាតុចម្បងដែលមិនទាក់ទងគ្នា។ នៅទីនេះ ភាពស្របគ្នានៃសមីការតំរែតំរង់សម្រាប់សូចនាករដំបូង (53.22), (53.23) និងសមាសធាតុសំខាន់ៗ (53.41), (53.42) គឺគួរឱ្យចាប់អារម្មណ៍។

សមីការ (53.42) គឺសំខាន់ដោយសារតែ obs = 194 > kr = 3.01 រកឃើញនៅ α = 0.05, v1 = 4, v2= 16. មេគុណនៃសមីការក៏សំខាន់ផងដែរ ចាប់តាំងពី t j > t kr . = 1.746 ដែលត្រូវគ្នានឹង α = 0.01, v= 16 សម្រាប់ j= 0, 1, 2, 3. មេគុណនៃការកំណត់ r= 0.486 បង្ហាញថា 48.6% នៃការប្រែប្រួល នៅដោយសារតែឥទ្ធិពលនៃសមាសធាតុសំខាន់បីដំបូង។

សមីការ (53.42) ត្រូវបានកំណត់លក្ខណៈដោយកំហុសទាក់ទងជាមធ្យមនៃប្រហាក់ប្រហែល = 9.99% និងបំរែបំរួលសំណល់ s2 = 1,91.

សមីការតំរែតំរង់នៅលើសមាសធាតុចម្បង (53.42) មានលក្ខណៈសម្បត្តិប្រហាក់ប្រហែលប្រសើរជាងបន្តិចបើប្រៀបធៀបទៅនឹងគំរូតំរែតំរង់ (53.23) នៅក្នុងលក្ខខណ្ឌនៃសូចនាករដំបូង: r= 0,486 > r= 0,469; = 9,99% < (X) = 10.5% និង s 2 (f) = 1,91 < s 2 (x) =១.៩៧. លើសពីនេះទៀតនៅក្នុងសមីការ (53.42) សមាសធាតុចម្បងគឺជាមុខងារលីនេអ៊ែរនៃសូចនាករបញ្ចូលទាំងអស់ ខណៈដែលសមីការ (53.23) រួមបញ្ចូលតែអថេរពីរប៉ុណ្ណោះ ( x ១និង x ៤). ក្នុងករណីខ្លះ គេត្រូវយកទៅពិចារណាថា គំរូ (53.42) ពិបាកបកស្រាយ ព្រោះវារួមបញ្ចូលសមាសធាតុសំខាន់ទីបី។ f ៣ដែល​យើង​មិន​បាន​បកស្រាយ និង​ការ​រួម​ចំណែក​របស់​អ្នក​ចំពោះ​ភាព​ខុស​គ្នា​សរុប​នៃ​សូចនាករ​ដំបូង ( x 1 , ..., x 5)ត្រឹមតែ ៨,៦% ប៉ុណ្ណោះ។ ទោះយ៉ាងណាក៏ដោយករណីលើកលែង f ៣ពីសមីការ (53.42) ធ្វើឱ្យលក្ខណៈសម្បត្តិប្រហាក់ប្រហែលនៃគំរូកាន់តែអាក្រក់ទៅ ៗ ៖ r= 0.349; = 12.4% និង ស២(f) = 2.41 ។ បន្ទាប់មក គួរតែជ្រើសរើសសមីការ (53.23) ជាគំរូតំរែតំរង់នៃផលិតភាព។

ការវិភាគចង្កោម

នៅក្នុងការស្រាវជ្រាវស្ថិតិ ការដាក់ជាក្រុមនៃទិន្នន័យបឋមគឺជាការសម្រេចចិត្តចម្បង ភារកិច្ចចាត់ថ្នាក់,ដូច្នេះហើយជាមូលដ្ឋាននៃការងារបន្ថែមទៀតទាំងអស់ជាមួយនឹងព័ត៌មានដែលប្រមូលបាន។

ជាប្រពៃណី បញ្ហានេះត្រូវបានដោះស្រាយតាមវិធីខាងក្រោម។ ពីសំណុំនៃលក្ខណៈពិសេសដែលពិពណ៌នាអំពីវត្ថុ មួយត្រូវបានជ្រើសរើស ពត៌មានច្រើនបំផុតពីទស្សនៈរបស់អ្នកស្រាវជ្រាវ ហើយទិន្នន័យត្រូវបានដាក់ជាក្រុមស្របតាមតម្លៃនៃលក្ខណៈពិសេសនេះ។ ប្រសិនបើវាត្រូវបានគេតម្រូវឱ្យចាត់ថ្នាក់តាមលក្ខណៈមួយចំនួន ដោយចាត់ថ្នាក់ក្នុងចំណោមខ្លួនគេតាមលំដាប់នៃសារៈសំខាន់ នោះដំបូងការចាត់ថ្នាក់ត្រូវបានអនុវត្តទៅតាមលក្ខណៈទីមួយ បន្ទាប់មកថ្នាក់លទ្ធផលនីមួយៗត្រូវបានបែងចែកទៅជាថ្នាក់រងតាមលក្ខណៈទីពីរ ហើយដូច្នេះ នៅលើ ការដាក់ជាក្រុមស្ថិតិរួមបញ្ចូលគ្នាភាគច្រើនត្រូវបានបង្កើតឡើងតាមរបៀបស្រដៀងគ្នា។

ក្នុងករណីដែលមិនអាចសម្រួលលក្ខណៈចាត់ថ្នាក់បាន វិធីសាស្ត្រសាមញ្ញបំផុតនៃការដាក់ជាក្រុមពហុវិមាត្រត្រូវបានប្រើ - ការបង្កើតសូចនាករអាំងតេក្រាល (លិបិក្រម) មុខងារអាស្រ័យលើលក្ខណៈដើម ជាមួយនឹងការចាត់ថ្នាក់ជាបន្តបន្ទាប់យោងទៅតាមសូចនាករនេះ។

ការអភិវឌ្ឍន៍នៃវិធីសាស្រ្តនេះគឺជាបំរែបំរួលនៃការចាត់ថ្នាក់យោងទៅតាមសូចនាករទូទៅមួយចំនួន (សមាសធាតុចម្បង) ដែលទទួលបានដោយប្រើវិធីសាស្រ្តនៃការវិភាគកត្តាឬសមាសធាតុ។

ប្រសិនបើមានលក្ខណៈពិសេសមួយចំនួន (ដំបូង ឬទូទៅ) បញ្ហានៃការចាត់ថ្នាក់អាចត្រូវបានដោះស្រាយដោយវិធីសាស្ត្រវិភាគចង្កោម ដែលខុសពីវិធីសាស្ត្រចាត់ថ្នាក់ពហុវ៉ារ្យង់ផ្សេងទៀត ក្នុងករណីដែលគ្មានគំរូបណ្តុះបណ្តាល ពោលគឺឧ។ ព័ត៌មានជាអាទិភាពអំពីការចែកចាយប្រជាជនទូទៅ។

ភាពខុសគ្នារវាងគ្រោងការណ៍សម្រាប់ការដោះស្រាយបញ្ហានៃការចាត់ថ្នាក់ត្រូវបានកំណត់យ៉ាងទូលំទូលាយដោយអ្វីដែលមានន័យដោយគំនិតនៃ "ភាពស្រដៀងគ្នា" និង "កម្រិតនៃភាពស្រដៀងគ្នា" ។

បន្ទាប់ពីគោលដៅនៃការងារត្រូវបានបង្កើតឡើង វាជាធម្មជាតិក្នុងការព្យាយាមកំណត់លក្ខណៈវិនិច្ឆ័យគុណភាព មុខងារគោលបំណង តម្លៃដែលនឹងអនុញ្ញាតឱ្យយើងប្រៀបធៀបគ្រោងការណ៍ចាត់ថ្នាក់ផ្សេងៗគ្នា។

នៅក្នុងការសិក្សាសេដ្ឋកិច្ច មុខងារគោលបំណង ជាក្បួនគួរតែកាត់បន្ថយប៉ារ៉ាម៉ែត្រមួយចំនួនដែលបានកំណត់លើសំណុំនៃវត្ថុមួយ (ឧទាហរណ៍ គោលបំណងនៃការបែងចែកឧបករណ៍អាចជាក្រុមដែលកាត់បន្ថយការចំណាយសរុបនៃពេលវេលា និងប្រាក់សម្រាប់ការងារជួសជុល)។

ក្នុងករណីដែលមិនអាចកំណត់គោលដៅនៃបញ្ហាជាផ្លូវការ លក្ខណៈវិនិច្ឆ័យសម្រាប់គុណភាពនៃចំណាត់ថ្នាក់អាចជាលទ្ធភាពនៃការបកស្រាយប្រកបដោយអត្ថន័យនៃក្រុមដែលបានរកឃើញ។

ពិចារណាបញ្ហាខាងក្រោម។ អនុញ្ញាតឱ្យប្រមូល ទំវត្ថុនីមួយៗដែលត្រូវបានកំណត់លក្ខណៈ kលក្ខណៈវាស់វែង។ វាត្រូវបានទាមទារដើម្បីបំបែកបណ្តុំនេះទៅជាក្រុម (ថ្នាក់) ដែលមានលក្ខណៈដូចគ្នាក្នុងន័យជាក់លាក់មួយ។ ក្នុងពេលជាមួយគ្នានេះ ជាក់ស្តែងមិនមានព័ត៌មានជាអាទិភាពអំពីលក្ខណៈនៃការចែកចាយនោះទេ។ k- វ៉ិចទ័រវិមាត្រ Xនៅខាងក្នុងថ្នាក់។

ក្រុមដែលទទួលបានជាលទ្ធផលនៃការបំបែកជាធម្មតាត្រូវបានគេហៅថា clusters* (taxons**, images) វិធីសាស្ត្រក្នុងការស្វែងរកពួកវាត្រូវបានគេហៅថា ការវិភាគចង្កោម (រៀងៗខ្លួន ការធ្វើវចនានុក្រមលេខ ឬការទទួលស្គាល់គំរូជាមួយនឹងការរៀនដោយខ្លួនឯង)។

* ចង្កោម(ភាសាអង់គ្លេស) - ក្រុមនៃធាតុដែលកំណត់ដោយទ្រព្យសម្បត្តិរួមមួយចំនួន។

**តាខប(ភាសាអង់គ្លេស) - ក្រុមប្រព័ន្ធនៃប្រភេទណាមួយ។

វាចាំបាច់តាំងពីដើមដំបូងដើម្បីយល់ច្បាស់ថាតើបញ្ហាចំណាត់ថ្នាក់ពីរណាដែលត្រូវដោះស្រាយ។ ប្រសិនបើបញ្ហាវាយអត្ថបទធម្មតាត្រូវបានដោះស្រាយ នោះសំណុំនៃការសង្កេតត្រូវបានបែងចែកទៅជាតំបន់មួយចំនួនតូចនៃក្រុម (ឧទាហរណ៍ ស៊េរីបំរែបំរួលចន្លោះពេលនៅក្នុងករណីនៃការសង្កេតមួយវិមាត្រ) ដូច្នេះធាតុនៃតំបន់មួយគឺដូចជា នៅជិតគ្នាតាមដែលអាចធ្វើទៅបាន។

ដំណោះស្រាយនៃបញ្ហាមួយទៀតគឺដើម្បីកំណត់ការតម្រៀបតាមធម្មជាតិនៃលទ្ធផលនៃការសង្កេតទៅជាចង្កោមដែលបានកំណត់យ៉ាងល្អដែលស្ថិតនៅចម្ងាយខ្លះពីគ្នាទៅវិញទៅមក។

ប្រសិនបើបញ្ហាវាយអក្សរទីមួយតែងតែមានដំណោះស្រាយ នោះក្នុងករណីទីពីរវាអាចបង្ហាញថាសំណុំនៃការសង្កេតមិនបង្ហាញពីការ stratification ធម្មជាតិទៅជាចង្កោម ពោលគឺឧ។ បង្កើតជាចង្កោមមួយ។

ទោះបីជាវិធីសាស្រ្តជាច្រើននៃការវិភាគចង្កោមមានលក្ខណៈបឋមក៏ដោយ ប៉ុន្តែភាគច្រើននៃការងារដែលពួកគេត្រូវបានស្នើឡើងមានតាំងពីទសវត្សរ៍ចុងក្រោយ។ នេះត្រូវបានពន្យល់ដោយការពិតដែលថាដំណោះស្រាយដ៏មានប្រសិទ្ធភាពនៃបញ្ហាស្វែងរកចង្កោម ដែលតម្រូវឱ្យមានប្រតិបត្តិការនព្វន្ធ និងតក្កវិជ្ជាមួយចំនួនធំ បានក្លាយជាអាចធ្វើទៅបានលុះត្រាតែការមកដល់ និងការអភិវឌ្ឍន៍នៃបច្ចេកវិទ្យាកុំព្យូទ័រ។

ទម្រង់ធម្មតានៃការតំណាងនៃទិន្នន័យដំបូងនៅក្នុងបញ្ហានៃការវិភាគចង្កោមគឺជាម៉ាទ្រីស

បន្ទាត់នីមួយៗដែលតំណាងឱ្យលទ្ធផលនៃការវាស់វែង kចាត់​ទុក​លក្ខណៈ​ពិសេស​នៅ​ក្នុង​វត្ថុ​មួយ​ក្នុង​ចំណោម​វត្ថុ​ដែល​បាន​ពិនិត្យ។ នៅក្នុងស្ថានភាពជាក់លាក់ ទាំងការដាក់ជាក្រុមនៃវត្ថុ និងការដាក់ជាក្រុមនៃលក្ខណៈអាចមានការចាប់អារម្មណ៍។ ក្នុងករណីទាំងនោះដែលភាពខុសគ្នារវាងកិច្ចការទាំងពីរនេះមិនសំខាន់ ឧទាហរណ៍ នៅពេលពិពណ៌នាអំពីក្បួនដោះស្រាយមួយចំនួន យើងនឹងប្រើតែពាក្យ "វត្ថុ" រួមទាំងពាក្យ "លក្ខណៈពិសេស" នៅក្នុងគំនិតនេះ។

ម៉ាទ្រីស Xមិនមែនជាមធ្យោបាយតែមួយគត់ដើម្បីតំណាងឱ្យទិន្នន័យនៅក្នុងបញ្ហានៃការវិភាគចង្កោមនោះទេ។ ពេលខ្លះព័ត៌មានដំបូងត្រូវបានផ្តល់ជាម៉ាទ្រីសការ៉េ

ធាតុ រីចដែលកំណត់កម្រិតនៃភាពជិតស្និទ្ធ ខ្ញុំ- វត្ថុទី j- មុ.

ក្បួនដោះស្រាយការវិភាគចង្កោមភាគច្រើនពឹងផ្អែកទាំងស្រុងលើម៉ាទ្រីសចម្ងាយ (ឬជិត) ឬទាមទារការគណនាធាតុនីមួយៗរបស់វា ដូច្នេះប្រសិនបើទិន្នន័យត្រូវបានបង្ហាញក្នុងទម្រង់ x,បន្ទាប់មកជំហានដំបូងក្នុងការដោះស្រាយបញ្ហានៃការស្វែងរកចង្កោមនឹងជាជម្រើសនៃវិធីសាស្ត្រសម្រាប់គណនាចម្ងាយ ឬជិតរវាងវត្ថុ ឬលក្ខណៈពិសេស។

សំណួរនៃការកំណត់ភាពជិតស្និទ្ធរវាងលក្ខណៈពិសេសគឺងាយស្រួលជាងក្នុងការដោះស្រាយ។ តាមក្បួន ការវិភាគចង្កោមនៃលក្ខណៈពិសេសបន្តគោលដៅដូចគ្នាទៅនឹងការវិភាគកត្តា៖ ការជ្រើសរើសក្រុមនៃលក្ខណៈពិសេសដែលទាក់ទងគ្នាទៅវិញទៅមកដែលឆ្លុះបញ្ចាំងពីទិដ្ឋភាពជាក់លាក់នៃវត្ថុដែលកំពុងសិក្សា។ ក្នុងករណីនេះ មេគុណទំនាក់ទំនងស្ថិតិផ្សេងៗ បម្រើជារង្វាស់នៃភាពជិតស្និទ្ធ។


ព័ត៌មានស្រដៀងគ្នា។


ដើម្បីកំណត់កម្រិតនៃការពឹងផ្អែករវាងសូចនាករជាច្រើន មេគុណជាប់ទាក់ទងច្រើនត្រូវបានប្រើ។ បន្ទាប់មកពួកវាត្រូវបានសង្ខេបនៅក្នុងតារាងដាច់ដោយឡែកមួយ ដែលត្រូវបានគេហៅថា ម៉ាទ្រីសជាប់ទាក់ទងគ្នា។ ឈ្មោះ​ជួរ​ដេក និង​ជួរ​ឈរ​នៃ​ម៉ាទ្រីស​បែប​នេះ​គឺ​ជា​ឈ្មោះ​ប៉ារ៉ាម៉ែត្រ​ដែល​ការ​ពឹង​ផ្អែក​លើ​គ្នា​ត្រូវ​បាន​បង្កើត​ឡើង។ មេគុណទំនាក់ទំនងដែលត្រូវគ្នាមានទីតាំងនៅចំនុចប្រសព្វនៃជួរដេកនិងជួរឈរ។ ចូរយើងស្វែងយល់ពីរបៀបដែលអ្នកអាចធ្វើការគណនាស្រដៀងគ្នាដោយប្រើឧបករណ៍ Excel ។

វាជាទម្លាប់ក្នុងការកំណត់កម្រិតនៃទំនាក់ទំនងរវាងសូចនាករផ្សេងៗដូចខាងក្រោម អាស្រ័យលើមេគុណទំនាក់ទំនង៖

  • 0 - 0.3 - គ្មានការតភ្ជាប់;
  • 0.3 - 0.5 - ការតភ្ជាប់ខ្សោយ;
  • 0.5 - 0.7 - ការតភ្ជាប់ជាមធ្យម;
  • 0.7 - 0.9 - ខ្ពស់;
  • 0.9 - 1 - ខ្លាំង។

ប្រសិនបើមេគុណទំនាក់ទំនងគឺអវិជ្ជមាន នោះមានន័យថាទំនាក់ទំនងនៃប៉ារ៉ាម៉ែត្រគឺបញ្ច្រាស។

ដើម្បីចងក្រងម៉ាទ្រីសជាប់ទាក់ទងគ្នាក្នុង Excel ឧបករណ៍មួយត្រូវបានប្រើប្រាស់ រួមបញ្ចូលក្នុងកញ្ចប់ "ការវិភាគ​ទិន្នន័យ". នោះហើយជាអ្វីដែលគេហៅថា - "ទំនាក់ទំនង". សូមមើលពីរបៀបដែលវាអាចត្រូវបានប្រើដើម្បីគណនាពិន្ទុជាប់ទាក់ទងគ្នាច្រើន។

ជំហានទី 1៖ ធ្វើឱ្យកញ្ចប់វិភាគសកម្ម

វាត្រូវតែនិយាយភ្លាមៗថាកញ្ចប់លំនាំដើម "ការវិភាគ​ទិន្នន័យ"ពិការ។ ដូច្នេះមុននឹងបន្តនីតិវិធីសម្រាប់ការគណនាដោយផ្ទាល់នូវមេគុណជាប់ទាក់ទងគ្នា អ្នកត្រូវដំណើរការវា។ ជាអកុសល មិនមែនអ្នកប្រើប្រាស់គ្រប់រូបដឹងពីរបៀបធ្វើវានោះទេ។ ដូច្នេះយើងនឹងផ្តោតលើបញ្ហានេះ។


បន្ទាប់ពីសកម្មភាពដែលបានបញ្ជាក់ កញ្ចប់ឧបករណ៍ "ការវិភាគ​ទិន្នន័យ"នឹងត្រូវបានធ្វើឱ្យសកម្ម។

ដំណាក់កាលទី 2: ការគណនាមេគុណ

ឥឡូវនេះអ្នកអាចបន្តដោយផ្ទាល់ទៅការគណនានៃមេគុណជាប់ទាក់ទងគ្នាច្រើន។ ចូរយើងគណនាមេគុណជាប់ទាក់ទងគ្នាច្រើននៃកត្តាទាំងនេះដោយប្រើឧទាហរណ៍នៃតារាងសូចនាករនៃផលិតភាពការងារ សមាមាត្រដើមទុន-កម្លាំងពលកម្ម និងសមាមាត្រថាមពលទៅទម្ងន់នៅសហគ្រាសផ្សេងៗ។


ដំណាក់កាលទី ៣៖ ការវិភាគលទ្ធផល

ឥឡូវនេះ ចូរយើងស្វែងយល់ពីរបៀបដើម្បីយល់ពីលទ្ធផលដែលយើងទទួលបាននៅក្នុងដំណើរការនៃការដំណើរការទិន្នន័យដោយឧបករណ៍ "ទំនាក់ទំនង"នៅក្នុងកម្មវិធី Excel ។

ដូចដែលយើងអាចមើលឃើញពីតារាង មេគុណជាប់ទាក់ទងគ្នានៃសមាមាត្រដើមទុន-កម្លាំងពលកម្ម (ជួរទី 2) និងសមាមាត្រថាមពលទៅទម្ងន់ ( ជួរទី 1) គឺ 0.92 ដែលត្រូវនឹងទំនាក់ទំនងខ្លាំង។ រវាងផលិតភាពការងារ ( ជួរទី 3) និងសមាមាត្រថាមពលទៅទម្ងន់ ( ជួរទី 1) សូចនាករនេះគឺស្មើនឹង 0.72 ដែលជាកម្រិតខ្ពស់នៃការពឹងផ្អែក។ មេគុណទំនាក់ទំនងរវាងផលិតភាពការងារ ( ជួរទី 3) និងសមាមាត្រកម្លាំងពលកម្ម ( ជួរទី 2) គឺស្មើនឹង 0.88 ដែលក៏ត្រូវគ្នាទៅនឹងកម្រិតខ្ពស់នៃការពឹងផ្អែក។ ដូច្នេះយើងអាចនិយាយបានថាទំនាក់ទំនងរវាងកត្តាដែលបានសិក្សាទាំងអស់អាចតាមដានបានយ៉ាងរឹងមាំ។

ដូចដែលអ្នកអាចឃើញកញ្ចប់ "ការវិភាគ​ទិន្នន័យ"នៅក្នុង Excel គឺជាឧបករណ៍ដ៏ងាយស្រួល និងងាយស្រួលប្រើសម្រាប់កំណត់មេគុណទំនាក់ទំនងច្រើន។ វាក៏អាចត្រូវបានប្រើដើម្បីគណនាទំនាក់ទំនងធម្មតារវាងកត្តាពីរ។

ទិន្នន័យសេដ្ឋកិច្ចគឺជាលក្ខណៈបរិមាណនៃវត្ថុ ឬដំណើរការសេដ្ឋកិច្ចណាមួយ។ ពួកវាត្រូវបានបង្កើតឡើងក្រោមឥទិ្ធពលនៃកត្តាជាច្រើន ដែលមិនមែនសុទ្ធតែមានសម្រាប់ការគ្រប់គ្រងខាងក្រៅនោះទេ។ កត្តាដែលមិនអាចគ្រប់គ្រងបានអាចទទួលយកតម្លៃចៃដន្យពីសំណុំនៃតម្លៃហើយដោយហេតុនេះបណ្តាលឱ្យចៃដន្យនៃទិន្នន័យដែលពួកគេកំណត់។ ភារកិច្ចចម្បងមួយក្នុងការស្រាវជ្រាវសេដ្ឋកិច្ចគឺ ការវិភាគភាពអាស្រ័យរវាងអថេរ។

ដោយពិចារណាលើភាពអាស្រ័យរវាងលក្ខណៈពិសេស ចាំបាច់ត្រូវបែងចែកជាដំបូងនៃទំនាក់ទំនងទាំងពីរប្រភេទ៖

  • មុខងារ -ត្រូវបានកំណត់លក្ខណៈដោយការឆ្លើយឆ្លងពេញលេញរវាងការផ្លាស់ប្តូរគុណលក្ខណៈកត្តា និងការផ្លាស់ប្តូរតម្លៃលទ្ធផល៖ តម្លៃនីមួយៗនៃ attribute-factor ត្រូវគ្នាទៅនឹងតម្លៃដែលបានកំណត់យ៉ាងល្អនៃ attribute ដែលមានប្រសិទ្ធភាព។ប្រភេទនៃទំនាក់ទំនងនេះត្រូវបានបញ្ជាក់ជាទំនាក់ទំនងរូបមន្ត។ ការពឹងផ្អែកមុខងារអាចភ្ជាប់លក្ខណៈលទ្ធផលទៅនឹងលក្ខណៈកត្តាមួយ ឬច្រើន។ ដូច្នេះចំនួននៃប្រាក់ឈ្នួលសម្រាប់ប្រាក់ឈ្នួលម៉ោងអាស្រ័យលើចំនួនម៉ោងធ្វើការ;
  • ទំនាក់ទំនង- មិនមានការឆ្លើយឆ្លងពេញលេញរវាងការផ្លាស់ប្តូរនៃសញ្ញាពីរទេឥទ្ធិពលនៃកត្តាបុគ្គលត្រូវបានបង្ហាញតែជាមធ្យមជាមួយនឹងការសង្កេតដ៏ធំនៃទិន្នន័យជាក់ស្តែង។ ផលប៉ះពាល់ក្នុងពេលដំណាលគ្នាលើលក្ខណៈដែលបានសិក្សានៃកត្តាផ្សេងៗមួយចំនួនធំនាំឱ្យការពិតដែលថា តម្លៃដូចគ្នានៃ attribute-factor ត្រូវគ្នាទៅនឹងការចែកចាយទាំងមូលនៃតម្លៃនៃ attribute លទ្ធផល,ដោយសារនៅក្នុងករណីជាក់លាក់នីមួយៗ សញ្ញាកត្តាផ្សេងទៀតអាចផ្លាស់ប្តូរកម្លាំង និងទិសដៅនៃឥទ្ធិពលរបស់វា។

វាគួរតែត្រូវបានចងចាំក្នុងចិត្តថាប្រសិនបើមានទំនាក់ទំនងមុខងាររវាងសញ្ញាគឺអាចធ្វើទៅបានដោយដឹងពីតម្លៃនៃសញ្ញាកត្តាដើម្បីកំណត់ឱ្យបានត្រឹមត្រូវ។ តម្លៃនៃលទ្ធផល។នៅក្នុងវត្តមាននៃការជាប់ទាក់ទងគ្នាគឺមានតែ និន្នាការនៃការផ្លាស់ប្តូរនៃមុខងារដ៏មានប្រសិទ្ធភាពនៅពេលផ្លាស់ប្តូរតម្លៃនៃសញ្ញាកត្តា។

ការសិក្សាអំពីទំនាក់ទំនងរវាងសញ្ញា ពួកគេត្រូវបានចាត់ថ្នាក់តាមទិសដៅ ទម្រង់ ចំនួនកត្តា៖

  • ឆ្ពោះទៅរកការតភ្ជាប់ត្រូវបានបែងចែកទៅជា ត្រង់និង បញ្ច្រាស។ជាមួយនឹងការតភ្ជាប់ដោយផ្ទាល់ទិសដៅនៃការផ្លាស់ប្តូរនៅក្នុងគុណលក្ខណៈដែលមានប្រសិទ្ធភាពស្របគ្នាជាមួយនឹងទិសដៅនៃការផ្លាស់ប្តូរនៅក្នុងសញ្ញា - កត្តា។ ជាមួយនឹងមតិកែលម្អ ទិសដៅនៃការផ្លាស់ប្តូរនៅក្នុងមុខងារមានប្រសិទ្ធភាពគឺផ្ទុយពីទិសដៅនៃការផ្លាស់ប្តូរនៅក្នុងលក្ខណៈ-កត្តា។ ជាឧទាហរណ៍ គុណវុឌ្ឍិរបស់កម្មករកាន់តែខ្ពស់ កម្រិតផលិតភាពការងាររបស់គាត់កាន់តែខ្ពស់ (ទំនាក់ទំនងផ្ទាល់)។ ផលិតភាពនៃកម្លាំងពលកម្មកាន់តែខ្ពស់ តម្លៃឯកតានៃការផលិតកាន់តែទាប (មតិប្រតិកម្ម);
  • ក្នុងទម្រង់(ប្រភេទនៃមុខងារ) ការតភ្ជាប់ត្រូវបានបែងចែកទៅជា លីនេអ៊ែរ( rectilinear ) និង មិនមែនលីនេអ៊ែរ(ខ្សែកោង) ។ ទំនាក់ទំនងលីនេអ៊ែរត្រូវបានបង្ហាញជាបន្ទាត់ត្រង់ ទំនាក់ទំនងមិនមែនលីនេអ៊ែរ - ជាខ្សែកោង (ប៉ារ៉ាបូឡា អ៊ីពែបូឡា។ល។)។ ជាមួយនឹងទំនាក់ទំនងលីនេអ៊ែរជាមួយនឹងការកើនឡើងនៃតម្លៃនៃគុណលក្ខណៈកត្តាមានការកើនឡើងឯកសណ្ឋាន (ការថយចុះ) នៅក្នុងតម្លៃនៃគុណលក្ខណៈលទ្ធផល;
  • ដោយចំនួនកត្តាដែលដើរតួលើសញ្ញាមានប្រសិទ្ធភាពការទំនាក់ទំនងត្រូវបានបែងចែកទៅជា កត្តាតែមួយ(គូ) និង ពហុកត្តា។

ការសិក្សាអំពីភាពអាស្រ័យនៃការប្រែប្រួលនៃសញ្ញាមួយនៅលើលក្ខខណ្ឌជុំវិញគឺជាខ្លឹមសារនៃទ្រឹស្តីនៃការជាប់ទាក់ទងគ្នា។

នៅពេលធ្វើការវិភាគទំនាក់ទំនង សំណុំទិន្នន័យទាំងមូលត្រូវបានចាត់ទុកថាជាសំណុំនៃអថេរ (កត្តា) ដែលនីមួយៗមាន ទំការសង្កេត។

នៅពេលសិក្សាទំនាក់ទំនងរវាងកត្តាពីរ ពួកវាជាធម្មតាត្រូវបានបញ្ជាក់ X=(x ទំ x 2,..., x ទំ)និង Y = (y ( , y 2 ,... , y និង ).

ភាពឆបគ្នា -វា​ជា​ស្ថិតិ រង្វាស់នៃអន្តរកម្មអថេរពីរ។ ជាឧទាហរណ៍ តម្លៃវិជ្ជមានសម្រាប់ភាពខុសគ្នានៃការត្រឡប់មកវិញលើមូលបត្រពីរបង្ហាញថាការត្រឡប់មកវិញលើមូលបត្រទាំងនោះមាននិន្នាការផ្លាស់ទីក្នុងទិសដៅដូចគ្នា។

ភាពឆបគ្នារវាងអថេរពីរ Xនិង គណនាដូចខាងក្រោមៈ

តើតម្លៃពិតនៃអថេរនៅឯណា

Xនិង ជី;

ប្រសិនបើអថេរចៃដន្យ ហេ អ៊ីគឺឯករាជ្យ ភាពឆបគ្នាទ្រឹស្តីគឺសូន្យ។

ភាពប្រែប្រួលអាស្រ័យលើឯកតាដែលអថេរត្រូវបានវាស់វែង ហេ Y វាជាបរិមាណមិនប្រក្រតី។ ដូច្នេះដើម្បីវាស់វែង កងកម្លាំងទំនាក់ទំនងរវាងអថេរពីរ ស្ថិតិមួយទៀតត្រូវបានប្រើ ដែលហៅថា មេគុណទំនាក់ទំនង។

សម្រាប់អថេរពីរ Xនិង មេគុណទំនាក់ទំនងគូ Y

ត្រូវបានកំណត់ដូចខាងក្រោមៈ

កន្លែងណា អេសស៊ី-ការប៉ាន់ស្មានភាពខុសគ្នា ហេ អ៊ីការប៉ាន់ស្មានទាំងនេះកំណត់លក្ខណៈ កម្រិតនៃការបែកខ្ញែកតម្លៃ x ( , x 2 , ... , x n ( y 1 , y 2 , y n )ជុំវិញមធ្យមរបស់អ្នក។ x (yរៀងៗខ្លួន) ឬ ភាពប្រែប្រួល(ការប្រែប្រួល) នៃអថេរទាំងនេះលើសំណុំនៃការសង្កេត។

ការបែកខ្ញែក(ការប៉ាន់ប្រមាណភាពខុសគ្នា) ត្រូវបានកំណត់ដោយរូបមន្ត

ក្នុងករណីទូទៅ ដើម្បីទទួលបានការប៉ាន់ប្រមាណដែលមិនលំអៀងនៃការប្រែប្រួល ផលបូកនៃការ៉េគួរតែត្រូវបានបែងចែកដោយចំនួនដឺក្រេនៃសេរីភាពនៃការប៉ាន់ប្រមាណ។ (ល),កន្លែងណា P -ទំហំ​ធម្មតា, R -ចំនួននៃតំណភ្ជាប់ដែលដាក់លើគំរូ។ ចាប់តាំងពីគំរូត្រូវបានប្រើម្តងរួចហើយដើម្បីកំណត់មធ្យម x,បន្ទាប់មកចំនួននៃចំណងត្រួតលើគ្នាក្នុងករណីនេះគឺស្មើនឹងមួយ។ (ទំ = 1) និងចំនួនដឺក្រេនៃសេរីភាពនៃការប៉ាន់ប្រមាណ (ឧទាហរណ៍ចំនួននៃធាតុគំរូឯករាជ្យ) គឺស្មើនឹង (ព - 1).

វាមានលក្ខណៈធម្មជាតិជាងក្នុងការវាស់វែងកម្រិតនៃការរីករាលដាលនៅក្នុងតម្លៃនៃអថេរនៅក្នុងឯកតាដូចគ្នាដែលអថេរខ្លួនវាត្រូវបានវាស់។ បញ្ហានេះត្រូវបានដោះស្រាយដោយសូចនាករដែលគេហៅថា គម្លាតស្តង់ដារ (គម្លាតស្តង់ដារ) ឬ កំហុសស្តង់ដារអថេរ X(អថេរ យ)និងកំណត់ដោយសមាមាត្រ

លក្ខខណ្ឌនៅក្នុងភាគយកនៃរូបមន្ត (3.2.1) បង្ហាញពីអន្តរកម្មនៃអថេរពីរ និងកំណត់សញ្ញានៃការជាប់ទាក់ទងគ្នា (វិជ្ជមាន ឬអវិជ្ជមាន)។ ឧទាហរណ៍ ប្រសិនបើ​មាន​ទំនាក់ទំនង​វិជ្ជមាន​ខ្លាំង​រវាង​អថេរ (កើនឡើង​ក្នុង​អថេរ​មួយ​នៅពេល​មួយទៀត​កើនឡើង) ពាក្យ​នីមួយៗ​នឹង​ជា​ចំនួន​វិជ្ជមាន។ ស្រដៀងគ្នានេះដែរ ប្រសិនបើមានទំនាក់ទំនងអវិជ្ជមានខ្លាំងរវាងអថេរ ពាក្យទាំងអស់នៅក្នុងភាគយកនឹងជាលេខអវិជ្ជមាន ដែលនាំឱ្យតម្លៃទំនាក់ទំនងអវិជ្ជមាន។

ភាគបែងនៃកន្សោមសម្រាប់មេគុណទំនាក់ទំនងគូ [សូមមើល។ រូបមន្ត (3.2.2)] ធម្មតាធ្វើឱ្យភាគយកជាធម្មតាតាមរបៀបដែលមេគុណជាប់ទាក់ទងគ្នាប្រែទៅជាលេខដែលអាចបកស្រាយបានយ៉ាងងាយស្រួលដែលមិនមានវិមាត្រ ហើយយកតម្លៃពី -1 ដល់ +1 ។

ភាគយកនៃកន្សោមសម្រាប់មេគុណជាប់ទាក់ទងគ្នា ដែលពិបាកបកស្រាយ ដោយសារឯកតាមិនធម្មតាគឺ ភាពឆបគ្នា XY ។ទោះបីជាការពិតដែលថាជួនកាលវាត្រូវបានគេប្រើជាលក្ខណៈឯករាជ្យ (ឧទាហរណ៍នៅក្នុងទ្រឹស្តីហិរញ្ញវត្ថុដើម្បីពិពណ៌នាអំពីការផ្លាស់ប្តូររួមគ្នានៃតម្លៃភាគហ៊ុននៅលើការផ្លាស់ប្តូរពីរ) វាកាន់តែងាយស្រួលក្នុងការប្រើមេគុណទំនាក់ទំនង។ ការជាប់ទាក់ទងគ្នា និងភាពខុសគ្នាតំណាងឱ្យព័ត៌មានដូចគ្នាយ៉ាងសំខាន់ ប៉ុន្តែការជាប់ទាក់ទងគ្នាបង្ហាញព័ត៌មាននេះក្នុងទម្រង់ងាយស្រួលជាង។

សម្រាប់ការវាយតម្លៃគុណភាពនៃមេគុណទំនាក់ទំនង មាត្រដ្ឋានផ្សេងៗត្រូវបានប្រើ ដែលភាគច្រើនជាមាត្រដ្ឋាន Chaddock ។ អាស្រ័យលើតម្លៃនៃមេគុណទំនាក់ទំនង ទំនាក់ទំនងអាចមានការប៉ាន់ប្រមាណមួយដូចខាងក្រោម៖

  • 0.1-0.3 - ខ្សោយ;
  • 0.3-0.5 - គួរឱ្យកត់សម្គាល់;
  • 0.5-0.7 - មធ្យម;
  • 0.7-0.9 - ខ្ពស់;
  • 0.9-1.0 - ខ្ពស់ណាស់។

ការវាយតម្លៃកម្រិតនៃភាពស្និទ្ធស្នាលនៃទំនាក់ទំនងដោយប្រើមេគុណទំនាក់ទំនងត្រូវបានអនុវត្តជាក្បួនដោយផ្អែកលើព័ត៌មានដែលមានកម្រិតច្រើនឬតិចអំពីបាតុភូតដែលកំពុងសិក្សា។ ក្នុងន័យនេះ ចាំបាច់ត្រូវវាយតម្លៃពីសារៈសំខាន់នៃមេគុណទំនាក់ទំនងលីនេអ៊ែរ ដែលធ្វើឱ្យវាអាចពង្រីកការសន្និដ្ឋានដោយផ្អែកលើលទ្ធផលនៃគំរូដល់ប្រជាជនទូទៅ។

ការវាយតម្លៃពីសារៈសំខាន់នៃមេគុណទំនាក់ទំនងសម្រាប់ទំហំគំរូតូចត្រូវបានអនុវត្តដោយប្រើតេស្ត 7 របស់សិស្ស។ ក្នុងករណីនេះតម្លៃពិតប្រាកដ (សង្កេត) នៃលក្ខណៈវិនិច្ឆ័យនេះត្រូវបានកំណត់ដោយរូបមន្ត

តម្លៃ / obs ដែលគណនាដោយប្រើរូបមន្តនេះត្រូវបានប្រៀបធៀបជាមួយនឹងតម្លៃសំខាន់នៃθ-criterion ដែលយកចេញពីតារាងតម្លៃនៃ/-test របស់សិស្ស (សូមមើលឧបសម្ព័ន្ធទី 2) ដោយគិតគូរពីកម្រិតនៃសារៈសំខាន់ដែលបានផ្តល់ឱ្យ។ σ និងចំនួនដឺក្រេនៃសេរីភាព (ទំ - 2).

ប្រសិនបើ 7 obs > 7 tab នោះតម្លៃដែលទទួលបាននៃមេគុណជាប់ទាក់ទងគ្នាត្រូវបានទទួលស្គាល់ថាសំខាន់ (ឧ. សម្មតិកម្មទុកជាមោឃៈដែលអះអាងថាមេគុណជាប់ទាក់ទងស្មើសូន្យត្រូវបានច្រានចោល)។ ហើយដូច្នេះវាត្រូវបានសន្និដ្ឋានថាមានទំនាក់ទំនងស្ថិតិជិតស្និទ្ធរវាងអថេរដែលបានសិក្សា។

ប្រសិនបើតម្លៃ y xនៅជិតសូន្យ ទំនាក់ទំនងរវាងអថេរគឺខ្សោយ។ ប្រសិនបើការជាប់ទាក់ទងគ្នារវាងអថេរចៃដន្យ៖

  • គឺវិជ្ជមាន បន្ទាប់មកនៅពេលដែលអថេរចៃដន្យមួយកើនឡើង មួយទៀតមាននិន្នាការកើនឡើងជាមធ្យម។
  • គឺអវិជ្ជមាន បន្ទាប់មកនៅពេលដែលអថេរចៃដន្យមួយកើនឡើង មួយទៀតមាននិន្នាការថយចុះជាមធ្យម។ ឧបករណ៍ក្រាហ្វិកងាយស្រួលសម្រាប់ការវិភាគទិន្នន័យដែលបានផ្គូផ្គងគឺ ខ្ចាត់ខ្ចាយដែលតំណាងឱ្យការសង្កេតនីមួយៗក្នុងចន្លោះនៃវិមាត្រពីរដែលត្រូវគ្នានឹងកត្តាពីរ។ scatterplot ដែលពណ៌នាអំពីសំណុំនៃតម្លៃនៃលក្ខណៈពីរ ត្រូវបានគេហៅផងដែរ។ វាលទំនាក់ទំនង។ចំណុចនីមួយៗនៃដ្យាក្រាមនេះមានកូអរដោនេ x (. និង y gនៅពេលដែលកម្លាំងនៃទំនាក់ទំនងលីនេអ៊ែរកើនឡើង ចំនុចនៅលើក្រាហ្វនឹងស្ថិតនៅជិតបន្ទាត់ត្រង់មួយ ហើយទំហំ ជីនឹងខិតទៅជិតការរួបរួម។

មេគុណទំនាក់ទំនងគូត្រូវបានប្រើដើម្បីវាស់ស្ទង់ភាពខ្លាំងនៃទំនាក់ទំនងលីនេអ៊ែររវាងគូផ្សេងៗគ្នានៃលក្ខណៈពិសេសពីសំណុំរបស់វា។ សម្រាប់សំណុំនៃលក្ខណៈពិសេស ទទួលបាន ម៉ាទ្រីសនៃមេគុណទំនាក់ទំនងគូ។

សូមឱ្យសំណុំទិន្នន័យទាំងមូលមានអថេរមួយ។ យ==(នៅ r y 2 , ..., y ទំ)និង tអថេរ (កត្តា) x,ដែលនីមួយៗមាន ទំការសង្កេត។ តម្លៃអថេរ និង x,ដែលមាននៅក្នុងចំនួនប្រជាជនដែលបានសង្កេតត្រូវបានកត់ត្រានៅក្នុងតារាង (តារាង 3.2.1) ។

តារាង 3.2.1

អថេរ

ចំនួន

ការសង្កេត

X t3

Х tp

ដោយផ្អែកលើទិន្នន័យដែលមាននៅក្នុងតារាងនេះ គណនា ម៉ាទ្រីសនៃមេគុណទំនាក់ទំនងគូ R,វាស៊ីមេទ្រីអំពីអង្កត់ទ្រូងចម្បង៖


ការវិភាគនៃម៉ាទ្រីសនៃមេគុណទំនាក់ទំនងគូត្រូវបានប្រើក្នុងការសាងសង់គំរូតំរែតំរង់ច្រើន។

ម៉ាទ្រីសជាប់ទាក់ទងគ្នាមួយមិនអាចពិពណ៌នាពេញលេញអំពីភាពអាស្រ័យរវាងបរិមាណនោះទេ។ ក្នុងន័យនេះ បញ្ហាពីរត្រូវបានពិចារណាក្នុងការវិភាគទំនាក់ទំនងចម្រុះ៖

  • 1. កំណត់ភាពតឹងនៃទំនាក់ទំនងនៃអថេរចៃដន្យមួយជាមួយនឹងចំនួនសរុបនៃអថេរផ្សេងទៀតដែលរួមបញ្ចូលក្នុងការវិភាគ។
  • 2. ការកំណត់ភាពតឹងនៃទំនាក់ទំនងរវាងបរិមាណពីរខណៈពេលដែលជួសជុលឬមិនរាប់បញ្ចូលឥទ្ធិពលនៃបរិមាណផ្សេងទៀត។

បញ្ហាទាំងនេះត្រូវបានដោះស្រាយរៀងៗខ្លួន ដោយមានជំនួយពីមេគុណជាប់ទាក់ទងគ្នាច្រើន និងដោយផ្នែក។

ដំណោះស្រាយនៃបញ្ហាទីមួយ (កំណត់ភាពជិតស្និទ្ធនៃការតភ្ជាប់នៃអថេរចៃដន្យមួយជាមួយនឹងសំណុំនៃអថេរផ្សេងទៀតរួមបញ្ចូលក្នុងការវិភាគ) ត្រូវបានអនុវត្តដោយប្រើ គំរូមេគុណទំនាក់ទំនងច្រើន។យោងតាមរូបមន្ត

កន្លែងណា R- [សង់​ទី​ម៉ែ​ត។ រូបមន្ត (៣.២.៦)]; Rjj-ការបំពេញបន្ថែមពិជគណិតនៃធាតុនៃម៉ាទ្រីសដូចគ្នា។ រ.

ការ៉េនៃមេគុណជាប់ទាក់ទងច្រើន។ SCHj2 j _ច J+l mបានហៅ មេគុណច្រើនជម្រើសនៃការកំណត់; វាបង្ហាញពីសមាមាត្រនៃបំរែបំរួល (ចៃដន្យ) នៃបរិមាណដែលកំពុងសិក្សា Xjពន្យល់ពីបំរែបំរួលនៃអថេរចៃដន្យផ្សេងទៀត។ X ( , X 2 ,..., X t ។

មេគុណនៃការជាប់ទាក់ទងគ្នាច្រើន និងការកំណត់គឺជាតម្លៃវិជ្ជមាន ដោយយកតម្លៃក្នុងចន្លោះពី 0 ទៅ 1។ នៅពេលដែលមេគុណខិតជិត 2 ដើម្បីរួបរួម យើងអាចសន្និដ្ឋានថាទំនាក់ទំនងនៃអថេរចៃដន្យគឺនៅជិត ប៉ុន្តែមិនមែនអំពីទិសដៅរបស់វានោះទេ។ មេគុណជាប់ទាក់ទងគ្នាច្រើនអាចកើនឡើងបានលុះត្រាតែអថេរបន្ថែមត្រូវបានរួមបញ្ចូលនៅក្នុងគំរូ ហើយនឹងមិនកើនឡើងទេប្រសិនបើលក្ខណៈពិសេសដែលមានត្រូវបានដកចេញ។

ការពិនិត្យមើលសារៈសំខាន់នៃមេគុណនៃការកំណត់ត្រូវបានអនុវត្តដោយការប្រៀបធៀបតម្លៃដែលបានគណនានៃ /'-លក្ខណៈវិនិច្ឆ័យរបស់អ្នកនេសាទ

ជាមួយតារាង រ៉ាបល។ តម្លៃតារាងនៃលក្ខណៈវិនិច្ឆ័យ (សូមមើលឧបសម្ព័ន្ធទី 1) ត្រូវបានកំណត់ដោយកម្រិតនៃសារៈសំខាន់ a និងកម្រិតនៃសេរីភាព។ v l \u003d mnv 2 \u003d n-m-l ។មេគុណ R2មានភាពខុសគ្នាខ្លាំងពីសូន្យ ប្រសិនបើវិសមភាព

ប្រសិនបើអថេរចៃដន្យចាត់ទុក ទាក់ទងគ្នាទៅវិញទៅមកបន្ទាប់មកតម្លៃនៃមេគុណទំនាក់ទំនងគូត្រូវបានប៉ះពាល់ដោយផ្នែកដោយឥទ្ធិពលនៃបរិមាណផ្សេងទៀត។ ក្នុងន័យនេះ ចាំបាច់ត្រូវសិក្សាពីការជាប់ទាក់ទងគ្នាមួយផ្នែករវាងអថេរ ខណៈពេលដែលមិនរាប់បញ្ចូលឥទ្ធិពលនៃអថេរចៃដន្យផ្សេងទៀត (មួយ ឬច្រើន)។

គំរូមេគុណទំនាក់ទំនងផ្នែកត្រូវបានកំណត់ដោយរូបមន្ត

កន្លែងណា RJk, Rjj, Rkk -ការបន្ថែមពិជគណិតទៅធាតុម៉ាទ្រីសដែលត្រូវគ្នា។ [សង់​ទី​ម៉ែ​ត។ រូបមន្ត (៣.២.៦)] ។

មេគុណជាប់ទាក់ទងគ្នាជាផ្នែក ក៏ដូចជាមេគុណជាប់ទាក់ទងជាគូ ប្រែប្រួលពី -1 ដល់ +1 ។

កន្សោម (៣.២.៩) ក្រោមលក្ខខណ្ឌ t = 3 នឹងមើលទៅដូច

មេគុណ r 12 (3) ត្រូវបានគេហៅថា មេគុណទំនាក់ទំនងរវាង x (និង x 2 សម្រាប់ថេរ x yវាស៊ីមេទ្រីទាក់ទងទៅនឹងសន្ទស្សន៍បឋម 1, 2 ។ សន្ទស្សន៍បន្ទាប់បន្សំ 3 របស់វាសំដៅទៅលើអថេរថេរ។

ឧទាហរណ៍ 3.2.1 ។ ការគណនាមេគុណគូ,

ការជាប់ទាក់ទងគ្នាច្រើន និងដោយផ្នែក។

នៅក្នុងតារាង។ 3.2.2 ផ្តល់ព័ត៌មានអំពីបរិមាណលក់ និងថ្លៃផ្សាយពាណិជ្ជកម្មរបស់ក្រុមហ៊ុនមួយ ក៏ដូចជាសន្ទស្សន៍ចំណាយរបស់អ្នកប្រើប្រាស់សម្រាប់ឆ្នាំបច្ចុប្បន្នមួយចំនួន។

  • 1. បង្កើត scatterplot (វាលជាប់ទាក់ទងគ្នា) សម្រាប់អថេរ "បរិមាណលក់" និង "សន្ទស្សន៍ចំណាយអ្នកប្រើប្រាស់" ។
  • 2. កំណត់កម្រិតនៃឥទ្ធិពលនៃសន្ទស្សន៍ចំណាយរបស់អ្នកប្រើប្រាស់លើបរិមាណលក់ (គណនាមេគុណទំនាក់ទំនងគូ)។
  • 3. វាយតម្លៃសារៈសំខាន់នៃមេគុណទំនាក់ទំនងគូដែលបានគណនា។
  • 4. បង្កើតម៉ាទ្រីសនៃមេគុណទំនាក់ទំនងគូសម្រាប់អថេរបី។
  • 5. ស្វែងរកការប៉ាន់ប្រមាណនៃមេគុណជាប់ទាក់ទងច្រើន។
  • 6. ស្វែងរកការប៉ាន់ប្រមាណនៃមេគុណទំនាក់ទំនងផ្នែក។

1. ក្នុងឧទាហរណ៍របស់យើង ដ្យាក្រាមខ្ចាត់ខ្ចាយ មានទម្រង់បង្ហាញក្នុងរូបភព។ ៣.២.១. ការពន្លូតនៃពពកចំណុចនៅក្នុងគ្រោងការខ្ចាត់ខ្ចាយតាមបណ្តោយបន្ទាត់ត្រង់ដែលមានទំនោរអនុញ្ញាតឱ្យយើងសន្មត់ថាមានទំនោរគោលបំណងមួយចំនួនសម្រាប់ទំនាក់ទំនងលីនេអ៊ែរផ្ទាល់រវាងតម្លៃនៃអថេរ។ X ២ (បរិមាណនៃការលក់) ។

អង្ករ។ ៣.២.១.

2. ការគណនាកម្រិតមធ្យម នៅពេលគណនាមេគុណទំនាក់ទំនងរវាងអថេរ X ២(សន្ទស្សន៍ចំណាយអ្នកប្រើប្រាស់) និង (បរិមាណលក់) ត្រូវបានផ្តល់ឱ្យក្នុងតារាង។ ៣.២.៣.

មធ្យមអថេរចៃដន្យ X ២និង ដែលជាសូចនាករសាមញ្ញបំផុតដែលកំណត់លក្ខណៈនៃលំដាប់ jCj, x 2,... , x 16 និង y v y 2 ,..., y ១៦ យើងគណនាតាមរូបមន្តខាងក្រោម៖


បរិមាណលក់ Y, ពាន់រូប្លិ៍

សន្ទស្សន៍

ប្រើប្រាស់

តេលស្គី

ការចំណាយ

បរិមាណលក់ Y, ពាន់រូប្លិ៍

សន្ទស្សន៍

ប្រើប្រាស់

តេលស្គី

ការចំណាយ

តារាង 3.2.3

l:, - X

(ហើយ - យ) (x, - x)

(x, − x) ២

(y, - - y) ២

ការបែកខ្ញែកកំណត់កម្រិតនៃការរីករាលដាលនៃតម្លៃ x v x 2 , x :

ឥឡូវនេះសូមពិចារណាដំណោះស្រាយចំពោះឧទាហរណ៍ 3.2.1 ក្នុង Excel ។

ដើម្បីគណនាការជាប់ទាក់ទងគ្នាដោយប្រើ Excel អ្នកអាចប្រើមុខងារ =correl() ការបញ្ជាក់អាសយដ្ឋាននៃជួរឈរពីរនៃលេខដូចដែលបានបង្ហាញក្នុងរូបភព។ ៣.២.២. ចម្លើយត្រូវបានដាក់ក្នុង D8 និងស្មើនឹង 0.816។

អង្ករ។ ៣.២.២.

(ចំណាំ៖ អាគុយម៉ង់មុខងារ correls ត្រូវតែជាលេខ ឬឈ្មោះ អារេ ឬសេចក្តីយោងដែលមានលេខ។ ប្រសិនបើអាគុយម៉ង់ ដែលជាអារេ ឬតំណ មានអត្ថបទ ប៊ូលីន ឬក្រឡាទទេ នោះតម្លៃទាំងនោះមិនត្រូវបានអើពើ។ ទោះយ៉ាងណាក៏ដោយ កោសិកាដែលមានតម្លៃ null ត្រូវបានរាប់។

បើអារេ! និង array2 មានចំនួនផ្សេងគ្នានៃចំណុចទិន្នន័យ បន្ទាប់មកមុខងារ correl ត្រឡប់តម្លៃកំហុស #n/a ។

ប្រសិនបើ array1 ឬ array2 គឺទទេ ឬប្រសិនបើ o (គម្លាតស្តង់ដារ) នៃតម្លៃរបស់ពួកគេគឺសូន្យ នោះមុខងារ correl ត្រឡប់តម្លៃកំហុស #div/0!.)

តម្លៃសំខាន់នៃ/-ស្ថិតិសិស្សក៏អាចទទួលបានដោយប្រើមុខងារផងដែរ។ Steudrasprobr 1 កញ្ចប់ Excel ។ ជាអាគុយម៉ង់នៃមុខងារ អ្នកត្រូវតែបញ្ជាក់ចំនួនដឺក្រេនៃសេរីភាព ស្មើនឹង ទំ- 2 (ក្នុងឧទាហរណ៍របស់យើង 16 - 2= 14) និងសារៈសំខាន់កម្រិត a (ក្នុងឧទាហរណ៍របស់យើង a = 0.1) (រូបភាព 3.2.3) ។ ប្រសិនបើ ក តម្លៃជាក់ស្តែង// ស្ថិតិ, យកម៉ូឌុល, ច្រើនទៀត សំខាន់បន្ទាប់មកជាមួយនឹងប្រូបាប៊ីលីតេ (1 - ក) មេគុណទំនាក់ទំនងគឺខុសគ្នាយ៉ាងខ្លាំងពីសូន្យ។


អង្ករ។ ៣.២.៣. តម្លៃសំខាន់នៃ // ស្ថិតិគឺ 1.7613

Excel រួមបញ្ចូលសំណុំឧបករណ៍វិភាគទិន្នន័យ (ហៅថាកញ្ចប់វិភាគ) ដែលត្រូវបានរចនាឡើងដើម្បីដោះស្រាយបញ្ហាស្ថិតិផ្សេងៗ។ ដើម្បីគណនាម៉ាទ្រីសនៃមេគុណទំនាក់ទំនងគូ ប្រើឧបករណ៍ទំនាក់ទំនង (រូបភាព 3.2.4) ហើយកំណត់ប៉ារ៉ាម៉ែត្រវិភាគក្នុងប្រអប់ដែលត្រូវគ្នា។ ចម្លើយនឹងត្រូវបានដាក់នៅលើសន្លឹកកិច្ចការថ្មី (រូបភាព 3.2.5)។

1 នៅក្នុង Excel 2010 ឈ្មោះមុខងារ steudrasprobr បានប្តូរទៅជា steu-

DENT.ORD.2X ។

អង្ករ។ ៣.២.៤.


អង្ករ។ ៣.២.៥.

  • អ្នកស្ថិតិជនជាតិអង់គ្លេស F. Galton (1822-1911) និង K. Pearson (1857-1936) ត្រូវបានចាត់ទុកថាជាអ្នកបង្កើតទ្រឹស្ដីនៃការជាប់ទាក់ទងគ្នា។ ពាក្យ "ទំនាក់ទំនង" ត្រូវបានខ្ចីពីវិទ្យាសាស្ត្រធម្មជាតិ ហើយមានន័យថា "ទំនាក់ទំនង ការឆ្លើយឆ្លង" ។ គោលគំនិតនៃការជាប់ទាក់ទងគ្នាជាភាពអាស្រ័យគ្នាទៅវិញទៅមករវាងអថេរចៃដន្យ ផ្អែកលើទ្រឹស្តីគណិតវិទ្យា-ស្ថិតិនៃការជាប់ទាក់ទងគ្នា។

ជម្រើសទី 5

ការពឹងផ្អែកនៃអាយុកាលជាមធ្យមលើកត្តាជាច្រើនត្រូវបានសិក្សាដោយយោងតាមទិន្នន័យសម្រាប់ឆ្នាំ 1995 ដែលបង្ហាញក្នុងតារាង។ ៥.

តារាងទី 5

ម៉ូសំប៊ិក

……………………………………………………………………………………..

ប្រទេស​ស្វីស

ការរចនាដែលបានអនុម័តនៅក្នុងតារាង៖

· - អាយុកាលជាមធ្យមនៅពេលកើតឆ្នាំ;

· X 1 - GDP ក្នុងភាពស្មើគ្នានៃអំណាចទិញ;

· X 2 -- ខ្សែសង្វាក់ អត្រាកំណើនប្រជាជន, %;

· X 3 -- ខ្សែសង្វាក់ អត្រាកំណើនកម្លាំងពលកម្ម, %;

· X 4- អត្រាមរណៈរបស់ទារក % .

ទាមទារ៖

1. បង្កើតម៉ាទ្រីសនៃមេគុណទំនាក់ទំនងជាគូរវាងអថេរទាំងអស់ដែលកំពុងសិក្សា និងកំណត់កត្តារួម។

2. បង្កើតសមីការតំរែតំរង់ដែលមិនមានកត្តា collinear ។ ពិនិត្យមើលសារៈសំខាន់ស្ថិតិនៃសមីការ និងមេគុណរបស់វា។

3. បង្កើតសមីការតំរែតំរង់ដែលមានតែកត្តាស្ថិតិ និងព័ត៌មានសំខាន់ៗប៉ុណ្ណោះ។ ពិនិត្យមើលសារៈសំខាន់ស្ថិតិនៃសមីការ និងមេគុណរបស់វា។

ធាតុទី 4 - 6 សំដៅទៅលើសមីការតំរែតំរង់ដែលបានបង្កើតឡើងនៅពេលអនុវត្តធាតុទី 3 ។

4. វាយតម្លៃគុណភាព និងភាពត្រឹមត្រូវនៃសមីការតំរែតំរង់។

5. ផ្តល់ការបកស្រាយសេដ្ឋកិច្ចនៃមេគុណនៃសមីការតំរែតំរង់ និងការវាយតម្លៃប្រៀបធៀបនៃកម្លាំងនៃឥទ្ធិពលនៃកត្តាលើអថេរលទ្ធផល .

6. គណនាតម្លៃព្យាករណ៍នៃអថេរលទ្ធផល ប្រសិនបើតម្លៃដែលបានព្យាករណ៍នៃកត្តាមានចំនួន 75% នៃតម្លៃអតិបរមារបស់វា។ រៀបចំចន្លោះពេលទំនុកចិត្តនៃការទស្សន៍ទាយនៃតម្លៃជាក់ស្តែង ជាមួយនឹងភាពជឿជាក់ 80% ។

ការសម្រេចចិត្ត។ដើម្បីដោះស្រាយបញ្ហា សៀវភៅបញ្ជី EXCEL ត្រូវបានប្រើប្រាស់។

1. ការប្រើប្រាស់កម្មវិធីបន្ថែម "ការវិភាគទិន្នន័យ ... ការជាប់ទាក់ទងគ្នា" យើងបង្កើតម៉ាទ្រីសនៃមេគុណទំនាក់ទំនងជាគូរវាងអថេរទាំងអស់ដែលកំពុងសិក្សា (ម៉ឺនុយ "ឧបករណ៍" "ការវិភាគទិន្នន័យ..." "ទំនាក់ទំនង") ។ នៅលើរូបភព។ រូបភាពទី 1 បង្ហាញបន្ទះការវិភាគទំនាក់ទំនងដែលមានវាលដែលបំពេញ។ ដើម្បីចម្លងរូបថតបង្អួចទៅក្ដារតម្បៀតខ្ទាស់ទិន្នន័យ WINDOWS សូមប្រើបន្សំគ្រាប់ចុច Alt+Print Screen (នៅលើក្តារចុចមួយចំនួន Alt+PrtSc) លទ្ធផលការវិភាគជាប់ទាក់ទងត្រូវបានបង្ហាញនៅក្នុងឧបសម្ព័ន្ធ។ 2 និងផ្ទេរទៅតុ។ មួយ។

អង្ករ។ 1. បន្ទះវិភាគទំនាក់ទំនង

តារាងទី 1

ម៉ាទ្រីសនៃមេគុណទំនាក់ទំនងគូ

ការវិភាគ interfactorial មេគុណទំនាក់ទំនងបង្ហាញថាតម្លៃ 0.8 លើសពី នៅក្នុងតម្លៃដាច់ខាតមេគុណទំនាក់ទំនងរវាងកត្តាមួយគូ X 2 -X 3 (បន្លិចជាដិត)។ កត្តា X 2 -X 3 ត្រូវបានគេទទួលស្គាល់ថាជា collinear ។

2. ដូចដែលបានបង្ហាញក្នុងកថាខណ្ឌទី 1 កត្តា X2-X3 គឺជាប់គ្នា ដែលមានន័យថាពួកគេពិតជាចម្លងគ្នាទៅវិញទៅមក ហើយការដាក់បញ្ចូលក្នុងពេលដំណាលគ្នារបស់ពួកគេនៅក្នុងគំរូនឹងនាំឱ្យមានការបកស្រាយមិនត្រឹមត្រូវនៃមេគុណតំរែតំរង់ដែលត្រូវគ្នា។ វាអាចត្រូវបានគេមើលឃើញថាកត្តា X2 មានមេគុណជាប់ទាក់ទងដាច់ខាតខ្ពស់ជាងជាមួយនឹងលទ្ធផល Y ជាងកត្តា X3៖ ry,x2=0.72516; ry,x3=0.53397; |ry,x2|>|ry,x3| (សូមមើលតារាងទី 1) ។ នេះបង្ហាញពីឥទ្ធិពលកាន់តែខ្លាំងនៃកត្តា X2 លើការផ្លាស់ប្តូរ Y. ដូច្នេះកត្តា X3 ត្រូវបានដកចេញពីការពិចារណា។

ដើម្បី​បង្កើត​សមីការ​តំរែតំរង់ តម្លៃ​នៃ​អថេរ​ដែល​បាន​ប្រើ ( ,X 1 , X 2 , X 4) ចម្លងទៅសន្លឹកកិច្ចការទទេ ( adj. 3). យើងបង្កើតសមីការតំរែតំរង់ដោយប្រើ add-on " ការវិភាគទិន្នន័យ… តំរែតំរង់» (ម៉ឺនុយ « សេវាកម្ម" « ការវិភាគ​ទិន្នន័យ…» « តំរែតំរង់") បន្ទះការវិភាគតំរែតំរង់ជាមួយនឹងវាលដែលបំពេញត្រូវបានបង្ហាញនៅក្នុង អង្ករ។ ២.

លទ្ធផលនៃការវិភាគតំរែតំរង់ត្រូវបានផ្តល់ឱ្យ adj. ៤និងផ្ទេរទៅ ផ្ទាំង។ ២. សមីការតំរែតំរង់មានទម្រង់ (សូមមើល " ហាងឆេង»ក្នុង ផ្ទាំង។ ២):

y = 75.44 + 0.0447 ? x 1 - 0.0453 ? x2 - 0.24? x4

សមីការតំរែតំរង់ត្រូវបានទទួលស្គាល់ថាជាស្ថិតិសំខាន់ ចាប់តាំងពីប្រូបាប៊ីលីតេនៃការបង្កើតចៃដន្យរបស់វានៅក្នុងទម្រង់ដែលវាត្រូវបានទទួលគឺ 1.04571 × 10 -45 (សូមមើលរូបភព។ "សារៈសំខាន់ F"ក្នុង ផ្ទាំង។ ២) ដែលទាបជាងកម្រិតសារៈសំខាន់ដែលអាចទទួលយកបាន = 0.05 ។

ប្រូបាប៊ីលីតេនៃការបង្កើតចៃដន្យនៃមេគុណនៅកត្តា X 1 នៅក្រោមកម្រិតនៃសារៈសំខាន់ដែលបានទទួលយក = 0.05 (សូមមើល " P-Value"ក្នុង ផ្ទាំង។ ២) ដែលបង្ហាញពីសារៈសំខាន់ស្ថិតិនៃមេគុណ និងឥទ្ធិពលយ៉ាងសំខាន់នៃកត្តាទាំងនេះលើការផ្លាស់ប្តូរប្រាក់ចំណេញប្រចាំឆ្នាំ .

ប្រូបាប៊ីលីតេនៃការបង្កើតចៃដន្យនៃមេគុណនៅកត្តា X 2 និង X 4 លើសពីកម្រិតនៃសារៈសំខាន់ដែលទទួលយក = 0.05 (សូមមើល " P-Value"ក្នុង ផ្ទាំង។ ២) ហើយមេគុណទាំងនេះមិនត្រូវបានចាត់ទុកថាសំខាន់ជាស្ថិតិទេ។

អង្ករ។ 2. បន្ទះការវិភាគតំរែតំរង់គំរូ (X 1 ,X 2 ,X 4 )

តារាង 2

(X 1 , X 2 , X 4 )

ការវិភាគនៃភាពខុសគ្នា

សារៈសំខាន់ F

តំរែតំរង់

សមីការតំរែតំរង់

ហាងឆេង

កំហុសស្តង់ដារ

t-ស្ថិតិ

P-តម្លៃ

បាត 95%

កំពូល 95%

ទាបជាង 95.0%

កំពូល 95.0%

ផ្លូវបំបែក Y

3. ដោយផ្អែកលើលទ្ធផលនៃការត្រួតពិនិត្យសារៈសំខាន់ស្ថិតិនៃមេគុណនៃសមីការតំរែតំរង់ដែលបានអនុវត្តនៅក្នុងកថាខណ្ឌមុន យើងបង្កើតគំរូតំរែតំរង់ថ្មីដែលមានតែកត្តាផ្តល់ព័ត៌មានប៉ុណ្ណោះ ដែលរួមមានៈ

កត្តា, មេគុណដែលមានសារៈសំខាន់ជាស្ថិតិ;

កត្តាដែលមេគុណ t _statistics modulo លើសពីមួយ (និយាយម្យ៉ាងទៀត តម្លៃដាច់ខាតនៃមេគុណគឺធំជាងកំហុសស្តង់ដាររបស់វា)។

ក្រុមទីមួយរួមបញ្ចូលកត្តា Xកត្តា 1 ទៅ វិនាទី X៤. កត្តា X 2 មិនត្រូវបានរាប់បញ្ចូលពីការពិចារណាថាគ្មានព័ត៌មាន ហើយគំរូតំរែតំរង់ចុងក្រោយនឹងមានកត្តា X 1 , X 4 .

ដើម្បី​បង្កើត​សមីការ​តំរែតំរង់ សូម​ចម្លង​តម្លៃ​នៃ​អថេរ​ដែល​ប្រើ​ទៅ​សន្លឹក​កិច្ចការ​ទទេ ( adj. 5)និងធ្វើការវិភាគតំរែតំរង់ ( អង្ករ។ ៣) លទ្ធផលរបស់វាត្រូវបានផ្តល់ឱ្យ adj. ៦និងផ្ទេរទៅ ផ្ទាំង។ ៣. សមីការតំរែតំរង់មើលទៅដូចនេះ៖

y = 75.38278 + 0.044918 ? x 1 - 0.24031 ? x4

(សង់​ទី​ម៉ែ​ត។ " ហាងឆេង»ក្នុង តារាង 3).

អង្ករ។ 3. ការវិភាគតំរែតំរង់បន្ទះនៃគំរូ (X 1 , X 4 )

តារាងទី 3

លទ្ធផលការវិភាគតំរែតំរង់គំរូ (X 1 , X 4 )

ស្ថិតិតំរែតំរង់

ច្រើន R

R-ការ៉េ

R-square ធម្មតា។

កំហុសស្តង់ដារ

ការសង្កេត

ការវិភាគនៃភាពខុសគ្នា

សារៈសំខាន់ F

តំរែតំរង់

សមីការតំរែតំរង់

ហាងឆេង

កំហុសស្តង់ដារ

t-ស្ថិតិ

P-តម្លៃ

ផ្លូវបំបែក Y

សមីការតំរែតំរង់គឺមានសារៈសំខាន់ជាស្ថិតិ៖ ប្រូបាប៊ីលីតេនៃការបង្កើតចៃដន្យរបស់វាស្ថិតនៅក្រោមកម្រិតសារៈសំខាន់ដែលអាចទទួលយកបាន = 0.05 (សូមមើល " សារៈសំខាន់ F"ក្នុង តារាង 3).

មេគុណនៅកត្តាក៏ត្រូវបានទទួលស្គាល់ថាជាស្ថិតិសំខាន់ផងដែរ។ X 1 ប្រូបាប៊ីលីតេនៃការបង្កើតចៃដន្យរបស់វាស្ថិតនៅក្រោមកម្រិតសារៈសំខាន់ដែលអាចទទួលយកបាន = 0.05 (សូមមើល " P-Value"ក្នុង ផ្ទាំង។ ៣) នេះបង្ហាញពីផលប៉ះពាល់យ៉ាងសំខាន់នៃផលិតផលក្នុងស្រុកសរុបក្នុងភាពស្មើគ្នានៃអំណាចទិញ X 1 ក្នុងការផ្លាស់ប្តូរប្រាក់ចំណេញប្រចាំឆ្នាំ .

មេគុណនៅកត្តា X 4 (អត្រាមរណៈរបស់ទារកប្រចាំឆ្នាំ) មិនសំខាន់ជាស្ថិតិទេ។ ទោះយ៉ាងណាក៏ដោយកត្តានេះនៅតែអាចចាត់ទុកថាជាព័ត៌មានចាប់តាំងពី t _ ស្ថិតិហាងឆេងរបស់គាត់លើសពី ម៉ូឌុលឯកតា ទោះបីជាមានការសន្និដ្ឋានបន្ថែមទៀតទាក់ទងនឹងកត្តាក៏ដោយ។ X 4 គួរតែត្រូវបានព្យាបាលដោយប្រុងប្រយ័ត្ន។

4. ចូរយើងវាយតម្លៃគុណភាព និងភាពត្រឹមត្រូវនៃសមីការតំរែតំរង់ចុងក្រោយដោយប្រើលក្ខណៈស្ថិតិមួយចំនួនដែលទទួលបានអំឡុងពេលការវិភាគតំរែតំរង់ (សូមមើល "ស្ថិតិតំរែតំរង់" នៅក្នុងតារាងទី 3):

មេគុណច្រើននៃការកំណត់

R2 = _ i=1 ____________ =0.946576

2 = បង្ហាញថាគំរូតំរែតំរង់ពន្យល់ 94.7% នៃការប្រែប្រួលនៃអាយុកាលជាមធ្យមនៅពេលកើត ហើយបំរែបំរួលនេះគឺដោយសារតែការផ្លាស់ប្តូរកត្តាដែលរួមបញ្ចូលនៅក្នុងគំរូតំរែតំរង់ X 1 , X 4 ;

កំហុសស្តង់ដារនៃការតំរែតំរង់

បង្ហាញថាតម្លៃដែលត្រូវបានព្យាករណ៍ដោយសមីការតំរែតំរង់សម្រាប់អាយុកាលជាមធ្យមនៅពេលកើត ខុសគ្នាពីតម្លៃជាក់ស្តែងជាមធ្យម 2.252208 ឆ្នាំ។

កំហុសប្រហាក់ប្រហែលដែលទាក់ទងជាមធ្យមត្រូវបានកំណត់ដោយរូបមន្តប្រហាក់ប្រហែល៖

អ៊ី rel? 0.8 ? --? 100%=0.8 ? 2.252208/66.9? 100%?2.7

ដែលជាកន្លែងដែលរាប់ពាន់រូប្លិ៍។ -- តម្លៃអាយុកាលរំពឹងទុក (កំណត់ដោយប្រើមុខងារដែលភ្ជាប់មកជាមួយ" មធ្យម»; adj. មួយ។).

អ៊ី rel បង្ហាញថាតម្លៃនៃប្រាក់ចំណេញប្រចាំឆ្នាំព្យាករណ៍ដោយសមីការតំរែតំរង់ ខុសគ្នាពីតម្លៃជាក់ស្តែងជាមធ្យម 2.7% ។ ម៉ូដែលមានភាពត្រឹមត្រូវខ្ពស់ (នៅ - ភាពត្រឹមត្រូវនៃគំរូគឺខ្ពស់នៅ - ល្អនៅ - ពេញចិត្តនៅ - មិនពេញចិត្ត) ។

5. សម្រាប់ការបកស្រាយសេដ្ឋកិច្ចនៃមេគុណនៃសមីការតំរែតំរង់ យើងធ្វើតារាងតម្លៃមធ្យម និងគម្លាតស្តង់ដារនៃអថេរនៅក្នុងទិន្នន័យដំបូង (តារាងទី 4)។ តម្លៃមធ្យមត្រូវបានកំណត់ដោយប្រើមុខងារដែលភ្ជាប់មកជាមួយ "AVERAGE" គម្លាតស្តង់ដារ - ដោយប្រើមុខងារដែលភ្ជាប់មកជាមួយ "STDEV" (សូមមើលឧបសម្ព័ន្ធទី 1) ។