ទំនាក់ទំនងលីនេអ៊ែរច្រើន។ មេគុណទំនាក់ទំនង

ខ្លឹមសារនៃវិធីសាស្ត្រព្យាករណ៍មូលហេតុគឺបង្កើតទំនាក់ទំនងគណិតវិទ្យារវាងអថេរលទ្ធផល និងកត្តា។

លក្ខខណ្ឌចាំបាច់សម្រាប់ការអនុវត្តវិធីសាស្ត្រព្យាករណ៍មូលហេតុគឺភាពអាចរកបាននៃទិន្នន័យច្រើន។ ប្រសិនបើទំនាក់ទំនងរវាងអថេរអាចត្រូវបានពិពណ៌នាដោយគណិតវិទ្យាបានត្រឹមត្រូវ នោះភាពត្រឹមត្រូវនៃការព្យាករណ៍មូលហេតុនឹងខ្ពស់ណាស់។
វិធីសាស្រ្តព្យាករណ៍មូលហេតុរួមមាន:


  • គំរូតំរែតំរង់ពហុវ៉ារ្យ៉ង់,

  • ការធ្វើគំរូក្លែងធ្វើ។
វិធីសាស្ត្រព្យាករណ៍មូលហេតុទូទៅបំផុតគឺ គំរូតំរែតំរង់ចម្រុះ។ .

1.4.1 គំរូតំរែតំរង់ចម្រុះ

គំរូតំរែតំរង់ពហុវ៉ារ្យង់គឺជាសមីការដែលមានអថេរឯករាជ្យច្រើន។

ដើម្បីបង្កើតគំរូតំរែតំរង់ពហុវ៉ារ្យង់ មុខងារផ្សេងៗអាចត្រូវបានប្រើ ដែលទូទៅបំផុតគឺការពឹងលើលីនេអ៊ែរ និងថាមពល៖

នៅក្នុងគំរូលីនេអ៊ែរប៉ារ៉ាម៉ែត្រ(b 1 , b 2 , … b n) ត្រូវបានបកស្រាយថាជាឥទ្ធិពលនៃអថេរឯករាជ្យនីមួយៗលើតម្លៃដែលបានព្យាករណ៍ ប្រសិនបើអថេរឯករាជ្យផ្សេងទៀតទាំងអស់ស្មើនឹងសូន្យ។

អេ ម៉ូដែលថាមពលប៉ារ៉ាម៉ែត្រគឺមេគុណនៃការបត់បែន។ ពួកគេបង្ហាញពីចំនួនភាគរយដែលលទ្ធផល (y) នឹងផ្លាស់ប្តូរជាមធ្យមជាមួយនឹងការផ្លាស់ប្តូរកត្តាដែលត្រូវគ្នា 1% ខណៈពេលដែលសកម្មភាពនៃកត្តាផ្សេងទៀតនៅតែមិនផ្លាស់ប្តូរ។ ដើម្បីគណនាប៉ារ៉ាម៉ែត្រនៃសមីការតំរែតំរង់ច្រើនត្រូវបានប្រើផងដែរ។ វិធីសាស្រ្តការ៉េតិចបំផុត។

នៅពេលបង្កើតគំរូតំរែតំរង់ គុណភាពនៃទិន្នន័យដើរតួនាទីជាការសម្រេចចិត្ត។ ការប្រមូលទិន្នន័យបង្កើតមូលដ្ឋានគ្រឹះសម្រាប់ការព្យាករណ៍ ដូច្នេះមានតម្រូវការ និងច្បាប់មួយចំនួនដែលត្រូវសង្កេតនៅពេលប្រមូលទិន្នន័យ។


  1. ជា​ដំបូងបង្អស់, ទិន្នន័យត្រូវតែ អាចសង្កេតបាន។, i.e. បានទទួលជាលទ្ធផលនៃការវាស់វែង មិនមែនការគណនាទេ។

  1. ទីពីរពីអារេទិន្នន័យវាចាំបាច់ មិនរាប់បញ្ចូលទិន្នន័យស្ទួន និងខុសគ្នាខ្លាំង. ទិន្នន័យដែលមិនកើតឡើងដដែលៗ និងចំនួនប្រជាជនដូចគ្នាកាន់តែច្រើន សមីការនឹងកាន់តែប្រសើរ។តម្លៃខុសគ្នាយ៉ាងខ្លាំងត្រូវបានយល់ថាជាការសង្កេតដែលមិនសមនឹងស៊េរីទូទៅ។ ជាឧទាហរណ៍ ទិន្នន័យស្តីពីប្រាក់ឈ្នួលសម្រាប់កម្មករមានជាបួន និងប្រាំខ្ទង់ (7,000, 10,000, 15,000) ប៉ុន្តែលេខប្រាំមួយខ្ទង់ (250,000) ត្រូវបានរកឃើញ។ ជាក់ស្តែងនេះគឺជាកំហុសមួយ។

  1. ច្បាប់ទីបី (តម្រូវការ) គឺ ចំនួនទិន្នន័យដ៏ច្រើនគួរសម. អ្នកស្ថិតិមិនយល់ស្របលើចំនួនទិន្នន័យដែលត្រូវការដើម្បីបង្កើតសមីការល្អ។ យោងតាមអ្នកខ្លះទិន្នន័យគឺចាំបាច់ 4-6 ដងទៀត។ចំនួនកត្តា។ អ្នកផ្សេងទៀតអះអាងថា យ៉ាងហោចណាស់ 10 ដងទៀត។ចំនួននៃកត្តាបន្ទាប់មកច្បាប់នៃចំនួនធំដែលដើរតួជាកម្លាំងពេញលេញធានានូវការសងត្រលប់ប្រកបដោយប្រសិទ្ធភាពនៃគម្លាតចៃដន្យពីលក្ខណៈធម្មតានៃទំនាក់ទំនង។

ការកសាងគំរូតំរែតំរង់ពហុវ៉ារ្យង់នៅក្នុងMSexcel
នៅក្នុងសៀវភៅបញ្ជី Excel វាគឺអាចធ្វើទៅបានដើម្បីសាងសង់តែប៉ុណ្ណោះ លីនេអ៊ែរគំរូតំរែតំរង់ចម្រុះ។
, (1.19)
ដើម្បីធ្វើដូចនេះសូមជ្រើសរើស "ការវិភាគ​ទិន្នន័យ",ហើយបន្ទាប់មកនៅក្នុងបង្អួចដែលលេចឡើង - ឧបករណ៍ "តំរែតំរង់"


រូបភាព 1.45 - ប្រអប់ប្រអប់នៃឧបករណ៍ "តំរែតំរង់"
នៅក្នុងបង្អួចដែលលេចឡើង អ្នកត្រូវបំពេញវាលមួយចំនួន រួមទាំង៖


  • ចន្លោះពេលបញ្ចូល - ជួរនៃទិន្នន័យពីជួរឈរមួយដែលមានតម្លៃនៃអថេរលទ្ធផល Y ។

  • ចន្លោះពេលបញ្ចូល X គឺ​ជា​ជួរ​នៃ​ទិន្នន័យ​ដែល​មាន​តម្លៃ​នៃ​អថេរ​កត្តា។

ប្រសិនបើជួរទីមួយ ឬជួរទីមួយនៃចន្លោះពេលបញ្ចូលមានចំណងជើង នោះអ្នកត្រូវតែធីកប្រអប់ "ស្លាក" .

លំនាំដើមត្រូវបានអនុវត្ត កម្រិតភាពជឿជាក់ 95% ។ប្រសិនបើអ្នកចង់កំណត់កម្រិតផ្សេង សូមជ្រើសរើសប្រអប់ធីក ហើយបញ្ចូលកម្រិតនៃភាពជឿជាក់ដែលចង់បាននៅក្នុងវាលដែលនៅជាប់វា។

ប្រអប់ធីក "សូន្យថេរ"ចាំបាច់ត្រូវត្រួតពិនិត្យ លុះត្រាតែអ្នកចង់ទទួលបានសមីការតំរែតំរង់ដោយមិនចាំបាច់ស្ទាក់ចាប់ ដើម្បីឱ្យបន្ទាត់តំរែតំរង់ឆ្លងកាត់ប្រភពដើម។
លទ្ធផលនៃការគណនាអាចត្រូវបានរៀបចំតាម 3 វិធី៖


  • ក្នុង ជួរក្រឡានៃសន្លឹកកិច្ចការនេះ។ (សម្រាប់នេះនៅក្នុងវាល "ជួរទិន្នផល"កំណត់ក្រឡាខាងឆ្វេងខាងលើនៃជួរដែលលទ្ធផលគណនានឹងត្រូវបានបង្ហាញ);

  • នៅ​លើ សន្លឹកកិច្ចការថ្មី។ (អ្នកអាចបញ្ចូលឈ្មោះដែលចង់បាននៃសន្លឹកនេះនៅក្នុងវាលនៅជាប់វា);

  • ក្នុង សៀវភៅការងារថ្មី។ .

ប្រអប់ធីក "នៅសល់"និង "នៅសល់ស្តង់ដារ"បញ្ជាឱ្យពួកវាបញ្ចូលទៅក្នុងជួរទិន្នផល។
ដើម្បី​កំណត់​សំណល់​សម្រាប់​អថេរ​ឯករាជ្យ​នីមួយៗ សូម​ធីក​ប្រអប់ ក្រាហ្វសំណល់។នៅសល់គេ​ស្គាល់​ថា​ជា​កំហុស​ការ​ព្យាករ។ ពួកវាត្រូវបានកំណត់ថាជាភាពខុសគ្នារវាងតម្លៃ Y ជាក់ស្តែង និងដែលបានព្យាករណ៍។
ការបកស្រាយដីសំណល់
មិនគួរមានលំនាំនៅក្នុងគំនូសតាងសំណល់ទេ។ ប្រសិនបើគំរូមួយត្រូវបានតាមដាន នោះមានន័យថាគំរូមិនរួមបញ្ចូលអ្វីដែលមិនស្គាល់សម្រាប់យើងទេ ប៉ុន្តែជាកត្តាដែលមានលក្ខណៈធម្មជាតិ ដែលមិនមានទិន្នន័យ។

នៅពេលធីកប្រអប់ "ការជ្រើសរើសកាលវិភាគ"ស៊េរីនៃក្រាហ្វនឹងត្រូវបានបង្ហាញដែលបង្ហាញពីរបៀបដែលបន្ទាត់តំរែតំរង់ទ្រឹស្តីសមនឹងអ្វីដែលបានសង្កេត ពោលគឺឧ។ ទិន្នន័យជាក់ស្តែង។

ការបកស្រាយការរើសក្រាហ្វ
នៅក្នុង Excel នៅលើតារាងជ្រើសរើស ចំណុចក្រហមបង្ហាញពីតម្លៃទ្រឹស្តី , ចំណុចពណ៌ខៀវ - ទិន្នន័យដំបូង។ ប្រសិនបើចំណុចក្រហមត្រួតលើគ្នាយ៉ាងល្អជាមួយចំណុចពណ៌ខៀវ នោះបង្ហាញឱ្យឃើញពីសមីការតំរែតំរង់ដោយជោគជ័យ។
ជំហានចាំបាច់ក្នុងការព្យាករណ៍ដោយផ្អែកលើគំរូតំរែតំរង់ពហុវ៉ារ្យង់គឺការវាយតម្លៃពីសារៈសំខាន់ស្ថិតិនៃសមីការតំរែតំរង់ពោលគឺឧ។ ភាពសមស្របនៃសមីការតំរែតំរង់ដែលបានសាងសង់សម្រាប់ប្រើប្រាស់ក្នុងការព្យាករណ៍។ ដើម្បីដោះស្រាយបញ្ហានេះ MS Excel គណនាមេគុណមួយចំនួន។ ពោលគឺ៖


  1. មេគុណទំនាក់ទំនងច្រើន។

វាកំណត់លក្ខណៈនៃភាពតឹងតែងនិងទិសដៅនៃទំនាក់ទំនងរវាងលទ្ធផលនិង ជាច្រើនអថេរកត្តា។ ជាមួយនឹងការពឹងផ្អែកពីរកត្តា មេគុណជាប់ទាក់ទងច្រើនត្រូវបានគណនាដោយរូបមន្ត៖
, (1.20)


  1. មេគុណច្រើននៃការកំណត់ ( 2 ).

R 2 គឺជាសមាមាត្រនៃបំរែបំរួលនៃតម្លៃទ្រឹស្តីទាក់ទងទៅនឹងតម្លៃជាក់ស្តែងនៃ y ដែលពន្យល់ដោយកត្តារួមបញ្ចូលក្នុងគំរូ។ នៅសល់នៃតម្លៃទ្រឹស្តីអាស្រ័យលើកត្តាផ្សេងទៀតដែលមិនពាក់ព័ន្ធនឹងគំរូ។ R 2 អាចយកតម្លៃពី 0 ទៅ 1។ ប្រសិនបើ នោះគុណភាពនៃគំរូគឺខ្ពស់។ សូចនាករនេះមានប្រយោជន៍ជាពិសេសសម្រាប់ការប្រៀបធៀបម៉ូដែលជាច្រើននិងជ្រើសរើសម៉ូដែលល្អបំផុត។


  1. មេគុណធម្មតានៃការកំណត់ 2

សូចនាករ R 2 មានគុណវិបត្តិមួយដែលមាននៅក្នុងការពិតដែលថាតម្លៃដ៏ធំនៃមេគុណនៃការកំណត់អាចត្រូវបានសម្រេចដោយសារតែចំនួនតិចតួចនៃការសង្កេត។ បានធ្វើឱ្យមានលក្ខណៈធម្មតា។ ផ្តល់ព័ត៌មានអំពីតម្លៃដែលអ្នកអាចទទួលបាននៅក្នុងសំណុំទិន្នន័យមួយផ្សេងទៀតដែលមានទំហំធំជាងក្នុងករណីនេះ។

ធម្មតាត្រូវបានគណនាដោយរូបមន្ត៖

, (1.21)

តើមេគុណច្រើននៃការកំណត់ធម្មតានៅឯណា?

មេគុណច្រើននៃការកំណត់,

បរិមាណប្រជាជន,

ចំនួនអថេរកត្តា។


  1. កំហុសស្តង់ដារនៃការតំរែតំរង់ បង្ហាញពីចំនួនប្រហាក់ប្រហែលនៃកំហុសក្នុងការទស្សន៍ទាយ។ វាត្រូវបានគេប្រើជាបរិមាណចម្បងសម្រាប់វាស់គុណភាពនៃគំរូប៉ាន់ស្មាន។ គណនាតាមរូបមន្ត៖
, (1.22)

តើផលបូកនៃការ៉េនៃសំណល់នៅឯណា?

ចំនួនដឺក្រេនៃសេរីភាពនៃសំណល់។
នោះគឺជាកំហុសស្តង់ដារនៃការតំរែតំរង់បង្ហាញពីតម្លៃនៃការ៉េនៃកំហុសក្នុងមួយដឺក្រេនៃសេរីភាព។


លទ្ធផល

ស្ថិតិតំរែតំរង់

ច្រើន R

0.973101

R-ការ៉េ

0.946926

R-square ធម្មតា។

0.940682

កំហុសស្តង់ដារ

0.59867

ការសង្កេត

20

ការវិភាគនៃភាពខុសគ្នា

df

អេស

MS



សារៈសំខាន់ F

តំរែតំរង់

2

108.7071

54.35355

151.6535

1.45E-11

នៅសល់

17

6.092905

0.358406

សរុប

19

114.8

ហាងឆេង

កំហុសស្តង់ដារ

t-ស្ថិតិ

P-តម្លៃ

បាត 95%

កំពូល 95%

បាត 95.0%

កំពូល 95.0%

ផ្លូវបំបែក Y

1.835307

0.471065

3.89608

0.001162

0.841445

2.829169

0.841445

2.829169

x1

0.945948

0.212576

4.449917

0.000351

0.49745

1.394446

0.49745

1.394446

x2

0.085618

0.060483

1.415561

0.174964

-0.04199

0.213227

-0.04199

0.213227

ការវិភាគនៃវិធីសាស្ត្របំរែបំរួលមាននៅក្នុងការបំបែកផលបូកសរុបនៃគម្លាតការេនៃអថេរ នៅពីមធ្យមជាពីរផ្នែក៖


  1. ពន្យល់ដោយការតំរែតំរង់ (ឬកត្តា)

  2. សំណល់។
, (1.2 3)
ភាពស័ក្តិសមនៃគំរូតំរែតំរង់សម្រាប់ការទស្សន៍ទាយគឺអាស្រ័យលើចំនួននៃការប្រែប្រួលសរុបនៃលក្ខណៈ yគណនីសម្រាប់បំរែបំរួលដែលបានពន្យល់ដោយការតំរែតំរង់។ ជាក់ស្តែង ប្រសិនបើផលបូកនៃគម្លាតការ៉េដែលពន្យល់ដោយតំរែតំរង់គឺធំជាងសំណល់ នោះការសន្និដ្ឋានត្រូវបានធ្វើឡើងអំពីសារៈសំខាន់ស្ថិតិនៃសមីការតំរែតំរង់។ នេះគឺស្មើនឹងការពិតដែលថាមេគុណនៃការកំណត់ខិតទៅជិតការរួបរួម។
ការរចនានៅក្នុងតារាង "ការវិភាគភាពប្រែប្រួល"៖
ជួរទីពីរនៃតារាងត្រូវបានគេហៅថា និងមានន័យថាចំនួនដឺក្រេនៃសេរីភាព។ សម្រាប់បំរែបំរួលសរុប ចំនួនដឺក្រេនៃសេរីភាពគឺ៖ , សម្រាប់វ៉ារ្យ៉ង់កត្តា (ឬវ៉ារ្យ៉ង់ពន្យល់ដោយការតំរែតំរង់), សម្រាប់បំរែបំរួលសំណល់។

ដែល n ជាចំនួននៃការសង្កេត

m គឺជាចំនួនអថេរកត្តានៃគំរូ។
ជួរទីបីនៃតារាងត្រូវបានគេហៅថា។ វាតំណាងឱ្យផលបូកនៃគម្លាតការ៉េ។ ផលបូកសរុបនៃគម្លាតការេត្រូវបានកំណត់ដោយរូបមន្ត៖

, (1.24)
ផលបូកកត្តានៃការ៉េ៖

, (1.26)
ជួរទីបួនត្រូវបានគេហៅថា - តម្លៃមធ្យមនៃគម្លាតការ៉េ។ កំណត់ដោយរូបមន្ត៖

ដោយមានជំនួយពី Fisher's F-criterion សារៈសំខាន់ស្ថិតិនៃមេគុណនៃការកំណត់នៃសមីការតំរែតំរង់ត្រូវបានកំណត់។ ចំពោះបញ្ហានេះ សម្មតិកម្មទទេត្រូវបានដាក់ទៅមុខ ដែលចែងថារវាងអថេរលទ្ធផល និងកត្តា គ្មានការតភ្ជាប់. វាអាចធ្វើទៅបានលុះត្រាតែប៉ារ៉ាម៉ែត្រទាំងអស់នៃសមីការតំរែតំរង់លីនេអ៊ែរច្រើន និងមេគុណជាប់ទាក់ទងគឺស្មើសូន្យ។

ដើម្បីសាកល្បងសម្មតិកម្មនេះ ចាំបាច់ត្រូវគណនាតម្លៃពិតនៃការធ្វើតេស្ត F-test របស់ Fisher ហើយប្រៀបធៀបវាជាមួយតារាង។ តម្លៃជាក់ស្តែងនៃ F-criterion ត្រូវបានគណនាដោយរូបមន្ត៖

, (1.28)

ជ្រើសរើសពីតារាងស្ថិតិពិសេសដោយ៖


  • កម្រិតនៃសារៈសំខាន់ () និង

  • ចំនួនដឺក្រេនៃសេរីភាព។

នៅក្នុង MS Excel តម្លៃតារាងនៃ F-criterion អាចត្រូវបានកំណត់ដោយប្រើមុខងារ៖ = FINV(ប្រូបាប៊ីលីតេ; ដឺក្រេនៃសេរីភាព1; ដឺក្រេនៃសេរីភាព2)

ឧទាហរណ៍៖ =FDISP(0.05;df1;df2)
កម្រិតសារៈសំខាន់ 1 ត្រូវបានជ្រើសរើសសម្រាប់តែមួយដែលប៉ារ៉ាម៉ែត្រនៃគំរូតំរែតំរង់ត្រូវបានគណនា។ លំនាំដើមគឺ 95% ។

ប្រសិនបើ នោះសម្មតិកម្មដែលបានស្នើឡើងត្រូវបានច្រានចោល ហើយសារៈសំខាន់ស្ថិតិនៃសមីការតំរែតំរង់ត្រូវបានទទួលស្គាល់។ ក្នុងករណីមានការព្យាករណ៍សំខាន់ៗ វាត្រូវបានណែនាំឱ្យបង្កើនតម្លៃតារាងនៃលក្ខណៈវិនិច្ឆ័យ F ចំនួន 4 ដង ពោលគឺលក្ខខណ្ឌត្រូវបានពិនិត្យ៖
=151.65; = 3.59
តម្លៃដែលបានគណនាលើសពីតម្លៃដែលបានកំណត់យ៉ាងសំខាន់។ នេះមានន័យថាមេគុណនៃការកំណត់គឺខុសគ្នាយ៉ាងខ្លាំងពីសូន្យ ដូច្នេះសម្មតិកម្មនៃអវត្តមាននៃការពឹងផ្អែកនៃការតំរែតំរង់គួរតែត្រូវបានច្រានចោល។
ឥឡូវនេះ ចូរយើងវាយតម្លៃពីសារៈសំខាន់នៃមេគុណតំរែតំរង់ដោយផ្អែកលើ t- លក្ខណៈវិនិច្ឆ័យរបស់សិស្ស។វាអនុញ្ញាតឱ្យអ្នកកំណត់ថាតើអថេរកត្តាណាមួយ (x) មានឥទ្ធិពលខ្លាំងបំផុតលើអថេរលទ្ធផល (y) ។

កំហុសស្តង់ដារជាធម្មតាត្រូវបានបញ្ជាក់ដោយ . subscript បង្ហាញប៉ារ៉ាម៉ែត្រនៃសមីការតំរែតំរង់ដែលកំហុសនេះត្រូវបានគណនា។

គណនាតាមរូបមន្ត៖

, (1.29)

ដែល - RMS សម្រាប់អថេរលទ្ធផល,

RMS សម្រាប់លក្ខណៈពិសេស,

មេគុណនៃការកំណត់សម្រាប់សមីការពហុ

តំរែតំរង់,

មេគុណនៃការកំណត់សម្រាប់ការពឹងផ្អែកនៃកត្តាជាមួយ

កត្តាផ្សេងទៀតទាំងអស់នៅក្នុងសមីការ។

ចំនួនដឺក្រេនៃសេរីភាពសម្រាប់ផលបូកដែលនៅសល់នៃការ៉េ

គម្លាត។
នៅក្នុង MS Excel កំហុសស្តង់ដារត្រូវបានគណនាដោយស្វ័យប្រវត្តិ (មានទីតាំងនៅជួរទី 3 នៃតារាងទី 3) ។
តម្លៃជាក់ស្តែងt- លក្ខណៈវិនិច្ឆ័យរបស់សិស្សនៅក្នុង MS Excel មានទីតាំងនៅជួរទី 4 នៃតារាងទី 3 ហើយត្រូវបានគេហៅថា t-ស្ថិតិ។
(ជួរទី ៤) = (ជួរទី ២) / (ជួរទី ៣)

t-statistic = កំហុសមេគុណ/ស្តង់ដារ
តម្លៃតារាងt- លក្ខណៈវិនិច្ឆ័យរបស់សិស្សអាស្រ័យលើកម្រិតនៃសារៈសំខាន់ដែលទទួលយក (ជាធម្មតា 0.05; 0.01) និងចំនួនដឺក្រេនៃសេរីភាព។

ដែល n ជា​ចំនួន​ឯកតា​ប្រជាជន

m គឺជាចំនួនកត្តានៅក្នុងសមីការ។
នៅក្នុង MS Excel តម្លៃតារាងនៃលក្ខណៈវិនិច្ឆ័យរបស់សិស្សអាចត្រូវបានកំណត់ដោយប្រើមុខងារ៖

STUDRASP (ប្រូបាប៊ីលីតេ; ចំនួនដឺក្រេនៃសេរីភាព)
ឧទាហរណ៍៖ =STUDISP(0.05,7)
ប្រសិនបើ នោះវាត្រូវបានសន្និដ្ឋានថាមេគុណនៃសមីការតំរែតំរង់គឺមានសារៈសំខាន់ជាស្ថិតិ (អាចទុកចិត្តបាន) ហើយអាចត្រូវបានបញ្ចូលក្នុងគំរូ និងប្រើសម្រាប់ការព្យាករណ៍។

1.4.2 វិធីសាស្រ្តក្លែងធ្វើ Monte Carlo

វិធីសាស្ត្រក្លែងធ្វើបានទទួលឈ្មោះជាកិត្តិយសនៃទីក្រុង Monte Carlo ដែលមានទីតាំងនៅ Principality of Monaco ដែលជាប្រទេសតូចបំផុតមួយក្នុងពិភពលោក ដែលមានទីតាំងនៅឆ្នេរសមុទ្រមេឌីទែរ៉ាណេ ជិតព្រំដែននៃប្រទេសបារាំង និងប្រទេសអ៊ីតាលី។

វិធីសាស្រ្តក្លែងធ្វើ Monte Carlo ពាក់ព័ន្ធនឹងការបង្កើតតម្លៃចៃដន្យដោយអនុលោមតាមកម្រិតដែលបានផ្តល់ឱ្យ។ នៅពេលចាប់ផ្តើមការធ្វើគំរូក្លែងធ្វើ ជាដំបូង ចាំបាច់ត្រូវបង្កើតគំរូសេដ្ឋកិច្ច និងគណិតវិទ្យា (EMM) នៃសូចនាករដែលបានព្យាករណ៍ ដោយឆ្លុះបញ្ចាំងពីទំនាក់ទំនងរវាងអថេរកត្តា ក៏ដូចជាកម្រិត និងធម្មជាតិនៃឥទ្ធិពលរបស់វាទៅលើលទ្ធផល។ ដោយសារនៅក្នុងលក្ខខណ្ឌនៃលក្ខខណ្ឌទីផ្សារទំនើប ប្រធានបទនៃទំនាក់ទំនងសេដ្ឋកិច្ចត្រូវបានរងផលប៉ះពាល់ក្នុងពេលដំណាលគ្នាដោយកត្តាជាច្រើននៃធម្មជាតិ និងទិសដៅផ្សេងៗគ្នា ហើយកម្រិតនៃឥទ្ធិពលរបស់ពួកគេមិនត្រូវបានកំណត់ វាហាក់ដូចជាចាំបាច់ក្នុងការបែងចែកអថេរ EMM ជាពីរក្រុម៖ stochastic និងកំណត់;

បន្ទាប់មក អ្នកគួរកំណត់ប្រភេទនៃការចែកចាយប្រូបាប៊ីលីតេសម្រាប់អថេរ stochastic នីមួយៗ និងប៉ារ៉ាម៉ែត្របញ្ចូលដែលត្រូវគ្នា ក្លែងតម្លៃនៃអថេរ stochastic ដោយប្រើម៉ាស៊ីនបង្កើតលេខចៃដន្យ MS Excel ឬឧបករណ៍កម្មវិធីផ្សេងទៀត។

ឧបករណ៍ "បង្កើតលេខចៃដន្យ" មានសម្រាប់អ្នកប្រើប្រាស់ MS Excel 2007 បន្ទាប់ពីធ្វើឱ្យកម្មវិធីបន្ថែមសកម្ម កញ្ចប់វិភាគ. លំដាប់នៃការធ្វើឱ្យសកម្មនៃកម្មវិធីបន្ថែមត្រូវបានពិពណ៌នាខាងលើ (សូមមើលទំព័រ 10 រូបភព 1.5-1.8) ។ ដើម្បីដំណើរការការក្លែងធ្វើនៅក្នុងម៉ឺនុយ ទិន្នន័យធាតុត្រូវតែត្រូវបានជ្រើសរើស "ការវិភាគ​ទិន្នន័យ"នៅក្នុងប្រអប់ដែលបង្ហាញ សូមជ្រើសរើសឧបករណ៍ពីបញ្ជី "ការបង្កើតលេខចៃដន្យ"ហើយចុចយល់ព្រម។

រូបភាព 1.46 - ចំណុចប្រទាក់ម៉ឺនុយការវិភាគទិន្នន័យ
នៅក្នុងប្រអប់ដែលលេចឡើង អ្នកត្រូវតែជ្រើសរើសប្រភេទនៃការចែកចាយប្រូបាប៊ីលីតេសម្រាប់អថេរ stochastic នីមួយៗ ហើយកំណត់ប៉ារ៉ាម៉ែត្របញ្ចូលដែលសមស្រប។

រូបភាព 1.47 - ប្រអប់បង្កើតលេខចៃដន្យ
ដំណាក់កាលនេះគឺជាផ្នែកមួយនៃការលំបាកបំផុតដូច្នេះនៅពេលសម្តែងវាចាំបាច់ត្រូវប្រើចំណេះដឹងនិងបទពិសោធន៍របស់អ្នកជំនាញ។ ការជ្រើសរើសប្រភេទនៃការចែកចាយប្រូបាប៊ីលីតេក៏អាចត្រូវបានអនុវត្តនៅលើមូលដ្ឋាននៃព័ត៌មានស្ថិតិដែលមាន។ នៅក្នុងការអនុវត្ត ប្រភេទនៃការបែងចែកប្រូបាប៊ីលីតេដូចជាធម្មតា រាងត្រីកោណ និងឯកសណ្ឋានត្រូវបានគេប្រើញឹកញាប់បំផុត។

ការចែកចាយធម្មតា (ឬច្បាប់ Moivre-Gauss-Laplace)សន្មត់ថាវ៉ារ្យ៉ង់នៃប៉ារ៉ាម៉ែត្រទំនាញទំនាញឆ្ពោះទៅរកតម្លៃមធ្យម។ តម្លៃអថេរដែលខុសគ្នាយ៉ាងខ្លាំងពីមធ្យម ពោលគឺស្ថិតនៅក្នុង "កន្ទុយ" នៃការចែកចាយ មានប្រូបាបទាប។

ការចែកចាយត្រីកោណគឺជាដេរីវេនៃការបែងចែកធម្មតា ហើយសន្មតថាការចែកចាយកើនឡើងតាមលីនេអ៊ែរ នៅពេលដែលវាខិតជិតមធ្យម។

ការចែកចាយឯកសណ្ឋានត្រូវបានប្រើក្នុងករណីដែលតម្លៃទាំងអស់នៃសូចនាករអថេរមានប្រូបាប៊ីលីតេនៃការសម្រេចដូចគ្នា។

ជាមួយនឹងសារៈសំខាន់នៃអថេរនិង ភាពមិនអាចទៅរួចក្នុងការជ្រើសរើសច្បាប់នៃការចែកចាយវាអាចត្រូវបានមើលក្នុងលក្ខខណ្ឌ ការចែកចាយផ្តាច់មុខ។ប្រភេទនៃការចែកចាយប្រូបាប៊ីលីតេដែលបានរាយបញ្ជីខាងលើទាមទារនិយមន័យនៃប៉ារ៉ាម៉ែត្របញ្ចូលដែលបង្ហាញក្នុងតារាង 1.11
តារាង 1.11 - ប៉ារ៉ាម៉ែត្របញ្ចូលនៃប្រភេទចម្បងនៃការចែកចាយប្រូបាប៊ីលីតេ


ប្រភេទនៃប្រូបាប៊ីលីតេ

ការចែកចាយ


ប៉ារ៉ាម៉ែត្របញ្ចូល

1 ការចែកចាយធម្មតា។

  • មធ្យម;

  • គម្លាតស្តង់ដារ;

2 ការចែកចាយត្រីកោណ

  • មធ្យម;


3 ការចែកចាយសូម្បីតែ

  • ដែនកំណត់នៃជួរតម្លៃដែលអាចមាន;

4 ការចែកចាយផ្តាច់មុខ

  • តម្លៃជាក់លាក់នៃអថេរ;

  • ដែលត្រូវគ្នាទៅនឹងប្រូបាប៊ីលីតេដែលបានផ្តល់ឱ្យ។

ជាលទ្ធផលនៃការពិសោធន៍ជាបន្តបន្ទាប់ ការបែងចែកតម្លៃនៃអថេរ stochastic នឹងត្រូវបានទទួល ដោយឈរលើមូលដ្ឋានដែលតម្លៃនៃសូចនាករដែលបានព្យាករណ៍គួរតែត្រូវបានគណនា។

ជំហានចាំបាច់បន្ទាប់គឺដើម្បីធ្វើការវិភាគសេដ្ឋកិច្ច និងស្ថិតិនៃលទ្ធផលក្លែងធ្វើ ដែលវាត្រូវបានណែនាំឱ្យគណនាលក្ខណៈស្ថិតិដូចខាងក្រោមៈ


  • មធ្យម;

  • គម្លាតស្តង់ដារ;

  • ការបែកខ្ញែក;

  • តម្លៃអប្បបរមានិងអតិបរមា;

  • ជួរនៃការប្រែប្រួល;

  • មេគុណ asymmetry;

  • លើស។
សូចនាករខាងលើអាចត្រូវបានប្រើដើម្បីសាកល្បងសម្មតិកម្មនៃការចែកចាយធម្មតា។ ប្រសិនបើសម្មតិកម្មត្រូវបានបញ្ជាក់ ច្បាប់ "បី sigma" អាចត្រូវបានប្រើដើម្បីធ្វើការព្យាករណ៍ចន្លោះពេល។ ច្បាប់ sigma ទាំងបីចែងថាប្រសិនបើអថេរចៃដន្យ Xជាកម្មវត្ថុនៃច្បាប់ចែកចាយធម្មតាជាមួយនឹងប៉ារ៉ាម៉ែត្រ ហើយវាស្ទើរតែប្រាកដណាស់ថាតម្លៃរបស់វាស្ថិតនៅក្នុងចន្លោះពេល នោះគឺ . ដើម្បីបង្កើនភាពច្បាស់លាស់ និងសម្រួលការបកស្រាយ គួរតែបង្កើតអ៊ីស្តូក្រាម។


រូបភាព 1.48 - អ៊ីស្តូក្រាមនៃតម្លៃសូចនាករដែលបានព្យាករណ៍

ការអនុវត្តដំណាក់កាលទាំងនេះនឹងធ្វើឱ្យវាអាចធ្វើទៅបានដើម្បីទទួលបានការប៉ាន់ស្មានប្រហែលនៃតម្លៃនៃសូចនាករដែលបានព្យាករណ៍ (ការព្យាករណ៍ចន្លោះពេល) ។

សព្វថ្ងៃនេះ អ្នករាល់គ្នាដែលយ៉ាងហោចណាស់មានចំណាប់អារម្មណ៍តិចតួចក្នុងការជីកយករ៉ែទិន្នន័យប្រហែលជាបានឮអំពីការតំរែតំរង់លីនេអ៊ែរសាមញ្ញ។ វា​ត្រូវ​បាន​គេ​សរសេរ​រួច​ហើយ​នៅ​លើ Habre ហើយ Andrew Ng ក៏​បាន​និយាយ​យ៉ាង​លម្អិត​ក្នុង​វគ្គ​សិក្សា​ម៉ាស៊ីន​ដែល​ល្បី​របស់​គាត់។ ការតំរែតំរង់លីនេអ៊ែរគឺជាវិធីសាស្រ្តជាមូលដ្ឋាន និងសាមញ្ញបំផុតនៃការរៀនម៉ាស៊ីន ប៉ុន្តែវិធីសាស្ត្រសម្រាប់វាយតម្លៃគុណភាពនៃគំរូដែលបានសាងសង់គឺកម្រត្រូវបានលើកឡើងណាស់។ នៅក្នុងអត្ថបទនេះ ខ្ញុំនឹងព្យាយាមកែតម្រូវការលុបចោលដ៏គួរឱ្យរំខាននេះបន្តិច ដោយឧទាហរណ៍នៃការញែកលទ្ធផលនៃអនុគមន៍ summary.lm() ជាភាសា R ក្នុងការធ្វើដូច្នេះ ខ្ញុំនឹងព្យាយាមផ្តល់នូវរូបមន្តចាំបាច់ ដូច្នេះការគណនាទាំងអស់ អាច​ត្រូវ​បាន​កម្មវិធី​យ៉ាង​ងាយ​ស្រួល​ជា​ភាសា​ផ្សេង​ទៀត​។ អត្ថបទនេះត្រូវបានបម្រុងទុកសម្រាប់អ្នកដែលបានឮថាវាអាចទៅរួចក្នុងការបង្កើតតំរែតំរង់លីនេអ៊ែរ ប៉ុន្តែមិនទាន់បានឆ្លងកាត់នីតិវិធីស្ថិតិសម្រាប់ការវាយតម្លៃគុណភាពរបស់វា។

គំរូតំរែតំរង់លីនេអ៊ែរ

ដូច្នេះ សូមអោយមានអថេរចៃដន្យឯករាជ្យមួយចំនួន X1, X2, ..., Xn (អ្នកទស្សន៍ទាយ) និងអថេរ Y អាស្រ័យលើពួកវា (វាត្រូវបានសន្មត់ថាការបំប្លែងចាំបាច់ទាំងអស់របស់អ្នកទស្សន៍ទាយត្រូវបានធ្វើឡើងរួចហើយ)។ លើសពីនេះទៅទៀត យើងសន្មត់ថាការពឹងផ្អែកគឺលីនេអ៊ែរ ហើយកំហុសត្រូវបានចែកចាយជាធម្មតា i.e.

កន្លែងដែលខ្ញុំជាម៉ាទ្រីសអត្តសញ្ញាណការ៉េ n x n ។

ដូច្នេះយើងមានទិន្នន័យដែលមានការសង្កេត k នៃតម្លៃ Y និង Xi ហើយយើងចង់ប៉ាន់ប្រមាណមេគុណ។ វិធីសាស្ត្រស្ដង់ដារសម្រាប់ស្វែងរកការប៉ាន់ប្រមាណមេគុណគឺជាវិធីសាស្ត្រការេតិចបំផុត។ ហើយដំណោះស្រាយវិភាគដែលអាចទទួលបានដោយការអនុវត្តវិធីសាស្រ្តនេះមើលទៅដូចនេះ៖

កន្លែងណា ជាមួយមួក - ការប៉ាន់ស្មានវ៉ិចទ័រមេគុណ, yគឺជាវ៉ិចទ័រនៃតម្លៃនៃអថេរអាស្រ័យ ហើយ X គឺជាម៉ាទ្រីសនៃទំហំ k x n + 1 (n គឺជាចំនួនអ្នកទស្សន៍ទាយ k គឺជាចំនួននៃការសង្កេត) ដែលជួរទីមួយមានមួយ ទីពីរ - តម្លៃរបស់អ្នកទស្សន៍ទាយទីមួយ ទីបី - ទីពីរ និងបន្តបន្ទាប់ទៀត និងជួរដែលត្រូវគ្នានឹងការសង្កេតដែលមានស្រាប់។

មុខងារ summary.lm() និងការវាយតម្លៃលទ្ធផល

ឥឡូវពិចារណាឧទាហរណ៍នៃការកសាងគំរូតំរែតំរង់លីនេអ៊ែរជាភាសា R៖
> បណ្ណាល័យ (ឆ្ងាយ) > lm1<-lm(Species~Area+Elevation+Nearest+Scruz+Adjacent, data=gala) >summary(lm1) Call: lm(formula = Species ~ Area + Elevation + Nearest + Scruz + Adjacent, data = gala) Residuals: Min 1Q Median 3Q Max -111.679 -34.898 -7.862 33.460 182.584 Coefficients. Error t value Pr(>|t|) (Intercept) 7.068221 19.154198 0.369 0.715351 Area -0.023938 0.022422 -1.068 0.296318 Elevation 0.319465 0.053663 5.953 3.82e-06 *** Nearest 0.009144 1.054136 0.009 0.993151 Scruz -0.240524 0.215402 -1.117 0.275208 Adjacent -0.074805 0.017700 -4.226 0.000297 *** --- សញ្ញា។ លេខកូដ៖ 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 កំហុសស្ដង់ដារសំណល់៖ 60.98 នៅលើ 24 ដឺក្រេនៃសេរីភាព ច្រើន R-squared: 0.7658, លៃតម្រូវ R-717:11 F. ស្ថិតិ៖ 15.7 នៅលើ 5 និង 24 DF, p-value: 6.838e-07
តារាង gala មានទិន្នន័យមួយចំនួននៅលើកោះ Galapagos ចំនួន 30 ។ យើងនឹងពិចារណាគំរូមួយដែលប្រភេទសត្វ - ចំនួននៃប្រភេទរុក្ខជាតិផ្សេងៗគ្នានៅលើកោះគឺអាស្រ័យតាមបន្ទាត់លើអថេរផ្សេងៗទៀត។

ពិចារណាលទ្ធផលនៃអនុគមន៍ summary.lm() ។
ដំបូង​មក​នូវ​បន្ទាត់​ដែល​រំលឹក​ពី​របៀប​ដែល​គំរូ​ត្រូវ​បាន​គេ​បង្កើត​ឡើង។
បន្ទាប់មកមានព័ត៌មានអំពីការចែកចាយសំណល់៖ អប្បបរមា ត្រីមាសទីមួយ មធ្យមភាគ ត្រីមាសទីបី អតិបរមា។ នៅចំណុចនេះ វានឹងមានប្រយោជន៍មិនត្រឹមតែក្នុងការមើលបរិមាណមួយចំនួននៃសំណល់ប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងពិនិត្យមើលភាពធម្មតារបស់វាផងដែរ ឧទាហរណ៍ ការប្រើតេស្ត Shapiro-Wilk ។
បន្ទាប់ - គួរឱ្យចាប់អារម្មណ៍បំផុត - ព័ត៌មានអំពីមេគុណ។ ទ្រឹស្តីតិចតួចគឺត្រូវការនៅទីនេះ។
ដំបូងយើងសរសេរលទ្ធផលដូចខាងក្រោមៈ

ដែល sigma ការេជាមួយ cap គឺជាការប៉ាន់ប្រមាណដែលមិនលំអៀងសម្រាប់ sigma squared ពិតប្រាកដ។ នៅទីនេះ គឺជាវ៉ិចទ័រពិតនៃមេគុណ ហើយ epsilon ដែលដាក់ជាវ៉ិចទ័រនៃសំណល់ ប្រសិនបើយើងយកការប៉ាន់ប្រមាណការេតិចបំផុតជាមេគុណ។ នោះគឺនៅក្រោមការសន្មត់ថាកំហុសត្រូវបានចែកចាយជាធម្មតា វ៉ិចទ័រនៃមេគុណនឹងត្រូវបានចែកចាយជាធម្មតាជុំវិញតម្លៃពិត ហើយការប្រែប្រួលរបស់វាអាចត្រូវបានប៉ាន់ប្រមាណដោយមិនលំអៀង។ នេះមានន័យថាអ្នកអាចសាកល្បងសម្មតិកម្មសម្រាប់សមភាពនៃមេគុណទៅសូន្យ ហើយដូច្នេះពិនិត្យមើលសារៈសំខាន់របស់អ្នកទស្សន៍ទាយ ពោលគឺថាតើតម្លៃរបស់ Xi ពិតជាប៉ះពាល់ដល់គុណភាពនៃគំរូដែលបានសាងសង់ដែរឬទេ។
ដើម្បីសាកល្បងសម្មតិកម្មនេះ យើងត្រូវការស្ថិតិខាងក្រោម ដែលមានការចែកចាយសិស្ស ប្រសិនបើតម្លៃពិតនៃមេគុណ bi គឺ 0៖

កន្លែងណា
គឺជាកំហុសស្តង់ដារនៃការប៉ាន់ប្រមាណមេគុណ ហើយ t(k-n-1) គឺជាការចែកចាយរបស់សិស្សជាមួយនឹង k-n-1 ដឺក្រេនៃសេរីភាព។

ឥឡូវនេះយើងត្រៀមខ្លួនរួចរាល់ហើយដើម្បីបន្តញែកលទ្ធផលនៃអនុគមន៍ summary.lm()។
ដូច្នេះបន្ទាប់គឺការប៉ាន់ប្រមាណមេគុណដែលទទួលបានដោយវិធីសាស្ត្រការ៉េតិចបំផុត កំហុសស្តង់ដាររបស់វា តម្លៃនៃស្ថិតិ t និងតម្លៃ p សម្រាប់វា។ ជាធម្មតា p-value ត្រូវបានប្រៀបធៀបទៅនឹងកម្រិតដែលបានជ្រើសរើសជាមុនតូចល្មមមួយចំនួន ដូចជា 0.05 ឬ 0.01។ ហើយប្រសិនបើតម្លៃនៃស្ថិតិ p តិចជាងកម្រិតកំណត់ នោះសម្មតិកម្មត្រូវបានច្រានចោល ប្រសិនបើច្រើនជាងនេះ គ្មានអ្វីច្បាស់លាស់ទេ ជាអកុសលអាចនិយាយបាន។ ខ្ញុំសូមរំលឹកអ្នកថា ក្នុងករណីនេះ ដោយសារការចែកចាយរបស់សិស្សគឺស៊ីមេទ្រីប្រហែល 0 នោះ p-value នឹងស្មើនឹង 1-F(|t|)+F(-|t|) ដែល F គឺជាការបែងចែករបស់សិស្ស។ មុខងារជាមួយ k-n-1 ដឺក្រេនៃសេរីភាព។ ដូចគ្នានេះផងដែរ R សម្គាល់ដោយមេគុណសញ្ញាផ្កាយដែលតម្លៃ p-value គឺតូចគ្រប់គ្រាន់។ នោះគឺ មេគុណទាំងនោះដែលមិនទំនងជា 0. នៅក្នុងបន្ទាត់ Signif ។ លេខកូដគ្រាន់តែមានការឌិកូដសញ្ញាផ្កាយ៖ ប្រសិនបើមានបី នោះតម្លៃ p គឺពី 0 ដល់ 0.001 ប្រសិនបើមានពីរ នោះវាគឺពី 0.001 ដល់ 0.01 ហើយដូច្នេះនៅលើ។ ប្រសិនបើមិនមានរូបតំណាងទេនោះ p-value គឺធំជាង 0.1 ។

ក្នុងឧទាហរណ៍របស់យើង យើងអាចនិយាយដោយភាពប្រាកដប្រជាថា អ្នកព្យាករណ៍កម្ពស់ និងនៅជាប់គ្នាពិតជាទំនងជាប៉ះពាល់ដល់តម្លៃនៃប្រភេទសត្វ ប៉ុន្តែគ្មានអ្វីច្បាស់លាស់អាចនិយាយបានអំពីអ្នកព្យាករណ៍ដែលនៅសល់នោះទេ។ ជាធម្មតា ក្នុងករណីបែបនេះ អ្នកទស្សន៍ទាយត្រូវដកចេញម្តងមួយៗ ហើយមើលពីរបៀបដែលសូចនាករគំរូផ្សេងទៀតផ្លាស់ប្តូរ ឧទាហរណ៍ BIC ឬ Adjusted R-squared ដែលនឹងវិភាគនៅពេលក្រោយ។

តម្លៃនៃ Residual standard error ទាក់ទងទៅនឹងការប៉ាន់ប្រមាណសាមញ្ញនៃ sigma ជាមួយនឹង cap ហើយដឺក្រេនៃសេរីភាពត្រូវបានគណនាជា k-n-1 ។

ហើយឥឡូវនេះស្ថិតិសំខាន់បំផុតដែលមានតម្លៃមើលដំបូងបង្អស់: R-squared និង Adjusted R-squared:

ដែល Yi ជាតម្លៃ Y ពិតប្រាកដនៅក្នុងការសង្កេតនីមួយៗ Yi ជាមួយមួកគឺជាតម្លៃដែលព្យាករណ៍ដោយគំរូ Y ដែលមានរបារគឺជាមធ្យមនៃតម្លៃ Yi ពិតទាំងអស់។

ចូរចាប់ផ្តើមជាមួយស្ថិតិ R-squared ឬដូចដែលជួនកាលគេហៅថា មេគុណនៃការកំណត់។ វាបង្ហាញពីរបៀបបំរែបំរួលតាមលក្ខខណ្ឌនៃគំរូខុសពីបំរែបំរួលនៃតម្លៃពិតនៃ Y ។ ប្រសិនបើមេគុណនេះគឺជិតដល់ 1 នោះវ៉ារ្យ៉ង់តាមលក្ខខណ្ឌនៃគំរូគឺតូចណាស់ ហើយវាទំនងណាស់ដែលម៉ូដែលសមនឹង ទិន្នន័យបានយ៉ាងល្អ។ ប្រសិនបើមេគុណ R-squared គឺតិចជាងច្រើន ឧទាហរណ៍ តិចជាង 0.5 នោះ ដោយមានទំនុកចិត្តខ្ពស់ គំរូមិនឆ្លុះបញ្ចាំងពីស្ថានភាពជាក់ស្តែងនោះទេ។

ទោះជាយ៉ាងណាក៏ដោយ ស្ថិតិ R-squared មានគុណវិបត្តិយ៉ាងធ្ងន់ធ្ងរមួយ៖ នៅពេលដែលចំនួនអ្នកទស្សន៍ទាយកើនឡើង ស្ថិតិនេះអាចកើនឡើងតែប៉ុណ្ណោះ។ ដូច្នេះ វាអាចហាក់ដូចជាគំរូដែលមានអ្នកទស្សន៍ទាយច្រើនជាងគឺប្រសើរជាងគំរូដែលមានចំនួនតិចជាង បើទោះបីជាអ្នកព្យាករណ៍ថ្មីទាំងអស់មិនប៉ះពាល់ដល់អថេរអាស្រ័យក៏ដោយ។ នៅទីនេះយើងអាចរំលឹកឡើងវិញនូវគោលការណ៍នៃឡាមរបស់ Occam ។ ការធ្វើតាមវា ប្រសិនបើអាចធ្វើទៅបាន វាគឺមានតម្លៃកម្ចាត់ការទស្សន៍ទាយដែលមិនចាំបាច់នៅក្នុងគំរូព្រោះវាកាន់តែសាមញ្ញ និងអាចយល់បាន។ សម្រាប់គោលបំណងទាំងនេះ ស្ថិតិ R-squared ដែលបានកែតម្រូវត្រូវបានបង្កើត។ វាគឺជា R-squared ធម្មតា ប៉ុន្តែជាមួយនឹងការពិន័យសម្រាប់អ្នកទស្សន៍ទាយមួយចំនួនធំ។ គំនិតចម្បង៖ ប្រសិនបើអថេរឯករាជ្យថ្មីបានរួមចំណែកយ៉ាងធំធេងចំពោះគុណភាពនៃគំរូ តម្លៃនៃស្ថិតិនេះកើនឡើង ប្រសិនបើមិនមានទេ ផ្ទុយទៅវិញវាថយចុះ។

ជាឧទាហរណ៍ សូមពិចារណាគំរូដូចពីមុន ប៉ុន្តែឥឡូវនេះជំនួសឱ្យការទស្សន៍ទាយចំនួនប្រាំ យើងនឹងទុកពីរ៖
> lm2<-lm(Species~Elevation+Adjacent, data=gala) >summary(lm2) Call: lm(formula = Species ~ Elevation + Adjacent, data = gala) Residuals: Min 1Q Median 3Q Max -103.41 -34.33 -11.43 22.57 203.65 Coefficients: Estimate Std. កំហុស t តម្លៃ Pr(>|t|) (ស្កាត់) 1.43287 15.02469 0.095 0.924727 ការកាត់បន្ថយ 0.27657 0.03176 8.707 2.53e-09 *** សញ្ញានៅជិត -0.048409 0.070. លេខកូដ៖ 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 កំហុសស្ដង់ដារសំណល់៖ 60.86 នៅលើ 27 ដឺក្រេនៃសេរីភាព ច្រើន R-squared: 0.7376, លៃតម្រូវ R-7181: ស្ថិតិ៖ 37.94 លើ 2 និង 27 DF, p-value: 1.434e-08
ដូចដែលអ្នកអាចឃើញតម្លៃនៃស្ថិតិ R-square បានថយចុះប៉ុន្តែតម្លៃនៃ R-square ដែលបានកែតម្រូវសូម្បីតែកើនឡើងបន្តិច។

ឥឡូវនេះ ចូរយើងសាកល្បងសម្មតិកម្មថា មេគុណទាំងអស់របស់អ្នកទស្សន៍ទាយគឺស្មើនឹងសូន្យ។ នោះគឺជាសម្មតិកម្មថាតើតម្លៃនៃ Y ជាទូទៅអាស្រ័យលើតម្លៃរបស់ស៊ីលីនេអ៊ែរ។ ដើម្បីធ្វើដូច្នេះ អ្នកអាចប្រើស្ថិតិខាងក្រោម ដែលប្រសិនបើសម្មតិកម្មដែលថាមេគុណទាំងអស់ស្មើនឹងសូន្យគឺពិត នោះមាន

មេគុណទំនាក់ទំនងច្រើន។ប្រើជារង្វាស់នៃកម្រិតនៃភាពស្និទ្ធស្នាលនៃទំនាក់ទំនងស្ថិតិរវាងសូចនាករលទ្ធផល (អថេរអាស្រ័យ) yនិងសំណុំនៃអថេរពន្យល់ (ឯករាជ្យ) ឬនិយាយម្យ៉ាងទៀត ប៉ាន់ប្រមាណភាពជិតស្និទ្ធនៃឥទ្ធិពលរួមគ្នានៃកត្តាលើលទ្ធផល។

មេគុណជាប់ទាក់ទងច្រើនអាចត្រូវបានគណនាពីរូបមន្ត 5 មួយចំនួន រួមទាំង៖

    ដោយប្រើម៉ាទ្រីសនៃមេគុណជាប់ទាក់ទងជាគូ

, (3.18)

កន្លែងដែល  r- កត្តាកំណត់នៃម៉ាទ្រីសនៃមេគុណជាប់ទាក់ទងគ្នាជាគូ y,
,

r១១ - កត្តាកំណត់នៃម៉ាទ្រីសទំនាក់ទំនងអន្តរហ្វា
;

. (3.19)

សម្រាប់គំរូដែលមានអថេរឯករាជ្យពីរ រូបមន្ត (3.18) ត្រូវបានធ្វើឱ្យសាមញ្ញ

. (3.20)

ការ៉េនៃមេគុណទំនាក់ទំនងច្រើនគឺ មេគុណកំណត់ ២. ដូចនៅក្នុងករណីនៃការតំរែតំរង់ជាគូ។ 2 បង្ហាញពីគុណភាពនៃគំរូតំរែតំរង់ និងឆ្លុះបញ្ចាំងពីចំណែកនៃការប្រែប្រួលសរុបនៃលក្ខណៈលទ្ធផល yពន្យល់ដោយការផ្លាស់ប្តូរមុខងារតំរែតំរង់ f(x) (សូមមើល 2.4) ។ លើសពីនេះទៀតមេគុណនៃការកំណត់អាចត្រូវបានរកឃើញដោយរូបមន្ត

. (3.21)

ទោះយ៉ាងណាក៏ដោយការប្រើប្រាស់ 2 ក្នុងករណីនៃការតំរែតំរង់ច្រើនគឺមិនត្រឹមត្រូវទេ ចាប់តាំងពីមេគុណនៃការកំណត់កើនឡើង នៅពេលដែលការតំរែតំរង់ត្រូវបានបន្ថែមទៅក្នុងគំរូ។ នេះគឺដោយសារតែបំរែបំរួលសំណល់មានការថយចុះនៅពេលដែលអថេរបន្ថែមត្រូវបានណែនាំ។ ហើយប្រសិនបើចំនួនកត្តាខិតជិតចំនួននៃការសង្កេត នោះភាពខុសគ្នាដែលនៅសល់នឹងសូន្យ ហើយមេគុណជាប់ទាក់ទងគ្នាច្រើន ហេតុដូចនេះហើយ មេគុណនៃការកំណត់នឹងឈានដល់ការរួបរួម ទោះបីជាការពិតទំនាក់ទំនងរវាងកត្តា និងលទ្ធផល និងកត្តា អំណាចពន្យល់នៃសមីការតំរែតំរង់អាចទាបជាងច្រើន។

ដើម្បីទទួលបានការវាយតម្លៃឱ្យបានគ្រប់គ្រាន់ថាតើការបំរែបំរួលនៃលក្ខណៈលទ្ធផលត្រូវបានពន្យល់ដោយបំរែបំរួលនៃលក្ខណៈកត្តាជាច្រើនប៉ុណ្ណា សូមអនុវត្ត មេគុណដែលបានកែតម្រូវនៃការកំណត់

(3.22)

មេគុណដែលបានកែតម្រូវនៃការកំណត់គឺតែងតែតិចជាង ២. លើសពីនេះទៅទៀតមិនដូច 2 ដែលតែងតែវិជ្ជមាន
ក៏អាចយកតម្លៃអវិជ្ជមានផងដែរ។

ឧទាហរណ៍ (បន្តឧទាហរណ៍ ១). ចូរយើងគណនាមេគុណជាប់ទាក់ទងគ្នាច្រើន តាមរូបមន្ត (៣.២០)៖

តម្លៃនៃមេគុណទំនាក់ទំនងច្រើនស្មើនឹង 0.8601 បង្ហាញពីទំនាក់ទំនងដ៏រឹងមាំរវាងតម្លៃនៃការដឹកជញ្ជូន និងទម្ងន់នៃទំនិញ និងចម្ងាយដែលវាត្រូវបានដឹកជញ្ជូន។

មេគុណនៃការកំណត់គឺស្មើនឹង៖ 2 =0,7399.

មេគុណដែលបានកែតម្រូវត្រូវបានគណនាដោយរូបមន្ត (3.22)៖

=0,7092.

ចំណាំថាតម្លៃនៃមេគុណកំណត់នៃការកែតម្រូវខុសគ្នាពីតម្លៃនៃមេគុណនៃការកំណត់។

ដូច្នេះ 70.9% នៃការប្រែប្រួលនៃអថេរអាស្រ័យ (ថ្លៃដឹកជញ្ជូន) ត្រូវបានពន្យល់ដោយការប្រែប្រួលនៃអថេរឯករាជ្យ (ទម្ងន់ទំនិញ និងចម្ងាយដឹកជញ្ជូន)។ នៅសល់ 29.1% នៃបំរែបំរួលនៅក្នុងអថេរអាស្រ័យត្រូវបានពន្យល់ដោយកត្តាដែលមិនត្រូវបានយកមកពិចារណាក្នុងគំរូ។

តម្លៃនៃមេគុណដែលបានកែតម្រូវនៃការកំណត់គឺមានទំហំធំណាស់ ដូច្នេះយើងអាចយកមកពិចារណាក្នុងគំរូនូវកត្តាសំខាន់ៗបំផុតដែលកំណត់តម្លៃនៃការដឹកជញ្ជូន។ 

ការវិភាគតំរែតំរង់គឺជាវិធីសាស្រ្តស្រាវជ្រាវស្ថិតិដែលអនុញ្ញាតឱ្យអ្នកបង្ហាញពីការពឹងផ្អែកនៃប៉ារ៉ាម៉ែត្រលើអថេរឯករាជ្យមួយឬច្រើន។ នៅសម័យមុនកុំព្យូទ័រ ការប្រើប្រាស់របស់វាមានការពិបាកខ្លាំង ជាពិសេសនៅពេលដែលវាមកដល់បរិមាណទិន្នន័យច្រើន។ ថ្ងៃនេះដោយបានរៀនពីរបៀបបង្កើតតំរែតំរង់ក្នុង Excel អ្នកអាចដោះស្រាយបញ្ហាស្ថិតិស្មុគ្រស្មាញបានត្រឹមតែពីរបីនាទីប៉ុណ្ណោះ។ ខាងក្រោមនេះគឺជាឧទាហរណ៍ជាក់លាក់ពីវិស័យសេដ្ឋកិច្ច។

ប្រភេទនៃការតំរែតំរង់

គំនិតខ្លួនឯងត្រូវបានបញ្ចូលទៅក្នុងគណិតវិទ្យានៅឆ្នាំ 1886 ។ ការតំរែតំរង់កើតឡើង៖

  • លីនេអ៊ែរ;
  • ប៉ារ៉ាបូលិក;
  • អំណាច;
  • អិចស្ប៉ូណង់ស្យែល;
  • អ៊ីពែរបូល;
  • ការបង្ហាញ;
  • លោការីត។

ឧទាហរណ៍ ១

ពិចារណាពីបញ្ហានៃការកំណត់ការពឹងផ្អែកនៃចំនួនសមាជិកក្រុមចូលនិវត្តន៍លើប្រាក់ខែជាមធ្យមនៅសហគ្រាសឧស្សាហកម្មចំនួន 6 ។

កិច្ចការ។ នៅសហគ្រាសចំនួនប្រាំមួយ យើងបានវិភាគលើប្រាក់ខែជាមធ្យមប្រចាំខែ និងចំនួនបុគ្គលិកដែលបានចាកចេញទៅតាមការព្រមព្រៀងរបស់ពួកគេ។ ក្នុងទម្រង់តារាងយើងមាន៖

ចំនួនមនុស្សដែលចាកចេញ

ប្រាក់ខែ

30000 rubles

35000 rubles

40000 rubles

45000 rubles

50000 rubles

55000 rubles

60000 rubles

ចំពោះបញ្ហានៃការកំណត់ការពឹងផ្អែកនៃចំនួនកម្មករនិយោជិតដែលចូលនិវត្តន៍លើប្រាក់ខែជាមធ្យមនៅសហគ្រាសចំនួន 6 គំរូតំរែតំរង់មានទម្រង់នៃសមីការ Y = a 0 + a 1 x 1 +…+a k x k ដែល x i គឺជាអថេរដែលមានឥទ្ធិពល។ a i គឺជាមេគុណតំរែតំរង់, a k គឺជាចំនួនកត្តា។

សម្រាប់ការងារនេះ Y គឺជាសូចនាករនៃបុគ្គលិកដែលបានចាកចេញ ហើយកត្តាដែលមានឥទ្ធិពលគឺប្រាក់ខែ ដែលយើងបញ្ជាក់ដោយ X។

ការប្រើប្រាស់សមត្ថភាពនៃសៀវភៅបញ្ជី "Excel"

ការវិភាគតំរែតំរង់នៅក្នុង Excel ត្រូវតែនាំមុខដោយការអនុវត្តមុខងារដែលភ្ជាប់មកជាមួយទៅនឹងទិន្នន័យតារាងដែលមាន។ ទោះយ៉ាងណាក៏ដោយ សម្រាប់គោលបំណងទាំងនេះ វាជាការប្រសើរក្នុងការប្រើប្រាស់កម្មវិធីបន្ថែម "ឧបករណ៍វិភាគ" ដែលមានប្រយោជន៍បំផុត។ ដើម្បីដំណើរការវាអ្នកត្រូវការ៖

  • ពីផ្ទាំង "ឯកសារ" ទៅកាន់ផ្នែក "ជម្រើស";
  • នៅក្នុងបង្អួចដែលបើកសូមជ្រើសរើសបន្ទាត់ "កម្មវិធីបន្ថែម";
  • ចុចលើប៊ូតុង "ទៅ" ដែលមានទីតាំងនៅខាងក្រោមនៅខាងស្តាំបន្ទាត់ "ការគ្រប់គ្រង" ។
  • ធីកប្រអប់នៅជាប់នឹងឈ្មោះ "កញ្ចប់វិភាគ" ហើយបញ្ជាក់សកម្មភាពរបស់អ្នកដោយចុច "យល់ព្រម" ។

ប្រសិនបើអ្វីៗគ្រប់យ៉ាងត្រូវបានធ្វើបានត្រឹមត្រូវ ប៊ូតុងដែលចង់បាននឹងបង្ហាញនៅជ្រុងខាងស្តាំនៃផ្ទាំងទិន្នន័យ ដែលមានទីតាំងនៅខាងលើសន្លឹកកិច្ចការ Excel ។

នៅក្នុង Excel

ឥឡូវនេះយើងមានឧបករណ៍និម្មិតចាំបាច់ទាំងអស់សម្រាប់អនុវត្តការគណនាសេដ្ឋកិច្ច យើងអាចចាប់ផ្តើមដោះស្រាយបញ្ហារបស់យើង។ សម្រាប់​ការ​នេះ:

  • ចុចលើប៊ូតុង "ការវិភាគទិន្នន័យ";
  • នៅក្នុងបង្អួចដែលបើកសូមចុចលើប៊ូតុង "តំរែតំរង់";
  • នៅក្នុងផ្ទាំងដែលលេចឡើងសូមបញ្ចូលជួរតម្លៃសម្រាប់ Y (ចំនួនបុគ្គលិកដែលឈប់) និងសម្រាប់ X (ប្រាក់ខែរបស់ពួកគេ);
  • យើងបញ្ជាក់សកម្មភាពរបស់យើងដោយចុចប៊ូតុង "យល់ព្រម" ។

ជាលទ្ធផល កម្មវិធីនឹងបញ្ចូលសន្លឹកថ្មីនៃសៀវភៅបញ្ជីដោយស្វ័យប្រវត្តិជាមួយនឹងទិន្នន័យការវិភាគតំរែតំរង់។ ចំណាំ! Excel មានសមត្ថភាពក្នុងការកំណត់ទីតាំងដែលអ្នកចង់បានដោយដៃសម្រាប់គោលបំណងនេះ។ ឧទាហរណ៍ វាអាចជាសន្លឹកដូចគ្នាដែលតម្លៃ Y និង X ឬសូម្បីតែសៀវភៅការងារថ្មីដែលត្រូវបានរចនាឡើងជាពិសេសដើម្បីរក្សាទុកទិន្នន័យបែបនេះ។

ការវិភាគលទ្ធផលតំរែតំរង់សម្រាប់ R-square

នៅក្នុង Excel ទិន្នន័យដែលទទួលបានក្នុងអំឡុងពេលដំណើរការទិន្នន័យនៃឧទាហរណ៍ដែលបានពិចារណាមើលទៅដូចនេះ:

ដំបូងអ្នកគួរតែយកចិត្តទុកដាក់លើតម្លៃនៃ R-square ។ វាជាមេគុណនៃការកំណត់។ ក្នុងឧទាហរណ៍នេះ R-square = 0.755 (75.5%), i.e. ប៉ារ៉ាម៉ែត្រគណនានៃគំរូពន្យល់ពីទំនាក់ទំនងរវាងប៉ារ៉ាម៉ែត្រដែលបានពិចារណាដោយ 75.5% ។ តម្លៃនៃមេគុណនៃការកំណត់កាន់តែខ្ពស់ គំរូដែលបានជ្រើសរើសអាចអនុវត្តបានកាន់តែច្រើនសម្រាប់កិច្ចការជាក់លាក់មួយ។ វាត្រូវបានគេជឿថាវាពិពណ៌នាយ៉ាងត្រឹមត្រូវអំពីស្ថានភាពពិតជាមួយនឹងតម្លៃ R-squared ខាងលើ 0.8 ។ ប្រសិនបើ R-squared<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

ការវិភាគសមាមាត្រ

លេខ 64.1428 បង្ហាញថាតើតម្លៃ Y នឹងទៅជាយ៉ាងណា ប្រសិនបើអថេរ xi នៅក្នុងគំរូដែលយើងកំពុងពិចារណាត្រូវបានកំណត់ទៅសូន្យ។ ម៉្យាងទៀត វាអាចត្រូវបានអះអាងថាតម្លៃនៃប៉ារ៉ាម៉ែត្រដែលបានវិភាគក៏ត្រូវបានជះឥទ្ធិពលដោយកត្តាផ្សេងទៀតដែលមិនត្រូវបានពិពណ៌នានៅក្នុងគំរូជាក់លាក់មួយ។

មេគុណបន្ទាប់ -0.16285 ដែលស្ថិតនៅក្នុងក្រឡា B18 បង្ហាញពីទម្ងន់នៃឥទ្ធិពលនៃអថេរ X នៅលើ Y. នេះមានន័យថា ប្រាក់ខែជាមធ្យមប្រចាំខែរបស់និយោជិតក្នុងគំរូដែលកំពុងពិចារណាប៉ះពាល់ដល់ចំនួនអ្នកឈប់ធ្វើការដែលមានទម្ងន់ -0.16285 ពោលគឺឧ។ កម្រិតនៃឥទ្ធិពលរបស់វានៅតូច។ សញ្ញា "-" បង្ហាញថាមេគុណមានតម្លៃអវិជ្ជមាន។ នេះ​ជាការ​ជាក់ស្តែង ដោយសារ​គ្រប់គ្នា​ដឹងថា ប្រាក់ខែ​នៅ​សហគ្រាស​កាន់តែ​ខ្ពស់ មនុស្ស​កាន់តែ​តិច​បង្ហាញ​បំណង​ចង់​បញ្ចប់​កិច្ចសន្យា​ការងារ ឬ​លាឈប់​។

ការតំរែតំរង់ច្រើន។

ពាក្យនេះសំដៅទៅលើសមីការតភ្ជាប់ជាមួយអថេរឯករាជ្យជាច្រើននៃទម្រង់៖

y \u003d f (x 1 + x 2 + ... x m) + ε ដែល y ជាលក្ខណៈមានប្រសិទ្ធភាព (អថេរអាស្រ័យ) និង x 1 , x 2 , ... x m គឺជាកត្តាកត្តា (អថេរឯករាជ្យ)។

ការប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រ

សម្រាប់ការតំរែតំរង់ច្រើន (MR) វាត្រូវបានអនុវត្តដោយប្រើវិធីសាស្ត្រនៃការេយ៉ាងហោចណាស់ (OLS) ។ សម្រាប់សមីការលីនេអ៊ែរនៃទម្រង់ Y = a + b 1 x 1 +…+b m x m + ε យើងបង្កើតប្រព័ន្ធនៃសមីការធម្មតា (សូមមើលខាងក្រោម)

ដើម្បីយល់ពីគោលការណ៍នៃវិធីសាស្រ្ត សូមពិចារណាករណីកត្តាពីរ។ បន្ទាប់មកយើងមានស្ថានភាពដែលបានពិពណ៌នាដោយរូបមន្ត

ពីទីនេះយើងទទួលបាន៖

ដែល σ គឺជាបំរែបំរួលនៃលក្ខណៈពិសេសដែលត្រូវគ្នាដែលឆ្លុះបញ្ចាំងនៅក្នុងលិបិក្រម។

LSM អាចអនុវត្តបានចំពោះសមីការ MP នៅលើមាត្រដ្ឋានដែលអាចកែសម្រួលបានតាមស្តង់ដារ។ ក្នុងករណីនេះយើងទទួលបានសមីការ៖

ដែល t y , t x 1 , … t xm គឺជាអថេរស្តង់ដារដែលតម្លៃមធ្យមគឺ 0; β i គឺជាមេគុណតំរែតំរង់ស្តង់ដារ ហើយគម្លាតស្តង់ដារគឺ 1 ។

សូមចំណាំថា β i ទាំងអស់ក្នុងករណីនេះត្រូវបានកំណត់ថាមានលក្ខណៈធម្មតា និងមានលក្ខណៈកណ្តាល ដូច្នេះការប្រៀបធៀបរបស់ពួកគេជាមួយគ្នាទៅវិញទៅមកត្រូវបានចាត់ទុកថាត្រឹមត្រូវ និងអាចទទួលយកបាន។ លើសពីនេះទៀតវាជាទម្លាប់ក្នុងការច្រោះកត្តាដោយបោះបង់អ្នកដែលមានតម្លៃតូចបំផុតនៃβi។

បញ្ហាដោយប្រើសមីការតំរែតំរង់លីនេអ៊ែរ

ឧបមាថាមានតារាងនៃសក្ដានុពលតម្លៃនៃផលិតផលជាក់លាក់ N ក្នុងអំឡុងពេល 8 ខែចុងក្រោយ។ វាចាំបាច់ក្នុងការធ្វើការសម្រេចចិត្តលើការណែនាំនៃការទិញបាច់របស់វាក្នុងតម្លៃ 1850 rubles / t ។

លេខខែ

ឈ្មោះខែ

តម្លៃ​ទំនិញ N

1750 rubles ក្នុងមួយតោន

1755 rubles ក្នុងមួយតោន

1767 rubles ក្នុងមួយតោន

1760 rubles ក្នុងមួយតោន

1770 rubles ក្នុងមួយតោន

1790 រូប្លិក្នុងមួយតោន

1810 rubles ក្នុងមួយតោន

1840 rubles ក្នុងមួយតោន

ដើម្បីដោះស្រាយបញ្ហានេះនៅក្នុងសៀវភៅបញ្ជី Excel អ្នកត្រូវប្រើឧបករណ៍វិភាគទិន្នន័យដែលគេស្គាល់រួចហើយពីឧទាហរណ៍ខាងលើ។ បន្ទាប់មកជ្រើសរើសផ្នែក "តំរែតំរង់" ហើយកំណត់ប៉ារ៉ាម៉ែត្រ។ វាត្រូវតែចងចាំថានៅក្នុងវាល "ចន្លោះពេលបញ្ចូល Y" ជួរតម្លៃសម្រាប់អថេរអាស្រ័យ (ក្នុងករណីនេះ តម្លៃនៃផលិតផលក្នុងខែជាក់លាក់នៃឆ្នាំ) ត្រូវតែបញ្ចូល ហើយនៅក្នុង "បញ្ចូល ចន្លោះពេល X" - សម្រាប់អថេរឯករាជ្យ (លេខខែ) ។ បញ្ជាក់សកម្មភាពដោយចុច "យល់ព្រម" ។ នៅលើសន្លឹកថ្មី (ប្រសិនបើវាត្រូវបានចង្អុលបង្ហាញដូច្នេះ) យើងទទួលបានទិន្នន័យសម្រាប់ការតំរែតំរង់។

ដោយផ្អែកលើពួកវា យើងបង្កើតសមីការលីនេអ៊ែរនៃទម្រង់ y=ax+b ដែលប៉ារ៉ាម៉ែត្រ a និង b គឺជាមេគុណនៃជួរដែលមានឈ្មោះនៃលេខខែ និងមេគុណ និងជួរ "Y-ប្រសព្វ" ពីជួរ សន្លឹកលទ្ធផលនៃការវិភាគតំរែតំរង់។ ដូច្នេះសមីការតំរែតំរង់លីនេអ៊ែរ (LE) សម្រាប់បញ្ហាទី 3 ត្រូវបានសរសេរជា៖

តម្លៃផលិតផល N = 11.714 * លេខខែ + 1727.54 ។

ឬនៅក្នុងការសម្គាល់ពិជគណិត

y = 11.714 x + 1727.54

ការវិភាគលទ្ធផល

ដើម្បីសម្រេចថាតើសមីការតំរែតំរង់លីនេអ៊ែរដែលជាលទ្ធផលគឺគ្រប់គ្រាន់ទេ មេគុណជាប់ទាក់ទងគ្នាច្រើន (MCC) និងមេគុណកំណត់ត្រូវបានប្រើ ក៏ដូចជាការធ្វើតេស្តរបស់ Fisher និងការធ្វើតេស្តរបស់សិស្ស។ នៅក្នុងតារាង Excel ជាមួយនឹងលទ្ធផលតំរែតំរង់ ពួកវាលេចឡើងក្រោមឈ្មោះពហុ R, R-square, F-statistic និង t-statistic រៀងគ្នា។

KMC R ធ្វើឱ្យវាអាចធ្វើទៅបានដើម្បីវាយតម្លៃភាពតឹងនៃទំនាក់ទំនងប្រូបាប៊ីលីតេរវាងអថេរឯករាជ្យ និងអថេរ។ តម្លៃខ្ពស់របស់វាបង្ហាញពីទំនាក់ទំនងដ៏រឹងមាំដោយស្មើភាពរវាងអថេរ "ចំនួននៃខែ" និង "តម្លៃទំនិញ N គិតជារូប្លិតក្នុង 1 តោន" ។ ទោះ​ជា​យ៉ាង​ណា លក្ខណៈ​នៃ​ទំនាក់​ទំនង​នេះ​នៅ​មិន​ទាន់​ដឹង​នៅ​ឡើយ​ទេ។

ការេនៃមេគុណនៃការកំណត់ R 2 (RI) គឺជាលក្ខណៈលេខនៃចំណែកនៃការបែកខ្ចាត់ខ្ចាយសរុប ហើយបង្ហាញពីការខ្ចាត់ខ្ចាយនៃផ្នែកណាមួយនៃទិន្នន័យពិសោធន៍ ពោលគឺឧ។ តម្លៃ​នៃ​អថេរ​អាស្រ័យ​ត្រូវ​គ្នា​នឹង​សមីការ​តំរែតំរង់​លីនេអ៊ែរ។ នៅក្នុងបញ្ហាដែលកំពុងពិចារណា តម្លៃនេះគឺស្មើនឹង 84.8% ពោលគឺទិន្នន័យស្ថិតិត្រូវបានពិពណ៌នាជាមួយនឹងកម្រិតខ្ពស់នៃភាពត្រឹមត្រូវដោយ SD ដែលទទួលបាន។

ស្ថិតិ F ដែលត្រូវបានគេហៅថាការធ្វើតេស្តរបស់ Fisher ត្រូវបានគេប្រើដើម្បីវាយតម្លៃពីសារៈសំខាន់នៃទំនាក់ទំនងលីនេអ៊ែរ ដោយបដិសេធ ឬបញ្ជាក់ពីសម្មតិកម្មនៃអត្ថិភាពរបស់វា។

(លក្ខណៈវិនិច្ឆ័យរបស់សិស្ស) ជួយវាយតម្លៃសារៈសំខាន់នៃមេគុណជាមួយនឹងពាក្យមិនស្គាល់ ឬឥតគិតថ្លៃនៃទំនាក់ទំនងលីនេអ៊ែរ។ ប្រសិនបើតម្លៃនៃ t-criterion > t cr នោះសម្មតិកម្មនៃភាពមិនសំខាន់នៃពាក្យសេរីនៃសមីការលីនេអ៊ែរត្រូវបានច្រានចោល។

នៅក្នុងបញ្ហាដែលកំពុងពិចារណាសម្រាប់សមាជិកឥតគិតថ្លៃ ដោយប្រើឧបករណ៍ Excel វាត្រូវបានគេទទួលបានថា t = 169.20903 និង p = 2.89E-12 ពោលគឺ យើងមានប្រូបាប៊ីលីតេសូន្យដែលសម្មតិកម្មត្រឹមត្រូវអំពីភាពមិនសំខាន់នៃសមាជិកឥតគិតថ្លៃនឹង ត្រូវ​បាន​បដិសេធ។ សម្រាប់មេគុណនៅមិនស្គាល់ t=5.79405 និង p=0.001158។ ម៉្យាងទៀតប្រូបាប៊ីលីតេដែលសម្មតិកម្មត្រឹមត្រូវអំពីភាពមិនសំខាន់នៃមេគុណសម្រាប់មិនស្គាល់នឹងត្រូវបានច្រានចោលគឺ 0.12% ។

ដូច្នេះ វាអាចត្រូវបានអះអាងថាសមីការតំរែតំរង់លីនេអ៊ែរលទ្ធផលគឺគ្រប់គ្រាន់។

បញ្ហានៃភាពរហ័សរហួននៃការទិញភាគហ៊ុន

ការតំរែតំរង់ច្រើននៅក្នុង Excel ត្រូវបានអនុវត្តដោយប្រើឧបករណ៍វិភាគទិន្នន័យដូចគ្នា។ ពិចារណាបញ្ហាដែលបានអនុវត្តជាក់លាក់។

ការគ្រប់គ្រងរបស់ NNN ត្រូវតែធ្វើការសម្រេចចិត្តលើការណែនាំអំពីការទិញភាគហ៊ុន 20% នៅក្នុង MMM SA ។ តម្លៃនៃកញ្ចប់ (JV) គឺ 70 លានដុល្លារអាមេរិក។ អ្នកឯកទេស NNN បានប្រមូលទិន្នន័យអំពីប្រតិបត្តិការស្រដៀងគ្នា។ វាត្រូវបានសម្រេចចិត្តដើម្បីវាយតម្លៃតម្លៃនៃប្លុកនៃភាគហ៊ុននេះបើយោងតាមប៉ារ៉ាម៉ែត្របែបនេះដែលបានបង្ហាញជារាប់លានដុល្លារសហរដ្ឋអាមេរិកដូចជា:

  • គណនីដែលត្រូវបង់ (VK);
  • ចំណូលប្រចាំឆ្នាំ (VO);
  • គណនីទទួល (VD);
  • តម្លៃនៃទ្រព្យសកម្មថេរ (SOF) ។

លើសពីនេះ ប៉ារ៉ាម៉ែត​ដែល​ជាប់​ក្នុង​បញ្ជី​បើក​ប្រាក់​បៀវត្សរ៍​របស់​សហគ្រាស (V3 P) រាប់​ពាន់​ដុល្លារ​អាមេរិក​ត្រូវ​បាន​ប្រើ។

ដំណោះស្រាយដោយប្រើសៀវភៅបញ្ជី Excel

ដំបូងអ្នកត្រូវបង្កើតតារាងទិន្នន័យដំបូង។ វាមើលទៅដូចនេះ៖

  • ហៅបង្អួច "ការវិភាគទិន្នន័យ";
  • ជ្រើសរើសផ្នែក "តំរែតំរង់";
  • នៅក្នុងប្រអប់ "ចន្លោះពេលបញ្ចូល Y" បញ្ចូលជួរតម្លៃនៃអថេរអាស្រ័យពីជួរ G;
  • ចុចលើរូបតំណាងដែលមានព្រួញក្រហមនៅខាងស្តាំនៃបង្អួច "ចន្លោះពេលបញ្ចូល X" ហើយជ្រើសរើសជួរនៃតម្លៃទាំងអស់ពីជួរ B, C, D, F នៅលើសន្លឹក។

ជ្រើសរើស "សន្លឹកកិច្ចការថ្មី" ហើយចុច "យល់ព្រម" ។

ទទួលបានការវិភាគតំរែតំរង់សម្រាប់បញ្ហាដែលបានផ្តល់ឱ្យ។

ការពិនិត្យលទ្ធផល និងការសន្និដ្ឋាន

"យើងប្រមូល" ពីទិន្នន័យមូលដែលបានបង្ហាញខាងលើនៅលើសន្លឹកសៀវភៅបញ្ជី Excel សមីការតំរែតំរង់៖

SP \u003d 0.103 * SOF + 0.541 * VO - 0.031 * VK + 0.405 * VD + 0.691 * VZP - 265.844 ។

នៅក្នុងទម្រង់គណិតវិទ្យាដែលធ្លាប់ស្គាល់ វាអាចត្រូវបានសរសេរជា៖

y = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

ទិន្នន័យសម្រាប់ JSC "MMM" ត្រូវបានបង្ហាញក្នុងតារាង៖

ការជំនួសពួកវាទៅក្នុងសមីការតំរែតំរង់ ពួកគេទទួលបានតួលេខចំនួន 64.72 លានដុល្លារអាមេរិក។ នេះមានន័យថាភាគហ៊ុនរបស់ JSC MMM មិនគួរត្រូវបានទិញទេ ចាប់តាំងពីតម្លៃរបស់ពួកគេចំនួន 70 លានដុល្លារគឺហួសប្រមាណ។

ដូចដែលអ្នកអាចមើលឃើញ ការប្រើប្រាស់សៀវភៅបញ្ជី Excel និងសមីការតំរែតំរង់បានធ្វើឱ្យវាអាចធ្វើទៅបានដើម្បីធ្វើការសម្រេចចិត្តប្រកបដោយការយល់ដឹងទាក់ទងនឹងលទ្ធភាពនៃប្រតិបត្តិការជាក់លាក់មួយ។

ឥឡូវនេះអ្នកដឹងពីអ្វីដែលតំរែតំរង់។ ឧទាហរណ៍នៅក្នុង Excel ដែលបានពិភាក្សាខាងលើនឹងជួយអ្នកដោះស្រាយបញ្ហាជាក់ស្តែងពីវិស័យសេដ្ឋកិច្ច។