ការវិភាគតំរែតំរង់និងទំនាក់ទំនង - វិធីសាស្រ្តស្រាវជ្រាវស្ថិតិ។ ទាំងនេះគឺជាវិធីសាមញ្ញបំផុតដើម្បីបង្ហាញពីភាពអាស្រ័យនៃប៉ារ៉ាម៉ែត្រលើអថេរឯករាជ្យមួយ ឬច្រើន។
ខាងក្រោមនេះ ដោយប្រើឧទាហរណ៍ជាក់ស្តែង យើងនឹងពិចារណាការវិភាគទាំងពីរនេះ ដែលមានប្រជាប្រិយភាពខ្លាំងក្នុងចំណោមអ្នកសេដ្ឋកិច្ច។ យើងក៏នឹងផ្តល់ឧទាហរណ៍នៃការទទួលបានលទ្ធផលនៅពេលដែលពួកគេត្រូវបានបញ្ចូលគ្នា។
ការវិភាគតំរែតំរង់ក្នុង Excel
បង្ហាញឥទ្ធិពលនៃតម្លៃមួយចំនួន (ឯករាជ្យ ឯករាជ្យ) លើអថេរអាស្រ័យ។ ជាឧទាហរណ៍ របៀបដែលចំនួនប្រជាជនសកម្មសេដ្ឋកិច្ចអាស្រ័យលើចំនួនសហគ្រាស ប្រាក់ឈ្នួល និងប៉ារ៉ាម៉ែត្រផ្សេងទៀត។ ឬ៖ តើការវិនិយោគបរទេស តម្លៃថាមពល... ប៉ះពាល់ដល់កម្រិត GDP យ៉ាងដូចម្តេច?
លទ្ធផលនៃការវិភាគអនុញ្ញាតឱ្យអ្នកកំណត់អាទិភាព។ ហើយផ្អែកលើកត្តាសំខាន់ៗ ដើម្បីទស្សន៍ទាយ រៀបចំផែនការអភិវឌ្ឍន៍តំបន់អាទិភាព ធ្វើការសម្រេចចិត្តគ្រប់គ្រង។
ការតំរែតំរង់កើតឡើង៖
- លីនេអ៊ែរ (y = a + bx);
- parabolic (y = a + bx + cx 2);
- អិចស្ប៉ូណង់ស្យែល (y = a * exp(bx));
- ថាមពល (y = a*x^b);
- អ៊ីពែរបូល (y = b/x + a);
- លោការីត (y = b * 1n(x) + a);
- អិចស្ប៉ូណង់ស្យែល (y = a * b^x) ។
ពិចារណាឧទាហរណ៍នៃការកសាងគំរូតំរែតំរង់នៅក្នុង Excel និងបកស្រាយលទ្ធផល។ ចូរយើងយកប្រភេទនៃតំរែតំរង់លីនេអ៊ែរ។
កិច្ចការ។ នៅសហគ្រាសចំនួន 6 ប្រាក់ខែជាមធ្យមប្រចាំខែ និងចំនួនបុគ្គលិកដែលបានចាកចេញត្រូវបានវិភាគ។ វាចាំបាច់ដើម្បីកំណត់ភាពអាស្រ័យនៃចំនួននិយោជិតចូលនិវត្តន៍លើប្រាក់ខែជាមធ្យម។
គំរូតំរែតំរង់លីនេអ៊ែរមានទម្រង់ដូចខាងក្រោមៈ
Y \u003d a 0 + a 1 x 1 + ... + a k x k ។
ដែល a ជាមេគុណតំរែតំរង់នោះ x គឺជាអថេរដែលមានឥទ្ធិពល ហើយ k គឺជាចំនួនកត្តា។
ក្នុងឧទាហរណ៍របស់យើង Y គឺជាសូចនាករនៃការឈប់ធ្វើការរបស់កម្មករ។ កត្តាដែលមានឥទ្ធិពលគឺប្រាក់ឈ្នួល (x) ។
Excel មានមុខងារភ្ជាប់មកជាមួយដែលអាចត្រូវបានប្រើដើម្បីគណនាប៉ារ៉ាម៉ែត្រនៃគំរូតំរែតំរង់លីនេអ៊ែរ។ ប៉ុន្តែ Analysis ToolPak add-in នឹងធ្វើវាលឿនជាងមុន។
បើកដំណើរការឧបករណ៍វិភាគដ៏មានឥទ្ធិពល៖
នៅពេលដែលបានធ្វើឱ្យសកម្ម កម្មវិធីបន្ថែមនឹងមាននៅក្រោមផ្ទាំងទិន្នន័យ។
ឥឡូវនេះយើងនឹងដោះស្រាយដោយផ្ទាល់ជាមួយនឹងការវិភាគតំរែតំរង់។
ដំបូងយើងយកចិត្តទុកដាក់លើ R-square និងមេគុណ។
R-square គឺជាមេគុណនៃការកំណត់។ ក្នុងឧទាហរណ៍របស់យើងវាគឺ 0.755 ឬ 75.5% ។ នេះមានន័យថាប៉ារ៉ាម៉ែត្រគណនានៃគំរូពន្យល់ពីទំនាក់ទំនងរវាងប៉ារ៉ាម៉ែត្រដែលបានសិក្សាដោយ 75.5% ។ មេគុណនៃការកំណត់កាន់តែខ្ពស់ គំរូកាន់តែល្អ។ ល្អ - លើសពី 0.8 ។ ខ្សោយ - តិចជាង 0.5 (ការវិភាគបែបនេះមិនអាចចាត់ទុកថាសមហេតុផលទេ) ។ នៅក្នុងឧទាហរណ៍របស់យើង - "មិនអាក្រក់" ។
មេគុណ 64.1428 បង្ហាញថា Y នឹងទៅជាយ៉ាងណា ប្រសិនបើអថេរទាំងអស់នៅក្នុងគំរូដែលកំពុងពិចារណាគឺស្មើនឹង 0។ នោះគឺជាកត្តាផ្សេងទៀតដែលមិនត្រូវបានពិពណ៌នានៅក្នុងគំរូក៏ប៉ះពាល់ដល់តម្លៃនៃប៉ារ៉ាម៉ែត្រដែលបានវិភាគផងដែរ។
មេគុណ -0.16285 បង្ហាញពីទម្ងន់នៃអថេរ X នៅលើ Y. នោះគឺ ប្រាក់ខែជាមធ្យមប្រចាំខែនៅក្នុងគំរូនេះប៉ះពាល់ដល់ចំនួនអ្នកឈប់ដែលមានទម្ងន់ -0.16285 (នេះគឺជាកម្រិតតូចមួយនៃឥទ្ធិពល)។ សញ្ញា “-” បង្ហាញពីផលប៉ះពាល់អវិជ្ជមាន៖ ប្រាក់ខែកាន់តែខ្ពស់ ការឈប់សម្រាកតិច។ ដែលយុត្តិធម៌។
ការវិភាគទំនាក់ទំនងក្នុង Excel
ការវិភាគទំនាក់ទំនងជួយបង្កើតថាតើមានទំនាក់ទំនងរវាងសូចនាករនៅក្នុងគំរូមួយ ឬពីរ។ ឧទាហរណ៍រវាងពេលវេលាប្រតិបត្តិការរបស់ម៉ាស៊ីននិងតម្លៃនៃការជួសជុលតម្លៃឧបករណ៍និងរយៈពេលនៃប្រតិបត្តិការកម្ពស់និងទម្ងន់របស់កុមារជាដើម។
ប្រសិនបើមានទំនាក់ទំនងនោះថាតើការកើនឡើងនៅក្នុងប៉ារ៉ាម៉ែត្រមួយនាំឱ្យមានការកើនឡើង (ទំនាក់ទំនងវិជ្ជមាន) ឬការថយចុះ (អវិជ្ជមាន) នៅក្នុងផ្សេងទៀត។ ការវិភាគទំនាក់ទំនងជួយអ្នកវិភាគកំណត់ថាតើតម្លៃនៃសូចនាករមួយអាចត្រូវបានប្រើដើម្បីទស្សន៍ទាយតម្លៃដែលអាចមានរបស់មួយផ្សេងទៀត។
មេគុណទំនាក់ទំនងត្រូវបានតំណាង r ។ ប្រែប្រួលពី +1 ដល់ -1 ។ ការចាត់ថ្នាក់នៃទំនាក់ទំនងសម្រាប់តំបន់ផ្សេងៗគ្នានឹងខុសគ្នា។ នៅពេលតម្លៃមេគុណគឺ 0 វាមិនមានទំនាក់ទំនងលីនេអ៊ែររវាងគំរូទេ។
ពិចារណាពីរបៀបប្រើ Excel ដើម្បីស្វែងរកមេគុណទំនាក់ទំនង។
អនុគមន៍ CORREL ត្រូវបានប្រើដើម្បីស្វែងរកមេគុណដែលបានផ្គូផ្គង។
កិច្ចការ៖ កំណត់ថាតើមានទំនាក់ទំនងរវាងពេលវេលាប្រតិបត្តិការរបស់ម៉ាស៊ីនកំដៅ និងតម្លៃនៃការថែទាំរបស់វា។
ដាក់ទស្សន៍ទ្រនិចក្នុងក្រឡាណាមួយ ហើយចុចប៊ូតុង fx ។
- នៅក្នុងប្រភេទ "ស្ថិតិ" ជ្រើសរើសមុខងារ CORREL ។
- អាគុយម៉ង់ "អារេ 1" - ជួរដំបូងនៃតម្លៃ - ពេលវេលារបស់ម៉ាស៊ីន: A2: A14 ។
- អាគុយម៉ង់ "អារេ 2" - ជួរទីពីរនៃតម្លៃ - តម្លៃនៃការជួសជុល: B2: B14 ។ ចុចយល់ព្រម។
ដើម្បីកំណត់ប្រភេទនៃការតភ្ជាប់អ្នកត្រូវមើលចំនួនដាច់ខាតនៃមេគុណ (វាលនៃសកម្មភាពនីមួយៗមានមាត្រដ្ឋានផ្ទាល់ខ្លួនរបស់វា) ។
សម្រាប់ការវិភាគទំនាក់ទំនងនៃប៉ារ៉ាម៉ែត្រជាច្រើន (ច្រើនជាង 2) វាកាន់តែងាយស្រួលប្រើ "ការវិភាគទិន្នន័យ" (កម្មវិធីបន្ថែម "កញ្ចប់វិភាគ") ។ នៅក្នុងបញ្ជី អ្នកត្រូវជ្រើសរើសការជាប់ទាក់ទងគ្នា និងកំណត់អារេមួយ។ ទាំងអស់។
មេគុណលទ្ធផលនឹងត្រូវបានបង្ហាញនៅក្នុងម៉ាទ្រីសទំនាក់ទំនង។ ចូលចិត្តមួយនេះ:
ការវិភាគទំនាក់ទំនង - តំរែតំរង់
នៅក្នុងការអនុវត្ត បច្ចេកទេសទាំងពីរនេះច្រើនតែប្រើជាមួយគ្នា។
ឧទាហរណ៍៖
ឥឡូវនេះទិន្នន័យការវិភាគតំរែតំរង់អាចមើលឃើញ។
នៅក្នុងគំរូស្ថិតិ ការវិភាគតំរែតំរង់គឺជាការសិក្សាដែលប្រើដើម្បីវាយតម្លៃទំនាក់ទំនងរវាងអថេរ។ វិធីសាស្រ្តគណិតវិទ្យានេះរួមបញ្ចូលវិធីសាស្រ្តផ្សេងទៀតជាច្រើនសម្រាប់ការធ្វើគំរូ និងការវិភាគអថេរច្រើននៅពេលដែលផ្តោតទៅលើទំនាក់ទំនងរវាងអថេរអាស្រ័យ និងអថេរឯករាជ្យមួយឬច្រើន។ ពិសេសជាងនេះទៅទៀត ការវិភាគតំរែតំរង់ជួយអ្នកឱ្យយល់ពីរបៀបដែលតម្លៃធម្មតានៃការផ្លាស់ប្តូរអថេរអាស្រ័យ ប្រសិនបើអថេរឯករាជ្យមួយផ្លាស់ប្តូរ ខណៈពេលដែលអថេរឯករាជ្យផ្សេងទៀតនៅតែថេរ។
ក្នុងគ្រប់ករណីទាំងអស់ ពិន្ទុគោលដៅគឺជាមុខងារនៃអថេរឯករាជ្យ ហើយត្រូវបានគេហៅថាមុខងារតំរែតំរង់។ នៅក្នុងការវិភាគតំរែតំរង់ វាក៏មានការចាប់អារម្មណ៍ផងដែរក្នុងការកំណត់លក្ខណៈនៃការផ្លាស់ប្តូរនៅក្នុងអថេរអាស្រ័យជាមុខងារនៃតំរែតំរង់ ដែលអាចត្រូវបានពិពណ៌នាដោយប្រើការចែកចាយប្រូបាប៊ីលីតេ។
ភារកិច្ចនៃការវិភាគតំរែតំរង់
វិធីសាស្រ្តស្រាវជ្រាវស្ថិតិនេះត្រូវបានគេប្រើយ៉ាងទូលំទូលាយសម្រាប់ការព្យាករណ៍ ដែលការប្រើប្រាស់របស់វាមានអត្ថប្រយោជន៍យ៉ាងសំខាន់ ប៉ុន្តែជួនកាលវាអាចនាំឱ្យមានការបំភាន់ ឬទំនាក់ទំនងមិនពិត ដូច្នេះវាត្រូវបានណែនាំឱ្យប្រើវាដោយប្រុងប្រយ័ត្នក្នុងសំណួរនេះ ព្រោះឧទាហរណ៍ ការជាប់ទាក់ទងគ្នាមិនមានន័យថា បុព្វហេតុ។
វិធីសាស្រ្តមួយចំនួនធំត្រូវបានបង្កើតឡើងសម្រាប់អនុវត្តការវិភាគតំរែតំរង់ ដូចជាលីនេអ៊ែរ និងតំរែតំរង់ការ៉េតិចបំផុតដែលជាប៉ារ៉ាម៉ែត្រ។ ខ្លឹមសាររបស់ពួកគេគឺថាមុខងារតំរែតំរង់ត្រូវបានកំណត់ក្នុងលក្ខខណ្ឌនៃចំនួនកំណត់នៃប៉ារ៉ាម៉ែត្រដែលមិនស្គាល់ដែលត្រូវបានប៉ាន់ស្មានពីទិន្នន័យ។ ការតំរែតំរង់ nonparametric អនុញ្ញាតឱ្យមុខងាររបស់វាស្ថិតនៅក្នុងសំណុំមុខងារជាក់លាក់ ដែលអាចមានលក្ខណៈគ្មានកំណត់។
ជាវិធីសាស្រ្តស្រាវជ្រាវស្ថិតិ ការវិភាគតំរែតំរង់ក្នុងការអនុវត្តគឺអាស្រ័យលើទម្រង់នៃដំណើរការបង្កើតទិន្នន័យ និងរបៀបដែលវាទាក់ទងនឹងវិធីសាស្រ្តតំរែតំរង់។ ដោយសារទម្រង់ពិតនៃដំណើរការទិន្នន័យដែលបង្កើតជាធម្មតាជាលេខដែលមិនស្គាល់ ការវិភាគតំរែតំរង់ទិន្នន័យជារឿយៗអាស្រ័យលើវិសាលភាពមួយចំនួនលើការសន្មត់អំពីដំណើរការនេះ។ ការសន្មត់ទាំងនេះជួនកាលអាចសាកល្បងបានប្រសិនបើមានទិន្នន័យគ្រប់គ្រាន់។ គំរូតំរែតំរង់ច្រើនតែមានប្រយោជន៍ ទោះបីជាការសន្មត់ត្រូវបានបំពានកម្រិតមធ្យមក៏ដោយ ទោះបីពួកវាអាចមិនដំណើរការល្អបំផុតក៏ដោយ។
ក្នុងន័យតូចចង្អៀត ការតំរែតំរង់អាចសំដៅជាពិសេសទៅលើការប៉ាន់ប្រមាណនៃអថេរឆ្លើយតបជាបន្ត ផ្ទុយពីអថេរឆ្លើយតបដាច់ដោយឡែកដែលប្រើក្នុងចំណាត់ថ្នាក់។ ករណីនៃអថេរទិន្នផលបន្តត្រូវបានគេហៅថា តំរែតំរង់ម៉ែត្រ ដើម្បីសម្គាល់វាពីបញ្ហាពាក់ព័ន្ធ។
រឿង
ទម្រង់ដំបូងនៃការតំរែតំរង់គឺជាវិធីសាស្ត្រដែលគេស្គាល់យ៉ាងច្បាស់នៃការ៉េតិចបំផុត។ វាត្រូវបានបោះពុម្ពដោយ Legendre ក្នុងឆ្នាំ 1805 និងដោយ Gauss ក្នុងឆ្នាំ 1809 ។ Legendre និង Gauss បានអនុវត្តវិធីសាស្រ្តចំពោះបញ្ហានៃការកំណត់ពីការសង្កេតតារាសាស្ត្រនៃគន្លងនៃសាកសពជុំវិញព្រះអាទិត្យ (ភាគច្រើនជាផ្កាយដុះកន្ទុយ ប៉ុន្តែក្រោយមកក៏បានរកឃើញភពតូចៗផងដែរ) ។ Gauss បានបោះពុម្ភការវិវឌ្ឍន៍បន្ថែមនៃទ្រឹស្តីនៃការ៉េតិចបំផុតនៅឆ្នាំ 1821 រួមទាំងការប្រែប្រួលនៃទ្រឹស្តីបទ Gauss-Markov ។
ពាក្យ "តំរែតំរង់" ត្រូវបានបង្កើតឡើងដោយ Francis Galton ក្នុងសតវត្សទី 19 ដើម្បីពិពណ៌នាអំពីបាតុភូតជីវសាស្រ្ត។ ចំណុចសំខាន់គឺថាការលូតលាស់នៃកូនចៅពីការលូតលាស់របស់ដូនតាជាក្បួនថយចុះទៅមធ្យមធម្មតា។ សម្រាប់ Galton ការតំរែតំរង់មានតែអត្ថន័យជីវសាស្រ្តនេះប៉ុណ្ណោះ ប៉ុន្តែក្រោយមកការងាររបស់គាត់ត្រូវបានយកដោយ Udni Yoley និង Karl Pearson ហើយយកទៅក្នុងបរិបទស្ថិតិទូទៅបន្ថែមទៀត។ នៅក្នុងការងាររបស់ Yule និង Pearson ការចែកចាយរួមគ្នានៃការឆ្លើយតប និងអថេរពន្យល់ត្រូវបានចាត់ទុកថាជា Gaussian ។ ការសន្មត់នេះត្រូវបានបដិសេធដោយ Fischer នៅក្នុងឯកសារឆ្នាំ 1922 និង 1925 ។ Fisher បានស្នើថាការចែកចាយតាមលក្ខខណ្ឌនៃអថេរឆ្លើយតបគឺ Gaussian ប៉ុន្តែការចែកចាយរួមគ្នាមិនចាំបាច់ទេ។ ក្នុងន័យនេះ សំណូមពររបស់ Fisher គឺកាន់តែខិតជិតទៅនឹងរូបមន្តឆ្នាំ 1821 របស់ Gauss ។ មុនឆ្នាំ 1970 ពេលខ្លះវាត្រូវចំណាយពេល 24 ម៉ោងដើម្បីទទួលបានលទ្ធផលនៃការវិភាគតំរែតំរង់។
វិធីសាស្រ្តនៃការវិភាគតំរែតំរង់បន្តជាតំបន់នៃការស្រាវជ្រាវសកម្ម។ ក្នុងប៉ុន្មានទសវត្សរ៍ថ្មីៗនេះ វិធីសាស្រ្តថ្មីត្រូវបានបង្កើតឡើងសម្រាប់ការតំរែតំរង់ដ៏រឹងមាំ។ ការតំរែតំរង់ដែលទាក់ទងនឹងការឆ្លើយតបដែលទាក់ទងគ្នា; វិធីសាស្រ្តតំរែតំរង់ដែលសម្របសម្រួលប្រភេទផ្សេងៗនៃទិន្នន័យដែលបាត់; តំរែតំរង់ nonparametric; វិធីសាស្រ្តតំរែតំរង់ Bayesian; តំរែតំរង់ដែលអថេរទស្សន៍ទាយត្រូវបានវាស់ដោយមានកំហុស; ការតំរែតំរង់ជាមួយនឹងការទស្សន៍ទាយច្រើនជាងការសង្កេត និងការសន្និដ្ឋានមូលហេតុជាមួយនឹងការតំរែតំរង់។
ម៉ូដែលតំរែតំរង់
គំរូការវិភាគតំរែតំរង់រួមមានអថេរដូចខាងក្រោមៈ
- ប៉ារ៉ាម៉ែត្រមិនស្គាល់ តំណាងថាជាបេតា ដែលអាចជាមាត្រដ្ឋាន ឬវ៉ិចទ័រ។
- អថេរឯករាជ្យ, X.
- អថេរអាស្រ័យ, Y.
នៅក្នុងផ្នែកផ្សេងៗនៃវិទ្យាសាស្ត្រដែលការវិភាគតំរែតំរង់ត្រូវបានអនុវត្ត ពាក្យផ្សេងគ្នាត្រូវបានប្រើជំនួសឱ្យអថេរអាស្រ័យ និងឯករាជ្យ ប៉ុន្តែក្នុងគ្រប់ករណីទាំងអស់ គំរូតំរែតំរង់ទាក់ទងនឹង Y ទៅមុខងារនៃ X និង β។
ការប៉ាន់ស្មានជាធម្មតាត្រូវបានបង្កើតជា E (Y | X) = F (X, β) ។ ដើម្បីអនុវត្តការវិភាគតំរែតំរង់ ទម្រង់នៃអនុគមន៍ f ត្រូវតែកំណត់។ កម្រជាងនេះទៅទៀត វាគឺផ្អែកលើចំណេះដឹងអំពីទំនាក់ទំនងរវាង Y និង X ដែលមិនពឹងផ្អែកលើទិន្នន័យ។ ប្រសិនបើចំណេះដឹងបែបនេះមិនមានទេ នោះទម្រង់ F ដែលអាចបត់បែនបាន ឬងាយស្រួលត្រូវបានជ្រើសរើស។
អថេរអាស្រ័យ Y
ឥឡូវនេះ ចូរយើងសន្មតថាវ៉ិចទ័រនៃប៉ារ៉ាម៉ែត្រមិនស្គាល់ β មានប្រវែង k ។ ដើម្បីអនុវត្តការវិភាគតំរែតំរង់ អ្នកប្រើប្រាស់ត្រូវតែផ្តល់ព័ត៌មានអំពីអថេរអាស្រ័យ Y៖
- ប្រសិនបើចំណុចទិន្នន័យ N នៃទម្រង់ (Y, X) ត្រូវបានអង្កេត ដែលជាកន្លែងដែល N< k, большинство классических подходов к регрессионному анализу не могут быть выполнены, так как система уравнений, определяющих модель регрессии в качестве недоопределенной, не имеет достаточного количества данных, чтобы восстановить β.
- ប្រសិនបើ N = K ត្រូវបានគេសង្កេតឃើញ ហើយមុខងារ F គឺលីនេអ៊ែរ នោះសមីការ Y = F(X, β) អាចត្រូវបានដោះស្រាយយ៉ាងពិតប្រាកដ មិនមែនប្រមាណទេ។ នេះធ្វើឱ្យមានការដោះស្រាយសំណុំនៃសមីការ N ជាមួយ N-unknowns (ធាតុនៃ β) ដែលមានដំណោះស្រាយតែមួយគត់ ដរាបណា X គឺឯករាជ្យលីនេអ៊ែរ។ ប្រសិនបើ F មិនមែនជាលីនេអ៊ែរ ដំណោះស្រាយប្រហែលជាមិនមានទេ ឬអាចមានដំណោះស្រាយជាច្រើន។
- ស្ថានភាពទូទៅបំផុតគឺកន្លែងដែលមាន N > ចង្អុលទៅទិន្នន័យ។ ក្នុងករណីនេះ មានព័ត៌មានគ្រប់គ្រាន់នៅក្នុងទិន្នន័យដើម្បីប៉ាន់ប្រមាណតម្លៃតែមួយគត់សម្រាប់ β ដែលសមបំផុតនឹងទិន្នន័យ ហើយគំរូតំរែតំរង់នៅពេលអនុវត្តចំពោះទិន្នន័យអាចត្រូវបានគេមើលឃើញថាជាប្រព័ន្ធបដិសេធក្នុង β ។
ក្នុងករណីចុងក្រោយ ការវិភាគតំរែតំរង់ផ្តល់ឧបករណ៍សម្រាប់៖
- ការស្វែងរកដំណោះស្រាយសម្រាប់ប៉ារ៉ាម៉ែត្រដែលមិនស្គាល់ β ដែលនឹងជាឧទាហរណ៍ កាត់បន្ថយចម្ងាយរវាងតម្លៃដែលបានវាស់ និងព្យាករណ៍នៃ Y ។
- នៅក្រោមការសន្មត់ស្ថិតិជាក់លាក់ ការវិភាគតំរែតំរង់ប្រើប្រាស់ព័ត៌មានលើសដើម្បីផ្តល់ព័ត៌មានស្ថិតិអំពីប៉ារ៉ាម៉ែត្រមិនស្គាល់ β និងតម្លៃព្យាករណ៍នៃអថេរអាស្រ័យ Y ។
ចំនួនដែលត្រូវការនៃការវាស់វែងឯករាជ្យ
ពិចារណាគំរូតំរែតំរង់ដែលមានប៉ារ៉ាម៉ែត្រមិនស្គាល់ចំនួនបី៖ β 0 β 1 និង β 2 ។ ចូរសន្មត់ថាអ្នកពិសោធន៍បង្កើតការវាស់វែងចំនួន 10 ក្នុងតម្លៃដូចគ្នានៃអថេរឯករាជ្យនៃវ៉ិចទ័រ X. ក្នុងករណីនេះ ការវិភាគតំរែតំរង់មិនផ្តល់សំណុំនៃតម្លៃតែមួយគត់ទេ។ ល្អបំផុតដែលអ្នកអាចធ្វើបានគឺការប៉ាន់ប្រមាណមធ្យម និងគម្លាតស្តង់ដារនៃអថេរអាស្រ័យ Y. ដូចគ្នានេះដែរ ដោយការវាស់តម្លៃពីរផ្សេងគ្នានៃ X អ្នកអាចទទួលបានទិន្នន័យគ្រប់គ្រាន់សម្រាប់ការតំរែតំរង់ជាមួយនឹងចំនួនមិនស្គាល់ពីរ ប៉ុន្តែមិនមែនសម្រាប់ចំនួនមិនស្គាល់បី ឬច្រើននោះទេ។ .
ប្រសិនបើការវាស់វែងរបស់អ្នកពិសោធន៍ត្រូវបានគេយកនៅតម្លៃបីផ្សេងគ្នានៃអថេរវ៉ិចទ័រឯករាជ្យ X នោះការវិភាគតំរែតំរង់នឹងផ្តល់នូវសំណុំនៃការប៉ាន់ប្រមាណតែមួយគត់សម្រាប់ប៉ារ៉ាម៉ែត្រមិនស្គាល់ចំនួនបីនៅក្នុងβ។
នៅក្នុងករណីនៃការតំរែតំរង់លីនេអ៊ែរទូទៅ សេចក្តីថ្លែងការណ៍ខាងលើគឺស្មើនឹងតម្រូវការដែលម៉ាទ្រីស X T X បញ្ច្រាស់។
ការសន្មត់ស្ថិតិ
នៅពេលដែលចំនួនរង្វាស់ N ធំជាងចំនួនប៉ារ៉ាម៉ែត្រដែលមិនស្គាល់ k និងកំហុសរង្វាស់ ε i បន្ទាប់មកជាក្បួនព័ត៌មានលើសដែលមាននៅក្នុងការវាស់វែងត្រូវបានចែកចាយ និងប្រើប្រាស់សម្រាប់ការព្យាករណ៍ស្ថិតិទាក់ទងនឹងប៉ារ៉ាម៉ែត្រមិនស្គាល់។ ពត៌មានលើសនេះត្រូវបានគេហៅថាកម្រិតនៃសេរីភាពនៃការតំរែតំរង់។
ការសន្មត់មូលដ្ឋាន
ការសន្មត់បុរាណសម្រាប់ការវិភាគតំរែតំរង់រួមមាន:
- គំរូគឺជាតំណាងនៃការទស្សន៍ទាយការសន្និដ្ឋាន។
- កំហុសគឺជាអថេរចៃដន្យដែលមានតម្លៃមធ្យមសូន្យ ដែលមានលក្ខខណ្ឌលើអថេរពន្យល់។
- អថេរឯករាជ្យត្រូវបានវាស់វែងដោយគ្មានកំហុស។
- ក្នុងនាមជាអថេរឯករាជ្យ (អ្នកទស្សន៍ទាយ) ពួកវាមានភាពឯករាជ្យលីនេអ៊ែរ ពោលគឺវាមិនអាចបង្ហាញការព្យាករណ៍ណាមួយជាបន្សំលីនេអ៊ែររបស់អ្នកដទៃបានទេ។
- កំហុសមិនជាប់ទាក់ទងគ្នាទេ នោះគឺជាម៉ាទ្រីស error coariance matrix នៃអង្កត់ទ្រូង ហើយធាតុមិនសូន្យនីមួយៗគឺជាភាពខុសគ្នានៃកំហុស។
- ភាពខុសគ្នានៃកំហុសគឺថេរឆ្លងកាត់ការសង្កេត (ភាពដូចគ្នា) ។ បើមិនដូច្នោះទេ ការ៉េដែលមានទម្ងន់តិចបំផុត ឬវិធីផ្សេងទៀតអាចត្រូវបានប្រើ។
លក្ខខណ្ឌគ្រប់គ្រាន់ទាំងនេះសម្រាប់ការប៉ាន់ប្រមាណការេតិចបំផុតមានលក្ខណៈសម្បត្តិដែលត្រូវការ ជាពិសេសការសន្មត់ទាំងនេះមានន័យថាការប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រនឹងមានគោលបំណង ស៊ីសង្វាក់គ្នា និងមានប្រសិទ្ធភាព ជាពិសេសនៅពេលយកមកពិចារណាក្នុងថ្នាក់នៃការប៉ាន់ប្រមាណលីនេអ៊ែរ។ វាជាការសំខាន់ក្នុងការកត់សម្គាល់ថាទិន្នន័យពិតប្រាកដកម្រនឹងបំពេញលក្ខខណ្ឌ។ នោះគឺជាវិធីសាស្ត្រត្រូវបានប្រើបើទោះជាការសន្មតមិនត្រឹមត្រូវក៏ដោយ។ ការបំរែបំរួលពីការសន្មត់ពេលខ្លះអាចត្រូវបានប្រើជារង្វាស់នៃការប្រើប្រាស់គំរូ។ ការសន្មត់ទាំងនេះជាច្រើនអាចត្រូវបានបន្ធូរបន្ថយនៅក្នុងវិធីសាស្រ្តកម្រិតខ្ពស់បន្ថែមទៀត។ របាយការណ៍វិភាគស្ថិតិជាធម្មតារួមបញ្ចូលការវិភាគនៃការធ្វើតេស្តប្រឆាំងនឹងទិន្នន័យគំរូ និងវិធីសាស្រ្តសម្រាប់អត្ថប្រយោជន៍នៃគំរូ។
លើសពីនេះទៀតអថេរក្នុងករណីខ្លះសំដៅលើតម្លៃដែលបានវាស់នៅទីតាំងចំណុច។ វាអាចមាននិន្នាការលំហ និងទំនាក់ទំនងស្វ័យភាពនៃលំហនៅក្នុងអថេរដែលបំពានលើការសន្មត់ស្ថិតិ។ ការតំរែតំរង់តាមភូមិសាស្ត្រគឺជាវិធីសាស្រ្តតែមួយគត់ដែលទាក់ទងនឹងទិន្នន័យបែបនេះ។
នៅក្នុងតំរែតំរង់លីនេអ៊ែរ លក្ខណៈពិសេសគឺថា អថេរអាស្រ័យ ដែលជា Y i គឺជាការរួមបញ្ចូលគ្នាលីនេអ៊ែរនៃប៉ារ៉ាម៉ែត្រ។ ឧទាហរណ៍ ក្នុងការតំរែតំរង់លីនេអ៊ែរសាមញ្ញ ការធ្វើគំរូចំណុច n ប្រើអថេរឯករាជ្យមួយ x i និងប៉ារ៉ាម៉ែត្រពីរ β 0 និង β 1 ។
នៅក្នុងការតំរែតំរង់លីនេអ៊ែរច្រើន មានអថេរឯករាជ្យមួយចំនួន ឬមុខងាររបស់វា។
នៅពេលយកគំរូដោយចៃដន្យពីចំនួនប្រជាជន ប៉ារ៉ាម៉ែត្ររបស់វាធ្វើឱ្យវាអាចទទួលបានគំរូនៃគំរូតំរែតំរង់លីនេអ៊ែរ។
ក្នុងទិដ្ឋភាពនេះ វិធីសាស្ត្រការ៉េតិចបំផុតគឺពេញនិយមបំផុត។ វាផ្តល់នូវការប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រដែលកាត់បន្ថយផលបូកនៃការ៉េនៃសំណល់។ ប្រភេទនៃការបង្រួមអប្បបរមានេះ (ដែលជាតួយ៉ាងនៃការតំរែតំរង់លីនេអ៊ែរ) នៃមុខងារនេះនាំទៅដល់សំណុំសមីការធម្មតា និងសំណុំនៃសមីការលីនេអ៊ែរជាមួយនឹងប៉ារ៉ាម៉ែត្រ ដែលត្រូវបានដោះស្រាយដើម្បីទទួលបានការប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រ។
ដោយសន្មត់បន្ថែមទៀតថា ជាទូទៅកំហុសចំនួនប្រជាជនរីករាលដាល អ្នកស្រាវជ្រាវអាចប្រើការប៉ាន់ប្រមាណនៃកំហុសស្តង់ដារទាំងនេះ ដើម្បីបង្កើតចន្លោះពេលទំនុកចិត្ត និងអនុវត្តការសាកល្បងសម្មតិកម្មអំពីប៉ារ៉ាម៉ែត្ររបស់វា។
ការវិភាគតំរែតំរង់មិនលីនេអ៊ែរ
ឧទាហរណ៍ដែលអនុគមន៍មិនជាលីនេអ៊ែរទាក់ទងនឹងប៉ារ៉ាម៉ែត្របង្ហាញថាផលបូកនៃការេគួរត្រូវបានបង្រួមអប្បបរមាជាមួយនឹងនីតិវិធីដដែលៗ។ នេះណែនាំពីភាពស្មុគស្មាញជាច្រើនដែលកំណត់ភាពខុសគ្នារវាងវិធីសាស្ត្រការេតិចបំផុតលីនេអ៊ែរ និងមិនមែនលីនេអ៊ែរ។ អាស្រ័យហេតុនេះ លទ្ធផលនៃការវិភាគតំរែតំរង់នៅពេលប្រើវិធីសាស្ត្រមិនមែនលីនេអ៊ែរ ជួនកាលមិនអាចទាយទុកជាមុនបាន។
ការគណនាថាមពលនិងទំហំគំរូ
នៅទីនេះជាក្បួនមិនមានវិធីសាស្រ្តស្របគ្នាទាក់ទងនឹងចំនួននៃការសង្កេតធៀបនឹងចំនួនអថេរឯករាជ្យនៅក្នុងគំរូនោះទេ។ ច្បាប់ទីមួយត្រូវបានស្នើឡើងដោយ Dobra និង Hardin ហើយមើលទៅដូចជា N = t^n ដែល N ជាទំហំគំរូ n គឺជាចំនួននៃអថេរពន្យល់ ហើយ t គឺជាចំនួននៃការសង្កេតដែលត្រូវការដើម្បីសម្រេចបាននូវភាពត្រឹមត្រូវដែលចង់បាន ប្រសិនបើគំរូមាន អថេរពន្យល់តែមួយគត់។ ឧទាហរណ៍ អ្នកស្រាវជ្រាវបង្កើតគំរូតំរែតំរង់លីនេអ៊ែរដោយប្រើសំណុំទិន្នន័យដែលមានអ្នកជំងឺ 1000 នាក់ (N) ។ ប្រសិនបើអ្នកស្រាវជ្រាវសម្រេចថាការសង្កេតចំនួនប្រាំគឺចាំបាច់ដើម្បីកំណត់បន្ទាត់ (m) យ៉ាងត្រឹមត្រូវនោះ ចំនួនអតិបរិមានៃអថេរពន្យល់ដែលគំរូអាចគាំទ្រគឺ 4 ។
វិធីសាស្រ្តផ្សេងទៀត។
ទោះបីជាប៉ារ៉ាម៉ែត្រនៃគំរូតំរែតំរង់ជាធម្មតាត្រូវបានប៉ាន់ប្រមាណដោយប្រើវិធីសាស្ត្រការ៉េតិចបំផុតក៏ដោយ មានវិធីសាស្រ្តផ្សេងទៀតដែលត្រូវបានប្រើតិចជាញឹកញាប់។ ឧទាហរណ៍ទាំងនេះគឺជាវិធីសាស្រ្តដូចខាងក្រោម:
- វិធីសាស្រ្ត Bayesian (ឧទាហរណ៍វិធីសាស្រ្ត Bayesian នៃតំរែតំរង់លីនេអ៊ែរ) ។
- ការតំរែតំរង់ភាគរយដែលប្រើសម្រាប់ស្ថានភាពដែលកាត់បន្ថយកំហុសភាគរយត្រូវបានគេចាត់ទុកថាសមរម្យជាង។
- គម្លាតដាច់ខាតតូចបំផុត ដែលរឹងមាំជាងនៅក្នុងវត្តមានរបស់ outliers ដែលនាំទៅដល់ការតំរែតំរង់បរិមាណ។
- តំរែតំរង់ nonparametric ទាមទារចំនួនដ៏ច្រើននៃការសង្កេត និងការគណនា។
- ចម្ងាយនៃម៉ែត្រការរៀនដែលត្រូវបានរៀនក្នុងការស្វែងរកម៉ែត្រចម្ងាយដែលមានន័យនៅក្នុងចន្លោះបញ្ចូលដែលបានផ្តល់ឱ្យ។
កម្មវិធី
កញ្ចប់កម្មវិធីស្ថិតិសំខាន់ៗទាំងអស់ត្រូវបានអនុវត្តដោយប្រើការវិភាគតំរែតំរង់ការ៉េតិចបំផុត។ តំរែតំរង់លីនេអ៊ែរសាមញ្ញ និងការវិភាគតំរែតំរង់ច្រើនអាចត្រូវបានប្រើនៅក្នុងកម្មវិធីសៀវភៅបញ្ជីមួយចំនួន ក៏ដូចជាម៉ាស៊ីនគិតលេខមួយចំនួន។ ខណៈពេលដែលកញ្ចប់កម្មវិធីស្ថិតិជាច្រើនអាចអនុវត្តប្រភេទផ្សេងៗនៃការតំរែតំរង់ nonparametric និងរឹងមាំ វិធីសាស្ត្រទាំងនេះមិនមានលក្ខណៈស្តង់ដារទេ។ កញ្ចប់កម្មវិធីផ្សេងគ្នាអនុវត្តវិធីសាស្រ្តផ្សេងគ្នា។ កម្មវិធីតំរែតំរង់ឯកទេសត្រូវបានបង្កើតឡើងសម្រាប់ប្រើប្រាស់ក្នុងផ្នែកដូចជាការវិភាគស្ទង់មតិ និង neuroimaging ។
នៅក្នុងវត្តមាននៃការជាប់ទាក់ទងគ្នារវាងកត្តា និងសញ្ញាលទ្ធផល វេជ្ជបណ្ឌិតជារឿយៗត្រូវកំណត់ដោយចំនួនតម្លៃនៃសញ្ញាមួយអាចផ្លាស់ប្តូរនៅពេលដែលមួយផ្សេងទៀតត្រូវបានផ្លាស់ប្តូរដោយឯកតារង្វាស់ដែលជាទូទៅទទួលយក ឬបង្កើតឡើងដោយអ្នកស្រាវជ្រាវខ្លួនឯង។
ជាឧទាហរណ៍ តើទម្ងន់ខ្លួនរបស់សិស្សសាលាថ្នាក់ទី 1 (ក្មេងស្រី ឬក្មេងប្រុស) នឹងផ្លាស់ប្តូរយ៉ាងដូចម្តេច ប្រសិនបើកម្ពស់របស់ពួកគេកើនឡើង 1 សង់ទីម៉ែត្រ។ សម្រាប់គោលបំណងទាំងនេះ វិធីសាស្ត្រវិភាគការតំរែតំរង់ត្រូវបានប្រើប្រាស់។
ភាគច្រើនជាញឹកញាប់ វិធីសាស្ត្រវិភាគការតំរែតំរង់ត្រូវបានប្រើ ដើម្បីបង្កើតមាត្រដ្ឋានបទដ្ឋាន និងស្តង់ដារសម្រាប់ការអភិវឌ្ឍន៍រាងកាយ។
- និយមន័យនៃការតំរែតំរង់. ការតំរែតំរង់គឺជាអនុគមន៍ដែលអនុញ្ញាតដោយផ្អែកលើតម្លៃមធ្យមនៃគុណលក្ខណៈមួយ ដើម្បីកំណត់តម្លៃមធ្យមនៃគុណលក្ខណៈមួយផ្សេងទៀតដែលជាប់ទាក់ទងជាមួយគុណលក្ខណៈទីមួយ។
ចំពោះគោលបំណងនេះមេគុណតំរែតំរង់និងប៉ារ៉ាម៉ែត្រមួយចំនួនផ្សេងទៀតត្រូវបានប្រើ។ ឧទាហរណ៍អ្នកអាចគណនាចំនួននៃជំងឺផ្តាសាយជាមធ្យមនៅតម្លៃជាក់លាក់នៃសីតុណ្ហភាពខ្យល់ប្រចាំខែជាមធ្យមនៅក្នុងរដូវស្លឹកឈើជ្រុះ - រដូវរងា។
- និយមន័យនៃមេគុណតំរែតំរង់. មេគុណតំរែតំរង់គឺជាតម្លៃដាច់ខាតដែលតម្លៃនៃគុណលក្ខណៈមួយផ្លាស់ប្តូរជាមធ្យមនៅពេលដែលគុណលក្ខណៈផ្សេងទៀតដែលទាក់ទងនឹងវាផ្លាស់ប្តូរដោយឯកតារង្វាស់ដែលបានបញ្ជាក់។
- រូបមន្តមេគុណតំរែតំរង់. R y / x \u003d r xy x (σ y / σ x)
ដែល R y / x - មេគុណតំរែតំរង់;
r xy - មេគុណទំនាក់ទំនងរវាងលក្ខណៈពិសេស x និង y;
(σ y និង σ x) - គម្លាតស្តង់ដារនៃលក្ខណៈពិសេស x និង y ។នៅក្នុងឧទាហរណ៍របស់យើង;
σ x = 4.6 (គម្លាតស្តង់ដារនៃសីតុណ្ហភាពខ្យល់នៅរដូវស្លឹកឈើជ្រុះ - រដូវរងា;
σ y = 8.65 (គម្លាតស្តង់ដារនៃចំនួនជំងឺផ្តាសាយឆ្លង) ។
ដូច្នេះ R y/x គឺជាមេគុណតំរែតំរង់។
R y / x \u003d -0.96 x (4.6 / 8.65) \u003d 1.8, i.e. ជាមួយនឹងការថយចុះនៃសីតុណ្ហភាពខ្យល់ប្រចាំខែជាមធ្យម (x) ដោយ 1 ដឺក្រេ ចំនួនមធ្យមនៃជំងឺផ្តាសាយឆ្លង (y) នៅក្នុងរដូវស្លឹកឈើជ្រុះរដូវរងានឹងផ្លាស់ប្តូរចំនួន 1.8 ករណី។ - សមីការតំរែតំរង់. y \u003d M y + R y / x (x - M x)
ដែល y គឺជាតម្លៃមធ្យមនៃគុណលក្ខណៈ ដែលគួរតែត្រូវបានកំណត់នៅពេលដែលតម្លៃមធ្យមនៃគុណលក្ខណៈផ្សេងទៀត (x) ផ្លាស់ប្តូរ;
x - តម្លៃមធ្យមដែលគេស្គាល់នៃលក្ខណៈពិសេសមួយផ្សេងទៀត;
R y/x - មេគុណតំរែតំរង់;
M x, M y - ស្គាល់តម្លៃមធ្យមនៃលក្ខណៈពិសេស x និង y ។ឧទាហរណ៍ ចំនួនមធ្យមនៃជំងឺផ្តាសាយឆ្លង (y) អាចត្រូវបានកំណត់ដោយគ្មានការវាស់វែងពិសេសនៅតម្លៃមធ្យមណាមួយនៃសីតុណ្ហភាពខ្យល់ប្រចាំខែជាមធ្យម (x)។ ដូច្នេះប្រសិនបើ x \u003d - 9 °, R y / x \u003d 1.8 ជំងឺ, M x \u003d -7 °, M y \u003d 20 ជំងឺបន្ទាប់មក y \u003d 20 + 1.8 x (9-7) \u003d 20 + 3 .6 = 23.6 ជំងឺ។
សមីការនេះត្រូវបានអនុវត្តនៅក្នុងករណីនៃទំនាក់ទំនងបន្ទាត់ត្រង់រវាងលក្ខណៈពិសេសពីរ (x និង y) ។ - គោលបំណងនៃសមីការតំរែតំរង់. សមីការតំរែតំរង់ត្រូវបានប្រើដើម្បីគូសបន្ទាត់តំរែតំរង់។ ក្រោយមកទៀតអនុញ្ញាតឱ្យដោយគ្មានការវាស់វែងពិសេសដើម្បីកំណត់តម្លៃមធ្យមណាមួយ (y) នៃគុណលក្ខណៈមួយ ប្រសិនបើតម្លៃ (x) នៃគុណលក្ខណៈផ្សេងទៀតផ្លាស់ប្តូរ។ ផ្អែកលើទិន្នន័យទាំងនេះ ក្រាហ្វមួយត្រូវបានបង្កើតឡើង - បន្ទាត់តំរែតំរង់ដែលអាចត្រូវបានប្រើដើម្បីកំណត់ចំនួនមធ្យមនៃជំងឺផ្តាសាយនៅតម្លៃណាមួយនៃសីតុណ្ហភាពប្រចាំខែជាមធ្យមក្នុងចន្លោះរវាងតម្លៃដែលបានគណនានៃចំនួនជំងឺផ្តាសាយ។
- Regression sigma (រូបមន្ត).
ដែល σ Ru/x - sigma (គម្លាតស្តង់ដារ) នៃតំរែតំរង់;
σ y គឺជាគម្លាតស្តង់ដារនៃលក្ខណៈពិសេស y;
r xy - មេគុណទំនាក់ទំនងរវាងលក្ខណៈពិសេស x និង y ។ដូច្នេះប្រសិនបើ σ y គឺជាគម្លាតស្តង់ដារនៃចំនួនផ្តាសាយ = 8.65; r xy - មេគុណទំនាក់ទំនងរវាងចំនួននៃជំងឺផ្តាសាយ (y) និងសីតុណ្ហភាពខ្យល់ប្រចាំខែជាមធ្យមក្នុងរដូវស្លឹកឈើជ្រុះរដូវរងា (x) គឺ - 0.96 បន្ទាប់មក
- គោលបំណងនៃការតំរែតំរង់ sigma. ផ្តល់លក្ខណៈនៃរង្វាស់នៃភាពចម្រុះនៃលក្ខណៈលទ្ធផល (y)។
ជាឧទាហរណ៍ វាកំណត់លក្ខណៈនៃភាពចម្រុះនៃចំនួនជំងឺផ្តាសាយនៅតម្លៃជាក់លាក់នៃសីតុណ្ហភាពខ្យល់ប្រចាំខែជាមធ្យមក្នុងអំឡុងរដូវស្លឹកឈើជ្រុះ-រដូវរងា។ ដូច្នេះចំនួនមធ្យមនៃជំងឺផ្តាសាយនៅសីតុណ្ហភាពខ្យល់ x 1 \u003d -6 °អាចមានចាប់ពី 15.78 ជំងឺដល់ 20.62 ជំងឺ។
នៅ x 2 = -9° ចំនួនមធ្យមនៃជំងឺផ្តាសាយអាចមានចាប់ពី 21.18 ជំងឺដល់ 26.02 ជំងឺ។ល។regression sigma ត្រូវបានប្រើក្នុងការសាងសង់មាត្រដ្ឋានតំរែតំរង់ដែលឆ្លុះបញ្ចាំងពីគម្លាតនៃតម្លៃនៃគុណលក្ខណៈប្រសិទ្ធភាពពីតម្លៃមធ្យមរបស់វាដែលបានគ្រោងនៅលើបន្ទាត់តំរែតំរង់។
- ទិន្នន័យដែលត្រូវការដើម្បីគណនា និងគ្រោងមាត្រដ្ឋានតំរែតំរង់
- មេគុណតំរែតំរង់ - Ry/x;
- សមីការតំរែតំរង់ - y \u003d M y + R y / x (x-M x);
- តំរែតំរង់ sigma - σ Rx/y
- លំដាប់នៃការគណនា និងតំណាងក្រាហ្វិកនៃមាត្រដ្ឋានតំរែតំរង់.
- កំណត់មេគុណតំរែតំរង់ដោយរូបមន្ត (សូមមើលកថាខណ្ឌទី 3) ។ ជាឧទាហរណ៍ មនុស្សម្នាក់គួរតែកំណត់ថាតើទម្ងន់រាងកាយនឹងប្រែប្រួលជាមធ្យមប៉ុន្មាន (នៅអាយុជាក់លាក់មួយអាស្រ័យលើភេទ) ប្រសិនបើកម្ពស់ជាមធ្យមប្រែប្រួល 1 សង់ទីម៉ែត្រ។
- យោងតាមរូបមន្តនៃសមីការតំរែតំរង់ (សូមមើលកថាខណ្ឌទី 4) កំណត់នូវអ្វីដែលនឹងជាមធ្យមឧទាហរណ៍ ទំងន់រាងកាយ (y, y 2, y 3 ...) * សម្រាប់តម្លៃកំណើនជាក់លាក់ (x, x 2, x ៣ ... ) ។
________________
* តម្លៃនៃ "y" គួរតែត្រូវបានគណនាសម្រាប់តម្លៃដែលគេស្គាល់យ៉ាងហោចណាស់បីនៃ "x" ។ក្នុងពេលជាមួយគ្នានេះ តម្លៃមធ្យមនៃទំងន់រាងកាយ និងកម្ពស់ (M x, និង M y) សម្រាប់អាយុ និងភេទជាក់លាក់មួយត្រូវបានគេដឹង។
- គណនា sigma នៃតំរែតំរង់ដោយដឹងពីតម្លៃដែលត្រូវគ្នានៃ σ y និង r xy ហើយជំនួសតម្លៃរបស់វាទៅក្នុងរូបមន្ត (សូមមើលកថាខណ្ឌទី 6)។
- ដោយផ្អែកលើតម្លៃដែលគេស្គាល់ x 1, x 2, x 3 និងតម្លៃមធ្យមដែលត្រូវគ្នារបស់ពួកគេ y 1, y 2 y 3 ក៏ដូចជាតូចបំផុត (y - σ ru / x) និងធំបំផុត (y + σ ru / x) តម្លៃ \u200b\u200b(y) បង្កើតមាត្រដ្ឋានតំរែតំរង់។
សម្រាប់តំណាងក្រាហ្វិកនៃមាត្រដ្ឋានតំរែតំរង់ តម្លៃ x, x 2, x 3 (អ័ក្ស y) ត្រូវបានសម្គាល់ដំបូងនៅលើក្រាហ្វ ឧ។ បន្ទាត់តំរែតំរង់ត្រូវបានបង្កើតឡើង ឧទាហរណ៍ ការពឹងផ្អែកនៃទំងន់រាងកាយ (y) លើកម្ពស់ (x) ។
បន្ទាប់មកនៅចំណុចដែលត្រូវគ្នា y 1 , y 2 , y 3 តម្លៃលេខនៃការតំរែតំរង់ sigma ត្រូវបានសម្គាល់ i.e. នៅលើក្រាហ្វរកឃើញតម្លៃតូចបំផុត និងធំបំផុតនៃ y 1 , y 2 , y 3 ។
- ការប្រើប្រាស់ជាក់ស្តែងនៃមាត្រដ្ឋានតំរែតំរង់. មាត្រដ្ឋាន និងស្តង់ដារធម្មតាកំពុងត្រូវបានបង្កើតឡើង ជាពិសេសសម្រាប់ការអភិវឌ្ឍន៍រាងកាយ។ យោងតាមមាត្រដ្ឋានស្តង់ដារវាអាចធ្វើទៅបានដើម្បីផ្តល់ការវាយតម្លៃបុគ្គលអំពីការអភិវឌ្ឍន៍របស់កុមារ។ ទន្ទឹមនឹងនេះ ការអភិវឌ្ឍន៍រាងកាយត្រូវបានវាយតម្លៃថាមានភាពចុះសម្រុងគ្នា ប្រសិនបើឧទាហរណ៍ នៅកម្ពស់ជាក់លាក់មួយ ទម្ងន់រាងកាយរបស់កុមារស្ថិតក្នុងរង្វង់មួយនៃការតំរែតំរង់ទៅឯកតាគណនាជាមធ្យមនៃទំងន់រាងកាយ - (y) សម្រាប់កម្ពស់ដែលបានផ្តល់ឱ្យ (x) (y ± 1 σ Ry / x) ។
ការអភិវឌ្ឍន៍រាងកាយត្រូវបានចាត់ទុកថាមិនចុះសម្រុងគ្នាក្នុងលក្ខខណ្ឌនៃទំងន់រាងកាយ ប្រសិនបើទម្ងន់រាងកាយរបស់កុមារសម្រាប់កម្ពស់ជាក់លាក់មួយស្ថិតនៅក្នុងការតំរែតំរង់ទីពីរ sigma: (y ± 2 σ Ry/x)
ការអភិវឌ្ឍន៍រាងកាយនឹងមានភាពមិនចុះសម្រុងគ្នាយ៉ាងខ្លាំង ទាំងដោយសារតែទម្ងន់រាងកាយលើស និងមិនគ្រប់គ្រាន់ ប្រសិនបើទម្ងន់រាងកាយសម្រាប់កម្ពស់ជាក់លាក់មួយស្ថិតនៅក្នុងរង្វង់ទីបីនៃការតំរែតំរង់ (y ± 3 σ Ry / x) ។
យោងតាមលទ្ធផលនៃការសិក្សាស្ថិតិនៃការអភិវឌ្ឍន៍រាងកាយរបស់ក្មេងប្រុសអាយុ 5 ឆ្នាំវាត្រូវបានគេដឹងថាកម្ពស់ជាមធ្យមរបស់ពួកគេ (x) គឺ 109 សង់ទីម៉ែត្រហើយទម្ងន់ជាមធ្យមរបស់ពួកគេ (y) គឺ 19 គីឡូក្រាម។ មេគុណទំនាក់ទំនងរវាងកម្ពស់ និងទម្ងន់ខ្លួនគឺ +0.9 គម្លាតស្តង់ដារត្រូវបានបង្ហាញក្នុងតារាង។
ទាមទារ៖
- គណនាមេគុណតំរែតំរង់;
- ដោយប្រើសមីការតំរែតំរង់ កំណត់ថាតើទម្ងន់រាងកាយដែលរំពឹងទុករបស់ក្មេងប្រុសអាយុ 5 ឆ្នាំនឹងមានកម្ពស់ស្មើនឹង x1 = 100 សង់ទីម៉ែត្រ, x2 = 110 សង់ទីម៉ែត្រ, x3 = 120 សង់ទីម៉ែត្រ;
- គណនាការតំរែតំរង់ sigma បង្កើតមាត្រដ្ឋានតំរែតំរង់បង្ហាញលទ្ធផលនៃដំណោះស្រាយរបស់វាតាមក្រាហ្វិក។
- ទាញការសន្និដ្ឋានសមស្រប។
ស្ថានភាពនៃបញ្ហា និងលទ្ធផលនៃដំណោះស្រាយរបស់វាត្រូវបានបង្ហាញក្នុងតារាងសង្ខេប។
តារាងទី 1
លក្ខខណ្ឌនៃបញ្ហា | លទ្ធផលនៃដំណោះស្រាយបញ្ហា | ||||||||
សមីការតំរែតំរង់ | តំរែតំរង់ sigma | មាត្រដ្ឋានតំរែតំរង់ (ទំងន់រាងកាយរំពឹងទុក (គិតជាគីឡូក្រាម)) | |||||||
ម | σ | r xy | R y/x | X | នៅ | σRx/y | y - σ Rу/х | y + σ Rу/х | |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
កម្ពស់ (x) | 109 សង់ទីម៉ែត្រ | ± 4.4 សង់ទីម៉ែត្រ | +0,9 | 0,16 | 100 សង់ទីម៉ែត្រ | ១៧.៥៦ គីឡូក្រាម | ± 0.35 គីឡូក្រាម | ១៧,២១ គីឡូក្រាម | ១៧,៩១ គីឡូក្រាម |
ទំងន់រាងកាយ (y) | 19 គីឡូក្រាម | ± 0,8 គីឡូក្រាម | 110 សង់ទីម៉ែត្រ | 19.16 គីឡូក្រាម | 18.81 គីឡូក្រាម | 19.51 គីឡូក្រាម | |||
120 សង់ទីម៉ែត្រ | 20.76 គីឡូក្រាម | 20.41 គីឡូក្រាម | ២១,១១ គីឡូក្រាម |
ការសម្រេចចិត្ត.
សេចក្តីសន្និដ្ឋាន។ដូច្នេះមាត្រដ្ឋានតំរែតំរង់នៅក្នុងតម្លៃគណនានៃទំងន់រាងកាយអនុញ្ញាតឱ្យអ្នកកំណត់វាសម្រាប់តម្លៃផ្សេងទៀតនៃការលូតលាស់ឬដើម្បីវាយតម្លៃការអភិវឌ្ឍន៍បុគ្គលរបស់កុមារ។ ដើម្បីធ្វើដូចនេះស្តារកាត់កែងទៅបន្ទាត់តំរែតំរង់។
- Vlasov V.V. រោគរាតត្បាត។ - M. : GEOTAR-MED, 2004. - 464 ទំ។
- Lisitsyn Yu.P. សុខភាពសាធារណៈ និងការថែទាំសុខភាព។ សៀវភៅសិក្សាសម្រាប់វិទ្យាល័យ។ - M. : GEOTAR-MED, 2007. - 512 ទំ។
- Medik V.A., Yuriev V.K. វគ្គបណ្តុះបណ្តាលស្តីពីសុខភាពសាធារណៈ និងការថែទាំសុខភាព៖ វគ្គ ១.សុខភាពសាធារណៈ។ - M. : ថ្នាំ, 2003. - 368 ទំ។
- Minyaev V.A., Vishnyakov N.I. និងផ្សេងៗទៀត។ ឱសថសង្គម និងអង្គការថែទាំសុខភាព (ការណែនាំជា 2 ភាគ)។ - សាំងពេទឺប៊ឺគឆ្នាំ 1998 -528 ទំ។
- Kucherenko V.Z., Agarkov N.M. និងផ្សេងៗទៀត អនាម័យសង្គម និងអង្គការនៃការថែទាំសុខភាព (ការបង្រៀន) - Moscow, 2000. - 432 p.
- S. Glantz ។ ស្ថិតិ Medico-ជីវសាស្រ្ត។ ពីភាសាអង់គ្លេស។ - M. , ការអនុវត្ត, 1998. - 459 ទំ។
បន្ទាប់ពីការវិភាគទំនាក់ទំនងបានបង្ហាញពីវត្តមាននៃទំនាក់ទំនងស្ថិតិរវាងអថេរ និងវាយតម្លៃកម្រិតនៃភាពតឹងរបស់វា ពួកគេជាធម្មតាបន្តទៅការពិពណ៌នាគណិតវិទ្យានៃប្រភេទភាពអាស្រ័យជាក់លាក់មួយដោយប្រើការវិភាគតំរែតំរង់។ ចំពោះគោលបំណងនេះ ថ្នាក់នៃអនុគមន៍មួយត្រូវបានជ្រើសរើសដែលទាក់ទងនឹងសូចនាករដែលមានប្រសិទ្ធភាព y និងអាគុយម៉ង់ x 1, x 2, ..., x ទៅនឹងអាគុយម៉ង់ព័ត៌មានច្រើនបំផុតត្រូវបានជ្រើសរើស ការប៉ាន់ប្រមាណតម្លៃមិនស្គាល់នៃប៉ារ៉ាម៉ែត្រនៃតំណភ្ជាប់ សមីការត្រូវបានគណនា ហើយលក្ខណៈសម្បត្តិនៃសមីការលទ្ធផលត្រូវបានវិភាគ។
អនុគមន៍ f (x 1, x 2, ... , x k) ដែលពិពណ៌នាអំពីភាពអាស្រ័យនៃតម្លៃមធ្យមនៃលក្ខណៈមានប្រសិទ្ធភាព y លើតម្លៃដែលបានផ្តល់ឱ្យនៃអាគុយម៉ង់ត្រូវបានគេហៅថា អនុគមន៍តំរែតំរង់ (សមីការ) ។ ពាក្យថា "តំរែតំរង់" (lat. - regression - retreat, return to something) ត្រូវបានណែនាំដោយអ្នកចិត្តសាស្រ្តអង់គ្លេស និង នរវិទ្យា F. Galton ហើយត្រូវបានភ្ជាប់ទាំងស្រុងជាមួយនឹងភាពជាក់លាក់នៃឧទាហរណ៍ជាក់ស្តែងដំបូងបង្អស់ដែលគំនិតនេះត្រូវបានប្រើ។ ដូច្នេះ ដំណើរការទិន្នន័យស្ថិតិទាក់ទងនឹងការវិភាគតំណពូជនៃការលូតលាស់ F. Galton បានរកឃើញថា ប្រសិនបើឪពុកខុសគ្នាពីកម្ពស់មធ្យមរបស់ឪពុកទាំងអស់ត្រឹម x អ៊ីញ នោះកូនប្រុសរបស់ពួកគេបែរចេញពីកម្ពស់ជាមធ្យមរបស់កូនប្រុសទាំងអស់តិចជាង x អ៊ីញ។ និន្នាការដែលបានបង្ហាញត្រូវបានគេហៅថា "ការតំរែតំរង់ទៅរដ្ឋមធ្យម" ។ ចាប់តាំងពីពេលនោះមក ពាក្យ "តំរែតំរង់" ត្រូវបានគេប្រើយ៉ាងទូលំទូលាយនៅក្នុងអក្សរសិល្ប៍ស្ថិតិ ទោះបីជាក្នុងករណីជាច្រើនវាមិនកំណត់លក្ខណៈត្រឹមត្រូវនៃគោលគំនិតនៃការពឹងផ្អែកស្ថិតិក៏ដោយ។
សម្រាប់ការពិពណ៌នាត្រឹមត្រូវនៃសមីការតំរែតំរង់ ចាំបាច់ត្រូវដឹងពីច្បាប់នៃការចែកចាយនៃសូចនាករដែលមានប្រសិទ្ធភាព y ។ នៅក្នុងការអនុវត្តស្ថិតិ ជាធម្មតាមនុស្សម្នាក់ត្រូវកំណត់ខ្លួនឯងក្នុងការស្វែងរកការប៉ាន់ស្មានសមរម្យសម្រាប់មុខងារតំរែតំរង់ពិតប្រាកដដែលមិនស្គាល់ ចាប់តាំងពីអ្នកស្រាវជ្រាវមិនមានចំណេះដឹងពិតប្រាកដនៃច្បាប់តាមលក្ខខណ្ឌនៃការចែកចាយប្រូបាប៊ីលីតេនៃសូចនាករលទ្ធផលដែលបានវិភាគ y សម្រាប់តម្លៃដែលបានផ្តល់ឱ្យ។ នៃអាគុយម៉ង់ x ។
ពិចារណាទំនាក់ទំនងរវាងពិត f(x) = M(y1x), តំរែតំរង់គំរូ? និងពិន្ទុ y នៃតំរែតំរង់។ អនុញ្ញាតឱ្យសូចនាករប្រសិទ្ធភាព y ទាក់ទងទៅនឹងអាគុយម៉ង់ x ដោយសមាមាត្រ៖
ដែល - e គឺជាអថេរចៃដន្យដែលមានច្បាប់ចែកចាយធម្មតា ជាមួយនឹង Me \u003d 0 និង D e \u003d y 2 ។ មុខងារតំរែតំរង់ពិតក្នុងករណីនេះគឺ៖ f(x) = M(y/x) = 2x 1.5 ។
ឧបមាថាយើងមិនដឹងពីទម្រង់ពិតប្រាកដនៃសមីការតំរែតំរង់ពិតទេ ប៉ុន្តែយើងមានការសង្កេតប្រាំបួនលើអថេរចៃដន្យពីរវិមាត្រដែលទាក់ទងដោយសមាមាត្រ yi = 2x1.5 + e ហើយបង្ហាញក្នុងរូប។ មួយ។
រូបភាពទី 1 - ការរៀបចំគ្នាទៅវិញទៅមកនៃការពិត f (x) និងទ្រឹស្តី? ម៉ូដែលតំរែតំរង់
ទីតាំងនៃចំណុចនៅក្នុងរូបភព។ 1 អនុញ្ញាតឱ្យអ្នកកំណត់ខ្លួនអ្នកទៅនឹងថ្នាក់នៃភាពអាស្រ័យលីនេអ៊ែរនៃទម្រង់? = នៅ 0 + នៅ 1 x ។ ដោយប្រើវិធីសាស្ត្រការេតិចបំផុត យើងរកឃើញការប៉ាន់ប្រមាណនៃសមីការតំរែតំរង់ y = b 0 +b 1 x ។ សម្រាប់ការប្រៀបធៀបនៅក្នុងរូបភព។ 1 បង្ហាញក្រាហ្វនៃអនុគមន៍តំរែតំរង់ពិត y \u003d 2x 1.5 ទ្រឹស្ដីអនុគមន៍តំរែតំរង់ប្រហាក់ប្រហែល? = នៅ 0 + នៅ 1 x ។
ដោយសារយើងមានកំហុសក្នុងការជ្រើសរើសថ្នាក់នៃមុខងារតំរែតំរង់ ហើយនេះជារឿងធម្មតានៅក្នុងការអនុវត្តនៃការស្រាវជ្រាវស្ថិតិ ការសន្និដ្ឋាន និងការប៉ាន់ប្រមាណស្ថិតិរបស់យើងនឹងប្រែជាខុស។ ហើយមិនថាយើងបង្កើនបរិមាណនៃការសង្កេតប៉ុន្មានទេ ការប៉ាន់ប្រមាណគំរូរបស់យើងអំពី y នឹងមិននៅជិតមុខងារតំរែតំរង់ពិត f(x) ទេ។ ប្រសិនបើយើងជ្រើសរើសថ្នាក់នៃមុខងារតំរែតំរង់បានត្រឹមត្រូវ នោះភាពមិនត្រឹមត្រូវក្នុងការពិពណ៌នារបស់ f(x) ដោយប្រើ? អាចត្រូវបានពន្យល់ដោយទំហំគំរូដែលមានកំណត់។
ដើម្បីស្ដារតម្លៃតាមលក្ខខណ្ឌនៃសូចនាករដែលមានប្រសិទ្ធភាព y(x) និងមុខងារតំរែតំរង់ដែលមិនស្គាល់ f(x) = M(y/x) ពីទិន្នន័យស្ថិតិដំបូង លក្ខណៈវិនិច្ឆ័យគ្រប់គ្រាន់ខាងក្រោម (មុខងារបាត់បង់) ត្រូវបានគេប្រើញឹកញាប់បំផុត .
វិធីសាស្រ្តការ៉េតិចបំផុត។ យោងទៅតាមវាគម្លាតការ៉េនៃតម្លៃដែលបានសង្កេតឃើញនៃសូចនាករប្រសិទ្ធភាព y, (i = 1,2, ..., n) ពីតម្លៃគំរូត្រូវបានបង្រួមអប្បបរមា។ = f(x i) ដែល x i ជាតម្លៃនៃវ៉ិចទ័រនៃអាគុយម៉ង់នៅក្នុងការសង្កេត i-th៖
វិធីសាស្រ្តនៃម៉ូឌុលតិចបំផុត។ យោងតាមវាផលបូកនៃគម្លាតដាច់ខាតនៃតម្លៃដែលបានសង្កេតនៃសូចនាករប្រសិទ្ធភាពពីតម្លៃម៉ូឌុលត្រូវបានបង្រួមអប្បបរមា។ ហើយយើងទទួលបាន = f(x i) មានន័យថា តំរែតំរង់មធ្យមដាច់ខាត? |y i - f(х i)| > នាទី
ការវិភាគតំរែតំរង់គឺជាវិធីសាស្រ្តនៃការវិភាគស្ថិតិនៃការពឹងផ្អែកនៃអថេរចៃដន្យ y លើអថេរ x j = (j = 1,2, ..., k) ដែលត្រូវបានពិចារណាក្នុងការវិភាគតំរែតំរង់ជាអថេរមិនចៃដន្យ ដោយមិនគិតពីច្បាប់ចែកចាយពិត។ x j
ជាធម្មតាវាត្រូវបានសន្មត់ថាអថេរចៃដន្យ y មានច្បាប់ចែកចាយធម្មតាជាមួយនឹងការរំពឹងទុកគណិតវិទ្យាតាមលក្ខខណ្ឌ y ដែលជាមុខងារនៃអាគុយម៉ង់ x/ (/ = 1, 2, ..., k) និងថេរ ឯករាជ្យនៃ អាគុយម៉ង់ ភាពខុសគ្នា y 2 ។
ជាទូទៅ គំរូលីនេអ៊ែរនៃការវិភាគតំរែតំរង់មានទម្រង់៖
យ = យ k j=0ក្នុង jគ j(x 1 , x 2 . . .. , x k) + អ៊ី
ដែល c j គឺជាមុខងារមួយចំនួននៃអថេររបស់វា - x 1 , x 2 ។ . .. ,x k , E គឺជាអថេរចៃដន្យដែលមានការរំពឹងទុកគណិតវិទ្យាសូន្យ និងបំរែបំរួល y 2 ។
នៅក្នុងការវិភាគតំរែតំរង់ ប្រភេទនៃសមីការតំរែតំរង់ត្រូវបានជ្រើសរើសដោយផ្អែកលើលក្ខណៈរូបវន្តនៃបាតុភូតដែលកំពុងសិក្សា និងលទ្ធផលនៃការសង្កេត។
ការប៉ាន់ប្រមាណនៃប៉ារ៉ាម៉ែត្រដែលមិនស្គាល់នៃសមីការតំរែតំរង់ជាធម្មតាត្រូវបានរកឃើញដោយវិធីសាស្ត្រការ៉េតិចបំផុត។ ខាងក្រោមនេះយើងនឹងនិយាយអំពីបញ្ហានេះដោយលម្អិតបន្ថែមទៀត។
សមីការតំរែតំរង់លីនេអ៊ែរពីរវិមាត្រ។ អនុញ្ញាតឱ្យដោយផ្អែកលើការវិភាគនៃបាតុភូតដែលកំពុងសិក្សាវាត្រូវបានសន្មត់ថានៅក្នុង "មធ្យម" y មានមុខងារលីនេអ៊ែរនៃ x ពោលគឺមានសមីការតំរែតំរង់។
y \u003d M (y / x) \u003d នៅ 0 + នៅ 1 x)
ដែល M(y1x) គឺជាការរំពឹងទុកគណិតវិទ្យាតាមលក្ខខណ្ឌនៃអថេរចៃដន្យ y សម្រាប់ x ដែលបានផ្តល់ឱ្យ។ នៅ 0 និងនៅ 1 - ប៉ារ៉ាម៉ែត្រដែលមិនស្គាល់នៃប្រជាជនទូទៅដែលគួរតែត្រូវបានប៉ាន់ប្រមាណពីលទ្ធផលនៃការសង្កេតគំរូ។
ឧបមាថាដើម្បីប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រនៅ 0 និងនៅ 1 គំរូនៃទំហំ n ត្រូវបានគេយកពីចំនួនប្រជាជនទូទៅពីរវិមាត្រ (x, y) ដែល (x, y,) គឺជាលទ្ធផលនៃការសង្កេត i-th (i = 1, 2, ... , ន) ។ ក្នុងករណីនេះ គំរូការវិភាគតំរែតំរង់មានទម្រង់៖
y j = នៅ 0 + នៅ 1 x + e j ។
ដែល e j .- ឯករាជ្យជាធម្មតាចែកចាយអថេរចៃដន្យជាមួយនឹងការរំពឹងទុកគណិតវិទ្យាសូន្យ និងបំរែបំរួល y 2 ពោលគឺ M e j . = 0;
D e j .= y 2 ចំេពាះ i = 1, 2,... , n ។
យោងតាមវិធីសាស្ត្រការេតិចបំផុត ជាការប៉ាន់ស្មាននៃប៉ារ៉ាម៉ែត្រដែលមិនស្គាល់នៅ 0 និងនៅ 1 មួយគួរតែយកតម្លៃបែបនេះនៃលក្ខណៈគំរូ b 0 និង b 1 ដែលកាត់បន្ថយផលបូកនៃគម្លាតការេនៃតម្លៃនៃលទ្ធផល។ លក្ខណៈពិសេស y i ពីការរំពឹងទុកគណិតវិទ្យាតាមលក្ខខណ្ឌ? ខ្ញុំ
យើងនឹងពិចារណាអំពីវិធីសាស្រ្តសម្រាប់កំណត់ឥទ្ធិពលនៃលក្ខណៈទីផ្សារលើប្រាក់ចំណេញរបស់សហគ្រាសដោយប្រើឧទាហរណ៍នៃសហគ្រាសធម្មតាចំនួនដប់ប្រាំពីរដែលមានទំហំមធ្យម និងសូចនាករនៃសកម្មភាពសេដ្ឋកិច្ច។
នៅពេលដោះស្រាយបញ្ហា លក្ខណៈខាងក្រោមត្រូវបានគេយកមកពិចារណា ត្រូវបានកំណត់ថាជាចំណុចសំខាន់បំផុត (សំខាន់) ដែលជាលទ្ធផលនៃការស្ទង់មតិកម្រងសំណួរ៖
* សកម្មភាពច្នៃប្រឌិតរបស់សហគ្រាស;
* ធ្វើផែនការជួរនៃផលិតផល;
* ការបង្កើតគោលនយោបាយតម្លៃ;
* ទំនាក់ទំនងសាធារណៈ;
* ប្រព័ន្ធទីផ្សារ;
* ប្រព័ន្ធលើកទឹកចិត្តបុគ្គលិក។
ដោយផ្អែកលើប្រព័ន្ធនៃការប្រៀបធៀបដោយកត្តា មេទ្រីការ៉េនៃការនៅជាប់គ្នាត្រូវបានសាងសង់ ដែលក្នុងនោះតម្លៃនៃអាទិភាពទាក់ទងសម្រាប់កត្តានីមួយៗត្រូវបានគណនា៖ សកម្មភាពច្នៃប្រឌិតរបស់សហគ្រាស ការធ្វើផែនការជួរនៃផលិតផល គោលការណ៍កំណត់តម្លៃ ការផ្សាយពាណិជ្ជកម្ម។ ទំនាក់ទំនងសាធារណៈ ប្រព័ន្ធលក់ ប្រព័ន្ធលើកទឹកចិត្តបុគ្គលិក។
ការប៉ាន់ប្រមាណនៃអាទិភាពសម្រាប់កត្តា "ទំនាក់ទំនងជាមួយសាធារណៈជន" ត្រូវបានទទួលជាលទ្ធផលនៃការស្ទង់មតិរបស់អ្នកឯកទេសរបស់ក្រុមហ៊ុន។ ការរចនាខាងក្រោមត្រូវបានទទួលយក៖ > (ប្រសើរជាង), > (ប្រសើរជាង ឬដូចគ្នា), = (ស្មើ),< (хуже или одинаково), <
បន្ទាប់មកបញ្ហានៃការវាយតម្លៃដ៏ទូលំទូលាយនៃកម្រិតនៃការធ្វើទីផ្សាររបស់សហគ្រាសត្រូវបានដោះស្រាយ។ នៅពេលគណនាសូចនាករ សារៈសំខាន់ (ទម្ងន់) នៃលក្ខណៈជាក់លាក់ដែលបានពិចារណាត្រូវបានកំណត់ ហើយបញ្ហានៃការផ្លាស់ប្តូរលីនេអ៊ែរនៃសូចនាករជាក់លាក់ត្រូវបានដោះស្រាយ។ ដំណើរការទិន្នន័យត្រូវបានអនុវត្តតាមកម្មវិធីដែលបានបង្កើតជាពិសេស។
បន្ទាប់មក ការវាយតម្លៃដ៏ទូលំទូលាយនៃកម្រិតនៃការធ្វើទីផ្សាររបស់សហគ្រាសត្រូវបានគណនា - មេគុណទីផ្សារដែលត្រូវបានបញ្ចូលក្នុងតារាងទី 1។ លើសពីនេះ តារាងខាងលើរួមបញ្ចូលសូចនាករដែលកំណត់លក្ខណៈសហគ្រាសទាំងមូល។ ទិន្នន័យនៅក្នុងតារាងនឹងត្រូវបានប្រើសម្រាប់ការវិភាគតំរែតំរង់។ លទ្ធផលគឺប្រាក់ចំណេញ។ រួមជាមួយនឹងមេគុណទីផ្សារ សូចនាករខាងក្រោមត្រូវបានប្រើជាសញ្ញាកត្តា៖ បរិមាណនៃទិន្នផលសរុប តម្លៃនៃទ្រព្យសកម្មថេរ ចំនួនបុគ្គលិក មេគុណឯកទេស។
តារាងទី 1 - ទិន្នន័យដំបូងសម្រាប់ការវិភាគតំរែតំរង់
ដោយផ្អែកលើទិន្នន័យក្នុងតារាង និងលើមូលដ្ឋាននៃកត្តាដែលមានតម្លៃសំខាន់បំផុតនៃមេគុណទំនាក់ទំនង មុខងារតំរែតំរង់នៃការពឹងផ្អែកនៃប្រាក់ចំណេញលើកត្តាត្រូវបានបង្កើតឡើង។
សមីការតំរែតំរង់នៅក្នុងករណីរបស់យើងនឹងមានទម្រង់៖
មេគុណនៃសមីការតំរែតំរង់និយាយអំពីឥទ្ធិពលបរិមាណនៃកត្តាដែលបានពិភាក្សាខាងលើលើចំនួនប្រាក់ចំណេញ។ ពួកគេបង្ហាញពីចំនួនពាន់រូប្លិ៍តម្លៃរបស់វាផ្លាស់ប្តូរនៅពេលដែលសញ្ញាកត្តាផ្លាស់ប្តូរដោយឯកតាមួយ។ ដូចខាងក្រោមពីសមីការការកើនឡើងនៃសមាមាត្រល្បាយទីផ្សារដោយឯកតាមួយផ្តល់នូវការកើនឡើងនៃប្រាក់ចំណេញ 1547.7 ពាន់រូប្លិ៍។ នេះបង្ហាញថាមានសក្ដានុពលដ៏ធំសម្បើមសម្រាប់ការកែលម្អដំណើរការសេដ្ឋកិច្ចរបស់សហគ្រាសក្នុងការកែលម្អសកម្មភាពទីផ្សារ។
នៅក្នុងការសិក្សាអំពីប្រសិទ្ធភាពទីផ្សារ កត្តាដែលគួរឱ្យចាប់អារម្មណ៍ និងសំខាន់បំផុតគឺកត្តា X5 - មេគុណទីផ្សារ។ អនុលោមតាមទ្រឹស្ដីស្ថិតិ អត្ថប្រយោជន៍នៃសមីការតំរែតំរង់ច្រើនដែលមានស្រាប់គឺសមត្ថភាពក្នុងការវាយតម្លៃឥទ្ធិពលដាច់ស្រយាលនៃកត្តានីមួយៗ រួមទាំងកត្តាទីផ្សារ។
លទ្ធផលនៃការវិភាគតំរែតំរង់ត្រូវបានអនុវត្តក៏ត្រូវបានគេប្រើយ៉ាងទូលំទូលាយជាងការគណនាប៉ារ៉ាម៉ែត្រនៃសមីការ។ លក្ខណៈវិនិច្ឆ័យសម្រាប់ការចាត់ថ្នាក់ (Kef,) សហគ្រាសថាល្អជាង ឬទាបជាងនេះ គឺផ្អែកលើសូចនាករទាក់ទងនៃលទ្ធផល៖
ដែលជាកន្លែងដែល Y facti គឺជាតម្លៃពិតប្រាកដនៃសហគ្រាស i-th, ពាន់រូប្លិ៍;
Y គណនា - តម្លៃនៃប្រាក់ចំណេញរបស់សហគ្រាស i-th ដែលទទួលបានដោយការគណនាយោងទៅតាមសមីការតំរែតំរង់
នៅក្នុងលក្ខខណ្ឌនៃបញ្ហាដែលកំពុងត្រូវបានដោះស្រាយតម្លៃត្រូវបានគេហៅថា "កត្តាប្រសិទ្ធភាព" ។ សកម្មភាពរបស់សហគ្រាសអាចចាត់ទុកថាមានប្រសិទ្ធភាពក្នុងករណីដែលតម្លៃនៃមេគុណធំជាងមួយ។ នេះមានន័យថាប្រាក់ចំណេញពិតប្រាកដគឺធំជាងប្រាក់ចំណេញជាមធ្យមលើគំរូ។
តម្លៃប្រាក់ចំណេញជាក់ស្តែង និងគណនាត្រូវបានបង្ហាញក្នុងតារាង។ ២.
តារាងទី 2 - ការវិភាគលើលក្ខណៈមានប្រសិទ្ធភាពក្នុងគំរូតំរែតំរង់
ការវិភាគតារាងបង្ហាញថាក្នុងករណីរបស់យើងសកម្មភាពរបស់សហគ្រាស 3, 5, 7, 9, 12, 14, 15, 17 សម្រាប់រយៈពេលដែលកំពុងត្រួតពិនិត្យអាចចាត់ទុកថាទទួលបានជោគជ័យ។
គោលដៅសំខាន់នៃការវិភាគតំរែតំរង់មាននៅក្នុងការកំណត់ទម្រង់វិភាគនៃទំនាក់ទំនង ដែលការផ្លាស់ប្តូរនៃគុណលក្ខណៈលទ្ធផលគឺដោយសារឥទ្ធិពលនៃសញ្ញាកត្តាមួយ ឬច្រើន ហើយសំណុំនៃកត្តាផ្សេងទៀតទាំងអស់ដែលប៉ះពាល់ដល់គុណលក្ខណៈលទ្ធផលគឺត្រូវបានយកជាតម្លៃថេរ និងមធ្យម។ .ភារកិច្ចនៃការវិភាគតំរែតំរង់:
ក) ការបង្កើតទម្រង់នៃការពឹងផ្អែក។ ទាក់ទងនឹងធម្មជាតិនិងទម្រង់នៃទំនាក់ទំនងរវាងបាតុភូតមានលីនេអ៊ែរវិជ្ជមាននិងមិនលីនេអ៊ែរនិងអវិជ្ជមានលីនេអ៊ែរនិងមិនលីនេអ៊ែរតំរែតំរង់។
ខ) និយមន័យនៃអនុគមន៍តំរែតំរង់ក្នុងទម្រង់នៃសមីការគណិតវិទ្យានៃប្រភេទមួយ ឬមួយផ្សេងទៀត និងបង្កើតឥទ្ធិពលនៃអថេរពន្យល់លើអថេរអាស្រ័យ។
គ) ការប៉ាន់ប្រមាណតម្លៃដែលមិនស្គាល់នៃអថេរអាស្រ័យ។ ដោយប្រើមុខងារតំរែតំរង់ អ្នកអាចបង្កើតឡើងវិញនូវតម្លៃនៃអថេរអាស្រ័យក្នុងចន្លោះពេលនៃតម្លៃដែលបានផ្តល់ឱ្យនៃអថេរពន្យល់ (ឧ. ដោះស្រាយបញ្ហា interpolation) ឬវាយតម្លៃដំណើរការនៃដំណើរការនៅខាងក្រៅចន្លោះពេលដែលបានបញ្ជាក់ (ឧ។ ដោះស្រាយបញ្ហាបន្ថែម) ។ លទ្ធផលគឺជាការប៉ាន់ប្រមាណតម្លៃនៃអថេរអាស្រ័យ។
តំរែតំរង់គូ - សមីការនៃទំនាក់ទំនងនៃអថេរពីរ y និង x: y = f (x) ដែល y គឺជាអថេរអាស្រ័យ (សញ្ញាលទ្ធផល); x - ឯករាជ្យ អថេរពន្យល់ (លក្ខណៈ-កត្តា)។
មានតំរែតំរង់លីនេអ៊ែរនិងមិនលីនេអ៊ែរ។
តំរែតំរង់លីនេអ៊ែរ៖ y = a + bx + ε
តំរែតំរង់មិនមែនលីនេអ៊ែរត្រូវបានបែងចែកជាពីរថ្នាក់៖ តំរែតំរង់ដែលមិនមែនជាលីនេអ៊ែរទាក់ទងនឹងអថេរពន្យល់ដែលបានរួមបញ្ចូលក្នុងការវិភាគ ប៉ុន្តែលីនេអ៊ែរទាក់ទងនឹងប៉ារ៉ាម៉ែត្រប៉ាន់ស្មាន និងតំរែតំរង់ដែលមិនមែនជាលីនេអ៊ែរទាក់ទងនឹងប៉ារ៉ាម៉ែត្រប៉ាន់ស្មាន។
តំរែតំរង់ដែលមិនមែនជាលីនេអ៊ែរក្នុងអថេរពន្យល់៖
តំរែតំរង់ដែលមិនមែនជាលីនេអ៊ែរក្នុងប៉ារ៉ាម៉ែត្រប៉ាន់ស្មាន៖
- អំណាច y = a x b ε
- អិចស្ប៉ូណង់ស្យែល y = a b x ε
- អិចស្ប៉ូណង់ស្យែល y=e a+b x ε
.
សម្រាប់សមីការលីនេអ៊ែរ និងមិនលីនេអ៊ែរ កាត់បន្ថយទៅជាលីនេអ៊ែរ ប្រព័ន្ធខាងក្រោមត្រូវបានដោះស្រាយសម្រាប់ a និង b៖
អ្នកអាចប្រើរូបមន្តដែលត្រៀមរួចជាស្រេចដែលធ្វើតាមពីប្រព័ន្ធនេះ៖
ភាពជិតស្និទ្ធនៃការតភ្ជាប់រវាងបាតុភូតដែលបានសិក្សាត្រូវបានប៉ាន់ប្រមាណដោយមេគុណទំនាក់ទំនងគូលីនេអ៊ែរ r xy សម្រាប់តំរែតំរង់លីនេអ៊ែរ (-1≤r xy ≤1):
និងសន្ទស្សន៍ទំនាក់ទំនង p xy - សម្រាប់តំរែតំរង់មិនមែនលីនេអ៊ែរ (0≤p xy ≤1):
ការវាយតម្លៃគុណភាពនៃគំរូដែលបានសាងសង់នឹងត្រូវបានផ្តល់ដោយមេគុណ (សន្ទស្សន៍) នៃការកំណត់ ក៏ដូចជាកំហុសជាមធ្យមប្រហាក់ប្រហែល។
កំហុសប្រហាក់ប្រហែលជាមធ្យមគឺជាគម្លាតមធ្យមនៃតម្លៃដែលបានគណនាពីតម្លៃជាក់ស្តែង៖
.
ដែនកំណត់ដែលអាចអនុញ្ញាតបាននៃតម្លៃ A - មិនលើសពី 8-10% ។
មេគុណមធ្យមនៃការបត់បែន E បង្ហាញពីចំនួនភាគរយ ជាមធ្យម លទ្ធផល y នឹងផ្លាស់ប្តូរពីតម្លៃមធ្យមរបស់វាជាមធ្យម នៅពេលដែលកត្តា x ផ្លាស់ប្តូរ 1% ពីតម្លៃមធ្យមរបស់វា៖
.
ភារកិច្ចនៃការវិភាគនៃវ៉ារ្យង់គឺដើម្បីវិភាគភាពខុសគ្នានៃអថេរអាស្រ័យ:
∑(y-y)²=∑(y x -y)²+∑(y-y x)²
ដែល ∑(y-y)² ជាផលបូកសរុបនៃគម្លាតការេ;
∑(y x -y)² - ផលបូកនៃគម្លាតការេដោយសារការតំរែតំរង់ ("ពន្យល់" ឬ "កត្តា");
∑(y-y x)² - ផលបូកដែលនៅសល់នៃគម្លាតការេ។
ចំណែកនៃបំរែបំរួលដែលត្រូវបានពន្យល់ដោយការតំរែតំរង់នៅក្នុងវ៉ារ្យ៉ង់សរុបនៃលក្ខណៈប្រសិទ្ធភាព y ត្រូវបានកំណត់លក្ខណៈដោយមេគុណ (សន្ទស្សន៍) នៃការកំណត់ R2៖
មេគុណនៃការកំណត់គឺជាការ៉េនៃមេគុណ ឬសន្ទស្សន៍ទំនាក់ទំនង។
F-test - ការវាយតម្លៃគុណភាពនៃសមីការតំរែតំរង់ - មាននៅក្នុងការធ្វើតេស្តសម្មតិកម្មប៉ុន្តែអំពីភាពមិនសំខាន់នៃស្ថិតិនៃសមីការតំរែតំរង់និងសូចនាករនៃភាពជិតស្និទ្ធនៃការតភ្ជាប់។ ចំពោះបញ្ហានេះ ការប្រៀបធៀបនៃការពិត F ពិតប្រាកដ និងតារាង F សំខាន់ (តារាង) នៃតម្លៃនៃលក្ខណៈវិនិច្ឆ័យ F-Fisher ត្រូវបានអនុវត្ត។ F ការពិតត្រូវបានកំណត់ដោយសមាមាត្រនៃតម្លៃនៃបំរែបំរួលនៃកត្តានិងសំណល់ដែលត្រូវបានគណនាសម្រាប់កម្រិតមួយនៃសេរីភាព៖
,
ដែល n ជាចំនួនឯកតាប្រជាជន; m គឺជាចំនួនប៉ារ៉ាម៉ែត្រសម្រាប់អថេរ x ។
តារាង F គឺជាតម្លៃអតិបរមាដែលអាចធ្វើបាននៃលក្ខណៈវិនិច្ឆ័យដែលស្ថិតនៅក្រោមឥទ្ធិពលនៃកត្តាចៃដន្យសម្រាប់កម្រិតនៃសេរីភាព និងសារៈសំខាន់ដែលបានផ្តល់ឱ្យ a ។ កម្រិតសារៈសំខាន់ a - ប្រូបាប៊ីលីតេនៃការបដិសេធសម្មតិកម្មត្រឹមត្រូវដែលផ្តល់ថាវាជាការពិត។ ជាធម្មតា a ត្រូវបានគេយកស្មើនឹង 0.05 ឬ 0.01 ។
ប្រសិនបើតារាង F< F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >F គឺជាការពិត បន្ទាប់មកសម្មតិកម្ម H អំពីមិនត្រូវបានច្រានចោលទេ ហើយភាពមិនសំខាន់នៃស្ថិតិ ភាពមិនគួរឱ្យទុកចិត្តនៃសមីការតំរែតំរង់ត្រូវបានទទួលស្គាល់។
ដើម្បីវាយតម្លៃសារៈសំខាន់ស្ថិតិនៃតំរែតំរង់តំរែតំរង់និងមេគុណជាប់ទាក់ទងគ្នា ការធ្វើតេស្ត t និងចន្លោះពេលទំនុកចិត្តរបស់សិស្សសម្រាប់សូចនាករនីមួយៗត្រូវបានគណនា។ សម្មតិកម្ម H អំពីលក្ខណៈចៃដន្យនៃសូចនាករត្រូវបានដាក់ទៅមុខ ពោលគឺឧ។ អំពីភាពខុសគ្នាមិនសំខាន់របស់ពួកគេពីសូន្យ។ ការវាយតម្លៃពីសារៈសំខាន់នៃតំរែតំរង់តំរែតំរង់និងមេគុណជាប់ទាក់ទងគ្នាដោយប្រើតេស្ត t របស់សិស្សត្រូវបានអនុវត្តដោយការប្រៀបធៀបតម្លៃរបស់ពួកគេជាមួយនឹងទំហំនៃកំហុសចៃដន្យ:
; ; .
កំហុសចៃដន្យនៃប៉ារ៉ាម៉ែត្រតំរែតំរង់លីនេអ៊ែរ និងមេគុណជាប់ទាក់ទងគ្នាត្រូវបានកំណត់ដោយរូបមន្ត៖
ការប្រៀបធៀបតម្លៃជាក់ស្តែង និងសំខាន់ (តារាង) នៃស្ថិតិ t - t tabl និង t fact - យើងទទួលយក ឬបដិសេធសម្មតិកម្ម H o ។
ទំនាក់ទំនងរវាង Fisher's F-test និង t-statistics របស់សិស្សត្រូវបានបង្ហាញដោយសមភាព
ប្រសិនបើ t តារាង< t факт то H o отклоняется, т.е. a , b и r xy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл >t ការពិតដែលថាសម្មតិកម្ម H អំពីមិនត្រូវបានបដិសេធទេហើយធម្មជាតិចៃដន្យនៃការបង្កើត a, b ឬ r xy ត្រូវបានទទួលស្គាល់។
ដើម្បីគណនាចន្លោះពេលទំនុកចិត្ត យើងកំណត់កំហុសរឹម D សម្រាប់សូចនាករនីមួយៗ៖
Δ a = t តារាង m a , Δ b = t តារាង m b ។
រូបមន្តសម្រាប់គណនាចន្លោះពេលទំនុកចិត្តមានដូចខាងក្រោម៖
γ a \u003d aΔ a; γ a \u003d a-Δ a; γ a = a + Δa
γ b = bΔ b ; γ b = b-Δ b ; γb = b + Δb
ប្រសិនបើសូន្យធ្លាក់ក្នុងព្រំដែននៃចន្លោះពេលទំនុកចិត្ត ឧ។ ប្រសិនបើដែនកំណត់ទាបគឺអវិជ្ជមាន ហើយដែនកំណត់ខាងលើគឺវិជ្ជមាន នោះប៉ារ៉ាម៉ែត្រប៉ាន់ស្មានត្រូវបានសន្មត់ថាជាសូន្យ ព្រោះវាមិនអាចទទួលយកបានទាំងតម្លៃវិជ្ជមាន និងអវិជ្ជមានក្នុងពេលដំណាលគ្នា។
តម្លៃព្យាករណ៍ y p ត្រូវបានកំណត់ដោយការជំនួសតម្លៃ (ការព្យាករណ៍) ដែលត្រូវគ្នា x p ទៅក្នុងសមីការតំរែតំរង់ y x = a+b·x ។ កំហុសស្តង់ដារជាមធ្យមនៃការព្យាករណ៍ m y x ត្រូវបានគណនា៖
,
កន្លែងណា
ហើយចន្លោះពេលទំនុកចិត្តនៃការព្យាករណ៍ត្រូវបានបង្កើតឡើង៖
γ y x = y p Δ y p ; γ y x min = y p - Δ y p ; γ y x max = y p + Δ y p
ដែល Δ y x = t តារាង · m y x ។
ឧទាហរណ៍នៃដំណោះស្រាយ
លេខកិច្ចការ 1 ។ សម្រាប់ទឹកដីចំនួនប្រាំពីរនៃតំបន់ Ural សម្រាប់ 199X តម្លៃនៃសញ្ញាពីរត្រូវបានគេស្គាល់។តារាងទី 1 ។
ទាមទារ៖ 1. ដើម្បីកំណត់លក្ខណៈអាស្រ័យនៃ y លើ x គណនាប៉ារ៉ាម៉ែត្រនៃអនុគមន៍ខាងក្រោម៖
ក) លីនេអ៊ែរ;
b) ច្បាប់អំណាច (ពីមុនវាចាំបាច់ដើម្បីអនុវត្តនីតិវិធីនៃលីនេអ៊ែរនៃអថេរដោយយកលោការីតនៃផ្នែកទាំងពីរ);
គ) ការបង្ហាញ;
ឃ) អ៊ីពែបូឡាសមភាព (អ្នកក៏ត្រូវរកវិធីកំណត់ជាមុននូវគំរូនេះផងដែរ)។
2. វាយតម្លៃគំរូនីមួយៗតាមរយៈកំហុសប្រហាក់ប្រហែលជាមធ្យម A និង Fisher's F-test ។
ដំណោះស្រាយ (ជម្រើសទី ១)
ដើម្បីគណនាប៉ារ៉ាម៉ែត្រ a និង b នៃតំរែតំរង់លីនេអ៊ែរ y=a+b·x (ការគណនាអាចធ្វើឡើងដោយប្រើម៉ាស៊ីនគិតលេខ)។ដោះស្រាយប្រព័ន្ធនៃសមីការធម្មតាដោយគោរព កនិង ខ៖
ដោយផ្អែកលើទិន្នន័យដំបូង យើងគណនា ∑y, ∑x, ∑y x, ∑x², ∑y²:
y | x | yx | x2 | y2 | y x | y-y x | អាយ | |
លីត្រ | 68,8 | 45,1 | 3102,88 | 2034,01 | 4733,44 | 61,3 | 7,5 | 10,9 |
2 | 61,2 | 59,0 | 3610,80 | 3481,00 | 3745,44 | 56,5 | 4,7 | 7,7 |
3 | 59,9 | 57,2 | 3426,28 | 3271,84 | 3588,01 | 57,1 | 2,8 | 4,7 |
4 | 56,7 | 61,8 | 3504,06 | 3819,24 | 3214,89 | 55,5 | 1,2 | 2,1 |
5 | 55,0 | 58,8 | 3234,00 | 3457,44 | 3025,00 | 56,5 | -1,5 | 2,7 |
6 | 54,3 | 47,2 | 2562,96 | 2227,84 | 2948,49 | 60,5 | -6,2 | 11,4 |
7 | 49,3 | 55,2 | 2721,36 | 3047,04 | 2430,49 | 57,8 | -8,5 | 17,2 |
សរុប | 405,2 | 384,3 | 22162,34 | 21338,41 | 23685,76 | 405,2 | 0,0 | 56,7 |
ថ្ងៃពុធ តម្លៃ (សរុប/n) | 57,89 y | 54,90 x | 3166,05 x y | 3048,34 x² | 3383,68 y² | X | X | 8,1 |
ស | 5,74 | 5,86 | X | X | X | X | X | X |
ស២ | 32,92 | 34,34 | X | X | X | X | X | X |
a=y -b x = 57.89+0.35 54.9 ≈ 76.88
សមីការតំរែតំរង់៖ y= 76,88 - 0,35X.ជាមួយនឹងការកើនឡើងនៃប្រាក់ឈ្នួលប្រចាំថ្ងៃជាមធ្យម 1 ជូត។ ចំណែកនៃការចំណាយលើការទិញផលិតផលម្ហូបអាហារត្រូវបានកាត់បន្ថយជាមធ្យម 0.35% ពិន្ទុ។
គណនាមេគុណលីនេអ៊ែរនៃទំនាក់ទំនងគូ៖
ការទំនាក់ទំនងគឺមធ្យម, បញ្ច្រាស។
ចូរកំណត់មេគុណនៃការកំណត់៖ r² xy =(-0.35)=0.127
បំរែបំរួល 12.7% នៅក្នុងលទ្ធផលត្រូវបានពន្យល់ដោយការប្រែប្រួលនៃកត្តា x ។ ការជំនួសតម្លៃជាក់ស្តែងទៅក្នុងសមីការតំរែតំរង់ Xយើងកំណត់តម្លៃទ្រឹស្តី (គណនា) នៃ y x ។ ចូរយើងស្វែងរកតម្លៃនៃកំហុសប្រហាក់ប្រហែលជាមធ្យម A៖
ជាមធ្យម តម្លៃដែលបានគណនាខុសពីតម្លៃជាក់ស្តែង 8.1%។
តោះគណនា F-criterion៖
តម្លៃដែលទទួលបានបង្ហាញពីតម្រូវការក្នុងការទទួលយកសម្មតិកម្ម H 0 អំពីលក្ខណៈចៃដន្យនៃការពឹងផ្អែកដែលបានបង្ហាញនិងភាពមិនសំខាន់នៃស្ថិតិនៃប៉ារ៉ាម៉ែត្រនៃសមីការនិងសូចនាករនៃភាពតឹងនៃការតភ្ជាប់។
1 ខ។ការសាងសង់គំរូថាមពល y = a x b គឺមុនដោយដំណើរការលីនេអ៊ែរនៃអថេរ។ ក្នុងឧទាហរណ៍ លីនេអ៊ែរត្រូវធ្វើឡើងដោយយកលោការីតនៃភាគីទាំងពីរនៃសមីការ៖
lg y = lg a + b lg x
Y=C+b Y
ដែល Y=lg(y), X=lg(x), C=lg(a)។
សម្រាប់ការគណនា យើងប្រើទិន្នន័យក្នុងតារាង។ ១.៣.
តារាង 1.3
យ | X | YX | យ២ | x2 | y x | y-y x | (y-yx)² | អាយ | |
1 | 1,8376 | 1,6542 | 3,0398 | 3,3768 | 2,7364 | 61,0 | 7,8 | 60,8 | 11,3 |
2 | 1,7868 | 1,7709 | 3,1642 | 3,1927 | 3,1361 | 56,3 | 4,9 | 24,0 | 8,0 |
3 | 1,7774 | 1,7574 | 3,1236 | 3,1592 | 3,0885 | 56,8 | 3,1 | 9,6 | 5,2 |
4 | 1,7536 | 1,7910 | 3,1407 | 3,0751 | 3,2077 | 55,5 | 1,2 | 1,4 | 2,1 |
5 | 1,7404 | 1,7694 | 3,0795 | 3,0290 | 3,1308 | 56,3 | -1,3 | 1,7 | 2,4 |
6 | 1,7348 | 1,6739 | 2,9039 | 3,0095 | 2,8019 | 60,2 | -5,9 | 34,8 | 10,9 |
7 | 1,6928 | 1,7419 | 2,9487 | 2,8656 | 3,0342 | 57,4 | -8,1 | 65,6 | 16,4 |
សរុប | 12,3234 | 12,1587 | 21,4003 | 21,7078 | 21,1355 | 403,5 | 1,7 | 197,9 | 56,3 |
មធ្យម | 1,7605 | 1,7370 | 3,0572 | 3,1011 | 3,0194 | X | X | 28,27 | 8,0 |
σ | 0,0425 | 0,0484 | X | X | X | X | X | X | X |
σ២ | 0,0018 | 0,0023 | X | X | X | X | X | X | X |
គណនា C និង b៖
C=Y -b X = 1.7605+0.298 1.7370 = 2.278126
យើងទទួលបានសមីការលីនេអ៊ែរ៖ Y=2.278-0.298 X
បន្ទាប់ពីបង្កើនកម្លាំងហើយ យើងទទួលបាន៖ y=10 2.278 x -0.298
ការជំនួសនៅក្នុងសមីការនេះ តម្លៃជាក់ស្តែង X,យើងទទួលបានតម្លៃទ្រឹស្តីនៃលទ្ធផល។ ដោយផ្អែកលើពួកវាយើងគណនាសូចនាករ: ភាពតឹងនៃការតភ្ជាប់ - សន្ទស្សន៍ទំនាក់ទំនង p xy និងកំហុសប្រហាក់ប្រហែលជាមធ្យម A ។
លក្ខណៈនៃគំរូថាមពលបង្ហាញថាវាពិពណ៌នាអំពីទំនាក់ទំនងល្អជាងមុខងារលីនេអ៊ែរ។
1 វ. ការបង្កើតសមីការនៃខ្សែកោងអិចស្ប៉ូណង់ស្យែល y \u003d a b x ត្រូវបានបន្តដោយនីតិវិធីសម្រាប់កំណត់អថេរនៅពេលយកលោការីតនៃផ្នែកទាំងពីរនៃសមីការ៖
lg y = lg a + x lg ខ
Y=C+B x
សម្រាប់ការគណនាយើងប្រើទិន្នន័យតារាង។
យ | x | យស | យ២ | x2 | y x | y-y x | (y-yx)² | អាយ | |
1 | 1,8376 | 45,1 | 82,8758 | 3,3768 | 2034,01 | 60,7 | 8,1 | 65,61 | 11,8 |
2 | 1,7868 | 59,0 | 105,4212 | 3,1927 | 3481,00 | 56,4 | 4,8 | 23,04 | 7,8 |
3 | 1,7774 | 57,2 | 101,6673 | 3,1592 | 3271,84 | 56,9 | 3,0 | 9,00 | 5,0 |
4 | 1,7536 | 61,8 | 108,3725 | 3,0751 | 3819,24 | 55,5 | 1,2 | 1,44 | 2,1 |
5 | 1,7404 | 58,8 | 102,3355 | 3,0290 | 3457,44 | 56,4 | -1,4 | 1,96 | 2,5 |
6 | 1,7348 | 47,2 | 81,8826 | 3,0095 | 2227,84 | 60,0 | -5,7 | 32,49 | 10,5 |
7 | 1,6928 | 55,2 | 93,4426 | 2,8656 | 3047,04 | 57,5 | -8,2 | 67,24 | 16,6 |
សរុប | 12,3234 | 384,3 | 675,9974 | 21,7078 | 21338,41 | 403,4 | -1,8 | 200,78 | 56,3 |
ថ្ងៃពុធ zn. | 1,7605 | 54,9 | 96,5711 | 3,1011 | 3048,34 | X | X | 28,68 | 8,0 |
σ | 0,0425 | 5,86 | X | X | X | X | X | X | X |
σ២ | 0,0018 | 34,339 | X | X | X | X | X | X | X |
តម្លៃនៃប៉ារ៉ាម៉ែត្រតំរែតំរង់ A និង អេស្មើនឹង៖
A=Y -B x = 1.7605+0.0023 54.9 = 1.887
សមីការលីនេអ៊ែរត្រូវបានទទួល៖ Y=1.887-0.0023x ។ យើងពង្រឹងសមីការលទ្ធផល ហើយសរសេរវាក្នុងទម្រង់ធម្មតា៖
y x =10 1.887 10 -0.0023x = 77.1 0.9947 x
យើងប៉ាន់ស្មានភាពតឹងនៃទំនាក់ទំនងតាមរយៈសន្ទស្សន៍ទំនាក់ទំនង p xy៖