ការវិភាគតំរែតំរង់ជាជំហាន ៗ ។ មូលដ្ឋានគ្រឹះនៃតំរែតំរង់លីនេអ៊ែរ

ការវិភាគតំរែតំរង់និងទំនាក់ទំនង - វិធីសាស្រ្តស្រាវជ្រាវស្ថិតិ។ ទាំងនេះគឺជាវិធីសាមញ្ញបំផុតដើម្បីបង្ហាញពីភាពអាស្រ័យនៃប៉ារ៉ាម៉ែត្រលើអថេរឯករាជ្យមួយ ឬច្រើន។

ខាងក្រោមនេះ ដោយប្រើឧទាហរណ៍ជាក់ស្តែង យើងនឹងពិចារណាការវិភាគទាំងពីរនេះ ដែលមានប្រជាប្រិយភាពខ្លាំងក្នុងចំណោមអ្នកសេដ្ឋកិច្ច។ យើងក៏នឹងផ្តល់ឧទាហរណ៍នៃការទទួលបានលទ្ធផលនៅពេលដែលពួកគេត្រូវបានបញ្ចូលគ្នា។

ការវិភាគតំរែតំរង់ក្នុង Excel

បង្ហាញឥទ្ធិពលនៃតម្លៃមួយចំនួន (ឯករាជ្យ ឯករាជ្យ) លើអថេរអាស្រ័យ។ ជាឧទាហរណ៍ របៀបដែលចំនួនប្រជាជនសកម្មសេដ្ឋកិច្ចអាស្រ័យលើចំនួនសហគ្រាស ប្រាក់ឈ្នួល និងប៉ារ៉ាម៉ែត្រផ្សេងទៀត។ ឬ៖ តើការវិនិយោគបរទេស តម្លៃថាមពល... ប៉ះពាល់ដល់កម្រិត GDP យ៉ាងដូចម្តេច?

លទ្ធផលនៃការវិភាគអនុញ្ញាតឱ្យអ្នកកំណត់អាទិភាព។ ហើយផ្អែកលើកត្តាសំខាន់ៗ ដើម្បីទស្សន៍ទាយ រៀបចំផែនការអភិវឌ្ឍន៍តំបន់អាទិភាព ធ្វើការសម្រេចចិត្តគ្រប់គ្រង។

ការតំរែតំរង់កើតឡើង៖

  • លីនេអ៊ែរ (y = a + bx);
  • parabolic (y = a + bx + cx 2);
  • អិចស្ប៉ូណង់ស្យែល (y = a * exp(bx));
  • ថាមពល (y = a*x^b);
  • អ៊ីពែរបូល (y = b/x + a);
  • លោការីត (y = b * 1n(x) + a);
  • អិចស្ប៉ូណង់ស្យែល (y = a * b^x) ។

ពិចារណាឧទាហរណ៍នៃការកសាងគំរូតំរែតំរង់នៅក្នុង Excel និងបកស្រាយលទ្ធផល។ ចូរយើងយកប្រភេទនៃតំរែតំរង់លីនេអ៊ែរ។

កិច្ចការ។ នៅសហគ្រាសចំនួន 6 ប្រាក់ខែជាមធ្យមប្រចាំខែ និងចំនួនបុគ្គលិកដែលបានចាកចេញត្រូវបានវិភាគ។ វាចាំបាច់ដើម្បីកំណត់ភាពអាស្រ័យនៃចំនួននិយោជិតចូលនិវត្តន៍លើប្រាក់ខែជាមធ្យម។

គំរូតំរែតំរង់លីនេអ៊ែរមានទម្រង់ដូចខាងក្រោមៈ

Y \u003d a 0 + a 1 x 1 + ... + a k x k ។

ដែល a ជាមេគុណតំរែតំរង់នោះ x គឺជាអថេរដែលមានឥទ្ធិពល ហើយ k គឺជាចំនួនកត្តា។

ក្នុងឧទាហរណ៍របស់យើង Y គឺជាសូចនាករនៃការឈប់ធ្វើការរបស់កម្មករ។ កត្តាដែលមានឥទ្ធិពលគឺប្រាក់ឈ្នួល (x) ។

Excel មានមុខងារភ្ជាប់មកជាមួយដែលអាចត្រូវបានប្រើដើម្បីគណនាប៉ារ៉ាម៉ែត្រនៃគំរូតំរែតំរង់លីនេអ៊ែរ។ ប៉ុន្តែ Analysis ToolPak add-in នឹងធ្វើវាលឿនជាងមុន។

បើកដំណើរការឧបករណ៍វិភាគដ៏មានឥទ្ធិពល៖

នៅពេលដែលបានធ្វើឱ្យសកម្ម កម្មវិធីបន្ថែមនឹងមាននៅក្រោមផ្ទាំងទិន្នន័យ។

ឥឡូវនេះយើងនឹងដោះស្រាយដោយផ្ទាល់ជាមួយនឹងការវិភាគតំរែតំរង់។



ដំបូងយើងយកចិត្តទុកដាក់លើ R-square និងមេគុណ។

R-square គឺជាមេគុណនៃការកំណត់។ ក្នុងឧទាហរណ៍របស់យើងវាគឺ 0.755 ឬ 75.5% ។ នេះមានន័យថាប៉ារ៉ាម៉ែត្រគណនានៃគំរូពន្យល់ពីទំនាក់ទំនងរវាងប៉ារ៉ាម៉ែត្រដែលបានសិក្សាដោយ 75.5% ។ មេគុណនៃការកំណត់កាន់តែខ្ពស់ គំរូកាន់តែល្អ។ ល្អ - លើសពី 0.8 ។ ខ្សោយ - តិចជាង 0.5 (ការវិភាគបែបនេះមិនអាចចាត់ទុកថាសមហេតុផលទេ) ។ នៅក្នុងឧទាហរណ៍របស់យើង - "មិនអាក្រក់" ។

មេគុណ 64.1428 បង្ហាញថា Y នឹងទៅជាយ៉ាងណា ប្រសិនបើអថេរទាំងអស់នៅក្នុងគំរូដែលកំពុងពិចារណាគឺស្មើនឹង 0។ នោះគឺជាកត្តាផ្សេងទៀតដែលមិនត្រូវបានពិពណ៌នានៅក្នុងគំរូក៏ប៉ះពាល់ដល់តម្លៃនៃប៉ារ៉ាម៉ែត្រដែលបានវិភាគផងដែរ។

មេគុណ -0.16285 បង្ហាញពីទម្ងន់នៃអថេរ X នៅលើ Y. នោះគឺ ប្រាក់ខែជាមធ្យមប្រចាំខែនៅក្នុងគំរូនេះប៉ះពាល់ដល់ចំនួនអ្នកឈប់ដែលមានទម្ងន់ -0.16285 (នេះគឺជាកម្រិតតូចមួយនៃឥទ្ធិពល)។ សញ្ញា “-” បង្ហាញពីផលប៉ះពាល់អវិជ្ជមាន៖ ប្រាក់ខែកាន់តែខ្ពស់ ការឈប់សម្រាកតិច។ ដែលយុត្តិធម៌។



ការវិភាគទំនាក់ទំនងក្នុង Excel

ការវិភាគទំនាក់ទំនងជួយបង្កើតថាតើមានទំនាក់ទំនងរវាងសូចនាករនៅក្នុងគំរូមួយ ឬពីរ។ ឧទាហរណ៍រវាងពេលវេលាប្រតិបត្តិការរបស់ម៉ាស៊ីននិងតម្លៃនៃការជួសជុលតម្លៃឧបករណ៍និងរយៈពេលនៃប្រតិបត្តិការកម្ពស់និងទម្ងន់របស់កុមារជាដើម។

ប្រសិនបើមានទំនាក់ទំនងនោះថាតើការកើនឡើងនៅក្នុងប៉ារ៉ាម៉ែត្រមួយនាំឱ្យមានការកើនឡើង (ទំនាក់ទំនងវិជ្ជមាន) ឬការថយចុះ (អវិជ្ជមាន) នៅក្នុងផ្សេងទៀត។ ការវិភាគទំនាក់ទំនងជួយអ្នកវិភាគកំណត់ថាតើតម្លៃនៃសូចនាករមួយអាចត្រូវបានប្រើដើម្បីទស្សន៍ទាយតម្លៃដែលអាចមានរបស់មួយផ្សេងទៀត។

មេគុណទំនាក់ទំនងត្រូវបានតំណាង r ។ ប្រែប្រួលពី +1 ដល់ -1 ។ ការចាត់ថ្នាក់នៃទំនាក់ទំនងសម្រាប់តំបន់ផ្សេងៗគ្នានឹងខុសគ្នា។ នៅពេលតម្លៃមេគុណគឺ 0 វាមិនមានទំនាក់ទំនងលីនេអ៊ែររវាងគំរូទេ។

ពិចារណាពីរបៀបប្រើ Excel ដើម្បីស្វែងរកមេគុណទំនាក់ទំនង។

អនុគមន៍ CORREL ត្រូវបានប្រើដើម្បីស្វែងរកមេគុណដែលបានផ្គូផ្គង។

កិច្ចការ៖ កំណត់ថាតើមានទំនាក់ទំនងរវាងពេលវេលាប្រតិបត្តិការរបស់ម៉ាស៊ីនកំដៅ និងតម្លៃនៃការថែទាំរបស់វា។

ដាក់ទស្សន៍ទ្រនិចក្នុងក្រឡាណាមួយ ហើយចុចប៊ូតុង fx ។

  1. នៅក្នុងប្រភេទ "ស្ថិតិ" ជ្រើសរើសមុខងារ CORREL ។
  2. អាគុយម៉ង់ "អារេ 1" - ជួរដំបូងនៃតម្លៃ - ពេលវេលារបស់ម៉ាស៊ីន: A2: A14 ។
  3. អាគុយម៉ង់ "អារេ 2" - ជួរទីពីរនៃតម្លៃ - តម្លៃនៃការជួសជុល: B2: B14 ។ ចុចយល់ព្រម។

ដើម្បីកំណត់ប្រភេទនៃការតភ្ជាប់អ្នកត្រូវមើលចំនួនដាច់ខាតនៃមេគុណ (វាលនៃសកម្មភាពនីមួយៗមានមាត្រដ្ឋានផ្ទាល់ខ្លួនរបស់វា) ។

សម្រាប់ការវិភាគទំនាក់ទំនងនៃប៉ារ៉ាម៉ែត្រជាច្រើន (ច្រើនជាង 2) វាកាន់តែងាយស្រួលប្រើ "ការវិភាគទិន្នន័យ" (កម្មវិធីបន្ថែម "កញ្ចប់វិភាគ") ។ នៅក្នុងបញ្ជី អ្នកត្រូវជ្រើសរើសការជាប់ទាក់ទងគ្នា និងកំណត់អារេមួយ។ ទាំងអស់។

មេគុណលទ្ធផលនឹងត្រូវបានបង្ហាញនៅក្នុងម៉ាទ្រីសទំនាក់ទំនង។ ចូលចិត្ត​មួយ​នេះ:

ការវិភាគទំនាក់ទំនង - តំរែតំរង់

នៅក្នុងការអនុវត្ត បច្ចេកទេសទាំងពីរនេះច្រើនតែប្រើជាមួយគ្នា។

ឧទាហរណ៍៖


ឥឡូវនេះទិន្នន័យការវិភាគតំរែតំរង់អាចមើលឃើញ។

នៅក្នុងគំរូស្ថិតិ ការវិភាគតំរែតំរង់គឺជាការសិក្សាដែលប្រើដើម្បីវាយតម្លៃទំនាក់ទំនងរវាងអថេរ។ វិធីសាស្រ្តគណិតវិទ្យានេះរួមបញ្ចូលវិធីសាស្រ្តផ្សេងទៀតជាច្រើនសម្រាប់ការធ្វើគំរូ និងការវិភាគអថេរច្រើននៅពេលដែលផ្តោតទៅលើទំនាក់ទំនងរវាងអថេរអាស្រ័យ និងអថេរឯករាជ្យមួយឬច្រើន។ ពិសេសជាងនេះទៅទៀត ការវិភាគតំរែតំរង់ជួយអ្នកឱ្យយល់ពីរបៀបដែលតម្លៃធម្មតានៃការផ្លាស់ប្តូរអថេរអាស្រ័យ ប្រសិនបើអថេរឯករាជ្យមួយផ្លាស់ប្តូរ ខណៈពេលដែលអថេរឯករាជ្យផ្សេងទៀតនៅតែថេរ។

ក្នុងគ្រប់ករណីទាំងអស់ ពិន្ទុគោលដៅគឺជាមុខងារនៃអថេរឯករាជ្យ ហើយត្រូវបានគេហៅថាមុខងារតំរែតំរង់។ នៅក្នុងការវិភាគតំរែតំរង់ វាក៏មានការចាប់អារម្មណ៍ផងដែរក្នុងការកំណត់លក្ខណៈនៃការផ្លាស់ប្តូរនៅក្នុងអថេរអាស្រ័យជាមុខងារនៃតំរែតំរង់ ដែលអាចត្រូវបានពិពណ៌នាដោយប្រើការចែកចាយប្រូបាប៊ីលីតេ។

ភារកិច្ចនៃការវិភាគតំរែតំរង់

វិធីសាស្រ្តស្រាវជ្រាវស្ថិតិនេះត្រូវបានគេប្រើយ៉ាងទូលំទូលាយសម្រាប់ការព្យាករណ៍ ដែលការប្រើប្រាស់របស់វាមានអត្ថប្រយោជន៍យ៉ាងសំខាន់ ប៉ុន្តែជួនកាលវាអាចនាំឱ្យមានការបំភាន់ ឬទំនាក់ទំនងមិនពិត ដូច្នេះវាត្រូវបានណែនាំឱ្យប្រើវាដោយប្រុងប្រយ័ត្នក្នុងសំណួរនេះ ព្រោះឧទាហរណ៍ ការជាប់ទាក់ទងគ្នាមិនមានន័យថា បុព្វហេតុ។

វិធីសាស្រ្តមួយចំនួនធំត្រូវបានបង្កើតឡើងសម្រាប់អនុវត្តការវិភាគតំរែតំរង់ ដូចជាលីនេអ៊ែរ និងតំរែតំរង់ការ៉េតិចបំផុតដែលជាប៉ារ៉ាម៉ែត្រ។ ខ្លឹមសាររបស់ពួកគេគឺថាមុខងារតំរែតំរង់ត្រូវបានកំណត់ក្នុងលក្ខខណ្ឌនៃចំនួនកំណត់នៃប៉ារ៉ាម៉ែត្រដែលមិនស្គាល់ដែលត្រូវបានប៉ាន់ស្មានពីទិន្នន័យ។ ការតំរែតំរង់ nonparametric អនុញ្ញាតឱ្យមុខងាររបស់វាស្ថិតនៅក្នុងសំណុំមុខងារជាក់លាក់ ដែលអាចមានលក្ខណៈគ្មានកំណត់។

ជាវិធីសាស្រ្តស្រាវជ្រាវស្ថិតិ ការវិភាគតំរែតំរង់ក្នុងការអនុវត្តគឺអាស្រ័យលើទម្រង់នៃដំណើរការបង្កើតទិន្នន័យ និងរបៀបដែលវាទាក់ទងនឹងវិធីសាស្រ្តតំរែតំរង់។ ដោយសារទម្រង់ពិតនៃដំណើរការទិន្នន័យដែលបង្កើតជាធម្មតាជាលេខដែលមិនស្គាល់ ការវិភាគតំរែតំរង់ទិន្នន័យជារឿយៗអាស្រ័យលើវិសាលភាពមួយចំនួនលើការសន្មត់អំពីដំណើរការនេះ។ ការសន្មត់ទាំងនេះជួនកាលអាចសាកល្បងបានប្រសិនបើមានទិន្នន័យគ្រប់គ្រាន់។ គំរូតំរែតំរង់ច្រើនតែមានប្រយោជន៍ ទោះបីជាការសន្មត់ត្រូវបានបំពានកម្រិតមធ្យមក៏ដោយ ទោះបីពួកវាអាចមិនដំណើរការល្អបំផុតក៏ដោយ។

ក្នុងន័យតូចចង្អៀត ការតំរែតំរង់អាចសំដៅជាពិសេសទៅលើការប៉ាន់ប្រមាណនៃអថេរឆ្លើយតបជាបន្ត ផ្ទុយពីអថេរឆ្លើយតបដាច់ដោយឡែកដែលប្រើក្នុងចំណាត់ថ្នាក់។ ករណីនៃអថេរទិន្នផលបន្តត្រូវបានគេហៅថា តំរែតំរង់ម៉ែត្រ ដើម្បីសម្គាល់វាពីបញ្ហាពាក់ព័ន្ធ។

រឿង

ទម្រង់ដំបូងនៃការតំរែតំរង់គឺជាវិធីសាស្ត្រដែលគេស្គាល់យ៉ាងច្បាស់នៃការ៉េតិចបំផុត។ វាត្រូវបានបោះពុម្ពដោយ Legendre ក្នុងឆ្នាំ 1805 និងដោយ Gauss ក្នុងឆ្នាំ 1809 ។ Legendre និង Gauss បានអនុវត្តវិធីសាស្រ្តចំពោះបញ្ហានៃការកំណត់ពីការសង្កេតតារាសាស្ត្រនៃគន្លងនៃសាកសពជុំវិញព្រះអាទិត្យ (ភាគច្រើនជាផ្កាយដុះកន្ទុយ ប៉ុន្តែក្រោយមកក៏បានរកឃើញភពតូចៗផងដែរ) ។ Gauss បានបោះពុម្ភការវិវឌ្ឍន៍បន្ថែមនៃទ្រឹស្តីនៃការ៉េតិចបំផុតនៅឆ្នាំ 1821 រួមទាំងការប្រែប្រួលនៃទ្រឹស្តីបទ Gauss-Markov ។

ពាក្យ "តំរែតំរង់" ត្រូវបានបង្កើតឡើងដោយ Francis Galton ក្នុងសតវត្សទី 19 ដើម្បីពិពណ៌នាអំពីបាតុភូតជីវសាស្រ្ត។ ចំណុចសំខាន់គឺថាការលូតលាស់នៃកូនចៅពីការលូតលាស់របស់ដូនតាជាក្បួនថយចុះទៅមធ្យមធម្មតា។ សម្រាប់ Galton ការតំរែតំរង់មានតែអត្ថន័យជីវសាស្រ្តនេះប៉ុណ្ណោះ ប៉ុន្តែក្រោយមកការងាររបស់គាត់ត្រូវបានយកដោយ Udni Yoley និង Karl Pearson ហើយយកទៅក្នុងបរិបទស្ថិតិទូទៅបន្ថែមទៀត។ នៅក្នុងការងាររបស់ Yule និង Pearson ការចែកចាយរួមគ្នានៃការឆ្លើយតប និងអថេរពន្យល់ត្រូវបានចាត់ទុកថាជា Gaussian ។ ការសន្មត់នេះត្រូវបានបដិសេធដោយ Fischer នៅក្នុងឯកសារឆ្នាំ 1922 និង 1925 ។ Fisher បានស្នើថាការចែកចាយតាមលក្ខខណ្ឌនៃអថេរឆ្លើយតបគឺ Gaussian ប៉ុន្តែការចែកចាយរួមគ្នាមិនចាំបាច់ទេ។ ក្នុងន័យនេះ សំណូមពររបស់ Fisher គឺកាន់តែខិតជិតទៅនឹងរូបមន្តឆ្នាំ 1821 របស់ Gauss ។ មុនឆ្នាំ 1970 ពេលខ្លះវាត្រូវចំណាយពេល 24 ម៉ោងដើម្បីទទួលបានលទ្ធផលនៃការវិភាគតំរែតំរង់។

វិធីសាស្រ្តនៃការវិភាគតំរែតំរង់បន្តជាតំបន់នៃការស្រាវជ្រាវសកម្ម។ ក្នុងប៉ុន្មានទសវត្សរ៍ថ្មីៗនេះ វិធីសាស្រ្តថ្មីត្រូវបានបង្កើតឡើងសម្រាប់ការតំរែតំរង់ដ៏រឹងមាំ។ ការតំរែតំរង់ដែលទាក់ទងនឹងការឆ្លើយតបដែលទាក់ទងគ្នា; វិធីសាស្រ្តតំរែតំរង់ដែលសម្របសម្រួលប្រភេទផ្សេងៗនៃទិន្នន័យដែលបាត់; តំរែតំរង់ nonparametric; វិធីសាស្រ្តតំរែតំរង់ Bayesian; តំរែតំរង់ដែលអថេរទស្សន៍ទាយត្រូវបានវាស់ដោយមានកំហុស; ការតំរែតំរង់ជាមួយនឹងការទស្សន៍ទាយច្រើនជាងការសង្កេត និងការសន្និដ្ឋានមូលហេតុជាមួយនឹងការតំរែតំរង់។

ម៉ូដែលតំរែតំរង់

គំរូការវិភាគតំរែតំរង់រួមមានអថេរដូចខាងក្រោមៈ

  • ប៉ារ៉ាម៉ែត្រមិនស្គាល់ តំណាងថាជាបេតា ដែលអាចជាមាត្រដ្ឋាន ឬវ៉ិចទ័រ។
  • អថេរឯករាជ្យ, X.
  • អថេរអាស្រ័យ, Y.

នៅក្នុងផ្នែកផ្សេងៗនៃវិទ្យាសាស្ត្រដែលការវិភាគតំរែតំរង់ត្រូវបានអនុវត្ត ពាក្យផ្សេងគ្នាត្រូវបានប្រើជំនួសឱ្យអថេរអាស្រ័យ និងឯករាជ្យ ប៉ុន្តែក្នុងគ្រប់ករណីទាំងអស់ គំរូតំរែតំរង់ទាក់ទងនឹង Y ទៅមុខងារនៃ X និង β។

ការប៉ាន់ស្មានជាធម្មតាត្រូវបានបង្កើតជា E (Y | X) = F (X, β) ។ ដើម្បីអនុវត្តការវិភាគតំរែតំរង់ ទម្រង់នៃអនុគមន៍ f ត្រូវតែកំណត់។ កម្រជាងនេះទៅទៀត វាគឺផ្អែកលើចំណេះដឹងអំពីទំនាក់ទំនងរវាង Y និង X ដែលមិនពឹងផ្អែកលើទិន្នន័យ។ ប្រសិនបើចំណេះដឹងបែបនេះមិនមានទេ នោះទម្រង់ F ដែលអាចបត់បែនបាន ឬងាយស្រួលត្រូវបានជ្រើសរើស។

អថេរអាស្រ័យ Y

ឥឡូវនេះ ចូរយើងសន្មតថាវ៉ិចទ័រនៃប៉ារ៉ាម៉ែត្រមិនស្គាល់ β មានប្រវែង k ។ ដើម្បីអនុវត្តការវិភាគតំរែតំរង់ អ្នកប្រើប្រាស់ត្រូវតែផ្តល់ព័ត៌មានអំពីអថេរអាស្រ័យ Y៖

  • ប្រសិនបើចំណុចទិន្នន័យ N នៃទម្រង់ (Y, X) ត្រូវបានអង្កេត ដែលជាកន្លែងដែល N< k, большинство классических подходов к регрессионному анализу не могут быть выполнены, так как система уравнений, определяющих модель регрессии в качестве недоопределенной, не имеет достаточного количества данных, чтобы восстановить β.
  • ប្រសិនបើ N = K ត្រូវបានគេសង្កេតឃើញ ហើយមុខងារ F គឺលីនេអ៊ែរ នោះសមីការ Y = F(X, β) អាចត្រូវបានដោះស្រាយយ៉ាងពិតប្រាកដ មិនមែនប្រមាណទេ។ នេះធ្វើឱ្យមានការដោះស្រាយសំណុំនៃសមីការ N ជាមួយ N-unknowns (ធាតុនៃ β) ដែលមានដំណោះស្រាយតែមួយគត់ ដរាបណា X គឺឯករាជ្យលីនេអ៊ែរ។ ប្រសិនបើ F មិនមែនជាលីនេអ៊ែរ ដំណោះស្រាយប្រហែលជាមិនមានទេ ឬអាចមានដំណោះស្រាយជាច្រើន។
  • ស្ថានភាពទូទៅបំផុតគឺកន្លែងដែលមាន N > ចង្អុលទៅទិន្នន័យ។ ក្នុងករណីនេះ មានព័ត៌មានគ្រប់គ្រាន់នៅក្នុងទិន្នន័យដើម្បីប៉ាន់ប្រមាណតម្លៃតែមួយគត់សម្រាប់ β ដែលសមបំផុតនឹងទិន្នន័យ ហើយគំរូតំរែតំរង់នៅពេលអនុវត្តចំពោះទិន្នន័យអាចត្រូវបានគេមើលឃើញថាជាប្រព័ន្ធបដិសេធក្នុង β ។

ក្នុងករណីចុងក្រោយ ការវិភាគតំរែតំរង់ផ្តល់ឧបករណ៍សម្រាប់៖

  • ការស្វែងរកដំណោះស្រាយសម្រាប់ប៉ារ៉ាម៉ែត្រដែលមិនស្គាល់ β ដែលនឹងជាឧទាហរណ៍ កាត់បន្ថយចម្ងាយរវាងតម្លៃដែលបានវាស់ និងព្យាករណ៍នៃ Y ។
  • នៅក្រោមការសន្មត់ស្ថិតិជាក់លាក់ ការវិភាគតំរែតំរង់ប្រើប្រាស់ព័ត៌មានលើសដើម្បីផ្តល់ព័ត៌មានស្ថិតិអំពីប៉ារ៉ាម៉ែត្រមិនស្គាល់ β និងតម្លៃព្យាករណ៍នៃអថេរអាស្រ័យ Y ។

ចំនួនដែលត្រូវការនៃការវាស់វែងឯករាជ្យ

ពិចារណាគំរូតំរែតំរង់ដែលមានប៉ារ៉ាម៉ែត្រមិនស្គាល់ចំនួនបី៖ β 0 β 1 និង β 2 ។ ចូរសន្មត់ថាអ្នកពិសោធន៍បង្កើតការវាស់វែងចំនួន 10 ក្នុងតម្លៃដូចគ្នានៃអថេរឯករាជ្យនៃវ៉ិចទ័រ X. ក្នុងករណីនេះ ការវិភាគតំរែតំរង់មិនផ្តល់សំណុំនៃតម្លៃតែមួយគត់ទេ។ ល្អបំផុតដែលអ្នកអាចធ្វើបានគឺការប៉ាន់ប្រមាណមធ្យម និងគម្លាតស្តង់ដារនៃអថេរអាស្រ័យ Y. ដូចគ្នានេះដែរ ដោយការវាស់តម្លៃពីរផ្សេងគ្នានៃ X អ្នកអាចទទួលបានទិន្នន័យគ្រប់គ្រាន់សម្រាប់ការតំរែតំរង់ជាមួយនឹងចំនួនមិនស្គាល់ពីរ ប៉ុន្តែមិនមែនសម្រាប់ចំនួនមិនស្គាល់បី ឬច្រើននោះទេ។ .

ប្រសិនបើការវាស់វែងរបស់អ្នកពិសោធន៍ត្រូវបានគេយកនៅតម្លៃបីផ្សេងគ្នានៃអថេរវ៉ិចទ័រឯករាជ្យ X នោះការវិភាគតំរែតំរង់នឹងផ្តល់នូវសំណុំនៃការប៉ាន់ប្រមាណតែមួយគត់សម្រាប់ប៉ារ៉ាម៉ែត្រមិនស្គាល់ចំនួនបីនៅក្នុងβ។

នៅក្នុងករណីនៃការតំរែតំរង់លីនេអ៊ែរទូទៅ សេចក្តីថ្លែងការណ៍ខាងលើគឺស្មើនឹងតម្រូវការដែលម៉ាទ្រីស X T X បញ្ច្រាស់។

ការសន្មត់ស្ថិតិ

នៅពេលដែលចំនួនរង្វាស់ N ធំជាងចំនួនប៉ារ៉ាម៉ែត្រដែលមិនស្គាល់ k និងកំហុសរង្វាស់ ε i បន្ទាប់មកជាក្បួនព័ត៌មានលើសដែលមាននៅក្នុងការវាស់វែងត្រូវបានចែកចាយ និងប្រើប្រាស់សម្រាប់ការព្យាករណ៍ស្ថិតិទាក់ទងនឹងប៉ារ៉ាម៉ែត្រមិនស្គាល់។ ពត៌មានលើសនេះត្រូវបានគេហៅថាកម្រិតនៃសេរីភាពនៃការតំរែតំរង់។

ការសន្មត់មូលដ្ឋាន

ការសន្មត់បុរាណសម្រាប់ការវិភាគតំរែតំរង់រួមមាន:

  • គំរូគឺជាតំណាងនៃការទស្សន៍ទាយការសន្និដ្ឋាន។
  • កំហុសគឺជាអថេរចៃដន្យដែលមានតម្លៃមធ្យមសូន្យ ដែលមានលក្ខខណ្ឌលើអថេរពន្យល់។
  • អថេរឯករាជ្យត្រូវបានវាស់វែងដោយគ្មានកំហុស។
  • ក្នុងនាមជាអថេរឯករាជ្យ (អ្នកទស្សន៍ទាយ) ពួកវាមានភាពឯករាជ្យលីនេអ៊ែរ ពោលគឺវាមិនអាចបង្ហាញការព្យាករណ៍ណាមួយជាបន្សំលីនេអ៊ែររបស់អ្នកដទៃបានទេ។
  • កំហុសមិនជាប់ទាក់ទងគ្នាទេ នោះគឺជាម៉ាទ្រីស error coariance matrix នៃអង្កត់ទ្រូង ហើយធាតុមិនសូន្យនីមួយៗគឺជាភាពខុសគ្នានៃកំហុស។
  • ភាពខុសគ្នានៃកំហុសគឺថេរឆ្លងកាត់ការសង្កេត (ភាពដូចគ្នា) ។ បើមិនដូច្នោះទេ ការ៉េដែលមានទម្ងន់តិចបំផុត ឬវិធីផ្សេងទៀតអាចត្រូវបានប្រើ។

លក្ខខណ្ឌគ្រប់គ្រាន់ទាំងនេះសម្រាប់ការប៉ាន់ប្រមាណការេតិចបំផុតមានលក្ខណៈសម្បត្តិដែលត្រូវការ ជាពិសេសការសន្មត់ទាំងនេះមានន័យថាការប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រនឹងមានគោលបំណង ស៊ីសង្វាក់គ្នា និងមានប្រសិទ្ធភាព ជាពិសេសនៅពេលយកមកពិចារណាក្នុងថ្នាក់នៃការប៉ាន់ប្រមាណលីនេអ៊ែរ។ វាជាការសំខាន់ក្នុងការកត់សម្គាល់ថាទិន្នន័យពិតប្រាកដកម្រនឹងបំពេញលក្ខខណ្ឌ។ នោះ​គឺ​ជា​វិធីសាស្ត្រ​ត្រូវ​បាន​ប្រើ​បើ​ទោះ​ជា​ការ​សន្មត​មិន​ត្រឹមត្រូវ​ក៏​ដោយ។ ការបំរែបំរួលពីការសន្មត់ពេលខ្លះអាចត្រូវបានប្រើជារង្វាស់នៃការប្រើប្រាស់គំរូ។ ការសន្មត់ទាំងនេះជាច្រើនអាចត្រូវបានបន្ធូរបន្ថយនៅក្នុងវិធីសាស្រ្តកម្រិតខ្ពស់បន្ថែមទៀត។ របាយការណ៍វិភាគស្ថិតិជាធម្មតារួមបញ្ចូលការវិភាគនៃការធ្វើតេស្តប្រឆាំងនឹងទិន្នន័យគំរូ និងវិធីសាស្រ្តសម្រាប់អត្ថប្រយោជន៍នៃគំរូ។

លើសពីនេះទៀតអថេរក្នុងករណីខ្លះសំដៅលើតម្លៃដែលបានវាស់នៅទីតាំងចំណុច។ វាអាចមាននិន្នាការលំហ និងទំនាក់ទំនងស្វ័យភាពនៃលំហនៅក្នុងអថេរដែលបំពានលើការសន្មត់ស្ថិតិ។ ការតំរែតំរង់តាមភូមិសាស្ត្រគឺជាវិធីសាស្រ្តតែមួយគត់ដែលទាក់ទងនឹងទិន្នន័យបែបនេះ។

នៅក្នុងតំរែតំរង់លីនេអ៊ែរ លក្ខណៈពិសេសគឺថា អថេរអាស្រ័យ ដែលជា Y i គឺជាការរួមបញ្ចូលគ្នាលីនេអ៊ែរនៃប៉ារ៉ាម៉ែត្រ។ ឧទាហរណ៍ ក្នុង​ការ​តំរែតំរង់​លីនេអ៊ែរ​សាមញ្ញ ការ​ធ្វើ​គំរូ​ចំណុច n ប្រើ​អថេរ​ឯករាជ្យ​មួយ x i និង​ប៉ារ៉ាម៉ែត្រ​ពីរ β 0 និង β 1 ។

នៅក្នុងការតំរែតំរង់លីនេអ៊ែរច្រើន មានអថេរឯករាជ្យមួយចំនួន ឬមុខងាររបស់វា។

នៅពេលយកគំរូដោយចៃដន្យពីចំនួនប្រជាជន ប៉ារ៉ាម៉ែត្ររបស់វាធ្វើឱ្យវាអាចទទួលបានគំរូនៃគំរូតំរែតំរង់លីនេអ៊ែរ។

ក្នុងទិដ្ឋភាពនេះ វិធីសាស្ត្រការ៉េតិចបំផុតគឺពេញនិយមបំផុត។ វាផ្តល់នូវការប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រដែលកាត់បន្ថយផលបូកនៃការ៉េនៃសំណល់។ ប្រភេទនៃការបង្រួមអប្បបរមានេះ (ដែលជាតួយ៉ាងនៃការតំរែតំរង់លីនេអ៊ែរ) នៃមុខងារនេះនាំទៅដល់សំណុំសមីការធម្មតា និងសំណុំនៃសមីការលីនេអ៊ែរជាមួយនឹងប៉ារ៉ាម៉ែត្រ ដែលត្រូវបានដោះស្រាយដើម្បីទទួលបានការប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រ។

ដោយសន្មត់បន្ថែមទៀតថា ជាទូទៅកំហុសចំនួនប្រជាជនរីករាលដាល អ្នកស្រាវជ្រាវអាចប្រើការប៉ាន់ប្រមាណនៃកំហុសស្តង់ដារទាំងនេះ ដើម្បីបង្កើតចន្លោះពេលទំនុកចិត្ត និងអនុវត្តការសាកល្បងសម្មតិកម្មអំពីប៉ារ៉ាម៉ែត្ររបស់វា។

ការវិភាគតំរែតំរង់មិនលីនេអ៊ែរ

ឧទាហរណ៍​ដែល​អនុគមន៍​មិន​ជា​លីនេអ៊ែរ​ទាក់ទង​នឹង​ប៉ារ៉ាម៉ែត្រ​បង្ហាញ​ថា​ផលបូក​នៃ​ការេ​គួរ​ត្រូវ​បាន​បង្រួម​អប្បបរមា​ជាមួយ​នឹង​នីតិវិធី​ដដែលៗ។ នេះណែនាំពីភាពស្មុគស្មាញជាច្រើនដែលកំណត់ភាពខុសគ្នារវាងវិធីសាស្ត្រការេតិចបំផុតលីនេអ៊ែរ និងមិនមែនលីនេអ៊ែរ។ អាស្រ័យហេតុនេះ លទ្ធផលនៃការវិភាគតំរែតំរង់នៅពេលប្រើវិធីសាស្ត្រមិនមែនលីនេអ៊ែរ ជួនកាលមិនអាចទាយទុកជាមុនបាន។

ការគណនាថាមពលនិងទំហំគំរូ

នៅទីនេះជាក្បួនមិនមានវិធីសាស្រ្តស្របគ្នាទាក់ទងនឹងចំនួននៃការសង្កេតធៀបនឹងចំនួនអថេរឯករាជ្យនៅក្នុងគំរូនោះទេ។ ច្បាប់ទីមួយត្រូវបានស្នើឡើងដោយ Dobra និង Hardin ហើយមើលទៅដូចជា N = t^n ដែល N ជាទំហំគំរូ n គឺជាចំនួននៃអថេរពន្យល់ ហើយ t គឺជាចំនួននៃការសង្កេតដែលត្រូវការដើម្បីសម្រេចបាននូវភាពត្រឹមត្រូវដែលចង់បាន ប្រសិនបើគំរូមាន អថេរពន្យល់តែមួយគត់។ ឧទាហរណ៍ អ្នកស្រាវជ្រាវបង្កើតគំរូតំរែតំរង់លីនេអ៊ែរដោយប្រើសំណុំទិន្នន័យដែលមានអ្នកជំងឺ 1000 នាក់ (N) ។ ប្រសិនបើអ្នកស្រាវជ្រាវសម្រេចថាការសង្កេតចំនួនប្រាំគឺចាំបាច់ដើម្បីកំណត់បន្ទាត់ (m) យ៉ាងត្រឹមត្រូវនោះ ចំនួនអតិបរិមានៃអថេរពន្យល់ដែលគំរូអាចគាំទ្រគឺ 4 ។

វិធីសាស្រ្តផ្សេងទៀត។

ទោះបីជាប៉ារ៉ាម៉ែត្រនៃគំរូតំរែតំរង់ជាធម្មតាត្រូវបានប៉ាន់ប្រមាណដោយប្រើវិធីសាស្ត្រការ៉េតិចបំផុតក៏ដោយ មានវិធីសាស្រ្តផ្សេងទៀតដែលត្រូវបានប្រើតិចជាញឹកញាប់។ ឧទាហរណ៍ទាំងនេះគឺជាវិធីសាស្រ្តដូចខាងក្រោម:

  • វិធីសាស្រ្ត Bayesian (ឧទាហរណ៍វិធីសាស្រ្ត Bayesian នៃតំរែតំរង់លីនេអ៊ែរ) ។
  • ការតំរែតំរង់ភាគរយដែលប្រើសម្រាប់ស្ថានភាពដែលកាត់បន្ថយកំហុសភាគរយត្រូវបានគេចាត់ទុកថាសមរម្យជាង។
  • គម្លាតដាច់ខាតតូចបំផុត ដែលរឹងមាំជាងនៅក្នុងវត្តមានរបស់ outliers ដែលនាំទៅដល់ការតំរែតំរង់បរិមាណ។
  • តំរែតំរង់ nonparametric ទាមទារចំនួនដ៏ច្រើននៃការសង្កេត និងការគណនា។
  • ចម្ងាយ​នៃ​ម៉ែត្រ​ការ​រៀន​ដែល​ត្រូវ​បាន​រៀន​ក្នុង​ការ​ស្វែង​រក​ម៉ែត្រ​ចម្ងាយ​ដែល​មាន​ន័យ​នៅ​ក្នុង​ចន្លោះ​បញ្ចូល​ដែល​បាន​ផ្តល់​ឱ្យ​។

កម្មវិធី

កញ្ចប់កម្មវិធីស្ថិតិសំខាន់ៗទាំងអស់ត្រូវបានអនុវត្តដោយប្រើការវិភាគតំរែតំរង់ការ៉េតិចបំផុត។ តំរែតំរង់លីនេអ៊ែរសាមញ្ញ និងការវិភាគតំរែតំរង់ច្រើនអាចត្រូវបានប្រើនៅក្នុងកម្មវិធីសៀវភៅបញ្ជីមួយចំនួន ក៏ដូចជាម៉ាស៊ីនគិតលេខមួយចំនួន។ ខណៈពេលដែលកញ្ចប់កម្មវិធីស្ថិតិជាច្រើនអាចអនុវត្តប្រភេទផ្សេងៗនៃការតំរែតំរង់ nonparametric និងរឹងមាំ វិធីសាស្ត្រទាំងនេះមិនមានលក្ខណៈស្តង់ដារទេ។ កញ្ចប់កម្មវិធីផ្សេងគ្នាអនុវត្តវិធីសាស្រ្តផ្សេងគ្នា។ កម្មវិធីតំរែតំរង់ឯកទេសត្រូវបានបង្កើតឡើងសម្រាប់ប្រើប្រាស់ក្នុងផ្នែកដូចជាការវិភាគស្ទង់មតិ និង neuroimaging ។

នៅក្នុងវត្តមាននៃការជាប់ទាក់ទងគ្នារវាងកត្តា និងសញ្ញាលទ្ធផល វេជ្ជបណ្ឌិតជារឿយៗត្រូវកំណត់ដោយចំនួនតម្លៃនៃសញ្ញាមួយអាចផ្លាស់ប្តូរនៅពេលដែលមួយផ្សេងទៀតត្រូវបានផ្លាស់ប្តូរដោយឯកតារង្វាស់ដែលជាទូទៅទទួលយក ឬបង្កើតឡើងដោយអ្នកស្រាវជ្រាវខ្លួនឯង។

ជាឧទាហរណ៍ តើទម្ងន់ខ្លួនរបស់សិស្សសាលាថ្នាក់ទី 1 (ក្មេងស្រី ឬក្មេងប្រុស) នឹងផ្លាស់ប្តូរយ៉ាងដូចម្តេច ប្រសិនបើកម្ពស់របស់ពួកគេកើនឡើង 1 សង់ទីម៉ែត្រ។ សម្រាប់គោលបំណងទាំងនេះ វិធីសាស្ត្រវិភាគការតំរែតំរង់ត្រូវបានប្រើប្រាស់។

ភាគច្រើនជាញឹកញាប់ វិធីសាស្ត្រវិភាគការតំរែតំរង់ត្រូវបានប្រើ ដើម្បីបង្កើតមាត្រដ្ឋានបទដ្ឋាន និងស្តង់ដារសម្រាប់ការអភិវឌ្ឍន៍រាងកាយ។

  1. និយមន័យនៃការតំរែតំរង់. ការតំរែតំរង់គឺជាអនុគមន៍ដែលអនុញ្ញាតដោយផ្អែកលើតម្លៃមធ្យមនៃគុណលក្ខណៈមួយ ដើម្បីកំណត់តម្លៃមធ្យមនៃគុណលក្ខណៈមួយផ្សេងទៀតដែលជាប់ទាក់ទងជាមួយគុណលក្ខណៈទីមួយ។

    ចំពោះគោលបំណងនេះមេគុណតំរែតំរង់និងប៉ារ៉ាម៉ែត្រមួយចំនួនផ្សេងទៀតត្រូវបានប្រើ។ ឧទាហរណ៍អ្នកអាចគណនាចំនួននៃជំងឺផ្តាសាយជាមធ្យមនៅតម្លៃជាក់លាក់នៃសីតុណ្ហភាពខ្យល់ប្រចាំខែជាមធ្យមនៅក្នុងរដូវស្លឹកឈើជ្រុះ - រដូវរងា។

  2. និយមន័យនៃមេគុណតំរែតំរង់. មេគុណតំរែតំរង់គឺជាតម្លៃដាច់ខាតដែលតម្លៃនៃគុណលក្ខណៈមួយផ្លាស់ប្តូរជាមធ្យមនៅពេលដែលគុណលក្ខណៈផ្សេងទៀតដែលទាក់ទងនឹងវាផ្លាស់ប្តូរដោយឯកតារង្វាស់ដែលបានបញ្ជាក់។
  3. រូបមន្តមេគុណតំរែតំរង់. R y / x \u003d r xy x (σ y / σ x)
    ដែល R y / x - មេគុណតំរែតំរង់;
    r xy - មេគុណទំនាក់ទំនងរវាងលក្ខណៈពិសេស x និង y;
    (σ y និង σ x) - គម្លាតស្តង់ដារនៃលក្ខណៈពិសេស x និង y ។

    នៅក្នុងឧទាហរណ៍របស់យើង;
    σ x = 4.6 (គម្លាតស្តង់ដារនៃសីតុណ្ហភាពខ្យល់នៅរដូវស្លឹកឈើជ្រុះ - រដូវរងា;
    σ y = 8.65 (គម្លាតស្តង់ដារនៃចំនួនជំងឺផ្តាសាយឆ្លង) ។
    ដូច្នេះ R y/x គឺជាមេគុណតំរែតំរង់។
    R y / x \u003d -0.96 x (4.6 / 8.65) \u003d 1.8, i.e. ជាមួយនឹងការថយចុះនៃសីតុណ្ហភាពខ្យល់ប្រចាំខែជាមធ្យម (x) ដោយ 1 ដឺក្រេ ចំនួនមធ្យមនៃជំងឺផ្តាសាយឆ្លង (y) នៅក្នុងរដូវស្លឹកឈើជ្រុះរដូវរងានឹងផ្លាស់ប្តូរចំនួន 1.8 ករណី។

  4. សមីការតំរែតំរង់. y \u003d M y + R y / x (x - M x)
    ដែល y គឺជាតម្លៃមធ្យមនៃគុណលក្ខណៈ ដែលគួរតែត្រូវបានកំណត់នៅពេលដែលតម្លៃមធ្យមនៃគុណលក្ខណៈផ្សេងទៀត (x) ផ្លាស់ប្តូរ;
    x - តម្លៃមធ្យមដែលគេស្គាល់នៃលក្ខណៈពិសេសមួយផ្សេងទៀត;
    R y/x - មេគុណតំរែតំរង់;
    M x, M y - ស្គាល់តម្លៃមធ្យមនៃលក្ខណៈពិសេស x និង y ។

    ឧទាហរណ៍ ចំនួនមធ្យមនៃជំងឺផ្តាសាយឆ្លង (y) អាចត្រូវបានកំណត់ដោយគ្មានការវាស់វែងពិសេសនៅតម្លៃមធ្យមណាមួយនៃសីតុណ្ហភាពខ្យល់ប្រចាំខែជាមធ្យម (x)។ ដូច្នេះប្រសិនបើ x \u003d - 9 °, R y / x \u003d 1.8 ជំងឺ, M x \u003d -7 °, M y \u003d 20 ជំងឺបន្ទាប់មក y \u003d 20 + 1.8 x (9-7) \u003d 20 + 3 .6 = 23.6 ជំងឺ។
    សមីការនេះត្រូវបានអនុវត្តនៅក្នុងករណីនៃទំនាក់ទំនងបន្ទាត់ត្រង់រវាងលក្ខណៈពិសេសពីរ (x និង y) ។

  5. គោលបំណងនៃសមីការតំរែតំរង់. សមីការតំរែតំរង់ត្រូវបានប្រើដើម្បីគូសបន្ទាត់តំរែតំរង់។ ក្រោយមកទៀតអនុញ្ញាតឱ្យដោយគ្មានការវាស់វែងពិសេសដើម្បីកំណត់តម្លៃមធ្យមណាមួយ (y) នៃគុណលក្ខណៈមួយ ប្រសិនបើតម្លៃ (x) នៃគុណលក្ខណៈផ្សេងទៀតផ្លាស់ប្តូរ។ ផ្អែកលើទិន្នន័យទាំងនេះ ក្រាហ្វមួយត្រូវបានបង្កើតឡើង - បន្ទាត់តំរែតំរង់ដែលអាចត្រូវបានប្រើដើម្បីកំណត់ចំនួនមធ្យមនៃជំងឺផ្តាសាយនៅតម្លៃណាមួយនៃសីតុណ្ហភាពប្រចាំខែជាមធ្យមក្នុងចន្លោះរវាងតម្លៃដែលបានគណនានៃចំនួនជំងឺផ្តាសាយ។
  6. Regression sigma (រូបមន្ត).
    ដែល σ Ru/x - sigma (គម្លាតស្តង់ដារ) នៃតំរែតំរង់;
    σ y គឺជាគម្លាតស្តង់ដារនៃលក្ខណៈពិសេស y;
    r xy - មេគុណទំនាក់ទំនងរវាងលក្ខណៈពិសេស x និង y ។

    ដូច្នេះប្រសិនបើ σ y គឺជាគម្លាតស្តង់ដារនៃចំនួនផ្តាសាយ = 8.65; r xy - មេគុណទំនាក់ទំនងរវាងចំនួននៃជំងឺផ្តាសាយ (y) និងសីតុណ្ហភាពខ្យល់ប្រចាំខែជាមធ្យមក្នុងរដូវស្លឹកឈើជ្រុះរដូវរងា (x) គឺ - 0.96 បន្ទាប់មក

  7. គោលបំណងនៃការតំរែតំរង់ sigma. ផ្តល់លក្ខណៈនៃរង្វាស់នៃភាពចម្រុះនៃលក្ខណៈលទ្ធផល (y)។

    ជាឧទាហរណ៍ វាកំណត់លក្ខណៈនៃភាពចម្រុះនៃចំនួនជំងឺផ្តាសាយនៅតម្លៃជាក់លាក់នៃសីតុណ្ហភាពខ្យល់ប្រចាំខែជាមធ្យមក្នុងអំឡុងរដូវស្លឹកឈើជ្រុះ-រដូវរងា។ ដូច្នេះចំនួនមធ្យមនៃជំងឺផ្តាសាយនៅសីតុណ្ហភាពខ្យល់ x 1 \u003d -6 °អាចមានចាប់ពី 15.78 ជំងឺដល់ 20.62 ជំងឺ។
    នៅ x 2 = -9° ចំនួនមធ្យមនៃជំងឺផ្តាសាយអាចមានចាប់ពី 21.18 ជំងឺដល់ 26.02 ជំងឺ។ល។

    regression sigma ត្រូវបានប្រើក្នុងការសាងសង់មាត្រដ្ឋានតំរែតំរង់ដែលឆ្លុះបញ្ចាំងពីគម្លាតនៃតម្លៃនៃគុណលក្ខណៈប្រសិទ្ធភាពពីតម្លៃមធ្យមរបស់វាដែលបានគ្រោងនៅលើបន្ទាត់តំរែតំរង់។

  8. ទិន្នន័យដែលត្រូវការដើម្បីគណនា និងគ្រោងមាត្រដ្ឋានតំរែតំរង់
    • មេគុណតំរែតំរង់ - Ry/x;
    • សមីការតំរែតំរង់ - y \u003d M y + R y / x (x-M x);
    • តំរែតំរង់ sigma - σ Rx/y
  9. លំដាប់នៃការគណនា និងតំណាងក្រាហ្វិកនៃមាត្រដ្ឋានតំរែតំរង់.
    • កំណត់មេគុណតំរែតំរង់ដោយរូបមន្ត (សូមមើលកថាខណ្ឌទី 3) ។ ជាឧទាហរណ៍ មនុស្សម្នាក់គួរតែកំណត់ថាតើទម្ងន់រាងកាយនឹងប្រែប្រួលជាមធ្យមប៉ុន្មាន (នៅអាយុជាក់លាក់មួយអាស្រ័យលើភេទ) ប្រសិនបើកម្ពស់ជាមធ្យមប្រែប្រួល 1 សង់ទីម៉ែត្រ។
    • យោងតាមរូបមន្តនៃសមីការតំរែតំរង់ (សូមមើលកថាខណ្ឌទី 4) កំណត់នូវអ្វីដែលនឹងជាមធ្យមឧទាហរណ៍ ទំងន់រាងកាយ (y, y 2, y 3 ...) * សម្រាប់តម្លៃកំណើនជាក់លាក់ (x, x 2, x ៣ ... ) ។
      ________________
      * តម្លៃនៃ "y" គួរតែត្រូវបានគណនាសម្រាប់តម្លៃដែលគេស្គាល់យ៉ាងហោចណាស់បីនៃ "x" ។

      ក្នុងពេលជាមួយគ្នានេះ តម្លៃមធ្យមនៃទំងន់រាងកាយ និងកម្ពស់ (M x, និង M y) សម្រាប់អាយុ និងភេទជាក់លាក់មួយត្រូវបានគេដឹង។

    • គណនា sigma នៃតំរែតំរង់ដោយដឹងពីតម្លៃដែលត្រូវគ្នានៃ σ y និង r xy ហើយជំនួសតម្លៃរបស់វាទៅក្នុងរូបមន្ត (សូមមើលកថាខណ្ឌទី 6)។
    • ដោយផ្អែកលើតម្លៃដែលគេស្គាល់ x 1, x 2, x 3 និងតម្លៃមធ្យមដែលត្រូវគ្នារបស់ពួកគេ y 1, y 2 y 3 ក៏ដូចជាតូចបំផុត (y - σ ru / x) និងធំបំផុត (y + σ ru / x) តម្លៃ \u200b\u200b(y) បង្កើតមាត្រដ្ឋានតំរែតំរង់។

      សម្រាប់តំណាងក្រាហ្វិកនៃមាត្រដ្ឋានតំរែតំរង់ តម្លៃ x, x 2, x 3 (អ័ក្ស y) ត្រូវបានសម្គាល់ដំបូងនៅលើក្រាហ្វ ឧ។ បន្ទាត់តំរែតំរង់ត្រូវបានបង្កើតឡើង ឧទាហរណ៍ ការពឹងផ្អែកនៃទំងន់រាងកាយ (y) លើកម្ពស់ (x) ។

      បន្ទាប់មកនៅចំណុចដែលត្រូវគ្នា y 1 , y 2 , y 3 តម្លៃលេខនៃការតំរែតំរង់ sigma ត្រូវបានសម្គាល់ i.e. នៅលើក្រាហ្វរកឃើញតម្លៃតូចបំផុត និងធំបំផុតនៃ y 1 , y 2 , y 3 ។

  10. ការប្រើប្រាស់ជាក់ស្តែងនៃមាត្រដ្ឋានតំរែតំរង់. មាត្រដ្ឋាន និងស្តង់ដារធម្មតាកំពុងត្រូវបានបង្កើតឡើង ជាពិសេសសម្រាប់ការអភិវឌ្ឍន៍រាងកាយ។ យោងតាមមាត្រដ្ឋានស្តង់ដារវាអាចធ្វើទៅបានដើម្បីផ្តល់ការវាយតម្លៃបុគ្គលអំពីការអភិវឌ្ឍន៍របស់កុមារ។ ទន្ទឹមនឹងនេះ ការអភិវឌ្ឍន៍រាងកាយត្រូវបានវាយតម្លៃថាមានភាពចុះសម្រុងគ្នា ប្រសិនបើឧទាហរណ៍ នៅកម្ពស់ជាក់លាក់មួយ ទម្ងន់រាងកាយរបស់កុមារស្ថិតក្នុងរង្វង់មួយនៃការតំរែតំរង់ទៅឯកតាគណនាជាមធ្យមនៃទំងន់រាងកាយ - (y) សម្រាប់កម្ពស់ដែលបានផ្តល់ឱ្យ (x) (y ± 1 σ Ry / x) ។

    ការអភិវឌ្ឍន៍រាងកាយត្រូវបានចាត់ទុកថាមិនចុះសម្រុងគ្នាក្នុងលក្ខខណ្ឌនៃទំងន់រាងកាយ ប្រសិនបើទម្ងន់រាងកាយរបស់កុមារសម្រាប់កម្ពស់ជាក់លាក់មួយស្ថិតនៅក្នុងការតំរែតំរង់ទីពីរ sigma: (y ± 2 σ Ry/x)

    ការអភិវឌ្ឍន៍រាងកាយនឹងមានភាពមិនចុះសម្រុងគ្នាយ៉ាងខ្លាំង ទាំងដោយសារតែទម្ងន់រាងកាយលើស និងមិនគ្រប់គ្រាន់ ប្រសិនបើទម្ងន់រាងកាយសម្រាប់កម្ពស់ជាក់លាក់មួយស្ថិតនៅក្នុងរង្វង់ទីបីនៃការតំរែតំរង់ (y ± 3 σ Ry / x) ។

យោងតាមលទ្ធផលនៃការសិក្សាស្ថិតិនៃការអភិវឌ្ឍន៍រាងកាយរបស់ក្មេងប្រុសអាយុ 5 ឆ្នាំវាត្រូវបានគេដឹងថាកម្ពស់ជាមធ្យមរបស់ពួកគេ (x) គឺ 109 សង់ទីម៉ែត្រហើយទម្ងន់ជាមធ្យមរបស់ពួកគេ (y) គឺ 19 គីឡូក្រាម។ មេគុណទំនាក់ទំនងរវាងកម្ពស់ និងទម្ងន់ខ្លួនគឺ +0.9 គម្លាតស្តង់ដារត្រូវបានបង្ហាញក្នុងតារាង។

ទាមទារ៖

  • គណនាមេគុណតំរែតំរង់;
  • ដោយប្រើសមីការតំរែតំរង់ កំណត់ថាតើទម្ងន់រាងកាយដែលរំពឹងទុករបស់ក្មេងប្រុសអាយុ 5 ឆ្នាំនឹងមានកម្ពស់ស្មើនឹង x1 = 100 សង់ទីម៉ែត្រ, x2 = 110 សង់ទីម៉ែត្រ, x3 = 120 សង់ទីម៉ែត្រ;
  • គណនាការតំរែតំរង់ sigma បង្កើតមាត្រដ្ឋានតំរែតំរង់បង្ហាញលទ្ធផលនៃដំណោះស្រាយរបស់វាតាមក្រាហ្វិក។
  • ទាញការសន្និដ្ឋានសមស្រប។

ស្ថានភាពនៃបញ្ហា និងលទ្ធផលនៃដំណោះស្រាយរបស់វាត្រូវបានបង្ហាញក្នុងតារាងសង្ខេប។

តារាងទី 1

លក្ខខណ្ឌនៃបញ្ហា លទ្ធផលនៃដំណោះស្រាយបញ្ហា
សមីការតំរែតំរង់ តំរែតំរង់ sigma មាត្រដ្ឋានតំរែតំរង់ (ទំងន់រាងកាយរំពឹងទុក (គិតជាគីឡូក្រាម))
σ r xy R y/x X នៅ σRx/y y - σ Rу/х y + σ Rу/х
1 2 3 4 5 6 7 8 9 10
កម្ពស់ (x) 109 សង់ទីម៉ែត្រ ± 4.4 សង់ទីម៉ែត្រ +0,9 0,16 100 សង់ទីម៉ែត្រ ១៧.៥៦ គីឡូក្រាម ± 0.35 គីឡូក្រាម ១៧,២១ គីឡូក្រាម ១៧,៩១ គីឡូក្រាម
ទំងន់រាងកាយ (y) 19 គីឡូក្រាម ± 0,8 គីឡូក្រាម 110 សង់ទីម៉ែត្រ 19.16 គីឡូក្រាម 18.81 គីឡូក្រាម 19.51 គីឡូក្រាម
120 សង់ទីម៉ែត្រ 20.76 គីឡូក្រាម 20.41 គីឡូក្រាម ២១,១១ គីឡូក្រាម

ការសម្រេចចិត្ត.

សេចក្តីសន្និដ្ឋាន។ដូច្នេះមាត្រដ្ឋានតំរែតំរង់នៅក្នុងតម្លៃគណនានៃទំងន់រាងកាយអនុញ្ញាតឱ្យអ្នកកំណត់វាសម្រាប់តម្លៃផ្សេងទៀតនៃការលូតលាស់ឬដើម្បីវាយតម្លៃការអភិវឌ្ឍន៍បុគ្គលរបស់កុមារ។ ដើម្បីធ្វើដូចនេះស្តារកាត់កែងទៅបន្ទាត់តំរែតំរង់។

  1. Vlasov V.V. រោគរាតត្បាត។ - M. : GEOTAR-MED, 2004. - 464 ទំ។
  2. Lisitsyn Yu.P. សុខភាពសាធារណៈ និងការថែទាំសុខភាព។ សៀវភៅសិក្សាសម្រាប់វិទ្យាល័យ។ - M. : GEOTAR-MED, 2007. - 512 ទំ។
  3. Medik V.A., Yuriev V.K. វគ្គបណ្តុះបណ្តាលស្តីពីសុខភាពសាធារណៈ និងការថែទាំសុខភាព៖ វគ្គ ១.សុខភាពសាធារណៈ។ - M. : ថ្នាំ, 2003. - 368 ទំ។
  4. Minyaev V.A., Vishnyakov N.I. និងផ្សេងៗទៀត។ ឱសថសង្គម និងអង្គការថែទាំសុខភាព (ការណែនាំជា 2 ភាគ)។ - សាំងពេទឺប៊ឺគឆ្នាំ 1998 -528 ទំ។
  5. Kucherenko V.Z., Agarkov N.M. និងផ្សេងៗទៀត អនាម័យសង្គម និងអង្គការនៃការថែទាំសុខភាព (ការបង្រៀន) - Moscow, 2000. - 432 p.
  6. S. Glantz ។ ស្ថិតិ Medico-ជីវសាស្រ្ត។ ពីភាសាអង់គ្លេស។ - M. , ការអនុវត្ត, 1998. - 459 ទំ។

បន្ទាប់ពីការវិភាគទំនាក់ទំនងបានបង្ហាញពីវត្តមាននៃទំនាក់ទំនងស្ថិតិរវាងអថេរ និងវាយតម្លៃកម្រិតនៃភាពតឹងរបស់វា ពួកគេជាធម្មតាបន្តទៅការពិពណ៌នាគណិតវិទ្យានៃប្រភេទភាពអាស្រ័យជាក់លាក់មួយដោយប្រើការវិភាគតំរែតំរង់។ ចំពោះគោលបំណងនេះ ថ្នាក់នៃអនុគមន៍មួយត្រូវបានជ្រើសរើសដែលទាក់ទងនឹងសូចនាករដែលមានប្រសិទ្ធភាព y និងអាគុយម៉ង់ x 1, x 2, ..., x ទៅនឹងអាគុយម៉ង់ព័ត៌មានច្រើនបំផុតត្រូវបានជ្រើសរើស ការប៉ាន់ប្រមាណតម្លៃមិនស្គាល់នៃប៉ារ៉ាម៉ែត្រនៃតំណភ្ជាប់ សមីការត្រូវបានគណនា ហើយលក្ខណៈសម្បត្តិនៃសមីការលទ្ធផលត្រូវបានវិភាគ។

អនុគមន៍ f (x 1, x 2, ... , x k) ដែលពិពណ៌នាអំពីភាពអាស្រ័យនៃតម្លៃមធ្យមនៃលក្ខណៈមានប្រសិទ្ធភាព y លើតម្លៃដែលបានផ្តល់ឱ្យនៃអាគុយម៉ង់ត្រូវបានគេហៅថា អនុគមន៍តំរែតំរង់ (សមីការ) ។ ពាក្យថា "តំរែតំរង់" (lat. - regression - retreat, return to something) ត្រូវបានណែនាំដោយអ្នកចិត្តសាស្រ្តអង់គ្លេស និង នរវិទ្យា F. Galton ហើយត្រូវបានភ្ជាប់ទាំងស្រុងជាមួយនឹងភាពជាក់លាក់នៃឧទាហរណ៍ជាក់ស្តែងដំបូងបង្អស់ដែលគំនិតនេះត្រូវបានប្រើ។ ដូច្នេះ ដំណើរការទិន្នន័យស្ថិតិទាក់ទងនឹងការវិភាគតំណពូជនៃការលូតលាស់ F. Galton បានរកឃើញថា ប្រសិនបើឪពុកខុសគ្នាពីកម្ពស់មធ្យមរបស់ឪពុកទាំងអស់ត្រឹម x អ៊ីញ នោះកូនប្រុសរបស់ពួកគេបែរចេញពីកម្ពស់ជាមធ្យមរបស់កូនប្រុសទាំងអស់តិចជាង x អ៊ីញ។ និន្នាការដែលបានបង្ហាញត្រូវបានគេហៅថា "ការតំរែតំរង់ទៅរដ្ឋមធ្យម" ។ ចាប់តាំងពីពេលនោះមក ពាក្យ "តំរែតំរង់" ត្រូវបានគេប្រើយ៉ាងទូលំទូលាយនៅក្នុងអក្សរសិល្ប៍ស្ថិតិ ទោះបីជាក្នុងករណីជាច្រើនវាមិនកំណត់លក្ខណៈត្រឹមត្រូវនៃគោលគំនិតនៃការពឹងផ្អែកស្ថិតិក៏ដោយ។

សម្រាប់ការពិពណ៌នាត្រឹមត្រូវនៃសមីការតំរែតំរង់ ចាំបាច់ត្រូវដឹងពីច្បាប់នៃការចែកចាយនៃសូចនាករដែលមានប្រសិទ្ធភាព y ។ នៅក្នុងការអនុវត្តស្ថិតិ ជាធម្មតាមនុស្សម្នាក់ត្រូវកំណត់ខ្លួនឯងក្នុងការស្វែងរកការប៉ាន់ស្មានសមរម្យសម្រាប់មុខងារតំរែតំរង់ពិតប្រាកដដែលមិនស្គាល់ ចាប់តាំងពីអ្នកស្រាវជ្រាវមិនមានចំណេះដឹងពិតប្រាកដនៃច្បាប់តាមលក្ខខណ្ឌនៃការចែកចាយប្រូបាប៊ីលីតេនៃសូចនាករលទ្ធផលដែលបានវិភាគ y សម្រាប់តម្លៃដែលបានផ្តល់ឱ្យ។ នៃអាគុយម៉ង់ x ។

ពិចារណាទំនាក់ទំនងរវាងពិត f(x) = M(y1x), តំរែតំរង់គំរូ? និងពិន្ទុ y នៃតំរែតំរង់។ អនុញ្ញាតឱ្យសូចនាករប្រសិទ្ធភាព y ទាក់ទងទៅនឹងអាគុយម៉ង់ x ដោយសមាមាត្រ៖

ដែល - e គឺជាអថេរចៃដន្យដែលមានច្បាប់ចែកចាយធម្មតា ជាមួយនឹង Me \u003d 0 និង D e \u003d y 2 ។ មុខងារតំរែតំរង់ពិតក្នុងករណីនេះគឺ៖ f(x) = M(y/x) = 2x 1.5 ។

ឧបមាថាយើងមិនដឹងពីទម្រង់ពិតប្រាកដនៃសមីការតំរែតំរង់ពិតទេ ប៉ុន្តែយើងមានការសង្កេតប្រាំបួនលើអថេរចៃដន្យពីរវិមាត្រដែលទាក់ទងដោយសមាមាត្រ yi = 2x1.5 + e ហើយបង្ហាញក្នុងរូប។ មួយ។

រូបភាពទី 1 - ការរៀបចំគ្នាទៅវិញទៅមកនៃការពិត f (x) និងទ្រឹស្តី? ម៉ូដែលតំរែតំរង់

ទីតាំងនៃចំណុចនៅក្នុងរូបភព។ 1 អនុញ្ញាតឱ្យអ្នកកំណត់ខ្លួនអ្នកទៅនឹងថ្នាក់នៃភាពអាស្រ័យលីនេអ៊ែរនៃទម្រង់? = នៅ 0 + នៅ 1 x ។ ដោយប្រើវិធីសាស្ត្រការេតិចបំផុត យើងរកឃើញការប៉ាន់ប្រមាណនៃសមីការតំរែតំរង់ y = b 0 +b 1 x ។ សម្រាប់ការប្រៀបធៀបនៅក្នុងរូបភព។ 1 បង្ហាញក្រាហ្វនៃអនុគមន៍តំរែតំរង់ពិត y \u003d 2x 1.5 ទ្រឹស្ដីអនុគមន៍តំរែតំរង់ប្រហាក់ប្រហែល? = នៅ 0 + នៅ 1 x ។

ដោយសារយើងមានកំហុសក្នុងការជ្រើសរើសថ្នាក់នៃមុខងារតំរែតំរង់ ហើយនេះជារឿងធម្មតានៅក្នុងការអនុវត្តនៃការស្រាវជ្រាវស្ថិតិ ការសន្និដ្ឋាន និងការប៉ាន់ប្រមាណស្ថិតិរបស់យើងនឹងប្រែជាខុស។ ហើយមិនថាយើងបង្កើនបរិមាណនៃការសង្កេតប៉ុន្មានទេ ការប៉ាន់ប្រមាណគំរូរបស់យើងអំពី y នឹងមិននៅជិតមុខងារតំរែតំរង់ពិត f(x) ទេ។ ប្រសិនបើយើងជ្រើសរើសថ្នាក់នៃមុខងារតំរែតំរង់បានត្រឹមត្រូវ នោះភាពមិនត្រឹមត្រូវក្នុងការពិពណ៌នារបស់ f(x) ដោយប្រើ? អាចត្រូវបានពន្យល់ដោយទំហំគំរូដែលមានកំណត់។

ដើម្បីស្ដារតម្លៃតាមលក្ខខណ្ឌនៃសូចនាករដែលមានប្រសិទ្ធភាព y(x) និងមុខងារតំរែតំរង់ដែលមិនស្គាល់ f(x) = M(y/x) ពីទិន្នន័យស្ថិតិដំបូង លក្ខណៈវិនិច្ឆ័យគ្រប់គ្រាន់ខាងក្រោម (មុខងារបាត់បង់) ត្រូវបានគេប្រើញឹកញាប់បំផុត .

វិធីសាស្រ្តការ៉េតិចបំផុត។ យោងទៅតាមវាគម្លាតការ៉េនៃតម្លៃដែលបានសង្កេតឃើញនៃសូចនាករប្រសិទ្ធភាព y, (i = 1,2, ..., n) ពីតម្លៃគំរូត្រូវបានបង្រួមអប្បបរមា។ = f(x i) ដែល x i ជាតម្លៃនៃវ៉ិចទ័រនៃអាគុយម៉ង់នៅក្នុងការសង្កេត i-th៖

វិធីសាស្រ្តនៃម៉ូឌុលតិចបំផុត។ យោងតាមវាផលបូកនៃគម្លាតដាច់ខាតនៃតម្លៃដែលបានសង្កេតនៃសូចនាករប្រសិទ្ធភាពពីតម្លៃម៉ូឌុលត្រូវបានបង្រួមអប្បបរមា។ ហើយយើងទទួលបាន = f(x i) មានន័យថា តំរែតំរង់មធ្យមដាច់ខាត? |y i - f(х i)| > នាទី

ការវិភាគតំរែតំរង់គឺជាវិធីសាស្រ្តនៃការវិភាគស្ថិតិនៃការពឹងផ្អែកនៃអថេរចៃដន្យ y លើអថេរ x j = (j = 1,2, ..., k) ដែលត្រូវបានពិចារណាក្នុងការវិភាគតំរែតំរង់ជាអថេរមិនចៃដន្យ ដោយមិនគិតពីច្បាប់ចែកចាយពិត។ x j

ជាធម្មតាវាត្រូវបានសន្មត់ថាអថេរចៃដន្យ y មានច្បាប់ចែកចាយធម្មតាជាមួយនឹងការរំពឹងទុកគណិតវិទ្យាតាមលក្ខខណ្ឌ y ដែលជាមុខងារនៃអាគុយម៉ង់ x/ (/ = 1, 2, ..., k) និងថេរ ឯករាជ្យនៃ អាគុយម៉ង់ ភាពខុសគ្នា y 2 ។

ជាទូទៅ គំរូលីនេអ៊ែរនៃការវិភាគតំរែតំរង់មានទម្រង់៖

= យ k j=0ក្នុង jj(x 1 , x 2 . . .. , x k) + អ៊ី

ដែល c j គឺជាមុខងារមួយចំនួននៃអថេររបស់វា - x 1 , x 2 ។ . .. ,x k , E គឺជាអថេរចៃដន្យដែលមានការរំពឹងទុកគណិតវិទ្យាសូន្យ និងបំរែបំរួល y 2 ។

នៅក្នុងការវិភាគតំរែតំរង់ ប្រភេទនៃសមីការតំរែតំរង់ត្រូវបានជ្រើសរើសដោយផ្អែកលើលក្ខណៈរូបវន្តនៃបាតុភូតដែលកំពុងសិក្សា និងលទ្ធផលនៃការសង្កេត។

ការប៉ាន់ប្រមាណនៃប៉ារ៉ាម៉ែត្រដែលមិនស្គាល់នៃសមីការតំរែតំរង់ជាធម្មតាត្រូវបានរកឃើញដោយវិធីសាស្ត្រការ៉េតិចបំផុត។ ខាងក្រោមនេះយើងនឹងនិយាយអំពីបញ្ហានេះដោយលម្អិតបន្ថែមទៀត។

សមីការតំរែតំរង់លីនេអ៊ែរពីរវិមាត្រ។ អនុញ្ញាតឱ្យដោយផ្អែកលើការវិភាគនៃបាតុភូតដែលកំពុងសិក្សាវាត្រូវបានសន្មត់ថានៅក្នុង "មធ្យម" y មានមុខងារលីនេអ៊ែរនៃ x ពោលគឺមានសមីការតំរែតំរង់។

y \u003d M (y / x) \u003d នៅ 0 + នៅ 1 x)

ដែល M(y1x) គឺជាការរំពឹងទុកគណិតវិទ្យាតាមលក្ខខណ្ឌនៃអថេរចៃដន្យ y សម្រាប់ x ដែលបានផ្តល់ឱ្យ។ នៅ 0 និងនៅ 1 - ប៉ារ៉ាម៉ែត្រដែលមិនស្គាល់នៃប្រជាជនទូទៅដែលគួរតែត្រូវបានប៉ាន់ប្រមាណពីលទ្ធផលនៃការសង្កេតគំរូ។

ឧបមាថាដើម្បីប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រនៅ 0 និងនៅ 1 គំរូនៃទំហំ n ត្រូវបានគេយកពីចំនួនប្រជាជនទូទៅពីរវិមាត្រ (x, y) ដែល (x, y,) គឺជាលទ្ធផលនៃការសង្កេត i-th (i = 1, 2, ... , ន) ។ ក្នុងករណីនេះ គំរូការវិភាគតំរែតំរង់មានទម្រង់៖

y j = នៅ 0 + នៅ 1 x + e j ។

ដែល e j .- ឯករាជ្យជាធម្មតាចែកចាយអថេរចៃដន្យជាមួយនឹងការរំពឹងទុកគណិតវិទ្យាសូន្យ និងបំរែបំរួល y 2 ពោលគឺ M e j . = 0;

D e j .= y 2 ចំេពាះ i = 1, 2,... , n ។

យោងតាមវិធីសាស្ត្រការេតិចបំផុត ជាការប៉ាន់ស្មាននៃប៉ារ៉ាម៉ែត្រដែលមិនស្គាល់នៅ 0 និងនៅ 1 មួយគួរតែយកតម្លៃបែបនេះនៃលក្ខណៈគំរូ b 0 និង b 1 ដែលកាត់បន្ថយផលបូកនៃគម្លាតការេនៃតម្លៃនៃលទ្ធផល។ លក្ខណៈពិសេស y i ពីការរំពឹងទុកគណិតវិទ្យាតាមលក្ខខណ្ឌ? ខ្ញុំ

យើងនឹងពិចារណាអំពីវិធីសាស្រ្តសម្រាប់កំណត់ឥទ្ធិពលនៃលក្ខណៈទីផ្សារលើប្រាក់ចំណេញរបស់សហគ្រាសដោយប្រើឧទាហរណ៍នៃសហគ្រាសធម្មតាចំនួនដប់ប្រាំពីរដែលមានទំហំមធ្យម និងសូចនាករនៃសកម្មភាពសេដ្ឋកិច្ច។

នៅពេលដោះស្រាយបញ្ហា លក្ខណៈខាងក្រោមត្រូវបានគេយកមកពិចារណា ត្រូវបានកំណត់ថាជាចំណុចសំខាន់បំផុត (សំខាន់) ដែលជាលទ្ធផលនៃការស្ទង់មតិកម្រងសំណួរ៖

* សកម្មភាពច្នៃប្រឌិតរបស់សហគ្រាស;

* ធ្វើផែនការជួរនៃផលិតផល;

* ការបង្កើតគោលនយោបាយតម្លៃ;

* ទំនាក់ទំនង​សាធារណៈ;

* ប្រព័ន្ធទីផ្សារ;

* ប្រព័ន្ធលើកទឹកចិត្តបុគ្គលិក។

ដោយផ្អែកលើប្រព័ន្ធនៃការប្រៀបធៀបដោយកត្តា មេទ្រីការ៉េនៃការនៅជាប់គ្នាត្រូវបានសាងសង់ ដែលក្នុងនោះតម្លៃនៃអាទិភាពទាក់ទងសម្រាប់កត្តានីមួយៗត្រូវបានគណនា៖ សកម្មភាពច្នៃប្រឌិតរបស់សហគ្រាស ការធ្វើផែនការជួរនៃផលិតផល គោលការណ៍កំណត់តម្លៃ ការផ្សាយពាណិជ្ជកម្ម។ ទំនាក់ទំនងសាធារណៈ ប្រព័ន្ធលក់ ប្រព័ន្ធលើកទឹកចិត្តបុគ្គលិក។

ការប៉ាន់ប្រមាណនៃអាទិភាពសម្រាប់កត្តា "ទំនាក់ទំនងជាមួយសាធារណៈជន" ត្រូវបានទទួលជាលទ្ធផលនៃការស្ទង់មតិរបស់អ្នកឯកទេសរបស់ក្រុមហ៊ុន។ ការរចនាខាងក្រោមត្រូវបានទទួលយក៖ > (ប្រសើរជាង), > (ប្រសើរជាង ឬដូចគ្នា), = (ស្មើ),< (хуже или одинаково), <

បន្ទាប់មកបញ្ហានៃការវាយតម្លៃដ៏ទូលំទូលាយនៃកម្រិតនៃការធ្វើទីផ្សាររបស់សហគ្រាសត្រូវបានដោះស្រាយ។ នៅពេលគណនាសូចនាករ សារៈសំខាន់ (ទម្ងន់) នៃលក្ខណៈជាក់លាក់ដែលបានពិចារណាត្រូវបានកំណត់ ហើយបញ្ហានៃការផ្លាស់ប្តូរលីនេអ៊ែរនៃសូចនាករជាក់លាក់ត្រូវបានដោះស្រាយ។ ដំណើរការទិន្នន័យត្រូវបានអនុវត្តតាមកម្មវិធីដែលបានបង្កើតជាពិសេស។

បន្ទាប់មក ការវាយតម្លៃដ៏ទូលំទូលាយនៃកម្រិតនៃការធ្វើទីផ្សាររបស់សហគ្រាសត្រូវបានគណនា - មេគុណទីផ្សារដែលត្រូវបានបញ្ចូលក្នុងតារាងទី 1។ លើសពីនេះ តារាងខាងលើរួមបញ្ចូលសូចនាករដែលកំណត់លក្ខណៈសហគ្រាសទាំងមូល។ ទិន្នន័យនៅក្នុងតារាងនឹងត្រូវបានប្រើសម្រាប់ការវិភាគតំរែតំរង់។ លទ្ធផលគឺប្រាក់ចំណេញ។ រួមជាមួយនឹងមេគុណទីផ្សារ សូចនាករខាងក្រោមត្រូវបានប្រើជាសញ្ញាកត្តា៖ បរិមាណនៃទិន្នផលសរុប តម្លៃនៃទ្រព្យសកម្មថេរ ចំនួនបុគ្គលិក មេគុណឯកទេស។

តារាងទី 1 - ទិន្នន័យដំបូងសម្រាប់ការវិភាគតំរែតំរង់


ដោយផ្អែកលើទិន្នន័យក្នុងតារាង និងលើមូលដ្ឋាននៃកត្តាដែលមានតម្លៃសំខាន់បំផុតនៃមេគុណទំនាក់ទំនង មុខងារតំរែតំរង់នៃការពឹងផ្អែកនៃប្រាក់ចំណេញលើកត្តាត្រូវបានបង្កើតឡើង។

សមីការតំរែតំរង់នៅក្នុងករណីរបស់យើងនឹងមានទម្រង់៖

មេគុណនៃសមីការតំរែតំរង់និយាយអំពីឥទ្ធិពលបរិមាណនៃកត្តាដែលបានពិភាក្សាខាងលើលើចំនួនប្រាក់ចំណេញ។ ពួកគេបង្ហាញពីចំនួនពាន់រូប្លិ៍តម្លៃរបស់វាផ្លាស់ប្តូរនៅពេលដែលសញ្ញាកត្តាផ្លាស់ប្តូរដោយឯកតាមួយ។ ដូចខាងក្រោមពីសមីការការកើនឡើងនៃសមាមាត្រល្បាយទីផ្សារដោយឯកតាមួយផ្តល់នូវការកើនឡើងនៃប្រាក់ចំណេញ 1547.7 ពាន់រូប្លិ៍។ នេះបង្ហាញថាមានសក្ដានុពលដ៏ធំសម្បើមសម្រាប់ការកែលម្អដំណើរការសេដ្ឋកិច្ចរបស់សហគ្រាសក្នុងការកែលម្អសកម្មភាពទីផ្សារ។

នៅក្នុងការសិក្សាអំពីប្រសិទ្ធភាពទីផ្សារ កត្តាដែលគួរឱ្យចាប់អារម្មណ៍ និងសំខាន់បំផុតគឺកត្តា X5 - មេគុណទីផ្សារ។ អនុលោមតាមទ្រឹស្ដីស្ថិតិ អត្ថប្រយោជន៍នៃសមីការតំរែតំរង់ច្រើនដែលមានស្រាប់គឺសមត្ថភាពក្នុងការវាយតម្លៃឥទ្ធិពលដាច់ស្រយាលនៃកត្តានីមួយៗ រួមទាំងកត្តាទីផ្សារ។

លទ្ធផលនៃការវិភាគតំរែតំរង់ត្រូវបានអនុវត្តក៏ត្រូវបានគេប្រើយ៉ាងទូលំទូលាយជាងការគណនាប៉ារ៉ាម៉ែត្រនៃសមីការ។ លក្ខណៈវិនិច្ឆ័យសម្រាប់ការចាត់ថ្នាក់ (Kef,) សហគ្រាសថាល្អជាង ឬទាបជាងនេះ គឺផ្អែកលើសូចនាករទាក់ទងនៃលទ្ធផល៖

ដែលជាកន្លែងដែល Y facti គឺជាតម្លៃពិតប្រាកដនៃសហគ្រាស i-th, ពាន់រូប្លិ៍;

Y គណនា - តម្លៃនៃប្រាក់ចំណេញរបស់សហគ្រាស i-th ដែលទទួលបានដោយការគណនាយោងទៅតាមសមីការតំរែតំរង់

នៅក្នុងលក្ខខណ្ឌនៃបញ្ហាដែលកំពុងត្រូវបានដោះស្រាយតម្លៃត្រូវបានគេហៅថា "កត្តាប្រសិទ្ធភាព" ។ សកម្មភាពរបស់សហគ្រាសអាចចាត់ទុកថាមានប្រសិទ្ធភាពក្នុងករណីដែលតម្លៃនៃមេគុណធំជាងមួយ។ នេះមានន័យថាប្រាក់ចំណេញពិតប្រាកដគឺធំជាងប្រាក់ចំណេញជាមធ្យមលើគំរូ។

តម្លៃប្រាក់ចំណេញជាក់ស្តែង និងគណនាត្រូវបានបង្ហាញក្នុងតារាង។ ២.

តារាងទី 2 - ការវិភាគលើលក្ខណៈមានប្រសិទ្ធភាពក្នុងគំរូតំរែតំរង់

ការវិភាគតារាងបង្ហាញថាក្នុងករណីរបស់យើងសកម្មភាពរបស់សហគ្រាស 3, 5, 7, 9, 12, 14, 15, 17 សម្រាប់រយៈពេលដែលកំពុងត្រួតពិនិត្យអាចចាត់ទុកថាទទួលបានជោគជ័យ។

គោលដៅសំខាន់នៃការវិភាគតំរែតំរង់មាននៅក្នុងការកំណត់ទម្រង់វិភាគនៃទំនាក់ទំនង ដែលការផ្លាស់ប្តូរនៃគុណលក្ខណៈលទ្ធផលគឺដោយសារឥទ្ធិពលនៃសញ្ញាកត្តាមួយ ឬច្រើន ហើយសំណុំនៃកត្តាផ្សេងទៀតទាំងអស់ដែលប៉ះពាល់ដល់គុណលក្ខណៈលទ្ធផលគឺត្រូវបានយកជាតម្លៃថេរ និងមធ្យម។ .
ភារកិច្ចនៃការវិភាគតំរែតំរង់:
ក) ការបង្កើតទម្រង់នៃការពឹងផ្អែក។ ទាក់ទងនឹងធម្មជាតិនិងទម្រង់នៃទំនាក់ទំនងរវាងបាតុភូតមានលីនេអ៊ែរវិជ្ជមាននិងមិនលីនេអ៊ែរនិងអវិជ្ជមានលីនេអ៊ែរនិងមិនលីនេអ៊ែរតំរែតំរង់។
ខ) និយមន័យនៃអនុគមន៍តំរែតំរង់ក្នុងទម្រង់នៃសមីការគណិតវិទ្យានៃប្រភេទមួយ ឬមួយផ្សេងទៀត និងបង្កើតឥទ្ធិពលនៃអថេរពន្យល់លើអថេរអាស្រ័យ។
គ) ការប៉ាន់ប្រមាណតម្លៃដែលមិនស្គាល់នៃអថេរអាស្រ័យ។ ដោយប្រើមុខងារតំរែតំរង់ អ្នកអាចបង្កើតឡើងវិញនូវតម្លៃនៃអថេរអាស្រ័យក្នុងចន្លោះពេលនៃតម្លៃដែលបានផ្តល់ឱ្យនៃអថេរពន្យល់ (ឧ. ដោះស្រាយបញ្ហា interpolation) ឬវាយតម្លៃដំណើរការនៃដំណើរការនៅខាងក្រៅចន្លោះពេលដែលបានបញ្ជាក់ (ឧ។ ដោះស្រាយបញ្ហាបន្ថែម) ។ លទ្ធផលគឺជាការប៉ាន់ប្រមាណតម្លៃនៃអថេរអាស្រ័យ។

តំរែតំរង់គូ - សមីការនៃទំនាក់ទំនងនៃអថេរពីរ y និង x: y = f (x) ដែល y គឺជាអថេរអាស្រ័យ (សញ្ញាលទ្ធផល); x - ឯករាជ្យ អថេរពន្យល់ (លក្ខណៈ-កត្តា)។

មានតំរែតំរង់លីនេអ៊ែរនិងមិនលីនេអ៊ែរ។
តំរែតំរង់លីនេអ៊ែរ៖ y = a + bx + ε
តំរែតំរង់មិនមែនលីនេអ៊ែរត្រូវបានបែងចែកជាពីរថ្នាក់៖ តំរែតំរង់ដែលមិនមែនជាលីនេអ៊ែរទាក់ទងនឹងអថេរពន្យល់ដែលបានរួមបញ្ចូលក្នុងការវិភាគ ប៉ុន្តែលីនេអ៊ែរទាក់ទងនឹងប៉ារ៉ាម៉ែត្រប៉ាន់ស្មាន និងតំរែតំរង់ដែលមិនមែនជាលីនេអ៊ែរទាក់ទងនឹងប៉ារ៉ាម៉ែត្រប៉ាន់ស្មាន។
តំរែតំរង់ដែលមិនមែនជាលីនេអ៊ែរក្នុងអថេរពន្យល់៖

តំរែតំរង់ដែលមិនមែនជាលីនេអ៊ែរក្នុងប៉ារ៉ាម៉ែត្រប៉ាន់ស្មាន៖

  • អំណាច y = a x b ε
  • អិចស្ប៉ូណង់ស្យែល y = a b x ε
  • អិចស្ប៉ូណង់ស្យែល y=e a+b x ε
ការស្ថាបនាសមីការតំរែតំរង់ត្រូវបានកាត់បន្ថយទៅជាការប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្ររបស់វា។ ដើម្បីប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រនៃតំរែតំរង់ដែលមានលក្ខណៈលីនេអ៊ែរក្នុងប៉ារ៉ាម៉ែត្រ វិធីសាស្ត្រនៃការ៉េតិចបំផុត (LSM) ត្រូវបានប្រើ។ LSM ធ្វើឱ្យវាអាចធ្វើទៅបានដើម្បីទទួលបានការប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្របែបនេះដែលផលបូកនៃគម្លាតការ៉េនៃតម្លៃជាក់ស្តែងនៃលក្ខណៈមានប្រសិទ្ធភាព y ពីតម្លៃទ្រឹស្តី y x គឺតិចតួចបំផុត i.e.
.
សម្រាប់សមីការលីនេអ៊ែរ និងមិនលីនេអ៊ែរ កាត់បន្ថយទៅជាលីនេអ៊ែរ ប្រព័ន្ធខាងក្រោមត្រូវបានដោះស្រាយសម្រាប់ a និង b៖

អ្នកអាចប្រើរូបមន្តដែលត្រៀមរួចជាស្រេចដែលធ្វើតាមពីប្រព័ន្ធនេះ៖

ភាពជិតស្និទ្ធនៃការតភ្ជាប់រវាងបាតុភូតដែលបានសិក្សាត្រូវបានប៉ាន់ប្រមាណដោយមេគុណទំនាក់ទំនងគូលីនេអ៊ែរ r xy សម្រាប់តំរែតំរង់លីនេអ៊ែរ (-1≤r xy ≤1):

និងសន្ទស្សន៍ទំនាក់ទំនង p xy - សម្រាប់តំរែតំរង់មិនមែនលីនេអ៊ែរ (0≤p xy ≤1):

ការវាយតម្លៃគុណភាពនៃគំរូដែលបានសាងសង់នឹងត្រូវបានផ្តល់ដោយមេគុណ (សន្ទស្សន៍) នៃការកំណត់ ក៏ដូចជាកំហុសជាមធ្យមប្រហាក់ប្រហែល។
កំហុសប្រហាក់ប្រហែលជាមធ្យមគឺជាគម្លាតមធ្យមនៃតម្លៃដែលបានគណនាពីតម្លៃជាក់ស្តែង៖
.
ដែនកំណត់ដែលអាចអនុញ្ញាតបាននៃតម្លៃ A - មិនលើសពី 8-10% ។
មេគុណមធ្យមនៃការបត់បែន E បង្ហាញពីចំនួនភាគរយ ជាមធ្យម លទ្ធផល y នឹងផ្លាស់ប្តូរពីតម្លៃមធ្យមរបស់វាជាមធ្យម នៅពេលដែលកត្តា x ផ្លាស់ប្តូរ 1% ពីតម្លៃមធ្យមរបស់វា៖
.

ភារកិច្ចនៃការវិភាគនៃវ៉ារ្យង់គឺដើម្បីវិភាគភាពខុសគ្នានៃអថេរអាស្រ័យ:
∑(y-y)²=∑(y x -y)²+∑(y-y x)²
ដែល ∑(y-y)² ជាផលបូកសរុបនៃគម្លាតការេ;
∑(y x -y)² - ផលបូកនៃគម្លាតការេដោយសារការតំរែតំរង់ ("ពន្យល់" ឬ "កត្តា");
∑(y-y x)² - ផលបូកដែលនៅសល់នៃគម្លាតការេ។
ចំណែកនៃបំរែបំរួលដែលត្រូវបានពន្យល់ដោយការតំរែតំរង់នៅក្នុងវ៉ារ្យ៉ង់សរុបនៃលក្ខណៈប្រសិទ្ធភាព y ត្រូវបានកំណត់លក្ខណៈដោយមេគុណ (សន្ទស្សន៍) នៃការកំណត់ R2៖

មេគុណនៃការកំណត់គឺជាការ៉េនៃមេគុណ ឬសន្ទស្សន៍ទំនាក់ទំនង។

F-test - ការវាយតម្លៃគុណភាពនៃសមីការតំរែតំរង់ - មាននៅក្នុងការធ្វើតេស្តសម្មតិកម្មប៉ុន្តែអំពីភាពមិនសំខាន់នៃស្ថិតិនៃសមីការតំរែតំរង់និងសូចនាករនៃភាពជិតស្និទ្ធនៃការតភ្ជាប់។ ចំពោះបញ្ហានេះ ការប្រៀបធៀបនៃការពិត F ពិតប្រាកដ និងតារាង F សំខាន់ (តារាង) នៃតម្លៃនៃលក្ខណៈវិនិច្ឆ័យ F-Fisher ត្រូវបានអនុវត្ត។ F ការពិតត្រូវបានកំណត់ដោយសមាមាត្រនៃតម្លៃនៃបំរែបំរួលនៃកត្តានិងសំណល់ដែលត្រូវបានគណនាសម្រាប់កម្រិតមួយនៃសេរីភាព៖
,
ដែល n ជាចំនួនឯកតាប្រជាជន; m គឺជាចំនួនប៉ារ៉ាម៉ែត្រសម្រាប់អថេរ x ។
តារាង F គឺជាតម្លៃអតិបរមាដែលអាចធ្វើបាននៃលក្ខណៈវិនិច្ឆ័យដែលស្ថិតនៅក្រោមឥទ្ធិពលនៃកត្តាចៃដន្យសម្រាប់កម្រិតនៃសេរីភាព និងសារៈសំខាន់ដែលបានផ្តល់ឱ្យ a ។ កម្រិតសារៈសំខាន់ a - ប្រូបាប៊ីលីតេនៃការបដិសេធសម្មតិកម្មត្រឹមត្រូវដែលផ្តល់ថាវាជាការពិត។ ជាធម្មតា a ត្រូវបានគេយកស្មើនឹង 0.05 ឬ 0.01 ។
ប្រសិនបើតារាង F< F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >F គឺជាការពិត បន្ទាប់មកសម្មតិកម្ម H អំពីមិនត្រូវបានច្រានចោលទេ ហើយភាពមិនសំខាន់នៃស្ថិតិ ភាពមិនគួរឱ្យទុកចិត្តនៃសមីការតំរែតំរង់ត្រូវបានទទួលស្គាល់។
ដើម្បីវាយតម្លៃសារៈសំខាន់ស្ថិតិនៃតំរែតំរង់តំរែតំរង់និងមេគុណជាប់ទាក់ទងគ្នា ការធ្វើតេស្ត t និងចន្លោះពេលទំនុកចិត្តរបស់សិស្សសម្រាប់សូចនាករនីមួយៗត្រូវបានគណនា។ សម្មតិកម្ម H អំពីលក្ខណៈចៃដន្យនៃសូចនាករត្រូវបានដាក់ទៅមុខ ពោលគឺឧ។ អំពីភាពខុសគ្នាមិនសំខាន់របស់ពួកគេពីសូន្យ។ ការវាយតម្លៃពីសារៈសំខាន់នៃតំរែតំរង់តំរែតំរង់និងមេគុណជាប់ទាក់ទងគ្នាដោយប្រើតេស្ត t របស់សិស្សត្រូវបានអនុវត្តដោយការប្រៀបធៀបតម្លៃរបស់ពួកគេជាមួយនឹងទំហំនៃកំហុសចៃដន្យ:
; ; .
កំហុសចៃដន្យនៃប៉ារ៉ាម៉ែត្រតំរែតំរង់លីនេអ៊ែរ និងមេគុណជាប់ទាក់ទងគ្នាត្រូវបានកំណត់ដោយរូបមន្ត៖



ការប្រៀបធៀបតម្លៃជាក់ស្តែង និងសំខាន់ (តារាង) នៃស្ថិតិ t - t tabl និង t fact - យើងទទួលយក ឬបដិសេធសម្មតិកម្ម H o ។
ទំនាក់ទំនងរវាង Fisher's F-test និង t-statistics របស់សិស្សត្រូវបានបង្ហាញដោយសមភាព

ប្រសិនបើ t តារាង< t факт то H o отклоняется, т.е. a , b и r xy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл >t ការពិតដែលថាសម្មតិកម្ម H អំពីមិនត្រូវបានបដិសេធទេហើយធម្មជាតិចៃដន្យនៃការបង្កើត a, b ឬ r xy ត្រូវបានទទួលស្គាល់។
ដើម្បីគណនាចន្លោះពេលទំនុកចិត្ត យើងកំណត់កំហុសរឹម D សម្រាប់សូចនាករនីមួយៗ៖
Δ a = t តារាង m a , Δ b = t តារាង m b ។
រូបមន្តសម្រាប់គណនាចន្លោះពេលទំនុកចិត្តមានដូចខាងក្រោម៖
γ a \u003d aΔ a; γ a \u003d a-Δ a; γ a = a + Δa
γ b = bΔ b ; γ b = b-Δ b ; γb = b + Δb
ប្រសិនបើសូន្យធ្លាក់ក្នុងព្រំដែននៃចន្លោះពេលទំនុកចិត្ត ឧ។ ប្រសិនបើដែនកំណត់ទាបគឺអវិជ្ជមាន ហើយដែនកំណត់ខាងលើគឺវិជ្ជមាន នោះប៉ារ៉ាម៉ែត្រប៉ាន់ស្មានត្រូវបានសន្មត់ថាជាសូន្យ ព្រោះវាមិនអាចទទួលយកបានទាំងតម្លៃវិជ្ជមាន និងអវិជ្ជមានក្នុងពេលដំណាលគ្នា។
តម្លៃព្យាករណ៍ y p ត្រូវបានកំណត់ដោយការជំនួសតម្លៃ (ការព្យាករណ៍) ដែលត្រូវគ្នា x p ទៅក្នុងសមីការតំរែតំរង់ y x = a+b·x ។ កំហុសស្តង់ដារជាមធ្យមនៃការព្យាករណ៍ m y x ត្រូវបានគណនា៖
,
កន្លែងណា
ហើយចន្លោះពេលទំនុកចិត្តនៃការព្យាករណ៍ត្រូវបានបង្កើតឡើង៖
γ y x = y p Δ y p ; γ y x min = y p - Δ y p ; γ y x max = y p + Δ y p
ដែល Δ y x = t តារាង · m y x ។

ឧទាហរណ៍នៃដំណោះស្រាយ

លេខកិច្ចការ 1 ។ សម្រាប់ទឹកដីចំនួនប្រាំពីរនៃតំបន់ Ural សម្រាប់ 199X តម្លៃនៃសញ្ញាពីរត្រូវបានគេស្គាល់។
តារាងទី 1 ។

ទាមទារ៖ 1. ដើម្បីកំណត់លក្ខណៈអាស្រ័យនៃ y លើ x គណនាប៉ារ៉ាម៉ែត្រនៃអនុគមន៍ខាងក្រោម៖
ក) លីនេអ៊ែរ;
b) ច្បាប់អំណាច (ពីមុនវាចាំបាច់ដើម្បីអនុវត្តនីតិវិធីនៃលីនេអ៊ែរនៃអថេរដោយយកលោការីតនៃផ្នែកទាំងពីរ);
គ) ការបង្ហាញ;
ឃ) អ៊ីពែបូឡាសមភាព (អ្នកក៏ត្រូវរកវិធីកំណត់ជាមុននូវគំរូនេះផងដែរ)។
2. វាយតម្លៃគំរូនីមួយៗតាមរយៈកំហុសប្រហាក់ប្រហែលជាមធ្យម A និង Fisher's F-test ។

ដំណោះស្រាយ (ជម្រើសទី ១)

ដើម្បីគណនាប៉ារ៉ាម៉ែត្រ a និង b នៃតំរែតំរង់លីនេអ៊ែរ y=a+b·x (ការគណនាអាចធ្វើឡើងដោយប្រើម៉ាស៊ីនគិតលេខ)។
ដោះស្រាយប្រព័ន្ធនៃសមីការធម្មតាដោយគោរព និង ខ៖
ដោយផ្អែកលើទិន្នន័យដំបូង យើងគណនា ∑y, ∑x, ∑y x, ∑x², ∑y²:
y x yx x2 y2 y xy-y xអាយ
លីត្រ68,8 45,1 3102,88 2034,01 4733,44 61,3 7,5 10,9
2 61,2 59,0 3610,80 3481,00 3745,44 56,5 4,7 7,7
3 59,9 57,2 3426,28 3271,84 3588,01 57,1 2,8 4,7
4 56,7 61,8 3504,06 3819,24 3214,89 55,5 1,2 2,1
5 55,0 58,8 3234,00 3457,44 3025,00 56,5 -1,5 2,7
6 54,3 47,2 2562,96 2227,84 2948,49 60,5 -6,2 11,4
7 49,3 55,2 2721,36 3047,04 2430,49 57,8 -8,5 17,2
សរុប405,2 384,3 22162,34 21338,41 23685,76 405,2 0,0 56,7
ថ្ងៃពុធ តម្លៃ (សរុប/n)57,89
y
54,90
x
3166,05
x y
3048,34
3383,68
XX8,1
5,74 5,86 XXXXXX
ស២32,92 34,34 XXXXXX


a=y -b x = 57.89+0.35 54.9 ≈ 76.88

សមីការ​តំរែតំរង់៖ y= 76,88 - 0,35X.ជាមួយនឹងការកើនឡើងនៃប្រាក់ឈ្នួលប្រចាំថ្ងៃជាមធ្យម 1 ជូត។ ចំណែកនៃការចំណាយលើការទិញផលិតផលម្ហូបអាហារត្រូវបានកាត់បន្ថយជាមធ្យម 0.35% ពិន្ទុ។
គណនាមេគុណលីនេអ៊ែរនៃទំនាក់ទំនងគូ៖

ការទំនាក់ទំនងគឺមធ្យម, បញ្ច្រាស។
ចូរកំណត់មេគុណនៃការកំណត់៖ r² xy =(-0.35)=0.127
បំរែបំរួល 12.7% នៅក្នុងលទ្ធផលត្រូវបានពន្យល់ដោយការប្រែប្រួលនៃកត្តា x ។ ការជំនួសតម្លៃជាក់ស្តែងទៅក្នុងសមីការតំរែតំរង់ Xយើងកំណត់តម្លៃទ្រឹស្តី (គណនា) នៃ y x ។ ចូរយើងស្វែងរកតម្លៃនៃកំហុសប្រហាក់ប្រហែលជាមធ្យម A៖

ជាមធ្យម តម្លៃដែលបានគណនាខុសពីតម្លៃជាក់ស្តែង 8.1%។
តោះគណនា F-criterion៖

តម្លៃដែលទទួលបានបង្ហាញពីតម្រូវការក្នុងការទទួលយកសម្មតិកម្ម H 0 អំពីលក្ខណៈចៃដន្យនៃការពឹងផ្អែកដែលបានបង្ហាញនិងភាពមិនសំខាន់នៃស្ថិតិនៃប៉ារ៉ាម៉ែត្រនៃសមីការនិងសូចនាករនៃភាពតឹងនៃការតភ្ជាប់។
1 ខ។ការសាងសង់គំរូថាមពល y = a x b គឺមុនដោយដំណើរការលីនេអ៊ែរនៃអថេរ។ ក្នុងឧទាហរណ៍ លីនេអ៊ែរត្រូវធ្វើឡើងដោយយកលោការីតនៃភាគីទាំងពីរនៃសមីការ៖
lg y = lg a + b lg x
Y=C+b Y
ដែល Y=lg(y), X=lg(x), C=lg(a)។

សម្រាប់ការគណនា យើងប្រើទិន្នន័យក្នុងតារាង។ ១.៣.
តារាង 1.3

X YX យ២ x2 y xy-y x(y-yx)²អាយ
1 1,8376 1,6542 3,0398 3,3768 2,7364 61,0 7,8 60,8 11,3
2 1,7868 1,7709 3,1642 3,1927 3,1361 56,3 4,9 24,0 8,0
3 1,7774 1,7574 3,1236 3,1592 3,0885 56,8 3,1 9,6 5,2
4 1,7536 1,7910 3,1407 3,0751 3,2077 55,5 1,2 1,4 2,1
5 1,7404 1,7694 3,0795 3,0290 3,1308 56,3 -1,3 1,7 2,4
6 1,7348 1,6739 2,9039 3,0095 2,8019 60,2 -5,9 34,8 10,9
7 1,6928 1,7419 2,9487 2,8656 3,0342 57,4 -8,1 65,6 16,4
សរុប12,3234 12,1587 21,4003 21,7078 21,1355 403,5 1,7 197,9 56,3
មធ្យម1,7605 1,7370 3,0572 3,1011 3,0194 XX28,27 8,0
σ 0,0425 0,0484 XXXXXXX
σ២0,0018 0,0023 XXXXXXX

គណនា C និង b៖

C=Y -b X = 1.7605+0.298 1.7370 = 2.278126
យើងទទួលបានសមីការលីនេអ៊ែរ៖ Y=2.278-0.298 X
បន្ទាប់​ពី​បង្កើន​កម្លាំង​ហើយ យើង​ទទួល​បាន៖ y=10 2.278 x -0.298
ការជំនួសនៅក្នុងសមីការនេះ តម្លៃជាក់ស្តែង X,យើងទទួលបានតម្លៃទ្រឹស្តីនៃលទ្ធផល។ ដោយផ្អែកលើពួកវាយើងគណនាសូចនាករ: ភាពតឹងនៃការតភ្ជាប់ - សន្ទស្សន៍ទំនាក់ទំនង p xy និងកំហុសប្រហាក់ប្រហែលជាមធ្យម A ។

លក្ខណៈនៃគំរូថាមពលបង្ហាញថាវាពិពណ៌នាអំពីទំនាក់ទំនងល្អជាងមុខងារលីនេអ៊ែរ។

1 វ. ការបង្កើតសមីការនៃខ្សែកោងអិចស្ប៉ូណង់ស្យែល y \u003d a b x ត្រូវបានបន្តដោយនីតិវិធីសម្រាប់កំណត់អថេរនៅពេលយកលោការីតនៃផ្នែកទាំងពីរនៃសមីការ៖
lg y = lg a + x lg ខ
Y=C+B x
សម្រាប់ការគណនាយើងប្រើទិន្នន័យតារាង។

x យស យ២ x2y xy-y x(y-yx)²អាយ
1 1,8376 45,1 82,8758 3,3768 2034,01 60,7 8,1 65,61 11,8
2 1,7868 59,0 105,4212 3,1927 3481,00 56,4 4,8 23,04 7,8
3 1,7774 57,2 101,6673 3,1592 3271,84 56,9 3,0 9,00 5,0
4 1,7536 61,8 108,3725 3,0751 3819,24 55,5 1,2 1,44 2,1
5 1,7404 58,8 102,3355 3,0290 3457,44 56,4 -1,4 1,96 2,5
6 1,7348 47,2 81,8826 3,0095 2227,84 60,0 -5,7 32,49 10,5
7 1,6928 55,2 93,4426 2,8656 3047,04 57,5 -8,2 67,24 16,6
សរុប12,3234 384,3 675,9974 21,7078 21338,41 403,4 -1,8 200,78 56,3
ថ្ងៃពុធ zn.1,7605 54,9 96,5711 3,1011 3048,34 XX28,68 8,0
σ 0,0425 5,86 XXXXXXX
σ២0,0018 34,339 XXXXXXX

តម្លៃនៃប៉ារ៉ាម៉ែត្រតំរែតំរង់ A និង អេស្មើនឹង៖

A=Y -B x = 1.7605+0.0023 54.9 = 1.887
សមីការលីនេអ៊ែរត្រូវបានទទួល៖ Y=1.887-0.0023x ។ យើងពង្រឹងសមីការលទ្ធផល ហើយសរសេរវាក្នុងទម្រង់ធម្មតា៖
y x =10 1.887 10 -0.0023x = 77.1 0.9947 x
យើងប៉ាន់ស្មានភាពតឹងនៃទំនាក់ទំនងតាមរយៈសន្ទស្សន៍ទំនាក់ទំនង p xy៖

3588,01 56,9 3,0 9,00 5,0 4 56,7 0,0162 0,9175 0,000262 3214,89 55,5 1,2 1,44 2,1 5 55 0,0170 0,9354 0,000289 3025,00 56,4 -1,4 1,96 2,5 6 54,3 0,0212 1,1504 0,000449 2948,49 60,8 -6,5 42,25 12,0 7 49,3 0,0181 0,8931 0,000328 2430,49 57,5 -8,2 67,24 16,6 សរុប405,2 0,1291 7,5064 0,002413 23685,76 405,2 0,0 194,90 56,5 មធ្យម57,9 0,0184 1,0723 0,000345 3383,68 XX27,84 8,1 σ 5,74 0,002145 XXXXXXX σ២32,9476 0,000005 XX