مشاهده انتخابی: مفهوم، انواع، خطاهای نمونه گیری، ارزیابی نتایج. نمونه هایی از حل مسئله

در طول مشاهده انتخابی، باید از آن اطمینان حاصل شود تصادفانتخاب واحد هر واحد باید فرصتی برابر برای انتخاب شدن با بقیه داشته باشد. این همان چیزی است که نمونه گیری تصادفی بر اساس آن است.

به نمونه تصادفی مناسب به انتخاب واحدها از کل جمعیت عمومی (بدون تقسیم اولیه آن به هیچ گروهی) با قرعه کشی (عمدتا) یا روش های مشابه دیگر، به عنوان مثال، با استفاده از جدول اعداد تصادفی اشاره دارد. انتخاب تصادفیاین انتخاب تصادفی نیست. اصل تصادفی بودن نشان می دهد که گنجاندن یا حذف یک شی از نمونه نمی تواند تحت تأثیر هیچ عامل دیگری غیر از شانس باشد. یک مثال در واقع تصادفیانتخاب می تواند به عنوان گردش برنده ها عمل کند: از مجموع تعداد بلیط های صادر شده، بخش خاصی از اعدادی که برنده شده اند به طور تصادفی انتخاب می شود. علاوه بر این، همه اعداد با یک فرصت برابر برای ورود به نمونه ارائه می شوند. در این حالت معمولاً تعداد واحدهای انتخاب شده در مجموعه نمونه بر اساس نسبت پذیرفته شده نمونه تعیین می شود.

اشتراک نمونه نسبت تعداد واحدهای جامعه نمونه به تعداد واحدهای جامعه عمومی است:

بنابراین، با یک نمونه 5٪ از یک دسته از قطعات در 1000 واحد. اندازهی نمونه پ 50 واحد است و با نمونه 10 درصد - 100 واحد. و غیره. با سازماندهی علمی صحیح نمونه گیری، خطاهای نمایندگی را می توان به حداقل مقادیر کاهش داد، در نتیجه، مشاهده انتخابی به اندازه کافی دقیق می شود.

انتخاب تصادفی مناسب "در شکل خالص آن" به ندرت در عمل مشاهده انتخابی استفاده می شود، اما نقطه شروع در بین سایر انواع انتخاب است، شامل و اجرای اصول اساسی مشاهده انتخابی است.

اجازه دهید چند سوال از نظریه روش نمونه گیری و فرمول خطا را برای یک نمونه تصادفی ساده در نظر بگیریم.

هنگام استفاده از روش نمونه گیری در آمار، معمولاً از دو نوع شاخص تعمیم دهنده استفاده می شود: مقدار متوسط ​​یک صفت کمیو ارزش نسبی ویژگی جایگزین(نسبت یا نسبت واحدها در جامعه آماری که تنها با وجود صفت مورد مطالعه با سایر واحدهای این جامعه تفاوت دارد).

اشتراک نمونه (w)یا فرکانس، با نسبت تعداد واحدهایی که دارای ویژگی مورد مطالعه هستند تعیین می شود تی،به تعداد کل واحدهای نمونه برداری پ:

برای مثال، اگر از 100 جزئیات نمونه ( n=100)، 95 قسمت استاندارد بود (تی=95)، سپس کسر نمونه

w=95/100=0,95 .

برای مشخص کردن قابلیت اطمینان شاخص های نمونه، وجود دارد وسطو خطای نمونه برداری حاشیه ای

خطای نمونه گیری ? یا به عبارت دیگر، خطای نمایندگی، تفاوت بین نمونه مربوطه و ویژگی های کلی است:

*

*

خطای نمونه گیری تنها مشخصه مشاهدات انتخابی است. هر چه مقدار این خطا بیشتر باشد، شاخص های نمونه با شاخص های کلی مربوطه تفاوت بیشتری دارند.

میانگین نمونه و سهم نمونه ذاتاً هستند متغیرهای تصادفی،که بسته به اینکه کدام واحد از جامعه در نمونه گنجانده شده است، می تواند مقادیر متفاوتی به خود بگیرد. بنابراین خطاهای نمونه گیری نیز متغیرهای تصادفی هستند و می توانند مقادیر متفاوتی به خود بگیرند. بنابراین، میانگین خطاهای احتمالی - میانگین خطای نمونه را تعیین کنید.

به چه چیزی بستگی دارد یعنی خطای نمونه گیری؟با توجه به اصل انتخاب تصادفی، میانگین خطای نمونه گیری در درجه اول تعیین می شود اندازهی نمونه:هر چه جمعیت بزرگتر باشد، ceteris paribus، میانگین خطای نمونه برداری کوچکتر است. با پوشش یک نظرسنجی نمونه با تعداد فزاینده ای از واحدهای جمعیت عمومی، ما بیشتر و دقیق تر کل جمعیت را مشخص می کنیم.

میانگین خطای نمونه گیری نیز به این بستگی دارد درجه تنوعصفت مورد مطالعه درجه تنوع، همانطور که می دانید، با پراکندگی مشخص می شود؟ 2 یا w(1-w)-- برای یک ویژگی جایگزین هر چه تنوع ویژگی و در نتیجه واریانس کمتر باشد، میانگین خطای نمونه برداری کوچکتر است و بالعکس. با پراکندگی صفر (ویژگی تغییر نمی کند)، میانگین خطای نمونه گیری صفر است، یعنی هر واحد از جمعیت عمومی به طور دقیق کل جمعیت را طبق این ویژگی مشخص می کند.

وابستگی میانگین خطای نمونه گیری به حجم آن و درجه تغییر ویژگی در فرمول هایی منعکس می شود که می توان از آنها برای محاسبه میانگین خطای نمونه گیری در شرایط مشاهده نمونه استفاده کرد، زمانی که ویژگی های کلی ( x, p)ناشناخته هستند، و بنابراین، نمی‌توان خطای نمونه‌گیری واقعی را مستقیماً از فرمول‌ها (فرم 1)، (فرم 2) پیدا کرد.

دبلیو با انتخاب تصادفی میانگین خطاهااز نظر تئوری با فرمول های زیر محاسبه می شود:

* برای صفت کمی متوسط

* برای اشتراک (ویژگی جایگزین)

از آنجایی که عملاً واریانس صفت در جمعیت عمومی؟ 2 دقیقاً مشخص نیست، در عمل آنها از مقدار واریانس S 2 محاسبه شده برای جامعه نمونه بر اساس قانون اعداد بزرگ استفاده می کنند، که بر اساس آن جامعه نمونه با حجم نمونه به اندازه کافی بزرگ به طور دقیق ویژگی های نمونه را بازتولید می کند. جمعیت عمومی.

بدین ترتیب، فرمول های محاسبه وسط خطاهای نمونه گیری نمونه گیری مجدد تصادفی به صورت زیر خواهد بود:

* برای صفت کمی متوسط

* برای اشتراک (ویژگی جایگزین)

اما واریانس جامعه نمونه با واریانس جامعه عمومی برابری نمی کند و بنابراین میانگین خطاهای نمونه محاسبه شده با فرمول (فرم. 5) و (فرم. 6) تقریبی خواهد بود. اما در نظریه احتمال ثابت می شود که واریانس کلی از طریق انتخابی با رابطه زیر بیان می شود:

زیرا پ/(n-1) برای به اندازه کافی بزرگ پ --مقدار نزدیک به واحد، می‌توان فرض کرد که می‌توان در محاسبات عملی میانگین خطاهای نمونه‌گیری از فرمول‌های (شکل 5) و (فرم 6) استفاده کرد. و فقط در موارد کوچک بودن نمونه (زمانی که حجم نمونه از 30 بیشتر نباشد) باید ضریب را در نظر گرفت. پ/(n-1) و محاسبه کنید میانگین خطای نمونه کوچکطبق فرمول:

W X با انتخاب تصادفی و غیر تکراری در فرمول های فوق برای محاسبه میانگین خطاهای نمونه گیری، لازم است بیان ریشه در 1-(n / N) ضرب شود، زیرا تعداد واحدها در جمعیت عمومی در فرآیند نمونه گیری غیر تکراری کاهش می یابد. بنابراین، برای انتخاب غیر تکراری فرمول های محاسبه میانگین خطای نمونه گیری به شکل زیر خواهد بود:

* برای صفت کمی متوسط

* برای اشتراک (ویژگی جایگزین)

. (فرم 10)

زیرا پهمیشه کمتر ن، سپس عامل اضافی 1-( n/N) همیشه کمتر از یک خواهد بود. از این نتیجه می شود که میانگین خطا با انتخاب غیر تکراری همیشه کمتر از انتخاب تکراری خواهد بود. در عین حال، با درصد نسبتاً کمی از نمونه، این ضریب نزدیک به یک است (مثلاً با نمونه 5٪ 0.95 است؛ با نمونه 2٪ 0.98 و غیره است). بنابراین، گاهی اوقات در عمل، از فرمول های (فرم های 5) و (فرم های 6) برای تعیین میانگین خطای نمونه گیری بدون ضریب مشخص شده استفاده می شود، اگرچه نمونه به صورت غیر تکراری سازماندهی می شود. این زمانی اتفاق می‌افتد که تعداد واحدهای جمعیت عمومی N ناشناخته یا نامحدود باشد، یا چه زمانی پبسیار کم در مقایسه با نو در اصل، معرفی یک عامل اضافی، نزدیک به یک، عملاً بر مقدار میانگین خطای نمونه‌گیری تأثیری نخواهد داشت.

نمونه برداری مکانیکی شامل این واقعیت است که انتخاب واحدها در نمونه از کلی، که با یک معیار خنثی به فواصل (گروه‌های) مساوی تقسیم می‌شوند، به گونه‌ای انجام می‌شود که تنها یک واحد از هر گروه در نمونه انتخاب می‌شود. برای جلوگیری از خطای سیستماتیک، واحدی که در وسط هر گروه قرار دارد باید انتخاب شود.

هنگام سازماندهی انتخاب مکانیکی، واحدهای جمعیت از قبل (معمولاً در یک لیست) به ترتیب خاصی (به عنوان مثال، بر اساس حروف الفبا، مکان، به ترتیب صعودی یا نزولی مقادیر هر شاخصی که مرتبط نیست) مرتب می شوند. با ملک مورد مطالعه و غیره) و غیره)، پس از آن تعداد معینی از واحدها به صورت مکانیکی در یک بازه زمانی مشخص انتخاب می شود. در این حالت، اندازه فاصله در جامعه عمومی برابر است با متقابل سهم نمونه. بنابراین، با یک نمونه 2٪، هر 50 واحد (1: 0.02) انتخاب و بررسی می شود، با یک نمونه 5٪، هر 20 واحد (1: 0.05)، به عنوان مثال، جزئیات نزولی از دستگاه.

با جمعیت به اندازه کافی بزرگ، انتخاب مکانیکی از نظر دقت نتایج نزدیک به تصادفی مناسب است. بنابراین، برای تعیین میانگین خطای یک نمونه مکانیکی، از فرمول های نمونه گیری غیرتکراری تصادفی خود استفاده می شود (فرم. 9)، (فرم. 10).

برای انتخاب واحدها از یک جمعیت ناهمگن، به اصطلاح نمونه معمولی , که در مواردی استفاده می شود که همه واحدهای جمعیت عمومی را می توان با توجه به ویژگی هایی که بر شاخص های مورد مطالعه تأثیر می گذارد به چندین گروه از نظر کیفی همگن و مشابه تقسیم کرد.

هنگام بررسی بنگاه ها، چنین گروه هایی می توانند، به عنوان مثال، صنعت و زیربخش، اشکال مالکیت باشند. سپس، از هر گروه معمولی، یک انتخاب جداگانه از واحدها در نمونه توسط یک نمونه تصادفی یا مکانیکی انجام می شود.

یک نمونه معمولی معمولا در مطالعه جمعیت های آماری پیچیده استفاده می شود. به عنوان مثال، در یک بررسی نمونه از بودجه خانواده کارگران و کارمندان در بخش‌های خاصی از اقتصاد، بهره‌وری نیروی کار کارگران در یک شرکت، که توسط گروه‌های مهارتی جداگانه نشان داده شده است.

یک نمونه معمولی نتایج دقیق تری در مقایسه با روش های دیگر انتخاب واحدها در یک مجموعه نمونه می دهد. نمونه‌سازی جمعیت عمومی، نمایندگی چنین نمونه‌ای را تضمین می‌کند، نمایش هر گروه گونه‌شناختی در آن، که امکان حذف تأثیر پراکندگی بین گروهی بر میانگین خطای نمونه را فراهم می‌کند.

هنگام تعیین میانگین خطای یک نمونه معمولیبه عنوان شاخص تنوع است میانگین واریانس های درون گروهی

میانگین خطای نمونه گیری با فرمول ها پیدا می شوند:

* برای صفت کمی متوسط

(انتخاب مجدد)؛ (فرم. 11)

(انتخاب برگشت ناپذیر)؛ (فرم. 12)

* برای اشتراک (ویژگی جایگزین)

(انتخاب مجدد)؛ (فرم.13)

(انتخاب غیر تکراری)، (فرم. 14)

میانگین واریانس های درون گروهی برای جامعه نمونه کجاست.

میانگین واریانس های درون گروهی سهم (ویژگی جایگزین) در جامعه نمونه.

نمونه برداری سریال شامل انتخاب تصادفی از جمعیت عمومی نه واحدهای منفرد، بلکه از گروه‌های مساوی آنها (لانه، سری) است تا همه واحدها بدون استثنا در چنین گروه‌هایی مورد مشاهده قرار گیرند.

استفاده از نمونه برداری سریال به این دلیل است که بسیاری از کالاها برای حمل، نگهداری و فروش آنها در بسته بندی، جعبه و ... بسته بندی می شوند. بنابراین، هنگام کنترل کیفیت کالاهای بسته بندی شده، بررسی چند بسته (سری) منطقی تر از انتخاب مقدار مورد نیاز کالا از همه بسته ها است.

از آنجایی که در داخل گروه ها (سری ها) همه واحدها بدون استثنا مورد بررسی قرار می گیرند، میانگین خطای نمونه گیری (هنگام انتخاب سری های مساوی) تنها به واریانس بین گروهی (بین سری) بستگی دارد.

دبلیو میانگین خطای نمونه گیری برای میانگین نمره در طول انتخاب سریال، آنها با فرمول های زیر پیدا می شوند:

(انتخاب مجدد)؛ (فرم.15)

(انتخاب غیر تکراری)، (فرم 16)

جایی که r-تعداد سری های انتخابی؛ R-تعداد کل قسمت ها

واریانس بین گروهی نمونه سریال به صورت زیر محاسبه می شود:

میانگین کجاست من- سری هفتم؛ - میانگین کلی برای کل جامعه نمونه.

دبلیو میانگین خطای نمونه برداری برای اشتراک (ویژگی جایگزین) در انتخاب سریال:

(انتخاب مجدد)؛ (فرم. 17)

(انتخاب غیر تکراری). (فرم. 18)

بین گروهی(بین سری) واریانس سهم نمونه سریالبا فرمول تعیین می شود:

، (فرم 19)

سهم ویژگی در کجاست منسری هفتم; - سهم کل صفت در کل نمونه.

در عمل بررسی های آماری، علاوه بر روش های انتخاب قبلی، از ترکیب آنها استفاده می شود (انتخاب ترکیبی).

مفهوم و محاسبه خطای نمونه گیری.

وظیفه مشاهده انتخابی ارائه ایده های صحیح در مورد شاخص های خلاصه کل جمعیت بر اساس بخشی از آنها است که در معرض مشاهده قرار گرفته اند. انحراف احتمالی سهم نمونه و میانگین نمونه از سهم و میانگین در جامعه عمومی نامیده می شود خطای نمونه گیری یا خطای نمایندگی هر چه مقدار این خطا بیشتر باشد، شاخص‌های مشاهده نمونه با جمعیت عمومی بیشتر متفاوت است.

فرق داشتن:

خطاهای نمونه گیری؛

خطاهای ثبت نام

خطاهای ثبت نامزمانی رخ می دهد که یک واقعیت به اشتباه در فرآیند مشاهده ثابت شود. آنها هم برای مشاهده پیوسته و هم برای مشاهده انتخابی مشخص هستند، اما در مشاهده انتخابی کمتر هستند.

ماهیت خطا این است:

تمایلی - عمدی، یعنی. بهترین یا بدترین واحدهای جمعیت انتخاب شدند. در این صورت مشاهدات معنای خود را از دست می دهند;

تصادفی - اصل سازمانی اصلی مشاهده انتخابی جلوگیری از انتخاب عمدی است، به عنوان مثال. از رعایت دقیق اصل انتخاب تصادفی اطمینان حاصل کنید.

قانون کلی انتخاب تصادفیاین است: واحدهای منفرد از جمعیت عمومی باید دقیقاً شرایط و فرصت‌های مشابهی برای قرار گرفتن در تعداد واحدهای موجود در نمونه داشته باشند. این مشخصه استقلال نتیجه نمونه از اراده ناظر است. اراده ناظر خطاهای احتمالی ایجاد می کند. خطای نمونه گیری در انتخاب تصادفی تصادفی است. اندازه انحرافات مشخصات کلی از نمونه ها را مشخص می کند.

با توجه به اینکه ویژگی ها در جامعه مورد مطالعه متفاوت است، ترکیب واحدهای نمونه ممکن است با ترکیب واحدهای کل جامعه منطبق نباشد. این به آن معنا است آرو مطابقت ندارد دبلیوو . اختلاف احتمالی بین این ویژگی ها با خطای نمونه گیری مشخص می شود که با فرمول تعیین می شود:

واریانس کلی کجاست

واریانس نمونه کجاست

این نشان می دهد که واریانس کلی در چه زمانی با واریانس نمونه متفاوت است.

انتخاب مکرر و غیر تکراری وجود دارد. ماهیت انتخاب مجدد این است که هر واحد در نمونه پس از مشاهده، به جمعیت عمومی باز می گردد و قابل بررسی مجدد است. هنگام نمونه گیری مجدد، میانگین خطای نمونه گیری محاسبه می شود:

برای نشانگر سهم یک ویژگی جایگزین، واریانس نمونه با فرمول تعیین می شود:

در عمل، انتخاب مجدد به ندرت مورد استفاده قرار می گیرد. با انتخاب غیر تکراری، اندازه جمعیت عمومی ندر طول نمونه گیری کاهش می یابد، فرمول میانگین خطای نمونه گیری برای یک ویژگی کمی است:



یکی از مقادیر ممکن که سهم صفت مورد مطالعه می تواند در آن باشد برابر است با:

خطای نمونه برداری ویژگی جایگزین کجاست.

مثال.

طی بررسی نمونه 10 درصد از محصولات یک دسته از محصولات نهایی طبق روش بدون انتخاب مجدد، داده های زیر در مورد میزان رطوبت نمونه ها به دست آمد.

میانگین درصد رطوبت، واریانس، انحراف معیار، با احتمال 954/0، حدود احتمالی که در آن میانگین مورد انتظار است را تعیین کنید. درصد رطوبت تمام محصولات نهایی با احتمال 987/0، محدودیت های احتمالی وزن مخصوص محصولات استاندارد، مشروط بر اینکه محصولات با رطوبت حداکثر 13 و بالاتر از 19 درصد متعلق به دسته ای غیر استاندارد باشند.

فقط با احتمال معینی می توان استدلال کرد که سهم کلی سهم نمونه و میانگین کلی میانگین نمونه در انحراف است. تییک بار.

در آمار به این انحرافات گفته می شود خطاهای نمونه برداری حاشیه ای و مشخص شده اند.

احتمال قضاوت را می توان افزایش یا کاهش داد تییک بار. با احتمال 0.683، با 0.954، با 0.987، سپس شاخص های جامعه عمومی با توجه به شاخص های نمونه مشخص می شود:

میانگین خطای نمونه گیری همیشه در مطالعات نمونه وجود دارد و به دلیل این که همه واحدهای جامعه آماری مورد بررسی قرار نمی گیرند، بلکه تنها بخشی از آن بررسی می شود، ظاهر می شود.

میانگین خطای نمونه گیری می شود خطای حاشیه ای Δ وقتی در ضریب اطمینان ضرب شود تی ، که بر اساس دقت مشاهده مورد نیاز از پیش تنظیم شده است. خطای حاشیه ای به شما امکان می دهد تا اندازه "واقعی" پارامتر در جمعیت عمومی را با درجه خاصی از احتمال قضاوت کنید.

برای انتخاب معمولی و سریال، هنگام محاسبه خطای نمونه گیری به جای واریانس کل 2 ) از میانگین واریانس های درون گروهی و واریانس بین گروهی استفاده کنید
، جایی که
- واریانس خصوصی گروه i، گروه جلد من

فرمول های خطای حاشیه ای یک نمونه تصادفی در تعیین میانگین

برای انتخاب مجدد

فرمول های خطای حاشیه ای یک نمونه تصادفی در تعیین نسبت

برای انتخاب مجدد

برای انتخاب غیر تکراری

فرمول های اندازه یک نمونه تصادفی در تعیین مقدار متوسط

فرمول تعداد نمونه تصادفی در تعیین سهم صفت مورد مطالعه

تفاوت حاشیه ای بین میانگین کلی و نمونه با خطای حاشیه ای مطابقت دارد

مقادیر احتمال و به ترتیب تی در جداول توزیع قرار دارند:

  • دانشجو (در مورد نمونه کوچک)

فرمول های نمونه گیری تصادفی نیز برای نمونه برداری مکانیکی مناسب هستند.

در صورت لزوم گرد کردن، با نمونه برداری تصادفی - گرد کردن به بالا، با نمونه برداری مکانیکی - گرد کردن به پایین.

نمونه کوچک

اگر حجم نمونه بیشتر از 30 واحد نباشد، میانگین خطای یک نمونه کوچک در تعیین مقدار متوسط ​​با فرمول محاسبه می شود:

برای محاسبه خطای یک نمونه کوچک از فرمول واریانس تصفیه شده استفاده می شود

انواع وظایف نمونه گیری

    تعریف خطای نمونه گیری،

    تعیین حجم نمونه n ,

    تعیین احتمال انحراف میانگین (یا سهم) نمونه از مقدار عمومی بیش از یک مقدار معین t=Δ/μ،

    ارزیابی تصادفی بودن اختلافات در شاخص های مشاهدات نمونه،

    انتقال ویژگی های نمونه به جامعه عمومی

آزمون فرضیه میانگین و نسبت

برآورد تصادفی بودن اختلاف در شاخص های مشاهدات نمونه


روش های انتقال داده های نمونه به جامعه عمومی

    روش توزین؛

    روش وزن کشی؛

    روش پر کردن با انتخاب تصادفی در کلاس های جایگزین.

خطای حاشیه ای- حداکثر اختلاف ممکن بین میانگین یا حداکثر خطا برای یک احتمال معین از وقوع آن.

1. خطای نمونه برداری حاشیه ای برای میانگین در طول انتخاب مکرر در با فرمول محاسبه می شود:

جایی که t - انحراف نرمال شده - "ضریب اطمینان"، که بستگی به احتمالی دارد که خطای نمونه نهایی را تضمین می کند.

mu x میانگین خطای نمونه گیری است.

2. خطای نمونه برداری حاشیه ای برای تناسبهنگامی که انتخاب مجدد با فرمول تعیین می شود:

3. خطای نمونه گیری حاشیه ای برای میانگین با انتخاب غیر تکراری:

خطای نسبی را محدود کنیدنمونه گیری به عنوان نسبت درصد خطای نمونه گیری حاشیه ای به مشخصه متناظر جامعه نمونه تعریف می شود. اینگونه تعریف می شود:

نمونه کوچک

تئوری نمونه های کوچک توسعه داده شد دانشجوی آمارگیر انگلیسیدر آغاز قرن بیستم. در سال 1908، او توزیع خاصی را کشف کرد که حتی با نمونه‌های کوچک، همبستگی t و احتمال اطمینان F(t) را ممکن می‌سازد. برای n بیشتر از 100، نتایج مشابه جداول انتگرال احتمال لاپلاس را برای 30 می دهند.< n < 100 различия получаются незначительные. Поэтому на практике к малым выборкам относятся выборки объемом менее 30 единиц.

همانطور که مشخص است، در آمار، بسته به کامل بودن پوشش جسم، دو روش برای مشاهده پدیده های توده وجود دارد: پیوسته و غیر پیوسته. تنوع مشاهده ناپیوسته، مشاهده انتخابی است.

زیر مشاهده انتخابی به عنوان یک مشاهده غیرمستمر درک می شود که در آن واحدهای جامعه مورد مطالعه که به طور تصادفی انتخاب شده اند، تحت بررسی آماری (مشاهده) قرار می گیرند.

مشاهدات انتخابی وظیفه تعیین مشخصات کل جمعیت واحدها را برای بخش مورد بررسی، با رعایت کلیه قوانین و اصول مشاهده آماری و کار علمی سازماندهی شده در مورد انتخاب واحدها تعیین می کند.

مجموعه واحدهای انتخاب شده برای نظرسنجی در آمار معمولاً نامیده می شود جامعه نمونه ، و مجموعه واحدهایی که از آنها انتخاب می شود نامیده می شود جمعیت عمومی . مشخصات اصلی جامعه عمومی و نمونه در جدول 1 ارائه شده است.

میز 1 - ویژگی های اصلی جامعه عمومی و نمونه
فهرست مطالبتعیین یا فرمول
جمعیت جمعیت نمونه
تعداد واحدها ن n
تعداد واحدهایی که دارای یک ویژگی هستند م متر
نسبت واحدهای دارای این ویژگی p = M/N ω = m/n
نسبت واحدهایی که این ویژگی را ندارند q = 1 - p 1 - w
مقدار متوسط امضا کردن
پراکندگی امضا کردن
پراکندگی یک ویژگی جایگزین (پراکندگی یک سهم) pq ω (1 - ω)

هنگام انجام مشاهدات انتخابی، خطاهای سیستماتیک و تصادفی رخ می دهد. خطاهای سیستماتیک به دلیل نقض قوانین انتخاب واحد در نمونه ایجاد می شود. با تغییر قوانین انتخاب، می توان چنین خطاهایی را از بین برد.

خطاهای تصادفی به دلیل ماهیت ناپیوسته نظرسنجی به وجود می آیند. در غیر این صورت به آنها خطاهای نمایندگی (representativeness) می گویند. خطاهای تصادفی به خطاهای نمونه گیری متوسط ​​و حاشیه ای تقسیم می شوند که هم هنگام محاسبه ویژگی و هم هنگام محاسبه سهم تعیین می شوند.

خطاهای میانگین و حد با رابطه زیر مرتبط می شوند :Δ = tμ، که در آن Δ خطای نمونه گیری حاشیه ای است، μ میانگین خطای نمونه گیری، t ضریب اطمینان است که بسته به سطح احتمال تعیین می شود. جدول 2 مقادیری از t را نشان می دهد که از تئوری احتمالات گرفته شده است.

مقدار میانگین خطای نمونه گیری بسته به روش انتخاب و روش نمونه گیری متفاوت محاسبه می شود. فرمول های اصلی برای محاسبه خطاهای نمونه گیری در جدول 3 ارائه شده است.

جدول 3 - فرمول های اساسی برای محاسبه خطاهای نمونه گیری در انتخاب های تکراری و غیر تکراری
فهرست مطالبتعیین و فرمول
جمعیت جمعیت نمونه
میانگین خطای ویژگی برای نمونه‌گیری مجدد تصادفی
میانگین خطای اشتراک برای نمونه‌گیری مجدد تصادفی
محدود کردن خطای یک ویژگی در صورت انتخاب مجدد تصادفی
خطای اشتراک حاشیه ای در انتخاب مجدد تصادفی
میانگین خطای یک ویژگی برای انتخاب تصادفی و غیر تکراری
میانگین خطای سهم در نمونه گیری تصادفی غیر تکراری
محدود کردن خطای یک ویژگی با انتخاب تصادفی و غیر تکراری
خطای اشتراک حاشیه ای برای انتخاب تصادفی غیر تکراری

محاسبه خطاهای نمونه گیری متوسط ​​و حاشیه ای به شما امکان می دهد محدودیت های احتمالی را تعیین کنید که در آن ویژگی های جمعیت عمومی قرار دارند. .

به عنوان مثال، برای یک میانگین نمونه، چنین محدودیت هایی بر اساس روابط زیر تنظیم می شوند:

حدود سهم صفت در جمعیت عمومی ص.

نمونه هایی از حل مسائل با موضوع "مشاهده نمونه در آمار"

وظیفه 1 . اطلاعاتی در مورد خروجی محصولات (کارها، خدمات) به دست آمده بر اساس 10٪ مشاهده نمونه از شرکت ها در منطقه وجود دارد:

تعیین: 1) برای شرکت های موجود در نمونه: الف) اندازه متوسط ​​تولید در هر شرکت. ب) پراکندگی حجم تولید؛ ج) سهم شرکت هایی با حجم تولید بیش از 400 هزار روبل؛ 2) برای کل منطقه، با احتمال 0.954، حدودی که در آن می توان انتظار داشت: الف) میانگین حجم تولید در هر بنگاه. ب) سهم شرکت هایی با حجم تولید بیش از 400 هزار روبل؛ 3) حجم کل خروجی در منطقه.

راه حل

برای حل مشکل، جدول پیشنهادی را گسترش می دهیم.

1) برای شرکت های موجود در نمونه، اندازه متوسط ​​خروجی در هر شرکت

110800/400 = 277 هزار روبل

پراکندگی حجم تولید را به صورت ساده شده محاسبه می کنیم σ 2 = 35640000/400 - 277 2 = 89100 - 76229 = 12371.

تعداد شرکت هایی که حجم تولید آنها بیش از 400 هزار روبل است. برابر با 36+12 = 48، و سهم آنها برابر با ω = 48:400 = 0.12 = 12٪ است.

2) از نظریه احتمال مشخص می شود که با احتمال P=0.954 ضریب اطمینان t=2. خطای نمونه برداری حاشیه ای

2√12371:400 = 11.12 هزار روبل

اجازه دهید مرزهای میانگین عمومی را تعیین کنیم: 277-11.12 ≤Xav ≤ 277+11.12; 265.88 ≤Xav ≤ 288.12

خطای نمونه برداری حاشیه ای سهم بنگاه ها

2√0,12*0,88/400 = 0,03

اجازه دهید مرزهای سهم عمومی را تعریف کنیم: 0.12-0.03≤ p ≤0.12+0.03; 0.09≤ p≤0.15

3) از آنجایی که گروه بنگاه های در نظر گرفته شده 10 درصد از کل بنگاه های منطقه را تشکیل می دهد، در کل منطقه 4000 بنگاه وجود دارد. سپس حجم کل خروجی در منطقه در محدوده 265.88×4000≤Q≤288.12×4000 قرار دارد. 1063520 ≤ Q ≤ 1152480

وظیفه 2 . بر اساس نتایج ممیزی کنترلی سازمان امور مالیاتی 400 واحد تجاری، 140 مورد از آنها درآمد مشمول مالیات را به طور کامل در اظهارنامه مالیاتی خود قید نمی کنند. در جمعیت عمومی (برای کل منطقه) سهم ساختارهای تجاری که بخشی از درآمدهای مالیاتی خود را پنهان کرده اند را با احتمال 0.954 تعیین کنید.

راه حل

با توجه به شرط مسئله، تعداد واحدهای جامعه نمونه n=400، تعداد واحدهای دارای ویژگی در نظر گرفته m=140، احتمال P=0.954 است.

از تئوری احتمال مشخص می شود که با احتمال P=0.954 ضریب اطمینان t=2.

نسبت واحدهایی که ویژگی نشان داده شده را دارند با فرمول تعیین می شود: p=w+∆p، که در آن w = m/n=140/400=0.35=35%،
و خطای حدی مشخصه ∆p از فرمول بدست می آید: ∆p= t √w(1-w)/n = 2√0.35×0.65/400 ≈ 0.5 = 5%

سپس p = 35±5٪.

پاسخ : سهم ساختارهای تجاری که بخشی از درآمد مالیاتی خود را با احتمال 954/0 پنهان کرده اند 5±35 درصد است.