Model statistik. Prinsip-prinsip untuk membangun objek statistik proses lingkungan

Pemodelan statis merupakan representasi atau gambaran suatu fenomena tertentu atau sistem hubungan antar fenomena melalui sekumpulan variabel (indikator, karakteristik) dan hubungan statistik antar fenomena tersebut. Tujuan pemodelan statis (seperti pemodelan lainnya) adalah untuk menyajikan ciri-ciri paling penting dari fenomena yang diteliti dalam bentuk yang jelas dan dapat diakses untuk dipelajari. Semua model statistik pada akhirnya dirancang untuk mengukur kekuatan dan arah hubungan antara dua variabel atau lebih. Model yang paling kompleks juga memungkinkan seseorang untuk menilai struktur hubungan antara beberapa variabel. Kebanyakan model statistik secara garis besar dapat dibagi menjadi korelasional, struktural, dan kausal. Model korelasi digunakan untuk mengukur hubungan berpasangan “non-arah” antar variabel, yaitu hubungan yang komponen penyebabnya tidak ada atau diabaikan. Contoh model tersebut adalah koefisien korelasi linier berpasangan Pearson, koefisien peringkat korelasi berpasangan dan ganda, dan sebagian besar ukuran asosiasi yang dikembangkan untuk tabel kontingensi (dengan pengecualian koefisien teori informasi dan analisis log-linear).

Model struktural dalam pemodelan statis dirancang untuk mempelajari struktur sekumpulan variabel atau objek tertentu. Data awal untuk mempelajari struktur hubungan beberapa variabel adalah matriks korelasi antar variabel. Analisis matriks korelasi dapat dilakukan secara manual atau menggunakan metode analisis statistik multidimensi – metode penskalaan faktor, cluster, multidimensi. Dalam banyak kasus, mempelajari struktur hubungan antar variabel merupakan langkah awal dalam memecahkan masalah yang lebih kompleks - mengurangi dimensi ruang fitur.

Untuk mempelajari struktur sekumpulan objek, digunakan metode analisis cluster dan penskalaan multidimensi. Matriks jarak antar keduanya digunakan sebagai data awal. Jarak antar benda semakin kecil, semakin “kemiripan” benda tersebut satu sama lain dalam arti nilai variabel yang diukur padanya; jika nilai semua variabel untuk dua benda sama, maka jarak antara keduanya adalah nol. Tergantung pada tujuan penelitian, model struktural dapat disajikan dalam bentuk matriks (korelasi, jarak), struktur faktor, atau secara visual. Hasil analisis klaster paling sering disajikan dalam bentuk dendrogram; hasil analisis faktor dan penskalaan multidimensi disajikan dalam bentuk scatterplot. Struktur matriks korelasi juga dapat disajikan dalam bentuk grafik yang mencerminkan hubungan paling signifikan antar variabel. Model kausal dirancang untuk mengeksplorasi hubungan sebab akibat antara dua variabel atau lebih. Variabel yang mengukur fenomena sebab akibat disebut variabel bebas atau prediktor dalam statistik; Variabel yang mengukur fenomena konsekuensi disebut dependen. Kebanyakan model statistik kausal mengasumsikan satu variabel terikat dan satu atau lebih prediktor. Pengecualiannya adalah model struktural linier, di mana beberapa variabel terikat dapat digunakan secara bersamaan, dan beberapa variabel sekaligus dapat bertindak sebagai variabel terikat dalam kaitannya dengan beberapa indikator dan sebagai prediktor dalam kaitannya dengan indikator lain.

Ada dua bidang penerapan metode pemodelan statistik: perencanaan pemodelan simulasi statis

  • - untuk mempelajari sistem stokastik;
  • - untuk memecahkan masalah deterministik.

Gagasan utama yang digunakan untuk menyelesaikan masalah deterministik dengan menggunakan metode pemodelan statistik adalah untuk mengganti masalah deterministik dengan rangkaian ekivalen dari beberapa sistem stokastik, yang karakteristik keluarannya bertepatan dengan hasil penyelesaian masalah deterministik. Dengan penggantian ini, kesalahan berkurang seiring dengan bertambahnya jumlah pengujian (implementasi algoritma pemodelan) N.

Sebagai hasil pemodelan statistik sistem S serangkaian nilai parsial dari besaran atau fungsi yang diinginkan diperoleh, pemrosesan statistik yang memungkinkan untuk memperoleh informasi tentang perilaku objek atau proses nyata pada waktu yang berubah-ubah. Jika kuantitas penjualan N cukup besar, maka hasil pemodelan sistem yang diperoleh memperoleh kestabilan statistik dan dapat diterima dengan ketelitian yang cukup sebagai perkiraan karakteristik yang diperlukan dari proses berfungsinya sistem S.

Pemodelan statistik adalah metode numerik untuk menyelesaikan masalah matematika, di mana besaran yang diinginkan diwakili oleh karakteristik probabilistik dari beberapa fenomena acak. Fenomena ini dimodelkan, setelah itu karakteristik yang diperlukan kira-kira ditentukan melalui pemrosesan statistik dari “pengamatan” model.

Pengembangan model-model tersebut terdiri dari pemilihan metode analisis statistik, perencanaan proses memperoleh data, pengumpulan data tentang sistem ekologi, algoritma dan perhitungan komputer dari hubungan statistik. Mengubah pola perkembangan situasi ekologi memerlukan pengulangan prosedur yang telah dijelaskan, tetapi dalam kapasitas yang baru.

Penemuan statistik suatu model matematika meliputi memilih jenis model dan menentukan parameternya. Selain itu, fungsi yang diinginkan dapat berupa fungsi dari satu variabel bebas (faktor tunggal) atau banyak variabel (multifaktor). Tugas memilih jenis model merupakan tugas informal, karena ketergantungan yang sama dapat dijelaskan dengan kesalahan yang sama melalui berbagai ekspresi analitis (persamaan regresi). Pilihan jenis model yang rasional dapat dibenarkan dengan mempertimbangkan sejumlah kriteria: kekompakan (misalnya, dijelaskan oleh monomial atau polinomial), interpretabilitas (kemampuan untuk memberikan arti yang berarti pada koefisien model), dll. Tugas menghitung parameter model yang dipilih seringkali murni formal dan dilakukan di komputer.

Saat membentuk hipotesis statistik tentang sistem ekologi tertentu, diperlukan serangkaian data (database) yang beragam, yang jumlahnya bisa jadi terlalu besar. Pemahaman yang memadai tentang sistem dalam hal ini dikaitkan dengan pemisahan informasi yang tidak penting. Baik daftar (jenis) data maupun jumlah data dapat dikurangi. Salah satu metode untuk melakukan kompresi informasi lingkungan (tanpa asumsi apriori tentang struktur dan dinamika ekosistem yang diamati) dapat berupa analisis faktor. Reduksi data dilakukan dengan metode kuadrat terkecil, komponen utama, dan metode statistik multivariat lainnya, yang nantinya akan menggunakan, misalnya analisis klaster.

Perhatikan itu informasi lingkungan primer yang dimilikinya kurang lebih fitur berikut:

– multidimensi data;

– nonlinier dan ambiguitas hubungan dalam sistem yang diteliti;

– kesalahan pengukuran;

– pengaruh faktor-faktor yang tidak terhitung;

– dinamika ruangwaktu.

Saat menyelesaikan masalah pertama dalam memilih jenis model, diasumsikan bahwa m data masukan (x 1, x 2, ..., x m dan n keluaran (y 1, y 2, ..., y) diketahui. Dalam hal ini, khususnya, dua model notasi matriks berikut dapat dilakukan:

dimana X dan Y diketahui parameter masukan (output) dan keluaran (input) suatu objek lingkungan (“kotak hitam”) dalam bentuk notasi vektor; A dan B adalah matriks koefisien model konstan (parameter model) yang diinginkan.

Seiring dengan model yang ditunjukkan bentuk pemodelan statistik yang lebih umum dipertimbangkan:

dimana F adalah vektor faktor pengaruh yang tersembunyi; C dan D adalah matriks koefisien yang diperlukan.

Saat memecahkan masalah lingkungan Disarankan untuk menggunakan model matematika linier dan nonlinier, karena banyak pola lingkungan yang kurang dipelajari. Akibatnya, multidimensi dan nonlinier dari hubungan yang dimodelkan akan diperhitungkan.

Berdasarkan model umum dimungkinkan untuk mengidentifikasi faktor-faktor internal yang tersembunyi dari proses lingkungan yang sedang dipelajari yang tidak diketahui oleh insinyur lingkungan, tetapi manifestasinya tercermin dalam komponen vektor X dan Y. Prosedur ini paling tepat jika tidak ada hubungan sebab-akibat yang ketat antara nilai X dan Y. Model yang digeneralisasi dengan mempertimbangkan pengaruh faktor-faktor tersembunyi menghilangkan kontradiksi tertentu antara dua model dengan matriks A dan B, padahal sebenarnya dua model berbeda dapat digunakan untuk menggambarkan proses lingkungan yang sama. Kontradiksi ini disebabkan oleh kebalikan dari hubungan sebab-akibat antara besaran A dan Y (dalam satu kasus, X adalah masukan, dan Y adalah keluaran, dan dalam kasus lain, sebaliknya). Model umum, dengan mempertimbangkan nilai F, menggambarkan sistem yang lebih kompleks dari mana nilai X dan Y adalah keluaran, dan faktor tersembunyi F bekerja pada masukannya.

Penting dalam pemodelan statistik untuk menggunakan data apriori, ketika selama proses pengambilan keputusan beberapa keteraturan model dapat ditetapkan dan jumlah potensinya dapat dipersempit.

Misalkan perlu untuk membuat model yang dengannya kesuburan jenis tanah tertentu dapat ditentukan secara numerik dalam 24 jam, dengan mempertimbangkan suhu T dan kelembaban W. Baik gandum maupun pohon apel tidak dapat menghasilkan panen di 24 jam. Namun untuk uji tanam, Anda dapat menggunakan bakteri dengan siklus hidup yang pendek, dan menggunakan jumlah P yang dilepaskan CO 2 per satuan waktu sebagai kriteria kuantitatif untuk intensitas aktivitas vitalnya. Maka model matematika dari proses yang diteliti adalah ekspresi

dimana P 0 adalah indikator numerik kualitas tanah.

Tampaknya kita tidak memiliki data apa pun mengenai bentuk fungsi f(T, W) karena insinyur sistem tidak memiliki pengetahuan agronomi yang diperlukan. Namun tidak demikian. Siapa yang tidak tahu bahwa pada suhu ≈0°C air membeku sehingga CO 2 tidak dapat dilepaskan, dan pada suhu 80°C terjadi pasteurisasi, yaitu sebagian besar bakteri mati. Data apriori sudah cukup untuk menyatakan bahwa fungsi yang diinginkan bersifat kuasi-parabola, mendekati nol pada T = 0 dan 80°C dan memiliki titik ekstrem dalam kisaran suhu ini. Alasan serupa mengenai kelembapan mengarah pada fakta bahwa ekstrem maksimum dari fungsi yang diinginkan dicatat pada W=20% dan pendekatannya ke nol pada W=0 dan 40%. Dengan demikian, bentuk model matematika perkiraan telah ditentukan secara apriori, dan tugas percobaan hanya memperjelas sifat fungsi f(T, W) pada T = 20...30 dan 50...60 ° C, serta untuk W = 10 ... 15 dan 25 ... 30% dan penentuan koordinat ekstrem yang lebih akurat (yang mengurangi volume pekerjaan eksperimental, yaitu volume data statistik).

Pemodelan Statistik

metode numerik untuk memecahkan masalah matematika, di mana kuantitas yang diperlukan diwakili oleh karakteristik probabilistik dari beberapa fenomena acak, fenomena ini dimodelkan, setelah itu karakteristik yang diperlukan kira-kira ditentukan melalui pemrosesan statistik dari "pengamatan" model. Misalnya, perlu menghitung aliran panas dalam pelat logam tipis yang dipanaskan, yang ujung-ujungnya dijaga pada suhu nol. Distribusi panas dijelaskan dengan persamaan yang sama seperti penyebaran noda cat pada lapisan cairan (lihat Konduktivitas termal, Difusi). Oleh karena itu, mereka mensimulasikan gerakan bidang Brown dari partikel “cat” di pelat, memantau posisinya pada saat tertentu kτ, k= 0, 1, 2,... Diasumsikan secara kasar bahwa dalam interval kecil τ partikel bergerak satu langkah H kemungkinan yang sama ke segala arah. Setiap kali arahnya dipilih secara acak, terlepas dari semua yang sebelumnya. Hubungan antara τ dan H ditentukan oleh koefisien konduktivitas termal. Pergerakan dimulai dari sumber panas dan berakhir ketika tepi pertama kali tercapai (terlihat “cat” menempel ke tepi). Aliran panas Q (C) melalui bagian batas C diukur dengan jumlah cat yang menempel. Dengan jumlah total N partikel menurut hukum bilangan besar perkiraan seperti itu memberikan kesalahan relatif acak berorde h karena keleluasaan model yang dipilih).

Nilai yang diinginkan diwakili oleh ekspektasi matematis (Lihat Ekspektasi matematis) dari fungsi numerik F dari hasil acak ω dari fenomena: , yaitu, integral atas ukuran probabilitas P (lihat Ukuran suatu himpunan). Untuk evaluasi , dimana ω 1 ,..., ω N hasil simulasi dapat dilihat sebagai rumus kuadratur untuk integral yang ditunjukkan dengan node acak ω k dan kesalahan acak R N biasanya diterima , menganggap kesalahan besar dapat diabaikan; Penyebaran Df dapat dinilai melalui observasi (lihat Teori kesalahan).

Dalam contoh di atas F(ω)= 1 , ketika lintasan berakhir di C; jika tidak F(ω) = 0. Varians

Pelaksanaan setiap "percobaan" dibagi menjadi dua bagian: "pengundian" dari hasil acak ω dan perhitungan fungsi selanjutnya F(ω). Jika ruang semua hasil dan ukuran probabilitas P terlalu rumit, penggambarannya dilakukan secara berurutan dalam beberapa tahap (lihat contoh). Pemilihan acak pada setiap tahap dilakukan dengan menggunakan nomor acak, misalnya dihasilkan oleh beberapa sensor fisik; Peniruan aritmatikanya juga digunakan - bilangan pseudorandom (lihat bilangan acak dan pseudorandom). Prosedur pemilihan acak serupa digunakan dalam statistik matematika dan teori permainan.

SM banyak digunakan untuk menyelesaikan persamaan integral di komputer, misalnya dalam studi sistem besar (lihat Sistem besar). Mereka nyaman karena keserbagunaannya, biasanya tidak memerlukan banyak memori. Kerugiannya adalah kesalahan acak yang besar, yang berkurang terlalu lambat seiring dengan bertambahnya jumlah eksperimen. Oleh karena itu, metode transformasi model telah dikembangkan yang memungkinkan untuk mengurangi sebaran nilai yang diamati dan volume percobaan model.

menyala.: Metode uji statistik (metode Monte Carlo), M., 1962; Ermakov S.M., Metode Monte Carlo dan masalah terkait, M., 1971.

N. N. Chentsov.


Ensiklopedia Besar Soviet. - M.: Ensiklopedia Soviet. 1969-1978 .

Lihat apa itu "Pemodelan Statistik" di kamus lain:

    Studi pemodelan statistik dan ekonometrik objek pengetahuan berdasarkan model statistiknya; konstruksi dan studi model objek, proses atau fenomena kehidupan nyata (misalnya: proses ekonomi di ... ... Wikipedia

    Pemodelan Statistik- cara untuk mempelajari proses perilaku sistem probabilistik dalam kondisi di mana interaksi internal dalam sistem ini tidak diketahui. Ini terdiri dari peniruan mesin dari proses yang sedang dipelajari, yang seolah-olah disalin ke... ... Kamus ekonomi dan matematika

    Sebuah metode matematika terapan dan komputasi, yang terdiri dari implementasi stokastik yang dikembangkan secara khusus pada komputer. model dari fenomena atau objek yang diteliti. Perluasan cakupan penerapan S.m dikaitkan dengan pesatnya perkembangan teknologi dan khususnya... ... Ensiklopedia Matematika

    Pemodelan situasi menggunakan pola statistik yang melekat pada fenomena yang sedang dipertimbangkan. Kamus istilah bisnis. Akademik.ru. 2001... Kamus istilah bisnis

    Pemodelan adalah studi tentang objek pengetahuan berdasarkan modelnya; membangun dan mempelajari model objek, proses atau fenomena kehidupan nyata untuk memperoleh penjelasan atas fenomena tersebut, serta untuk memprediksi fenomena yang menarik... ... Wikipedia

    PEMODELAN SIMULASI dalam sosiologi- jenis pemodelan matematika yang terdiri dari reproduksi proses sosial atau fungsi sistem sosial di komputer. Hampir selalu melibatkan reproduksi faktor acak yang mempengaruhi fenomena yang sedang dipelajari, dan, sebagai konsekuensinya,... ... Sosiologi: Ensiklopedia

    PEMODELAN, STATISTIK- pengembangan berbagai model yang mencerminkan pola statistik dari objek, fenomena yang dijelaskan. Ciri khusus yang umum dari model ini adalah pertimbangan gangguan atau penyimpangan acak. Objek S.m. berbeda... ... Kamus ekonomi besar

    PEMODELAN STATISTIK- representasi atau deskripsi suatu fenomena tertentu atau sistem hubungan antar fenomena melalui sekumpulan variabel (indikator, karakteristik) dan hubungan statistik di antara mereka. Tujuan dari M.S. (seperti pemodelan lainnya) bayangkan... ... Sosiologi: Ensiklopedia

    Untuk menyempurnakan artikel ini, disarankan?: Perbaiki artikel sesuai dengan aturan gaya Wikipedia. Pemodelan simulasi (situasi... Wikipedia

    PEMODELAN SIMULASI- (...dari sampel model Perancis) metode mempelajari setiap fenomena dan proses menggunakan uji statistik (metode Monte Carlo) dengan menggunakan komputer. Metode ini didasarkan pada penggambaran (simulasi) pengaruh faktor-faktor acak terhadap fenomena yang diteliti atau... ... Kamus Ensiklopedis Psikologi dan Pedagogi

Buku

  • Pemodelan statistik. Metode Monte Carlo. Buku teks untuk gelar sarjana dan master, Mikhailov G.A. Buku teks ini dikhususkan untuk fitur pemodelan variabel acak, proses, dan bidang. Perhatian khusus diberikan pada integrasi numerik, khususnya metode Monte Carlo. Solusi diberikan...

Ide seleksi acak. Sebelum kita mulai menjelaskan hipotesis statistik, mari kita bahas sekali lagi konsep seleksi acak.

Mengesampingkan rincian dan beberapa pengecualian (walaupun penting), dapat dikatakan bahwa semua analisis statistik didasarkan pada gagasan pilihan acak. Kami menerima tesis bahwa data yang tersedia muncul sebagai hasil seleksi acak dari populasi umum tertentu, seringkali hanya khayalan. Kita biasanya berasumsi bahwa pilihan acak ini dihasilkan oleh alam. Namun, dalam banyak permasalahan, populasi umum ini cukup nyata, dan pilihannya ditentukan oleh pengamat yang aktif.

Untuk singkatnya, kami akan mengatakan bahwa semua data yang akan kami pelajari secara keseluruhan adalah satu pengamatan. Sifat observasi kolektif ini bisa sangat beragam. Bisa berupa angka tunggal, urutan angka, urutan karakter, tabel angka, dll. Mari kita nyatakan observasi kolektif ini untuk saat ini dengan X. Sekali kita menghitung X hasil seleksi acak, kita harus menunjukkan populasi umum dari mana X terpilih. Artinya kita harus menunjukkan nilai-nilai yang mungkin muncul, bukan nilai sebenarnya X. Mari kita nyatakan koleksi ini dengan X. Sekelompok X disebut juga ruang sampel, atau ruang sampel.

Kami selanjutnya berasumsi bahwa pilihan yang ditentukan terjadi sesuai dengan distribusi probabilitas tertentu di himpunan X, menurut yang masing-masing elemen X mempunyai peluang tertentu untuk terpilih. Jika X - adalah himpunan berhingga, maka masing-masing elemennya X; ada kemungkinan positif R(X) untuk dipilih. Seleksi acak menurut hukum probabilistik mudah dipahami secara harfiah. Untuk himpunan tak hingga yang lebih kompleks X kita perlu menentukan probabilitas bukan untuk poin individualnya, tetapi untuk himpunan bagian. Pemilihan acak dari salah satu kemungkinan yang jumlahnya tak terhingga lebih sulit untuk dibayangkan, serupa dengan memilih suatu titik X dari suatu segmen atau wilayah spasial X.

Hubungan antar observasi X dan ruang sampel X, antara elemen-elemen yang probabilitasnya terdistribusi - persis sama dengan antara hasil-hasil dasar dan ruang hasil-hasil dasar yang dibahas oleh teori probabilitas. Berkat ini, teori probabilitas menjadi dasar statistik matematika, dan oleh karena itu, khususnya, kita dapat menerapkan pertimbangan probabilistik pada masalah pengujian hipotesis statistik.

Aturan pragmatis. Jelas bahwa setelah kita mengadopsi sudut pandang probabilistik tentang asal usul data kita (yaitu, kita percaya bahwa data tersebut diperoleh melalui seleksi acak), maka semua penilaian lebih lanjut berdasarkan data ini akan bersifat probabilistik. Pernyataan apa pun akan benar hanya dengan probabilitas tertentu, dan dengan probabilitas positif tertentu, pernyataan tersebut mungkin salah. Akankah kesimpulan tersebut berguna, dan mungkinkah memperoleh hasil yang dapat diandalkan melalui jalur ini?



Kedua pertanyaan ini harus dijawab secara positif. Pertama, pengetahuan tentang probabilitas suatu peristiwa berguna, karena peneliti dengan cepat mengembangkan intuisi probabilistik, memungkinkan dia untuk beroperasi dengan probabilitas, distribusi, ekspektasi matematis, dll., dengan memanfaatkannya. Kedua, hasil yang murni bersifat probabilistik bisa cukup meyakinkan: suatu kesimpulan dapat dianggap dapat diandalkan secara praktis jika probabilitasnya mendekati satu.

Berikut ini dapat dikatakan aturan pragmatis yang memandu orang dan yang menghubungkan teori probabilitas dengan aktivitas kita.

Kami menganggap sebagai peristiwa yang hampir pasti suatu peristiwa yang kemungkinannya dekat 1;

Kami menganggap secara praktis tidak mungkin suatu peristiwa yang kemungkinannya dekat 0.

Dan kami tidak hanya berpikir demikian, tetapi kami juga bertindak sesuai dengan itu!

Aturan pragmatis yang dikemukakan, dalam arti sempit, tentu saja salah, karena tidak sepenuhnya melindungi dari kesalahan. Namun kesalahan saat menggunakannya akan jarang terjadi. Aturan ini berguna karena memungkinkan penerapan kesimpulan probabilistik secara praktis.

Terkadang aturan yang sama diungkapkan sedikit berbeda: dalam satu percobaan peristiwa yang tidak terduga tidak terjadi(dan sebaliknya - suatu peristiwa pasti terjadi, yang kemungkinannya dekat 1). Kata “tunggal” disisipkan untuk tujuan klarifikasi, karena dalam rangkaian pengulangan percobaan independen yang cukup panjang, peristiwa yang tidak terduga (dalam satu percobaan!) yang disebutkan di atas hampir pasti akan terjadi. Tapi ini adalah situasi yang sangat berbeda.

Masih belum jelas probabilitas apa yang dianggap rendah. Tidak ada jawaban kuantitatif terhadap pertanyaan ini yang dapat diterapkan pada semua kasus. Jawabannya tergantung pada bahaya apa yang ditimbulkan oleh kesalahan tersebut kepada kita. Seringkali - ketika menguji hipotesis statistik, misalnya, lihat di bawah - probabilitas diasumsikan kecil, mulai dari 0,01 ¸ 0,05. Hal lainnya adalah keandalan perangkat teknis, misalnya rem mobil. Di sini kemungkinan kegagalan akan sangat tinggi, katakanlah 0,001, karena kegagalan rem sekali dalam seribu kejadian pengereman akan menyebabkan banyak kecelakaan. Oleh karena itu, ketika menghitung keandalan, sering kali probabilitas operasi bebas kegagalan harus berada pada kisaran 1-10 -6. Kami tidak akan membahas di sini seberapa realistis persyaratan tersebut: apakah model matematika perkiraan yang tak terelakkan dapat memberikan keakuratan dalam menghitung probabilitas dan bagaimana kemudian membandingkan hasil yang dihitung dan hasil nyata.

Peringatan 1. Beberapa saran harus diberikan tentang bagaimana membangun model statistik, seringkali dalam permasalahan yang tidak memiliki sifat statistik yang jelas. Untuk melakukan hal ini, perlu untuk menyatakan ciri-ciri yang melekat pada masalah yang sedang dibahas dalam kaitannya dengan ruang sampel dan distribusi probabilitas. Sayangnya, proses ini tidak dapat dijelaskan secara umum. Terlebih lagi, proses ini kreatif dan tidak mungkin menghafal seperti, katakanlah, tabel perkalian. Tapi dia bisa belajar untuk, dengan mempelajari pola dan contoh serta mengikuti semangatnya. Kita akan melihat beberapa contohnya. Kedepannya kami juga akan memberikan perhatian khusus pada tahap penelitian statistik ini.

2. Ketika memformalkan masalah nyata, model statistik yang sangat beragam dapat muncul. Namun, teori matematika telah mempersiapkan sarana untuk mempelajari model dalam jumlah terbatas. Untuk sejumlah model standar, teorinya telah dikembangkan dengan sangat rinci, dan di sanalah jawaban atas pertanyaan-pertanyaan utama yang menarik bagi peneliti dapat diperoleh. Kita akan membahas beberapa model standar ini, yang paling sering kita bahas dalam praktiknya, dalam buku ini. Lainnya dapat ditemukan di panduan dan buku referensi yang lebih khusus dan terperinci.

3. Perlu diingat keterbatasan alat matematika ketika memformalkan eksperimen secara matematis. Jika memungkinkan, kita harus mengurangi masalah ini menjadi masalah statistik standar. Pertimbangan ini sangat penting ketika perencanaan eksperimen atau penelitian; saat mengumpulkan informasi, jika kita berbicara tentang survei statistik; saat menyiapkan eksperimen, jika kita berbicara tentang eksperimen aktif.

Pengamatan statistik.

Inti dari observasi statistik.

Tahap awal dari setiap penelitian statistik adalah pengumpulan data yang sistematis dan terorganisir secara ilmiah tentang fenomena dan proses kehidupan sosial, yang disebut observasi statistik. Signifikansi penelitian tahap ini ditentukan oleh kenyataan bahwa penggunaan hanya data yang obyektif dan cukup lengkap yang diperoleh dari hasil pengamatan statistik pada tahap selanjutnya saja mampu memberikan kesimpulan yang berlandaskan ilmiah tentang sifat dan pola perkembangan penyakit. objek yang sedang dipelajari. Pengamatan statistik dilakukan dengan menilai dan mencatat karakteristik unit populasi yang diteliti dalam dokumen akuntansi yang relevan. Data yang diperoleh dengan cara ini mewakili fakta-fakta yang dalam satu atau lain cara mencirikan fenomena kehidupan sosial. Penggunaan argumentasi berbasis bukti tidak bertentangan dengan penggunaan analisis teoretis, karena teori apa pun pada akhirnya didasarkan pada materi faktual. Kekuatan pembuktian fakta semakin meningkat sebagai hasil pemrosesan statistik, yang memastikan sistematisasi dan penyajiannya dalam bentuk yang ringkas. Observasi statistik harus dibedakan dengan bentuk observasi lain yang dilakukan dalam kehidupan sehari-hari, berdasarkan persepsi indra. Hanya pengamatan seperti itu yang dapat disebut statistik, yang memastikan pencatatan fakta-fakta yang ada dalam dokumen akuntansi untuk generalisasi selanjutnya. Contoh spesifik observasi statistik adalah pengumpulan informasi secara sistematis, misalnya, di perusahaan pembuat mesin tentang jumlah mesin dan komponen yang diproduksi, biaya produksi, keuntungan, dll. Pengamatan statistik harus memenuhi persyaratan yang cukup ketat: 1. Fenomena yang diamati harus mempunyai kepentingan ekonomi nasional tertentu, nilai ilmiah atau praktis, mengungkapkan jenis fenomena sosio-ekonomi tertentu. 2. Pengamatan statistik harus menjamin pengumpulan data massal, yang mencerminkan seluruh rangkaian fakta yang berkaitan dengan masalah yang sedang dipertimbangkan, karena fenomena sosial terus berubah, berkembang, dan memiliki keadaan kualitatif yang berbeda.

Data yang tidak lengkap dan tidak cukup menjelaskan proses secara komprehensif menyebabkan pengambilan kesimpulan yang salah dari analisisnya. 3. Keanekaragaman penyebab dan faktor yang menentukan perkembangan fenomena sosial dan ekonomi menentukan orientasi pengamatan statistik, serta pengumpulan data yang secara langsung mencirikan objek yang diteliti, dengan mempertimbangkan fakta dan peristiwa yang dipengaruhi oleh perubahan mana yang terjadi di negara bagiannya. 4. Untuk menjamin keandalan data statistik pada tahap observasi statistik, perlu dilakukan pemeriksaan menyeluruh terhadap kualitas fakta yang dikumpulkan. Keandalan data yang ketat adalah salah satu karakteristik observasi statistik yang paling penting. Cacat pada informasi statistik, yang dinyatakan dalam ketidakandalannya, tidak dapat dihilangkan dalam proses pemrosesan lebih lanjut, sehingga kemunculannya menyulitkan pengambilan keputusan berdasarkan ilmiah dan keseimbangan perekonomian. 5. Pengamatan statistik harus dilakukan atas dasar ilmiah sesuai dengan sistem, rencana dan aturan (program) yang telah dikembangkan sebelumnya, yang memberikan solusi ilmiah yang ketat terhadap semua masalah program, metodologi dan organisasi.

Dukungan perangkat lunak dan metodologis untuk observasi statistik.

Persiapan observasi statistik, memastikan keberhasilan kasus, melibatkan kebutuhan untuk menyelesaikan sejumlah masalah metodologis secara tepat waktu terkait dengan definisi tugas, tujuan, objek, unit observasi, pengembangan program dan alat, dan penentuan metode observasi. mengumpulkan data statistik. Tugas observasi statistik langsung mengikuti tugas penelitian statistik dan khususnya terdiri dari memperoleh data massal secara langsung tentang keadaan objek yang diteliti, dengan memperhatikan keadaan fenomena yang mempengaruhi objek tersebut, dan mempelajari data tentangnya. proses perkembangan fenomena. Tujuan surveilans terutama ditentukan oleh kebutuhan dukungan informasi bagi pembangunan ekonomi dan sosial masyarakat. Tujuan yang ditetapkan untuk statistik negara diklarifikasi dan dikonkretkan oleh badan pengaturnya, sebagai akibatnya arah dan ruang lingkup pekerjaan ditentukan. Tergantung pada tujuannya, pertanyaan tentang objek pengamatan statistik diputuskan, yaitu. apa sebenarnya yang harus diperhatikan. Objek dipahami sebagai sekumpulan objek material, perusahaan, kolektif kerja, individu, dll., yang melaluinya fenomena dan proses yang menjadi sasaran penelitian statistik dilakukan. Objek pengamatan, tergantung pada tujuannya, dapat berupa kumpulan unit peralatan produksi, produk, inventaris, pemukiman, wilayah, perusahaan, organisasi dan lembaga dari berbagai sektor perekonomian nasional, penduduk dan masing-masing kategori. , dll. Penetapan suatu objek pengamatan statistik dikaitkan dengan penentuan batas-batasnya berdasarkan kriteria yang sesuai, yang dinyatakan dengan beberapa ciri pembatas yang disebut kualifikasi. Pilihan kualifikasi mempunyai pengaruh yang signifikan terhadap pembentukan populasi yang homogen dan memastikan ketidakmungkinan mencampurkan objek yang berbeda atau meremehkan beberapa bagian dari suatu objek. Hakikat objek pengamatan statistik lebih dapat dipahami bila mempertimbangkan satuan-satuan yang dikandungnya: Satuan-satuan pengamatan adalah unsur-unsur utama objek pengamatan statistik yang merupakan pembawa ciri-ciri yang terdaftar.

Unit pelaporan harus dibedakan dengan unit observasi. Unit pelaporan adalah unit pengamatan statistik dari mana informasi yang harus didaftarkan diterima sesuai dengan prosedur yang ditetapkan. Dalam beberapa kasus, kedua konsep tersebut bertepatan, tetapi seringkali keduanya memiliki arti yang sepenuhnya independen. Ternyata tidak mungkin dan tidak praktis untuk memperhitungkan seluruh rangkaian ciri-ciri yang menjadi ciri objek pengamatan, oleh karena itu dalam menyusun rencana pengamatan statistik, persoalan komposisi ciri-ciri yang akan didaftarkan sesuai dengan tujuannya harus diperhatikan dengan cermat. dan dengan terampil memutuskan. Daftar ciri-ciri yang dirumuskan dalam bentuk pertanyaan-pertanyaan yang ditujukan kepada satuan-satuan populasi yang harus dijawab oleh suatu studi statistik, merupakan suatu program observasi statistik.

Untuk memperoleh gambaran menyeluruh tentang fenomena yang diteliti, program harus mempertimbangkan keseluruhan ciri-ciri esensialnya. Namun, sifat problematis dari penerapan praktis prinsip ini mengharuskan pencantuman dalam program hanya fitur-fitur paling esensial yang mengungkapkan jenis fenomena sosio-ekonomi, fitur-fiturnya yang paling penting, sifat-sifatnya, dan hubungannya. Ruang lingkup program diatur oleh jumlah sumber daya yang tersedia bagi otoritas statistik, waktu perolehan hasil, persyaratan tingkat detail perkembangan, dll. Isi program ditentukan oleh sifat dan sifat objek yang diteliti, maksud dan tujuan penelitian. Di antara persyaratan umum untuk menyusun suatu program adalah tidak dapat diterimanya memasukkan pertanyaan-pertanyaan yang sulit memperoleh jawaban yang akurat dan dapat diandalkan sepenuhnya yang memberikan gambaran obyektif tentang situasi tertentu. Ketika mempertimbangkan beberapa karakteristik yang paling penting, biasanya pertanyaan kontrol dimasukkan dalam program untuk memastikan konsistensi informasi yang diterima. Untuk meningkatkan verifikasi timbal balik atas pertanyaan-pertanyaan dan sifat analitis dari program observasi, pertanyaan-pertanyaan yang saling terkait disusun dalam urutan tertentu, kadang-kadang dalam blok-blok karakteristik yang saling terkait.

Soal-soal program observasi statistik harus dirumuskan secara jelas, ringkas dan ringkas, tanpa membuka kemungkinan terjadinya perbedaan penafsiran. Program ini sering kali menyediakan daftar kemungkinan pilihan jawaban, yang melaluinya isi semantik pertanyaan diklarifikasi. Dukungan metodologis observasi statistik mengasumsikan bahwa bersamaan dengan program observasi, disusun program pengembangannya. Tujuan penelitian dirumuskan dalam daftar indikator statistik yang bersifat generalisasi. Indikator-indikator ini harus diperoleh sebagai hasil pengolahan bahan yang dikumpulkan, karakteristik yang sesuai dengan masing-masing indikator, dan tata letak tabel statistik, yang menyajikan hasil pengolahan informasi primer. Program pengembangan, dengan mengidentifikasi informasi yang hilang, memungkinkan Anda untuk memperjelas program observasi statistik. Melakukan observasi statistik memerlukan persiapan alat yang tepat: formulir dan petunjuk pengisiannya. Formulir statistik adalah dokumen utama yang mencatat jawaban atas pertanyaan program untuk setiap unit populasi. Oleh karena itu, formulir merupakan pembawa informasi primer. Semua formulir dicirikan oleh unsur-unsur wajib tertentu: bagian isi, termasuk daftar pertanyaan program, kolom bebas atau beberapa kolom untuk mencatat jawaban dan kode jawaban, pencetakan judul dan alamat. Untuk menjamin keseragaman interpretasi isinya, formulir statistik biasanya disertai dengan instruksi, yaitu. petunjuk dan penjelasan tertulis pengisian formulir observasi statistik. Petunjuk tersebut menjelaskan tujuan pengamatan statistik, ciri-ciri objek dan satuannya, waktu dan lama pengamatan, tata cara penyusunan dokumentasi, dan batas waktu penyajian hasil. Namun, tujuan utama dari petunjuk ini adalah untuk menjelaskan isi pertanyaan program, bagaimana menjawabnya dan mengisi formulir.

Jenis dan metode observasi statistik.

Keberhasilan pengumpulan data awal yang berkualitas dan lengkap, dengan memperhatikan kebutuhan penggunaan sumber daya material, tenaga kerja dan keuangan secara ekonomis, sangat ditentukan oleh keputusan pemilihan jenis, metode dan bentuk organisasi observasi statistik.

Jenis observasi statistik.

Kebutuhan untuk memilih satu atau beberapa opsi lain untuk mengumpulkan data statistik yang paling sesuai dengan kondisi masalah yang dipecahkan ditentukan oleh adanya beberapa jenis observasi, yang berbeda terutama dalam sifat pencatatan fakta dari waktu ke waktu. Pengamatan yang sistematis, yang dilakukan secara terus-menerus dan selalu seiring timbulnya tanda-tanda suatu fenomena, disebut arus. Pengamatan saat ini dilakukan atas dasar dokumen-dokumen primer yang memuat informasi-informasi yang diperlukan untuk memperoleh gambaran yang cukup lengkap tentang fenomena yang diteliti. Pengamatan statistik yang dilakukan pada selang waktu tertentu yang sama disebut periodik. Contohnya adalah sensus penduduk. Pengamatan yang dilakukan dari waktu ke waktu, tanpa memperhatikan frekuensi yang ketat atau satu kali saja, disebut satu kali. Jenis observasi statistik dibedakan dengan mempertimbangkan perbedaan informasi berdasarkan kelengkapan cakupan penduduk. Dalam hal ini, dibedakan antara observasi kontinyu dan observasi non kontinyu. Observasi yang berkesinambungan adalah observasi yang memperhitungkan seluruh satuan populasi yang diteliti tanpa kecuali. Pengamatan non-kontinyu jelas berorientasi pada mempertimbangkan bagian tertentu, biasanya cukup besar dari unit pengamatan, yang tetap memungkinkan diperolehnya karakteristik generalisasi yang stabil dari seluruh populasi statistik. Dalam praktik statistik, berbagai jenis observasi nonkontinyu digunakan: selektif, metode massal, kuesioner, dan monografi. Kualitas observasi nonkontinyu lebih rendah dibandingkan hasil observasi kontinyu, namun dalam beberapa kasus observasi statistik secara umum ternyata hanya dapat dilakukan sebagai observasi nonkontinyu. Untuk memperoleh ciri-ciri yang mewakili seluruh populasi statistik untuk beberapa bagian unitnya, digunakan observasi sampel, berdasarkan kaidah ilmiah pembentukan populasi sampel. Sifat pemilihan unit populasi yang acak menjamin ketidakberpihakan hasil pengambilan sampel dan mencegah bias. Dengan menggunakan metode susunan utama, unit populasi terbesar dan paling signifikan dipilih, yang dominan dalam massa totalnya sesuai dengan karakteristik yang dipelajari. Jenis pengamatan statistik tertentu adalah deskripsi monografik, yang merupakan pemeriksaan terperinci terhadap suatu objek yang terpisah, tetapi sangat khas, yang menarik dari sudut pandang mempelajari seluruh populasi.

Metode observasi statistik.

Diferensiasi jenis observasi statistik juga dimungkinkan tergantung pada sumber dan metode memperoleh informasi primer. Dalam hal ini dibedakan antara observasi langsung, survei dan observasi dokumenter. Pengamatan langsung dilakukan dengan cara menghitung, mengukur nilai tanda, melakukan pembacaan instrumen oleh orang khusus yang melakukan observasi, dengan kata lain pencatat. Tak jarang, karena ketidakmungkinan menggunakan metode lain, observasi statistik dilakukan melalui survei terhadap daftar pertanyaan tertentu. Jawabannya dicatat dalam bentuk khusus. Tergantung pada metode penerimaan tanggapan, perbedaan dibuat antara metode penerusan dan koresponden, serta metode pendaftaran mandiri. Metode survei penerusan dilakukan secara lisan oleh orang khusus (counter, forwarder), yang sekaligus mengisi formulir atau formulir survei.

Metode survei koresponden diselenggarakan oleh badan statistik yang mendistribusikan formulir survei kepada sekelompok orang tertentu yang telah dipersiapkan secara tepat yang disebut koresponden. Yang terakhir ini wajib, sesuai kesepakatan, mengisi formulir dan mengembalikannya ke organisasi statistik. Pengecekan kebenaran pengisian formulir dilakukan pada saat survei dengan menggunakan registrasi mandiri. Kuesioner diisi, seperti dalam metode koresponden, oleh responden sendiri, tetapi kuesioner tersebut didistribusikan dan dikumpulkan, serta diinstruksikan dan dipantau untuk pengisian yang benar, oleh enumerator.

Bentuk organisasi dasar observasi statistik.

Segala macam jenis dan metode observasi dalam praktiknya dilakukan melalui dua bentuk organisasi utama: pelaporan dan observasi yang diselenggarakan secara khusus. Pelaporan statistik adalah bentuk utama pengamatan statistik dalam masyarakat sosial, yang mencakup semua perusahaan, organisasi dan lembaga di bidang produksi dan non-produksi. Pelaporan adalah penyajian sistematis dokumentasi akuntansi dan statistik secara tepat waktu dalam bentuk laporan yang secara komprehensif mencirikan hasil kerja perusahaan dan lembaga selama periode pelaporan. Pelaporan berhubungan langsung dengan dokumen utama dan akuntansi, didasarkan pada dokumen tersebut dan mewakili sistematisasinya, yaitu. hasil pengolahan dan generalisasi. Pelaporan dilakukan dalam bentuk yang ditetapkan secara ketat, disetujui oleh Komite Statistik Negara Rusia. Daftar semua formulir yang menunjukkan rinciannya (aksesori) disebut lembar pelaporan. Setiap formulir pelaporan harus memuat informasi berikut: nama; nomor dan tanggal persetujuan; nama perusahaan, alamat dan subordinasinya; alamat tujuan penyampaian pelaporan; frekuensi, tanggal presentasi, cara penularan; konten dalam bentuk tabel; komposisi resmi orang yang bertanggung jawab atas pengembangan dan keandalan data pelaporan, yaitu. wajib menandatangani laporan tersebut. Keragaman kondisi proses produksi di berbagai sektor produksi material, kekhususan proses reproduksi dalam kondisi lokal, dengan mempertimbangkan pentingnya indikator tertentu menentukan perbedaan jenis pelaporan. Pertama-tama, ada pelaporan standar dan khusus. Standar pelaporan mempunyai bentuk dan isi yang sama untuk semua perusahaan atau lembaga dalam perekonomian nasional. Pelaporan khusus mengungkapkan aspek-aspek khusus untuk masing-masing perusahaan dalam industri. Berdasarkan prinsip frekuensi, pelaporan dibagi menjadi tahunan dan terkini: triwulanan, bulanan, dua mingguan, mingguan. Tergantung pada metode penyampaian informasi, pelaporan pos dan telegraf dibedakan. Sensus statistik berfungsi sebagai bentuk organisasi observasi statistik terpenting kedua. Sensus adalah suatu pengamatan statistik yang diselenggarakan secara khusus yang bertujuan untuk mencatat jumlah dan komposisi objek (fenomena) tertentu, serta menetapkan ciri-ciri kualitatif agregatnya pada suatu waktu tertentu. Sensus memberikan informasi statistik yang tidak disediakan dalam pelaporan, dan dalam beberapa kasus secara signifikan memperjelas data akuntansi terkini.

Untuk memastikan hasil sensus statistik berkualitas tinggi, serangkaian pekerjaan persiapan dilakukan. Isi tindakan organisasi untuk persiapan sensus, yang dilakukan sesuai dengan persyaratan dan kaidah ilmu statistik, dituangkan dalam dokumen yang dikembangkan secara khusus yang disebut rencana organisasi observasi statistik. Dalam rencana organisasi, masalah subjek (pelaksana) pengamatan statistik, tempat, waktu, waktu dan prosedur pelaksanaan, organisasi sensus wilayah, pemilihan dan pelatihan pekerja penghitung, penyediaan mereka dengan dokumentasi akuntansi yang diperlukan , sejumlah pekerjaan persiapan lainnya dan sebagainya. Subyek observasi adalah organisasi (lembaga) atau bagiannya yang bertanggung jawab melakukan observasi, menyelenggarakan pelaksanaannya, serta langsung menjalankan fungsi pengumpulan dan pengolahan data statistik. Pertanyaan tentang tempat observasi (tempat pencatatan fakta) muncul terutama ketika melakukan penelitian statistik dan sosiologis dan diselesaikan tergantung pada tujuan penelitian.

Waktu observasi adalah jangka waktu di mana pekerjaan pencatatan dan verifikasi data yang diperoleh harus dimulai dan diselesaikan. Waktu pengamatan dipilih berdasarkan kriteria mobilitas spasial minimal objek yang diteliti. Momen kritis dimana data yang dikumpulkan diberi tanggal harus dibedakan dari waktu observasi.

Konsep observasi statistik merupakan topik yang cukup menarik untuk dibahas. Pengamatan statistik digunakan hampir di mana pun penerapannya dapat ditentukan. Pada saat yang sama, meskipun cakupan penerapannya luas, pengamatan statistik adalah subjek yang agak rumit dan kesalahan sering terjadi. Namun, secara umum, observasi statistik sebagai bahan pertimbangan sangat menarik.