Signifikansi statistik perbedaan antara sampel. Signifikansi Statistik

Signifikansi statistik atau tingkat signifikansi p - hasil tes utama

hipotesis statistik. pembicaraan bahasa teknis, adalah peluang terambilnya

hasil studi sampel asalkan sebenarnya untuk jenderal

set, hipotesis nol benar - yaitu, tidak ada hubungan. Dengan kata lain, ini

probabilitas bahwa hubungan yang terdeteksi adalah acak dan bukan properti

agregat. Tepat signifikansi statistik, tingkat signifikansi p adalah

hitungan keandalan koneksi: semakin rendah probabilitas ini, semakin andal koneksi.

Misalkan, ketika membandingkan dua rata-rata sampel, nilai level diperoleh

signifikansi statistik p=0,05. Artinya pengujian hipotesis statistik tentang

persamaan rata-rata dalam populasi umum menunjukkan bahwa jika itu benar, maka probabilitas

kejadian acak dari perbedaan yang terdeteksi tidak lebih dari 5%. Dengan kata lain, jika

dua sampel diambil berulang kali dari populasi umum yang sama, kemudian dalam 1

20 kasus akan menunjukkan perbedaan yang sama atau lebih besar antara rata-rata sampel ini.

Artinya, ada kemungkinan 5% bahwa perbedaan yang ditemukan adalah acak.

karakter, dan bukan merupakan milik agregat.

Dalam suatu hubungan hipotesis ilmiah tingkat signifikansi statistik adalah kuantitatif

indikator tingkat ketidakpercayaan pada kesimpulan tentang keberadaan koneksi, dihitung dari hasil

selektif, pengujian empiris hipotesis ini. Bagaimana nilai kurang tingkat-p, semakin tinggi

signifikansi statistik dari hasil penelitian, membenarkan hipotesis ilmiah.

Hal ini berguna untuk mengetahui apa yang mempengaruhi tingkat signifikansi. Tingkat signifikansi, hal-hal lain dianggap sama

di atas (nilai p lebih rendah) jika:

Besarnya sambungan (selisih) lebih besar;

Keragaman sifat lebih kecil;

Ukuran sampel lebih besar.

Sepihak Berikut adalah uji signifikansi dua sisi:

Jika tujuan penelitian adalah untuk mengungkapkan perbedaan antara parameter dari dua umum

koleksi yang sesuai dengan berbagai kondisi alamnya ( kondisi hidup,

usia subjek, dll.), seringkali tidak diketahui parameter mana yang lebih besar, dan

mana yang lebih kecil.

Misalnya, jika Anda tertarik pada variabilitas hasil dalam kontrol dan

kelompok eksperimen, maka, sebagai aturan, tidak ada kepercayaan pada tanda perbedaan antara varians atau

standar deviasi hasil terhadap variabilitas yang diperkirakan. Pada kasus ini

hipotesis nol adalah bahwa variansnya sama satu sama lain, dan tujuan dari penelitian ini adalah

membuktikan sebaliknya, yaitu terdapat perbedaan antar varian. Pada saat yang sama, itu diperbolehkan

perbedaannya bisa berupa tanda apa saja. Hipotesis semacam itu disebut dua sisi.

Tetapi terkadang tugasnya adalah membuktikan peningkatan atau penurunan parameter;

Sebagai contoh, hasil rata-rata lebih tinggi pada kelompok eksperimen dibandingkan pada kelompok kontrol. Di mana

tidak boleh lagi perbedaan itu berlainan tanda. Hipotesis semacam itu disebut

Sepihak.

Uji signifikansi yang digunakan untuk menguji hipotesis dua sisi disebut

Bilateral, dan untuk unilateral - unilateral.

Muncul pertanyaan tentang kriteria mana yang harus dipilih dalam kasus tertentu. Menjawab

Pertanyaan ini di luar formal metode statistik dan sepenuhnya

Tergantung dari tujuan studi. Dalam kasus apa pun, satu atau kriteria lain tidak boleh dipilih setelah

Melakukan percobaan berdasarkan analisis data percobaan, karena hal ini dapat

mengarah pada kesimpulan yang salah. Jika, sebelum percobaan, diasumsikan bahwa perbedaan

Parameter yang dibandingkan bisa positif dan negatif, berikut ini

Tingkat signifikansi dalam statistika adalah indikator penting, mencerminkan tingkat kepercayaan terhadap keakuratan, kebenaran data yang diterima (diprediksi). Konsep ini banyak digunakan dalam berbagai bidang: dari memegang penelitian sosiologi, hingga uji statistik hipotesis ilmiah.

Definisi

Tingkat signifikansi statistik (atau hasil yang signifikan secara statistik) menunjukkan berapa probabilitas kemunculan acak dari indikator yang dipelajari. Signifikansi statistik keseluruhan dari fenomena tersebut dinyatakan oleh nilai-p (tingkat-p). Dalam setiap percobaan atau pengamatan, ada kemungkinan bahwa data yang diperoleh muncul karena kesalahan pengambilan sampel. Hal ini terutama berlaku untuk sosiologi.

Artinya, suatu nilai signifikan secara statistik, yang probabilitas kemunculan acaknya sangat kecil atau cenderung ekstrem. Ekstrem dalam konteks ini adalah tingkat penyimpangan statistik dari hipotesis nol (hipotesis yang diuji konsistensinya dengan data sampel yang diperoleh). PADA praktek ilmiah tingkat signifikansi dipilih sebelum pengumpulan data dan, sebagai aturan, koefisiennya adalah 0,05 (5%). Untuk sistem yang sangat penting nilai yang tepat, indikator ini bisa 0,01 (1%) atau kurang.

Latar belakang

Konsep tingkat signifikansi diperkenalkan oleh ahli statistik dan genetika Inggris Ronald Fisher pada tahun 1925 ketika ia mengembangkan metode untuk pengujian. hipotesis statistik. Saat menganalisis proses apa pun, ada kemungkinan tertentu dari fenomena tertentu. Kesulitan muncul ketika bekerja dengan persentase kecil (atau tidak jelas) dari probabilitas yang termasuk dalam konsep "kesalahan pengukuran".

Ketika bekerja dengan statistik yang tidak cukup spesifik untuk diuji, para ilmuwan dihadapkan pada masalah hipotesis nol, yang "mencegah" beroperasi dengan nilai-nilai kecil. Fisher mengusulkan sistem tersebut untuk menentukan probabilitas kejadian pada 5% (0,05) sebagai sampel cutoff yang memungkinkan seseorang untuk menolak hipotesis nol dalam perhitungan.

Pengenalan koefisien tetap

Pada tahun 1933 Ilmuwan Jerzy Neumann dan Egon Pearson dalam makalah mereka merekomendasikan pengaturan tingkat signifikansi tertentu terlebih dahulu (sebelum pengumpulan data). Contoh penggunaan aturan tersebut terlihat jelas saat pemilu. Misalkan ada dua kandidat, salah satunya sangat populer dan yang lainnya tidak begitu dikenal. Jelas bahwa kandidat pertama akan memenangkan pemilihan, dan peluang kandidat kedua cenderung nol. Upayakan - tetapi tidak sama: selalu ada kemungkinan force majeure, informasi sensasional, keputusan tak terduga yang dapat mengubah hasil pemilu yang diprediksi.

Neumann dan Pearson setuju bahwa tingkat signifikansi yang diusulkan Fisher sebesar 0,05 (dilambangkan dengan simbol ) adalah yang paling sesuai. Namun, Fischer sendiri pada tahun 1956 menentang penetapan nilai ini. Dia percaya bahwa tingkat harus diatur sesuai dengan keadaan tertentu. Misalnya, dalam fisika partikel adalah 0,01.

nilai-p

Istilah nilai p pertama kali digunakan oleh Brownlee pada tahun 1960. Level-p (nilai-p) adalah indikator yang ditemukan di hubungan terbalik pada validitas hasil. Nilai p tertinggi sesuai dengan tingkat kepercayaan terendah dalam hubungan sampel antar variabel.

Nilai ini mencerminkan kemungkinan kesalahan yang terkait dengan interpretasi hasil. Asumsikan nilai p = 0,05 (1/20). Ini menunjukkan kemungkinan lima persen bahwa hubungan antara variabel yang ditemukan dalam sampel hanyalah fitur acak dari sampel. Artinya, jika ketergantungan ini tidak ada, maka dengan beberapa eksperimen serupa, rata-rata, dalam setiap studi kedua puluh, seseorang dapat mengharapkan ketergantungan yang sama atau lebih besar antar variabel. Seringkali p-level dianggap sebagai "margin" dari tingkat kesalahan.

Omong-omong, nilai-p mungkin tidak mencerminkan kecanduan nyata antar variabel, tetapi hanya menunjukkan beberapa nilai rata-rata dalam asumsi. Secara khusus, analisis akhir data juga akan bergantung pada nilai yang dipilih koefisien yang diberikan. Dengan p-level = 0,05 akan ada beberapa hasil, dan dengan koefisien sama dengan 0,01, yang lain.

Menguji hipotesis statistik

Tingkat signifikansi statistik sangat penting ketika menguji hipotesis. Misalnya, saat menghitung uji dua sisi, area penolakan dibagi sama rata di kedua ujung distribusi sampling (relatif terhadap koordinat nol) dan kebenaran data yang diperoleh dihitung.

Misalkan saat memantau proses (fenomena) tertentu, ternyata informasi statistik baru menunjukkan perubahan kecil relatif terhadap nilai sebelumnya. Pada saat yang sama, perbedaan dalam hasil kecil, tidak jelas, tetapi penting untuk penelitian. Spesialis menghadapi dilema: apakah perubahan benar-benar terjadi atau apakah itu kesalahan pengambilan sampel (ketidakakuratan pengukuran)?

Dalam hal ini, hipotesis nol diterapkan atau ditolak (semuanya dihapuskan sebagai kesalahan, atau perubahan dalam sistem diakui sebagai fait accompli). Proses pemecahan masalah didasarkan pada rasio signifikansi statistik keseluruhan (p-value) dan tingkat signifikansi (α). Jika tingkat-p< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Nilai yang digunakan

Tingkat signifikansinya tergantung pada bahan yang dianalisis. Dalam praktiknya, nilai tetap berikut digunakan:

  • = 0,1 (atau 10%);
  • = 0,05 (atau 5%);
  • = 0,01 (atau 1%);
  • = 0,001 (atau 0,1%).

Semakin akurat perhitungan yang diperlukan, semakin kecil koefisien yang digunakan. Secara alami, prakiraan statistik dalam fisika, kimia, farmasi, dan genetika membutuhkan akurasi yang lebih tinggi daripada dalam ilmu politik dan sosiologi.

Ambang batas signifikansi di area tertentu

Dalam bidang presisi tinggi seperti fisika partikel dan manufaktur, signifikansi statistik sering dinyatakan sebagai rasio deviasi standar (dilambangkan dengan koefisien sigma - ) relatif terhadap distribusi normal probabilitas (distribusi Gaussian). adalah indikator statistik yang menentukan dispersi nilai kuantitas tertentu relatif terhadap harapan matematika. Digunakan untuk memplot probabilitas kejadian.

Tergantung pada bidang pengetahuan, koefisien sangat bervariasi. Misalnya, saat memprediksi keberadaan Higgs boson, parameter sama dengan lima (σ=5), yang sesuai dengan area nilai-p=1/3,5 juta.

Efisiensi

Harus diperhitungkan bahwa koefisien dan nilai p bukanlah karakteristik eksak. Apapun tingkat signifikansi dalam statistik dari fenomena yang diteliti, itu bukan dasar tanpa syarat untuk menerima hipotesis. Misalnya, semakin kecil nilai , semakin besar kemungkinan hipotesis yang dibuat adalah signifikan. Namun, ada risiko kesalahan, yang mengurangi kekuatan statistik (signifikansi) penelitian.

Peneliti yang fokus secara eksklusif pada statistik hasil yang berarti dapat menarik kesimpulan yang salah. Pada saat yang sama, sulit untuk memeriksa ulang pekerjaan mereka, karena mereka menerapkan asumsi (yang sebenarnya adalah nilai dan nilai p). Oleh karena itu, selalu disarankan, bersama dengan perhitungan signifikansi statistik, untuk menentukan indikator lain - besarnya efek statistik. Ukuran efek adalah ukuran kuantitatif kekuatan efek.

Statistik telah lama menjadi bagian integral dari kehidupan. Orang-orang menghadapinya di mana-mana. Berdasarkan statistik, ditarik kesimpulan tentang di mana dan penyakit apa yang umum, apa yang lebih diminati di wilayah tertentu atau di antara segmen populasi tertentu. Bahkan konstruksi didasarkan pada program politik calon pemerintah. Mereka juga digunakan oleh rantai ritel saat membeli barang, dan produsen dipandu oleh data ini dalam proposal mereka.

statistik bermain peran penting dalam kehidupan masyarakat dan mempengaruhi setiap individu anggotanya, bahkan dalam hal-hal kecil. Misalnya, jika oleh , kebanyakan orang lebih suka warna gelap dalam pakaian di kota atau wilayah tertentu, akan sangat sulit untuk menemukan jas hujan kuning cerah dengan cetakan bunga di outlet lokal. Tapi apa jumlah yang membentuk data ini yang memiliki dampak seperti itu? Misalnya, apa yang "signifikan secara statistik"? Apa sebenarnya yang dimaksud dengan definisi ini?

Apa itu?

Statistik sebagai ilmu terdiri dari kombinasi ukuran yang berbeda dan konsep. Salah satunya adalah konsep “signifikansi statistik”. Ini adalah nama nilainya variabel, probabilitas terjadinya indikator lain yang dapat diabaikan.

Misalnya, 9 dari 10 orang memakai sepatu karet di kaki mereka selama jalan pagi untuk jamur di hutan musim gugur setelah malam hujan. Probabilitas bahwa pada suatu saat 8 dari mereka memakai sepatu kanvas dapat diabaikan. Jadi, dalam hal ini contoh spesifik angka 9 adalah nilai yang disebut "signifikansi statistik".

Dengan demikian, jika kita mengembangkan lebih lanjut di atas contoh praktis, toko sepatu membeli pada akhirnya musim panas sepatu bot karet dalam jumlah yang lebih besar daripada waktu-waktu lain dalam setahun. Ya, nilainya signifikansi statistik memiliki dampak pada kehidupan sehari-hari.

Tentu saja, dalam perhitungan yang rumit, misalnya, saat memprediksi penyebaran virus, jumlah besar variabel. Tetapi esensi dari menentukan indikator signifikan dari data statistik serupa, terlepas dari kerumitan perhitungan dan jumlah nilai yang tidak konstan.

Bagaimana cara menghitungnya?

Digunakan saat menghitung nilai indikator "signifikansi statistik" dari persamaan. Artinya, dapat dikatakan bahwa dalam hal ini semuanya ditentukan oleh matematika. oleh sebagian besar pilihan sederhana komputasi adalah sebuah rantai operasi matematika, yang mencakup parameter berikut:

  • dua jenis hasil yang diperoleh dari survei atau studi data objektif, misalnya, jumlah pembelian yang dilakukan, dilambangkan dengan a dan b;
  • indikator untuk kedua kelompok - n;
  • nilai bagian dari sampel gabungan - p;
  • konsep "kesalahan standar" - SE.

Langkah selanjutnya adalah menentukan keseluruhan indikator uji – t, nilainya dibandingkan dengan angka 1,96. 1,96 adalah nilai rata-rata yang mewakili rentang 95% menurut distribusi-t Student.

Pertanyaan yang sering muncul adalah apa perbedaan antara nilai n dan p. Nuansa ini mudah diperjelas dengan sebuah contoh. Misalkan, signifikansi statistik loyalitas terhadap produk atau merek apa pun dari pria dan wanita dihitung.

Dalam hal ini, surat-surat akan diikuti oleh yang berikut:

  • n adalah jumlah responden;
  • p - jumlah puas dengan produk.

Jumlah wanita yang diwawancarai dalam kasus ini akan ditetapkan sebagai n1. Dengan demikian, laki-laki - n2. Nilai yang sama akan memiliki angka "1" dan "2" pada simbol p.

Membandingkan indikator uji dengan nilai rata-rata tabel perhitungan Siswa menjadi apa yang disebut “signifikansi statistik”.

Apa yang dimaksud dengan verifikasi?

Hasil perhitungan matematis apa pun selalu dapat diperiksa; ini diajarkan kepada anak-anak bahkan di sekolah dasar. Adalah logis untuk mengasumsikan bahwa karena indikator statistik ditentukan menggunakan rantai perhitungan, maka indikator tersebut diperiksa.

Namun, pengujian signifikansi statistik bukan hanya matematika. Statistik berurusan dengan jumlah besar variabel dan berbagai probabilitas, yang tidak selalu dapat dihitung. Artinya, jika kita kembali ke contoh yang diberikan di awal artikel dengan sepatu karet, maka konstruksi logis data statistik, yang akan diandalkan oleh pembeli barang untuk toko, dapat terganggu oleh cuaca kering dan panas, yang tidak khas untuk musim gugur. Akibat fenomena ini, jumlah orang yang membeli sepatu karet akan berkurang dan gerai akan mengalami kerugian. Antisipasi anomali cuaca rumus matematika, tentu saja tidak bisa. Momen ini disebut - "kesalahan".

Probabilitas kesalahan seperti itulah yang mempertimbangkan pemeriksaan tingkat signifikansi yang dihitung. Ini memperhitungkan indikator yang dihitung dan tingkat signifikansi yang diterima, serta jumlah yang secara konvensional disebut hipotesis.

Apa yang dimaksud dengan tingkat signifikansi?

Konsep "level" termasuk dalam kriteria utama signifikansi statistik. Ini digunakan dalam statistik terapan dan praktis. Ini adalah jenis kuantitas yang memperhitungkan probabilitas kemungkinan penyimpangan atau kesalahan.

Level didasarkan pada identifikasi perbedaan dalam sampel yang sudah jadi, memungkinkan Anda untuk menetapkan signifikansinya atau, sebaliknya, keacakan. Konsep ini tidak hanya memiliki makna digital, tetapi juga interpretasinya yang khas. Mereka menjelaskan bagaimana memahami nilainya, dan level itu sendiri ditentukan dengan membandingkan hasilnya dengan indeks rata-rata, ini mengungkapkan tingkat keandalan perbedaan.

Dengan demikian, adalah mungkin untuk menyajikan konsep level secara sederhana - ini adalah indikator dari kesalahan yang dapat diterima, kemungkinan kesalahan atau kesalahan dalam kesimpulan yang diambil dari data statistik yang diperoleh.

Tingkat signifikansi apa yang digunakan?

Signifikansi statistik dari koefisien probabilitas kesalahan dalam praktek didasarkan pada tiga tingkat dasar.

Tingkat pertama adalah ambang batas di mana nilainya 5%. Artinya, probabilitas kesalahan tidak melebihi taraf signifikansi 5%. Ini berarti bahwa keyakinan akan ketidaksempurnaan dan ketidaksempurnaan kesimpulan yang dibuat berdasarkan data penelitian statistik adalah 95%.

Tingkat kedua adalah ambang 1%. Dengan demikian, angka ini berarti bahwa seseorang dapat dipandu oleh data yang diperoleh selama perhitungan statistik dengan kepercayaan 99%.

Tingkat ketiga adalah 0,1%. Dengan nilai ini, kemungkinan kesalahan sama dengan sebagian kecil dari persen, yaitu, kesalahan praktis dihilangkan.

Apa yang dimaksud dengan hipotesis dalam statistika?

Kesalahan sebagai konsep dibagi menjadi dua bidang mengenai penerimaan atau penolakan hipotesis nol. Hipotesis adalah konsep di baliknya, yang menurut definisinya, sekumpulan data atau pernyataan lain disembunyikan. Itu deskripsinya distribusi kemungkinan sesuatu yang berhubungan dengan mata pelajaran akuntansi statistik.

Ada dua hipotesis dalam perhitungan sederhana - nol dan alternatif. Perbedaan di antara mereka adalah bahwa hipotesis nol didasarkan pada gagasan bahwa tidak ada perbedaan mendasar antara sampel yang terlibat dalam menentukan signifikansi statistik, dan alternatif yang sepenuhnya berlawanan dengan itu. Yaitu hipotesis alternatif berdasarkan adanya perbedaan yang signifikan dalam sampel tersebut.

Apa saja kesalahannya?

Kesalahan sebagai konsep dalam statistik secara langsung tergantung pada penerimaan satu atau lain hipotesis sebagai benar. Mereka dapat dibagi menjadi dua arah atau jenis:

  • tipe pertama adalah karena penerimaan hipotesis nol, yang ternyata salah;
  • yang kedua disebabkan oleh mengikuti alternatif.

Jenis kesalahan pertama disebut false positive dan cukup umum di semua area di mana statistik digunakan. Dengan demikian, kesalahan jenis kedua disebut negatif palsu.

Mengapa regresi penting dalam statistik?

Signifikansi statistik dari regresi adalah dapat digunakan untuk menetapkan seberapa realistis model yang dihitung berdasarkan data tersebut. berbagai dependensi; memungkinkan Anda untuk mengidentifikasi kecukupan atau kekurangan faktor akuntansi dan kesimpulan.

Nilai regresi ditentukan dengan membandingkan hasil dengan data yang tercantum pada tabel Fisher. Atau menggunakan analisis varians. Pentingnya indikator regresi memiliki dengan kompleks studi statistik dan perhitungan yang melibatkan sejumlah besar variabel, data acak dan kemungkinan perubahan.

Signifikansi Statistik

Hasil yang diperoleh dengan menggunakan prosedur penelitian tertentu disebut signifikan secara statistik jika probabilitas kemunculan acak mereka sangat kecil. Konsep ini dapat diilustrasikan dengan contoh melempar koin. Misalkan sebuah koin dilempar 30 kali; Muncul 17 kali kepala dan 13 kali muncul ekor. Melakukannya penting Apakah ini penyimpangan dari hasil yang diharapkan (15 ekor dan 15 ekor), ataukah ini kebetulan? Untuk menjawab pertanyaan ini, Anda dapat, misalnya, melempar koin yang sama sebanyak 30 kali berturut-turut, dan pada saat yang sama mencatat berapa kali rasio kepala dan ekor, sama dengan 17:13, diulang. Analisis statistik menyelamatkan kita dari proses yang membosankan ini. Dengan bantuannya, setelah 30 lemparan koin pertama, dimungkinkan untuk memperkirakan jumlah kemungkinan kemunculan acak dari 17 kepala dan 13 ekor. Perkiraan seperti itu disebut pernyataan probabilistik.

PADA literatur ilmiah dalam pernyataan probabilistik psikologi industri-organisasi di bentuk matematika dilambangkan dengan ekspresi R(kemungkinan)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (R< 0,01). Fakta ini penting untuk memahami literatur, tetapi tidak boleh diartikan bahwa tidak ada gunanya melakukan pengamatan yang tidak memenuhi standar ini. Yang disebut hasil penelitian tidak signifikan (pengamatan yang dapat diperoleh secara kebetulan) lagi satu atau lima kali dari 100) bisa sangat berguna untuk mengidentifikasi tren dan sebagai panduan untuk penelitian masa depan.

Perlu juga dicatat bahwa tidak semua psikolog setuju dengan standar dan prosedur tradisional (misalnya Cohen, 1994; Sauley & Bedeian, 1989). Masalah yang terkait dengan pengukuran itu sendiri tema utama karya banyak peneliti yang mempelajari keakuratan metode pengukuran dan prasyarat yang mendasarinya metode yang ada dan standar, serta mengembangkan dokter dan instrumen baru. Mungkin suatu saat di masa depan, penelitian dalam kekuatan ini akan mengarah pada perubahan standar tradisional untuk menilai signifikansi statistik, dan perubahan ini akan mendapatkan penerimaan universal. (Bab Kelima American Psychological Association menyatukan psikolog yang berspesialisasi dalam studi perkiraan, pengukuran, dan statistik.)

Dalam laporan penelitian, pernyataan probabilistik seperti: R< 0,05, karena beberapa statistik yaitu, angka yang diperoleh sebagai hasil dari serangkaian prosedur komputasi matematis tertentu. Konfirmasi probabilistik diperoleh dengan membandingkan statistik ini dengan data dari tabel khusus yang diterbitkan untuk tujuan ini. Dalam industri-organisasi penelitian psikologi statistik yang sering ditemui seperti r, F, t, r>(baca "chi square") dan R(baca "banyak R"). Dalam setiap kasus, statistik (satu angka) yang diperoleh dari analisis serangkaian pengamatan dapat dibandingkan dengan angka-angka dari tabel yang dipublikasikan. Setelah itu, dimungkinkan untuk merumuskan pernyataan probabilistik tentang probabilitas mendapatkan angka ini secara acak, yaitu, untuk menarik kesimpulan tentang signifikansi pengamatan.

Untuk memahami kajian-kajian yang diuraikan dalam buku ini, cukup memiliki pemahaman yang jelas tentang konsep signifikansi statistik dan tidak serta merta mengetahui bagaimana statistik tersebut di atas dihitung. Namun, akan berguna untuk membahas satu asumsi yang mendasari semua prosedur ini. Ini adalah asumsi bahwa semua variabel yang diamati berdistribusi kira-kira hukum biasa. Selain itu, ketika membaca laporan penelitian psikologi industri-organisasi, tiga konsep lagi sering muncul yang memainkan peran penting - pertama, korelasi dan korelasi, kedua, variabel determinan/prediktor dan "ANOVA" ( analisis varians), ketiga, sekelompok metode statistik di bawah nama yang umum"meta-analisis".

Pengujian hipotesis dilakukan dengan menggunakan analisis statistik. Signifikansi statistik ditemukan menggunakan nilai-P, yang sesuai dengan probabilitas acara ini dengan asumsi bahwa beberapa pernyataan (hipotesis nol) benar. Jika nilai-P kurang dari tingkat signifikansi statistik tertentu (biasanya 0,05), peneliti dapat dengan aman menyimpulkan bahwa hipotesis nol salah dan melanjutkan untuk mempertimbangkan hipotesis alternatif. Dengan menggunakan uji-t Student, Anda dapat menghitung nilai-P dan menentukan signifikansi untuk dua kumpulan data.

Langkah

Bagian 1

Menyiapkan percobaan

    Tentukan hipotesis Anda. Langkah pertama dalam mengevaluasi signifikansi statistik adalah memilih pertanyaan yang ingin Anda jawab dan merumuskan hipotesis. Hipotesis adalah pernyataan tentang data eksperimen, distribusi dan sifat-sifatnya. Untuk eksperimen apa pun, ada hipotesis nol dan hipotesis alternatif. Secara umum, Anda harus membandingkan dua set data untuk menentukan apakah mereka serupa atau berbeda.

    • Hipotesis nol (H 0) biasanya menyatakan bahwa tidak ada perbedaan antara kedua kumpulan data. Misalnya: siswa yang membaca materi sebelum kelas tidak mendapatkan nilai yang lebih tinggi.
    • Hipotesis alternatif (H a) adalah kebalikan dari hipotesis nol dan merupakan pernyataan yang perlu dikonfirmasi dengan data eksperimen. Misalnya: siswa yang membaca materi sebelum kelas mendapat nilai lebih tinggi.
  1. Tetapkan tingkat signifikansi untuk menentukan seberapa besar distribusi data yang harus berbeda dari yang biasa agar dapat dianggap sebagai hasil yang signifikan. Tingkat signifikansi (juga disebut (\displaystyle \alpha )-level) adalah ambang batas yang Anda tetapkan untuk signifikansi statistik. Jika nilai P lebih kecil atau sama dengan tingkat signifikansi, data dianggap signifikan secara statistik.

    • Sebagai aturan, tingkat signifikansi (nilai (\displaystyle \alpha )) diambil sama dengan 0,05, dalam hal ini probabilitas untuk mendeteksi perbedaan acak antara kumpulan data yang berbeda hanya 5%.
    • Semakin tinggi tingkat signifikansi (dan, karenanya, nilai p lebih kecil), semakin dapat diandalkan hasilnya.
    • Jika Anda ingin hasil yang lebih andal, turunkan nilai P ke 0,01. Biasanya, nilai P yang lebih rendah digunakan dalam produksi ketika diperlukan untuk mendeteksi cacat pada produk. Dalam hal ini, kesetiaan yang tinggi diperlukan untuk memastikan bahwa semua bagian bekerja seperti yang diharapkan.
    • Untuk sebagian besar eksperimen hipotesis, tingkat signifikansi 0,05 sudah cukup.
  2. Tentukan kriteria mana yang akan Anda gunakan: satu sisi atau dua sisi. Salah satu asumsi dalam uji-t Student adalah bahwa data berdistribusi normal. Distribusi normal adalah kurva berbentuk lonceng dengan jumlah maksimum hasil di tengah kurva. Uji-t siswa adalah metode matematika validasi data, yang memungkinkan Anda untuk menentukan apakah data berada di luar distribusi normal (lebih banyak, lebih sedikit, atau di "ekor" kurva).

    • Jika Anda tidak yakin apakah data di atas atau di bawah kelompok kontrol nilai, gunakan uji dua sisi. Ini akan memungkinkan Anda untuk menentukan signifikansi di kedua arah.
    • Jika Anda mengetahui ke arah mana data mungkin berada di luar distribusi normal, gunakan uji satu sisi. Dalam contoh di atas, kami mengharapkan nilai siswa naik, sehingga tes satu arah dapat digunakan.
  3. Tentukan ukuran sampel menggunakan kekuatan statistik. Kekuatan statistik suatu penelitian adalah probabilitas bahwa ukuran sampel tertentu akan menghasilkan hasil yang diharapkan. Ambang batas daya umum (atau ) adalah 80%. Analisis daya tanpa data sebelumnya bisa menjadi rumit karena beberapa informasi diperlukan tentang rata-rata yang diharapkan di setiap kumpulan data dan standar deviasinya. Gunakan kalkulator daya statistik online untuk menentukan ukuran sampel yang optimal untuk data Anda.

    • Biasanya, peneliti melakukan studi percontohan kecil yang menyediakan data untuk analisis daya dan menentukan ukuran sampel yang diperlukan untuk studi yang lebih besar dan lebih lengkap.
    • Jika Anda tidak memiliki kesempatan untuk melakukan studi percontohan, cobalah untuk memperkirakan kemungkinan nilai rata-rata berdasarkan data literatur dan hasil orang lain. Ini dapat membantu Anda menentukan ukuran sampel yang optimal.

    Bagian 2

    Menghitung simpangan baku
    1. Tuliskan rumus simpangan bakunya. Standar deviasi menunjukkan seberapa besar penyebaran data. Hal ini memungkinkan Anda untuk menyimpulkan seberapa dekat data yang diperoleh pada sampel tertentu. Sekilas, rumusnya tampak agak rumit, namun penjelasan di bawah ini akan membantu Anda memahaminya. Rumus memiliki tampilan berikutnya: s = ((x i – ) 2 /(N – 1)).

      • s - simpangan baku;
      • tanda menunjukkan bahwa semua data yang diperoleh dalam sampel harus ditambahkan;
      • x i sesuai dengan nilai ke-i, yaitu hasil terpisah yang diperoleh;
      • adalah nilai rata-rata untuk grup ini;
      • N- jumlah total data dalam sampel.
    2. Temukan rata-rata di setiap kelompok. Untuk menghitung simpangan baku, Anda harus terlebih dahulu mencari rata-rata untuk setiap kelompok belajar. Nilai rata-rata dilambangkan huruf Yunani(mu). Untuk menemukan rata-rata, cukup tambahkan semua nilai yang dihasilkan dan bagi dengan jumlah data (ukuran sampel).

      • Misalnya, untuk menemukan nilai rata-rata dalam kelompok siswa yang mempelajari materi sebelum kelas, pertimbangkan kumpulan data kecil. Untuk mempermudah, kami menggunakan satu set lima poin: 90, 91, 85, 83 dan 94.
      • Mari kita jumlahkan semua nilai bersama-sama: 90 + 91 + 85 + 83 + 94 = 443.
      • Bagilah jumlah dengan jumlah nilai, N = 5:443/5 = 88,6.
      • Dengan demikian, nilai rata-rata untuk kelompok ini adalah 88,6.
    3. Kurangi setiap nilai yang diperoleh dari rata-rata. Langkah berikutnya adalah menghitung selisih (x i - ). Untuk melakukan ini, kurangi dari yang ditemukan ukuran sedang setiap nilai yang diterima. Dalam contoh kita, kita perlu menemukan lima perbedaan:

      • (90 - 88,6), (91 - 88.6), (85 - 88,6), (83 - 88,6) dan (94 - 88,6).
      • Akibatnya, kita mendapatkan nilai-nilai berikut: 1.4, 2.4, -3.6, -5.6 dan 5.4.
    4. Kuadratkan setiap nilai yang diperoleh dan tambahkan bersama-sama. Setiap besaran yang baru saja ditemukan harus dikuadratkan. Semua akan hilang pada langkah ini. nilai negatif. Jika setelah langkah ini Anda memiliki bilangan negatif, lalu Anda lupa mengkuadratkannya.

      • Untuk contoh kita, kita mendapatkan 1,96, 5,76, 12,96, 31,36 dan 29,16.
      • Kami menambahkan nilai yang diperoleh: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
    5. Bagi dengan ukuran sampel dikurangi 1. Dalam rumus, jumlah dibagi dengan N - 1 karena fakta bahwa kami tidak memperhitungkan populasi umum, tetapi kami mengambil sampel untuk evaluasi semua siswa.

      • Kurangi: N - 1 = 5 - 1 = 4
      • Bagi: 81.2/4 = 20.3
    6. Ekstrak Akar pangkat dua. Setelah membagi jumlah dengan ukuran sampel dikurangi satu, ambil akar kuadrat dari nilai yang ditemukan. Ini adalah langkah terakhir dalam menghitung standar deviasi. Ada program statistik yang, setelah memasukkan data awal, melakukan semua perhitungan yang diperlukan.

      • Dalam contoh kita, simpangan baku nilai siswa yang membaca materi sebelum kelas adalah s = 20.3 = 4,51.

      Bagian 3

      Tentukan Signifikansi
      1. Hitung varians antara dua kelompok data. Hingga langkah ini, kami telah mempertimbangkan contoh hanya untuk satu kelompok data. Jika Anda ingin membandingkan dua kelompok, jelas Anda harus mengambil data untuk kedua kelompok. Hitung simpangan baku untuk kelompok data kedua dan kemudian temukan varians di antara keduanya kelompok eksperimen. Dispersi dihitung dengan menggunakan rumus berikut: s d = ((s 1 /N 1) + (s 2 /N 2)).