Contoh statistik persamaan tren linier. Membangun Tren Linier

CONTOH. Studi statistik dinamika populasi.

    Dengan bantuan rantai, dasar, indikator dinamika rata-rata, evaluasi perubahan angka, tuliskan kesimpulannya.

    Menggunakan metode perataan analitik (sepanjang garis lurus dan parabola, setelah menentukan koefisien menggunakan LSM), mengidentifikasi tren utama dalam perkembangan fenomena (penduduk Republik Komi). Evaluasi kualitas model yang dihasilkan menggunakan kesalahan dan faktor aproksimasi.

    Tentukan koefisien tren linier dan parabola menggunakan Chart Wizard. Berikan prakiraan populasi titik dan interval untuk tahun 2010. Tuliskan kesimpulannya.

Metode penjajaran analitik a) Persamaan tren linier adalah y = bt + a 1. Temukan parameter persamaan dengan metode kuadrat terkecil. Kami menggunakan metode menghitung waktu dari awal bersyarat. Sistem persamaan kuadrat terkecil untuk tren linier memiliki bentuk: a 0 n + a 1 t = y a 0 ∑t + a 1 t 2 = y t

Untuk data kita, sistem persamaan akan berbentuk: 10a 0 + 0a 1 = 10400 0a 0 + 330a 1 = -4038 -12,236t+1040

Mari kita mengevaluasi kualitas persamaan tren menggunakan kesalahan pendekatan absolut. Kesalahan perkiraan dalam 5% -7% menunjukkan pilihan yang baik dari persamaan tren dengan data asli.

b) kesejajaran parabola Persamaan tren memiliki bentuk y = pada 2 + bt + c 1. Kami menemukan parameter persamaan menggunakan metode kuadrat terkecil. Sistem persamaan kuadrat terkecil: a 0 n + a 1 t + a 2 t 2 = y a 0 t + a 1 t 2 + a 2 t 3 = yt a 0 t 2 + a 1 t 3 + a 2 t 4 = yt 2

Untuk data kami, sistem persamaan memiliki bentuk 2 = 998.5 Persamaan tren: y = 1.258t 2 -12.236t+998.5

Kesalahan perkiraan untuk persamaan tren parabola. Karena kesalahannya kurang dari 7%, persamaan ini dapat digunakan sebagai tren.

Kesalahan aproksimasi minimum untuk perataan parabola. Selain itu, koefisien determinasi R 2 lebih tinggi dibandingkan dengan yang linier. Oleh karena itu, untuk peramalan perlu menggunakan persamaan parabola.

Perkiraan interval. Mari kita tentukan kesalahan kuadrat rata-rata dari indikator yang diprediksi. m = 1 - jumlah faktor yang mempengaruhi dalam persamaan tren. Uy = y n+L ± K dimana L - waktu tunggu; n+L - perkiraan titik menurut model pada (n + L)-titik waktu; n adalah jumlah pengamatan dalam deret waktu; Sy adalah kesalahan standar dari indikator yang diprediksi; T tabel - nilai tabular kriteria Student untuk tingkat signifikansi dan untuk jumlah derajat kebebasan sama dengan n-2. Berdasarkan tabel Student, kita menemukan Ttabel Ttabel (n-m-1;α/2) = (8;0,025) = 2,306 Peramalan titik, t = 10: y(10) = 1,26*10 2 -12,24*10 + 998,5 = 1001,89 seribu orang 1001,89 - 71,13 = 930,76; 1001,89 + 71,13 = 1073,02 Perkiraan interval: t = 9+1 = 10: (930,76;1073,02)

Menurut rumus (9.29), parameter tren linier adalah a = 1894/11 = 172,2 q/ha; b= 486/110 = 4,418 q/ha. Persamaan tren linier adalah:

= 172,2 + 4,418t, di mana t = 0 tahun 1987 Artinya rata-rata tingkat aktual dan disesuaikan, mengacu pada pertengahan periode, yaitu. pada tahun 1991, sama dengan 172 sen per 1 ra, peningkatan tahunan rata-rata adalah 4,418 sen/ha per tahun

Parameter tren parabola menurut (9.23) adalah b= 4,418; sebuah = 177,75; c =-0.5571. Persamaan tren parabola memiliki bentuk = 177,75 + 4,418t - 0.5571t2; t= 0 pada tahun 1991. Ini berarti bahwa peningkatan absolut dalam hasil melambat rata-rata sebesar 2.0,56 c/ha per tahun per tahun. Pertumbuhan absolut itu sendiri tidak lagi merupakan konstanta dari tren parabola, tetapi merupakan nilai rata-rata untuk periode tersebut. Pada tahun yang diambil sebagai titik acuan, yaitu 1991, trend melewati titik dengan ordinat 77,75 c/ha; Istilah bebas dari tren parabola bukanlah level rata-rata untuk periode tersebut. Parameter tren eksponensial dihitung dengan rumus (9.32) dan (9.33) ln sebuah= 56,5658/11 = 5,1423; mempotensiasi, kita mendapatkan sebuah= 171.1; ln k= 2.853:110 = 0,025936; mempotensiasi, kita mendapatkan k = 1,02628.

Persamaan tren eksponensial adalah: y = 171.1 1.02628 t .

Ini berarti bahwa rata-rata tingkat pasca hasil tahunan untuk periode tersebut adalah 102,63%. Pada titik yang diambil ke titik asal, tren melewati titik dengan ordinat 171,1 q/ha.

Level yang dihitung menurut persamaan tren dicatat dalam tiga kolom terakhir dari Tabel. 9.5. Seperti yang terlihat dari data tersebut. nilai level yang dihitung untuk ketiga jenis tren tidak jauh berbeda, karena percepatan parabola dan laju pertumbuhan eksponennya kecil. Parabola memiliki perbedaan yang signifikan - pertumbuhan level telah berhenti sejak 1995, sementara dengan tren linier, level terus tumbuh, dan dengan eksponensial, OST mereka berakselerasi. Oleh karena itu, untuk prakiraan untuk masa depan, ketiga tren ini tidak sama: ketika mengekstrapolasi parabola untuk tahun-tahun mendatang, levelnya akan menyimpang tajam dari garis lurus dan eksponen, seperti yang dapat dilihat dari Tabel. 9.6. Tabel ini menunjukkan hasil cetak solusi pada PC yang menggunakan program Statgraphics untuk tiga tren yang sama. Perbedaan antara suku bebas mereka dan yang diberikan di atas dijelaskan oleh fakta bahwa program menghitung tahun bukan dari tengah, tetapi dari awal, sehingga suku bebas dari tren mengacu pada 1986, di mana t = 0. persamaan eksponensial pada hasil cetakan dibiarkan dalam bentuk logaritma. Ramalan dibuat untuk 5 tahun ke depan, yaitu. sampai 2001. Ketika asal koordinat (referensi waktu) berubah dalam persamaan parabola, peningkatan absolut rata-rata, parameter b. karena, sebagai akibat dari percepatan negatif, pertumbuhan menurun sepanjang waktu, dan maksimumnya adalah pada awal periode. Konstanta parabola hanyalah percepatan.


Baris "Data" berisi level dari seri aslinya; "Ringkasan perkiraan" berarti ringkasan data untuk perkiraan. Pada baris berikut - persamaan garis lurus, parabola, eksponen - dalam bentuk logaritmik. Kolom ME berarti perbedaan rata-rata antara level seri asli dan level tren (disesuaikan). Untuk garis lurus dan parabola, perbedaan ini selalu nol. Tingkat eksponen rata-rata 0,48852 lebih rendah dari tingkat seri aslinya. Pencocokan tepat dimungkinkan jika tren sebenarnya adalah eksponensial; dalam hal ini tidak ada kebetulan, tetapi perbedaannya kecil. Kolom MAE adalah varians s2- ukuran volatilitas tingkat aktual relatif terhadap tren, seperti yang dijelaskan dalam paragraf 9.7. Kolom MAE - deviasi linier rata-rata level dari modulo tren (lihat paragraf 5.8); kolom MARE - deviasi linier relatif dalam persen. Di sini mereka diberikan sebagai indikator kesesuaian jenis tren yang dipilih. Sebuah parabola memiliki modulus varians dan deviasi yang lebih kecil: untuk periode 1986 - 1996. lebih dekat ke tingkat yang sebenarnya. Tetapi pilihan jenis tren tidak dapat direduksi menjadi kriteria ini saja. Padahal, perlambatan pertumbuhan tersebut merupakan akibat dari penyimpangan negatif yang besar, yaitu gagal panen pada tahun 1996.

Bagian kedua dari tabel adalah perkiraan tingkat hasil untuk tiga jenis tren selama bertahun-tahun; t = 12, 13, 14, 15 dan 16 dari titik asal (1986). Tingkat perkiraan secara eksponensial hingga tahun ke-16 tidak jauh lebih tinggi daripada garis lurus. Level parabola tren menurun, semakin menyimpang dari tren lainnya.

Seperti dapat dilihat pada Tabel. 9.4, saat menghitung parameter tren, level seri awal masuk dengan bobot - nilai yang berbeda tp dan persegi mereka. Oleh karena itu, pengaruh fluktuasi tingkat pada parameter tren tergantung pada jumlah tahun yang jatuh pada tahun produktif atau ramping. Jika penyimpangan tajam terjadi dalam satu tahun dengan angka nol ( ti = 0), maka tidak akan berpengaruh pada parameter tren, dan jika menyentuh awal dan akhir seri, itu akan memiliki efek yang kuat. Akibatnya, penyelarasan analitik tunggal tidak sepenuhnya membebaskan parameter tren dari pengaruh volatilitas, dan dengan fluktuasi yang kuat mereka dapat sangat terdistorsi, yang terjadi dengan parabola dalam contoh kita. Untuk lebih menghilangkan efek distorsi dari fluktuasi pada parameter tren, seseorang harus menerapkan beberapa metode pelurusan geser.

Teknik ini terdiri dari fakta bahwa parameter tren dihitung tidak segera di seluruh rangkaian, tetapi dengan metode geser, pertama untuk yang pertama. t periode waktu atau momen, kemudian untuk periode dari tanggal 2 sampai t+ 1, 3 sampai (t + tingkat 2)-th, dll. Jika jumlah tingkat awal deret tersebut adalah P, dan panjang setiap basis perhitungan parameter geser sama dengan t, maka jumlah basis bergerak t atau nilai individual dari parameter yang akan ditentukan darinya adalah:

L = n+ 1 - t.

Penerapan teknik sliding multiple alignment dapat dipertimbangkan, seperti yang terlihat dari perhitungan di atas, hanya jika jumlah tingkatan pada rangkaian tersebut cukup besar, biasanya 15 atau lebih. Perhatikan teknik ini pada contoh data pada Tabel. 9.4 menunjukkan dinamika harga barang-barang non-bahan bakar di negara-negara berkembang, yang sekali lagi memberikan kesempatan kepada pembaca untuk berpartisipasi dalam studi ilmiah kecil-kecilan. Pada contoh yang sama, kita akan melanjutkan teknik peramalan di Bagian 9.10.

Jika kami menghitung parameter dalam seri kami untuk periode 11 tahun (untuk 11 level), maka t= 17 + 1 - 11 = 7. Arti multiple sliding alignment adalah bahwa dengan pergeseran berturut-turut dari dasar perhitungan parameter, di ujungnya dan di tengahnya akan ada level yang berbeda dengan tanda dan besaran penyimpangan yang berbeda dari tren. Oleh karena itu, dengan beberapa pergeseran dalam basis, parameter akan ditaksir terlalu tinggi, dengan yang lain akan diremehkan, dan dengan rata-rata berikutnya dari nilai parameter atas semua pergeseran dalam basis perhitungan, distorsi parameter tren akan lebih jauh. diimbangi oleh fluktuasi level.

Perataan geser ganda tidak hanya memungkinkan untuk memperoleh perkiraan parameter tren yang lebih akurat dan andal, tetapi juga untuk mengontrol pilihan jenis persamaan tren yang tepat. Jika ternyata parameter tren terkemuka, konstanta, saat menghitung dengan basis bergerak, tidak berfluktuasi secara acak, tetapi secara sistematis mengubah nilainya secara signifikan, maka jenis tren yang dipilih salah, parameter ini bukan konstanta.

Adapun suku bebas dengan penyelarasan berganda, tidak perlu dan, apalagi, menghitung nilainya sebagai rata-rata untuk semua pergeseran basis, karena dengan metode ini, tingkat individu dari deret asli akan dimasukkan dalam perhitungan rata-rata dengan bobot yang berbeda, dan jumlah tingkat yang disejajarkan akan berbeda dengan jumlah suku-suku deret aslinya. Istilah bebas tren adalah nilai rata-rata level untuk periode tersebut, asalkan waktunya dihitung dari pertengahan periode. Saat menghitung dari awal, jika level pertama aku= 1, istilah bebas akan sama dengan: a 0 = - b((N-1)/2). Disarankan untuk memilih panjang dasar pergerakan untuk menghitung parameter tren setidaknya level 9-11 untuk meredam fluktuasi level secara memadai. Jika baris aslinya sangat panjang, alasnya bisa mencapai 0,7 - 0,8 dari panjangnya. Untuk menghilangkan pengaruh fluktuasi periode panjang (siklis) pada parameter tren, jumlah pergeseran dasar harus sama dengan atau kelipatan dari panjang siklus fluktuasi. Kemudian awal dan akhir basis akan secara berurutan "melewati" semua fase siklus, dan ketika parameter dirata-ratakan untuk semua pergeseran, distorsinya dari fluktuasi siklus akan membatalkan satu sama lain. Cara lain adalah dengan mengambil panjang alas geser sama dengan panjang siklus, sehingga awal alas dan ujung alas selalu jatuh pada fase yang sama dari siklus osilasi.

Karena menurut Tabel. 9.4, telah ditetapkan bahwa tren memiliki bentuk linier, kami menghitung peningkatan absolut rata-rata tahunan, yaitu, parameter b persamaan tren linier dengan cara meluncur di atas basis 11 tahun (lihat Tabel 9.7). Ini juga berisi perhitungan data yang diperlukan untuk studi volatilitas selanjutnya dalam paragraf 9.7. Mari kita membahas lebih detail tentang metode penyelarasan ganda dengan alas geser. Hitung parameternya b untuk semua basis:


Garis tren digunakan untuk menggambarkan tren harga secara visual. Elemen analisis teknikal adalah representasi geometris dari nilai rata-rata dari indikator yang dianalisis.

Mari kita lihat cara menambahkan garis tren ke bagan di Excel.

Menambahkan garis tren ke grafik

Sebagai contoh, mari kita ambil rata-rata harga minyak sejak tahun 2000 dari sumber terbuka. Kami akan memasukkan data untuk analisis dalam tabel:



Garis tren di Excel adalah grafik fungsi perkiraan. Mengapa diperlukan - untuk membuat prakiraan berdasarkan data statistik. Untuk tujuan ini, perlu untuk memperpanjang garis dan menentukan nilainya.

Jika R2 = 1, maka kesalahan aproksimasi adalah nol. Dalam contoh kami, memilih pendekatan linier memberikan kepercayaan yang rendah dan hasil yang buruk. Ramalan akan menjadi tidak akurat.

Perhatian!!! Garis tren tidak dapat ditambahkan ke jenis grafik dan bagan berikut:

  • daun bunga;
  • bundar;
  • permukaan;
  • berbentuk lingkaran;
  • volume;
  • dengan akumulasi.


Persamaan Garis Tren di Excel

Dalam contoh di atas, pendekatan linier dipilih hanya untuk mengilustrasikan algoritma. Seperti yang ditunjukkan oleh nilai reliabilitas, pilihan itu tidak sepenuhnya berhasil.

Anda harus memilih jenis tampilan yang paling akurat menggambarkan tren input pengguna. Mari kita lihat opsinya.

Pendekatan linier

Representasi geometrisnya adalah garis lurus. Oleh karena itu, pendekatan linier digunakan untuk menggambarkan indikator yang meningkat atau menurun pada tingkat yang konstan.

Pertimbangkan jumlah kontrak bersyarat yang dibuat oleh manajer selama 10 bulan:

Berdasarkan data di tabel Excel, kami akan membuat plot pencar (ini akan membantu menggambarkan tipe linier):


Pilih grafik - "tambahkan garis tren". Dalam parameter, pilih tipe linier. Kami menambahkan nilai keandalan perkiraan dan persamaan garis tren di Excel (cukup centang kotak di bagian bawah jendela "Parameter").


Kami mendapatkan hasilnya:


Catatan! Dengan pendekatan tipe linier, titik-titik data ditempatkan sedekat mungkin dengan garis lurus. Tampilan ini menggunakan persamaan berikut:

y = 4,503x + 6,1333

  • dimana 4,503 adalah indikator kemiringan;
  • 6.1333 - offset;
  • y adalah urutan nilai,
  • x adalah nomor periode.

Garis lurus pada grafik menunjukkan peningkatan yang stabil dalam kualitas pekerjaan manajer. Nilai reliabilitas aproksimasi adalah 0,9929, yang menunjukkan kesepakatan yang baik antara garis lurus yang dihitung dan data asli. Perkiraan harus akurat.

Untuk memprediksi jumlah kontrak yang diselesaikan, misalnya, pada periode ke-11, Anda perlu mengganti angka 11, bukan x, ke dalam persamaan. Dalam perhitungan, kita mengetahui bahwa pada periode ke-11 manajer ini akan menyelesaikan 55-56 kontrak.

Garis tren eksponensial

Tipe ini akan berguna jika nilai input berubah pada tingkat yang terus meningkat. Pendekatan eksponensial tidak diterapkan dengan adanya nol atau karakteristik negatif.

Mari kita buat garis tren eksponensial di Excel. Mari kita ambil contoh nilai bersyarat dari pasokan listrik yang berguna di wilayah X:

Kami membuat grafik. Tambahkan garis eksponensial.


Persamaan tersebut memiliki bentuk sebagai berikut:

y = 7,6403е^-0,084x

  • di mana 7,6403 dan -0,084 adalah konstanta;
  • e adalah basis dari logaritma natural.

Indeks keandalan perkiraan adalah 0,938 - kurva sesuai dengan data, kesalahannya minimal, perkiraannya akan akurat.

Catat Garis Tren di Excel

Ini digunakan untuk perubahan indikator berikut: pertama, peningkatan atau penurunan yang cepat, kemudian stabilitas relatif. Kurva yang dioptimalkan beradaptasi dengan baik dengan "perilaku" kuantitas ini. Tren logaritmik cocok untuk memprediksi penjualan produk baru yang baru saja diperkenalkan ke pasar.

Pada tahap awal, tugas pabrikan adalah meningkatkan basis pelanggan. Ketika produk memiliki pembeli sendiri, itu harus dipertahankan, dilayani.

Mari buat grafik dan tambahkan garis tren logaritmik untuk memprediksi penjualan produk bersyarat:


R2 mendekati nilai 1 (0,9633), yang menunjukkan kesalahan aproksimasi minimum. Kami akan memperkirakan volume penjualan pada periode berikutnya. Untuk melakukan ini, Anda perlu mengganti jumlah periode dalam persamaan, bukan x.

Sebagai contoh:

Periode14 15 16 17 18 19 20
Ramalan1005,4 1024,18 1041,74 1058,24 1073,8 1088,51 1102,47

Untuk menghitung angka perkiraan, rumus berikut digunakan: =272.14*LN(B18)+287.21. Dimana B18 adalah nomor periode.

Garis Tren Polinomial di Excel

Kurva ini memiliki variabel naik dan turun. Untuk polinomial (polinomial), derajat ditentukan (dengan jumlah nilai maksimum dan minimum). Misalnya, satu ekstrem (minimum dan maksimum) adalah derajat kedua, dua ekstrem adalah derajat ketiga, tiga adalah derajat keempat.

Tren polinomial di Excel digunakan untuk menganalisis sekumpulan besar data tentang nilai yang tidak stabil. Mari kita lihat contoh set nilai pertama (harga minyak).


Untuk mendapatkan nilai reliabilitas perkiraan seperti itu (0,9256), saya harus meletakkan derajat ke-6.

Tetapi tren seperti itu memungkinkan Anda membuat perkiraan yang kurang lebih akurat.

  • 6. Ringkasan dan pengelompokan statistik. Pengelompokan jenis.
  • 7. Nilai statistik absolut: konsep, tipe.
  • 8. Nilai statistik relatif: konsep, tipe.
  • 9. Nilai rata-rata: konsep, tipe. (kekuatan, struktural) Nilai rata-rata.
  • Rata-rata Daya
  • Rata-rata struktural
  • 10. Rata-rata aritmatika dan rata-rata harmonik. Rata-rata aritmatika
  • Harmonik rata-rata.
  • 11. Sifat dasar rata-rata aritmatika.
  • 12.Indikator variasi sifat dan metode perhitungannya.
  • Indikator variasi dan metode absolut dan rata-rata untuk perhitungannya.
  • 13.Indeks ekonomi: konsep, tipe. Indeks harga individu, volume fisik penjualan, omset. Konsep indeks
  • Indeks individu
  • Indeks Komposit
  • Indeks harga omset perdagangan Indeks volume fisik perdagangan Masalah memilih bobot
  • Indeks berantai dan dasar dengan bobot konstan dan variabel
  • Indeks komposisi konstan, komposisi variabel dan pergeseran struktural
  • Indeks teritorial
  • 14. Indeks agregat harga, volume fisik, omset, hubungannya. indeks agregat.
  • 15. Rata-rata aritmatika dan indeks harmonik rata-rata dari volume fisik produksi. Indeks rata-rata.
  • 16. Pengamatan selektif, jenis produksi (berulang, tidak berulang).
  • 17. Kesalahan sampling rata-rata dan marginal. Perhitungan interval kepercayaan.
  • 18. Perhitungan ukuran sampel yang dibutuhkan, memberikan akurasi pengamatan yang diberikan dengan probabilitas tertentu.
  • 19.Ryady dynamics: konsep, tipe (sesaat, interval). Indikator baris
  • 20. Indikator rata-rata dari serangkaian dinamika. Menentukan tingkat rata-rata dari serangkaian dinamika.
  • 21. Metode pemulusan rangkaian dinamika.
  • 22. Jenis hubungan antar fenomena (fungsional, korelasi). Klasifikasi hubungan korelasi.
  • 23. Perhitungan parameter tren linier.
  • 24. Koefisien korelasi linier.
  • 25. Perhitungan parameter regresi linier berpasangan.
  • 26. Konsep dan pembentukan SNS.
  • 27. Sistem Neraca Nasional: seperangkat neraca standar untuk sektor-sektor ekonomi.
  • 28.Indikator ekonomi makro utama SNS.
  • 29. Metode penghitungan produk domestik bruto.
  • 30.Indikator pergerakan alami populasi dan metode perhitungannya.
  • 31.Indikator migrasi penduduk dan metode penghitungannya.
  • 32. Perhitungan calon penduduk.
  • 33. Sistem indikator taraf hidup. Indeks Pembangunan Manusia.
  • 34.Kategori orang yang terkait dengan pekerjaan. Perhitungan tingkat pekerjaan dan beban ini dipekerjakan dalam perekonomian.
  • 35.Kategori orang yang berhubungan dengan pengangguran. Perhitungan tingkat pengangguran.
  • 36. Statistik jumlah karyawan perusahaan.
  • 37.Dana waktu kerja dan metode perhitungannya.
  • 38Koefisien penggunaan dana waktu kerja dan metode penghitungannya.
  • 39. Statistik kekayaan nasional: komposisi aset produktif non-keuangan.
  • 40. Statistik kekayaan nasional: komposisi aset non-produktif non-keuangan.
  • 41. Statistik kekayaan nasional: komposisi aset keuangan.
  • Struktur kekayaan nasional. Unsur kekayaan nasional* (di awal tahun, tidak termasuk nilai tanah, lapisan tanah bawah dan hutan)
  • 42. Statistik perdagangan internasional.
  • 43.Statistik APBN.
  • 44. Statistik aset tetap.
  • 45. Statistik dana bergulir.
  • 46. ​​Statistik produktivitas tenaga kerja.
  • 47. Statistik upah.
  • 48. Statistik biaya produksi.
  • 49. Perhitungan indeks yang digunakan untuk mempelajari dinamika harga rata-rata, indeks komposisi konstan, indeks perubahan struktural, indeks komposisi variabel.
  • 50. Indeks harga agregat Laspeyres, Paasche, Fisher, Marshall.
  • Paasche, Laspeyres dan "indeks ideal" Fisher
  • 23. Perhitungan parameter tren linier.

    Tren perkembangan utama (tren) adalah perubahan yang mulus dan stabil dalam tingkat fenomena dalam waktu, bebas dari fluktuasi acak.

    Tugasnya adalah mengidentifikasi tren umum dalam perubahan level seri, dibebaskan dari aksi berbagai faktor acak. Untuk tujuan ini, deret waktu diproses dengan metode pembesaran interval, rata-rata bergerak dan perataan analitis.

    *Salah satu metode paling sederhana untuk mempelajari tren utama dalam deret waktu adalah dengan memperbesar interval. Ini didasarkan pada perluasan periode waktu, yang mencakup tingkat rangkaian dinamika (pada saat yang sama, jumlah interval berkurang). Misalnya, seri keluaran harian diganti dengan seri keluaran bulanan, dan seterusnya. Rata-rata, dihitung pada interval yang diperbesar, memungkinkan untuk mengidentifikasi arah dan sifat (percepatan atau perlambatan pertumbuhan) dari tren pembangunan utama.

    * Identifikasi tren utama juga dapat dilakukan dengan menggunakan metode rata-rata bergerak (moving). Esensinya terletak pada kenyataan bahwa level rata-rata dihitung dari angka tertentu, biasanya ganjil (3, 5, 7, dll.), dari level pertama berturut-turut, kemudian dari jumlah level yang sama, tetapi dimulai dari kedua berturut-turut, lalu - mulai dari yang ketiga, dll. Jadi, rata-rata, seolah-olah, "meluncur" di sepanjang rangkaian dinamika, bergerak selama satu periode.

    menjadi dua anggota di awal dan akhir baris. Ini kurang dari yang sebenarnya tunduk pada fluktuasi karena penyebab acak, dan lebih jelas, dalam bentuk garis halus pada grafik, itu mengungkapkan tren utama dalam pertumbuhan hasil selama periode yang diteliti, terkait dengan tindakan penyebab dan kondisi perkembangan yang ada dalam jangka panjang.

    Kerugian dari pemulusan seri adalah "pemendekan" dari seri yang dihaluskan dibandingkan dengan yang sebenarnya, dan, akibatnya, hilangnya informasi.

    Metode pemulusan deret dinamis yang dipertimbangkan (interval kasar dan metode rata-rata bergerak) memungkinkan untuk menentukan hanya tren umum dalam perkembangan fenomena, yang sedikit banyak terbebas dari fluktuasi acak dan bergelombang. Namun, tidak mungkin untuk mendapatkan model tren statistik umum menggunakan metode ini.

    *Untuk memberikan model kuantitatif yang mengungkapkan tren utama perubahan dalam tingkat deret waktu dari waktu ke waktu, penyelarasan analitik deret waktu digunakan.

    di mana yt adalah tingkat deret dinamis yang dihitung menurut persamaan analitik yang sesuai pada waktu t.

    Level teoretis (dihitung) dari yt ditentukan berdasarkan model matematika yang disebut memadai, yang paling mencerminkan (menaksir) tren utama deret waktu. Pemilihan jenis model tergantung pada tujuan penelitian dan harus didasarkan pada analisis teoritis yang mengungkapkan sifat perkembangan fenomena, serta pada representasi grafis dari serangkaian dinamika (diagram linier).

    Misalnya, model (rumus) paling sederhana yang mengungkapkan tren perkembangan adalah:

    fungsi linier - yt langsung = a0 + a1t,

    di mana a0,a1 adalah parameter persamaan; t - waktu;

    fungsi eksponensial yt = A0A1t

    fungsi daya - kurva orde kedua (parabola)

    Dalam kasus di mana studi tren perkembangan yang sangat akurat diperlukan (misalnya, model tren untuk peramalan), ketika memilih jenis fungsi yang memadai, kriteria khusus statistik matematika dapat digunakan.

    Parameter fungsi biasanya dihitung dengan menggunakan metode kuadrat terkecil, di mana titik minimum dari jumlah deviasi kuadrat antara tingkat teoritis dan empiris diambil sebagai solusi:

    di mana yt - level sejajar (dihitung); yt - level aktual.

    Parameter persamaan a, - yang memenuhi kondisi ini dapat ditemukan dengan menyelesaikan sistem persamaan normal. Berdasarkan persamaan tren yang ditemukan, level level dihitung. Dengan demikian, penyelarasan deret waktu terdiri dari penggantian level aktual y, - dengan level yang bervariasi Y(, paling baik mendekati data statistik.

    Penjajaran dalam garis lurus digunakan, sebagai suatu peraturan, dalam kasus di mana perolehan absolut praktis konstan, yaitu ketika level berubah dalam deret aritmatika (atau mendekatinya).

    Penjajaran dengan fungsi eksponensial digunakan dalam kasus di mana deret mencerminkan perkembangan dalam deret geometri, yaitu, ketika faktor pertumbuhan rantai praktis konstan.

    Pertimbangkan "teknik" untuk menyelaraskan deret waktu dalam garis lurus: yt=a0+a1t

    Parameter a0, a1 menurut metode kuadrat terkecil ditemukan dengan menyelesaikan sistem persamaan normal berikut yang diperoleh dengan transformasi aljabar dari kondisi

    di mana y - level aktual (empiris) dari seri; t - waktu (nomor seri periode atau titik waktu).

    Kami akan menunjukkan contoh perhitungan rinci parameter persamaan tren berdasarkan data berikut (lihat tabel) menggunakan kalkulator.

    Persamaan tren linier adalah y = di + b.
    1. Temukan parameter persamaan dengan metode kuadrat terkecil.
    Sistem persamaan kuadrat terkecil:
    a 0 n + a 1 t = y
    a 0 t + a 1 t 2 = yt

    t kamu t2 y2 t y y(t) (y-y cp) 2 (y-y(t)) 2 (t-t p) 2 (y-y(t)) : y
    1 17.4 1 302.76 17.4 12.26 895.01 26.47 30.25 0.3
    2 26.9 4 723.61 53.8 18.63 416.84 68.39 20.25 0.31
    3 23 9 529 69 25 591.3 4.02 12.25 0.0872
    4 23.7 16 561.69 94.8 31.38 557.75 58.98 6.25 0.32
    5 27.2 25 739.84 136 37.75 404.68 111.4 2.25 0.39
    6 34.5 36 1190.25 207 44.13 164.27 92.72 0.25 0.28
    7 50.7 49 2570.49 354.9 50.5 11.45 0.0383 0.25 0.0039
    8 61.4 64 3769.96 491.2 56.88 198.34 20.44 2.25 0.0736
    9 69.3 81 4802.49 623.7 63.25 483.27 36.56 6.25 0.0872
    10 94.4 100 8911.36 944 69.63 2216.84 613.62 12.25 0.26
    11 61.1 121 3733.21 672.1 76 189.98 222.11 20.25 0.24
    12 78.2 144 6115.24 938.4 82.38 953.78 17.46 30.25 0.0534
    78 567.8 650 33949.9 4602.3 567.8 7083.5 1272.21 143 2.41

    Untuk data kami, sistem persamaan memiliki bentuk:
    12a 0 + 78a 1 = 567,8
    78a 0 + 650a 1 = 4602,3
    Dari persamaan pertama kita nyatakan 0 dan substitusikan ke persamaan kedua
    Kami mendapatkan 0 = 6,37, a 1 = 5,88

    Catatan: Nilai kolom #6 y(t) dihitung berdasarkan persamaan tren turunan. Misalnya, t = 1: y(1) = 6,37*1 + 5,88 = 12,26

    persamaan tren

    y = 6,37 t + 5,88

    Mari kita mengevaluasi kualitas persamaan tren menggunakan kesalahan pendekatan absolut.


    Karena kesalahannya lebih besar dari 15%, persamaan ini tidak diinginkan untuk digunakan sebagai tren.

    Nilai rata-rata:


    Penyebaran

    simpangan baku

    Koefisien elastisitas


    Koefisien elastisitas kurang dari 1. Oleh karena itu, jika X berubah 1%, Y akan berubah kurang dari 1%. Dengan kata lain pengaruh X terhadap Y tidak signifikan.

    Koefisien determinasi

    itu. dalam 82,04% kasus itu mempengaruhi perubahan data. Dengan kata lain, akurasi pemilihan persamaan tren tinggi

    2. Analisis akurasi penentuan estimasi parameter persamaan tren.
    Varians kesalahan persamaan.

    di mana m = 1 adalah jumlah faktor yang mempengaruhi dalam model tren.

    Kesalahan standar persamaan.



    3. Menguji hipotesis mengenai koefisien persamaan tren linier.
    1) t-statistik. Kriteria siswa.
    Menurut tabel Siswa, kami menemukan Ttabel
    T tabel (n-m-1; / 2) \u003d (10; 0,025) \u003d 2.228

    >
    Signifikansi statistik dari koefisien a 0 dikonfirmasi. Estimasi parameter a 0 signifikan dan time series memiliki trend.


    Signifikansi statistik dari koefisien a 1 tidak dikonfirmasi.

    Interval kepercayaan untuk koefisien persamaan tren.
    Mari kita tentukan interval kepercayaan dari koefisien tren, yang, dengan keandalan 95%, adalah sebagai berikut:
    (a 1 - t obs S a 1 ;a 1 + t obs S a 1)
    (6.375 - 2.228*0.943; 6.375 + 2.228*0.943)
    (4.27;8.48)
    (a 0 - t obs S a 0 ;a 0 + t obs S a 0)
    (5.88 - 2.228*6.942; 5.88 + 2.228*6.942)
    (-9.59;21.35)
    Karena titik 0 (nol) terletak dalam interval kepercayaan, estimasi interval dari koefisien a 0 secara statistik tidak signifikan.
    2) F-statistik. kriteria Fisher.


    fkp = 4,84
    Karena F > Fkp, maka koefisien determinasi signifikan secara statistik

    Periksa Autokorelasi Residual.
    Prasyarat penting untuk membangun model regresi kualitatif menggunakan LSM adalah independensi nilai penyimpangan acak dari nilai penyimpangan dalam semua pengamatan lainnya. Ini memastikan bahwa tidak ada korelasi antara setiap penyimpangan dan, khususnya, antara penyimpangan yang berdekatan.
    Autokorelasi (korelasi serial) didefinisikan sebagai korelasi antara ukuran yang diamati yang diurutkan dalam waktu (deret waktu) atau ruang (seri silang). Autokorelasi residual (outlier) sering dijumpai dalam analisis regresi jika menggunakan data runtun waktu dan sangat jarang jika menggunakan data cross-sectional.
    Dalam tugas-tugas ekonomi, itu jauh lebih umum autokorelasi positif dibandingkan autokorelasi negatif. Dalam kebanyakan kasus, autokorelasi positif disebabkan oleh pengaruh konstan arah dari beberapa faktor yang tidak diperhitungkan dalam model.
    Autokorelasi negatif sebenarnya berarti bahwa penyimpangan positif diikuti oleh penyimpangan negatif dan sebaliknya. Situasi seperti itu dapat terjadi jika hubungan yang sama antara permintaan minuman ringan dan pendapatan dipertimbangkan menurut data musiman (musim dingin-musim panas).
    Di antara penyebab utama yang menyebabkan autokorelasi, berikut ini dapat dibedakan:
    1. Kesalahan spesifikasi. Kegagalan untuk memperhitungkan variabel penjelas penting dalam model atau pilihan yang salah dari bentuk ketergantungan biasanya menyebabkan penyimpangan sistemik titik pengamatan dari garis regresi, yang dapat menyebabkan autokorelasi.
    2. Kelembaman. Banyak indikator ekonomi (inflasi, pengangguran, GNP, dll.) memiliki siklus tertentu yang terkait dengan aktivitas bisnis yang bergelombang. Oleh karena itu, perubahan indikator tidak terjadi secara instan, tetapi memiliki inersia tertentu.
    3. Efek web. Di banyak industri dan area lainnya, indikator ekonomi bereaksi terhadap perubahan kondisi ekonomi dengan penundaan (jeda waktu).
    4. Perataan data. Seringkali, data untuk jangka waktu lama tertentu diperoleh dengan merata-ratakan data selama interval penyusunnya. Hal ini dapat menyebabkan pemulusan fluktuasi tertentu yang ada dalam periode yang sedang dipertimbangkan, yang pada gilirannya dapat menyebabkan autokorelasi.
    Efek autokorelasi mirip dengan heteroskedastisitas: kesimpulan pada t- dan F-statistik yang menentukan signifikansi koefisien regresi dan koefisien determinasi mungkin salah.

    Deteksi autokorelasi
    1. Metode grafis
    Ada sejumlah pilihan untuk definisi grafis dari autokorelasi. Salah satunya mengaitkan penyimpangan e i dengan saat-saat penerimaannya i. Pada saat yang sama, baik saat memperoleh data statistik atau nomor seri pengamatan diplot sepanjang sumbu absis, dan deviasi e i (atau perkiraan deviasi) diplot sepanjang sumbu ordinat.
    Wajar untuk berasumsi bahwa jika ada hubungan tertentu antara penyimpangan, maka terjadi autokorelasi. Tidak adanya ketergantungan cenderung menunjukkan tidak adanya autokorelasi.
    Autokorelasi menjadi lebih jelas jika Anda memplot ei versus e i-1
    Tes Durbin-Watson.
    Kriteria ini paling dikenal untuk mendeteksi autokorelasi.
    Selama analisis statistik persamaan regresi, pada tahap awal, seseorang sering memeriksa kelayakan satu premis: kondisi untuk independensi statistik dari penyimpangan satu sama lain. Dalam hal ini, ketidakterkaitan nilai tetangga e i diperiksa.

    kamu y(x) e i = y-y(x) e 2 (e i - e i-1) 2
    17.4 12.26 5.14 26.47 0
    26.9 18.63 8.27 68.39 9.77
    23 25 -2 4.02 105.57
    23.7 31.38 -7.68 58.98 32.2
    27.2 37.75 -10.55 111.4 8.26
    34.5 44.13 -9.63 92.72 0.86
    50.7 50.5 0.2 0.0384 96.53
    61.4 56.88 4.52 20.44 18.71
    69.3 63.25 6.05 36.56 2.33
    94.4 69.63 24.77 613.62 350.63
    61.1 76 -14.9 222.11 1574.09
    78.2 82.38 -4.18 17.46 115.03
    1272.21 2313.98

    Untuk menganalisis korelasi penyimpangan, gunakan Statistik Durbin-Watson:


    Nilai kritis d 1 dan d 2 ditentukan berdasarkan tabel khusus untuk tingkat signifikansi yang diperlukan , jumlah pengamatan n = 12 dan jumlah variabel penjelas m=1.
    Tidak ada autokorelasi jika kondisi berikut ini benar:
    d1< DW и d 2 < DW < 4 - d 2 .
    Tanpa mengacu pada tabel, kita dapat menggunakan aturan perkiraan dan mengasumsikan bahwa tidak ada autokorelasi dari residual jika 1,5< DW < 2.5. Поскольку 1.5 < 1.82 < 2.5, то автокорреляция остатков hilang.
    Untuk kesimpulan yang lebih andal, disarankan untuk mengacu pada nilai tabel.
    Menurut tabel Durbin-Watson untuk n=12 dan k=1 (tingkat signifikansi 5%) kita menemukan: d 1 = 1,08; d2 = 1,36.
    Sejak 1.08< 1.82 и 1.36 < 1.82 < 4 - 1.36, то автокорреляция остатков hilang.

    Memeriksa heteroskedastisitas.
    1) Dengan metode analisis grafis dari residu.
    Dalam hal ini, nilai-nilai variabel penjelas X diplot di sepanjang absis, dan deviasi e i atau kuadratnya e 2 i diplot di sepanjang ordinat.
    Jika terdapat hubungan yang pasti antara deviasi, maka terjadi heteroskedastisitas. Tidak adanya ketergantungan cenderung menunjukkan tidak adanya heteroskedastisitas.
    2) Menggunakan uji korelasi peringkat Spearman.
    Koefisien korelasi peringkat Spearman.
    Tetapkan peringkat untuk fitur Y dan faktor X. Temukan jumlah selisih kuadrat d 2 .
    Dengan menggunakan rumus, kami menghitung koefisien korelasi peringkat Spearman.

    t tabel (n-m-1; / 2) \u003d (10; 0,05 / 2) \u003d 2.228
    Sejak Tobl< tтабл, то принимаем гипотезу о равенстве 0 коэффициента ранговой корреляции. Другими словами, коэффициент ранговой корреляции статистически - не значим.
    Mari kita periksa hipotesis H 0: tidak ada heteroskedastisitas.
    Karena 2,228 > 0,45 maka hipotesis tidak adanya heteroskedastisitas diterima.
    t saya peringkat X, dx peringkat e i , d y (dx - dy) 2
    1 -5.14 1 4 9
    2 -8.27 2 2 0
    3 2 3 7 16
    4 7.68 4 9 25
    5 10.55 5 11 36
    6 9.63 6 10 16
    7 -0.2 7 6 1
    8 -4.52 8 5 9