I.V. Danilevsky, Hukum Zipf-Pareto, teknologi kuantum baru dan filosofi alam bawah sadar

Selama proses pemilihan, pemilih mengekspresikan sikap mereka terhadap politisi atau partai, memberikan suara mereka untuk kandidat atau partai tertentu. Timbul pertanyaan - apakah ada pola yang menggambarkan distribusi suara antara kandidat atau partai yang berbeda? Jika tidak ada keteraturan, maka dimungkinkan adanya korelasi antara jumlah suara yang diterima oleh calon atau partai, serta antara jumlah suara tersebut dan, misalnya, jumlah pemilih atau jumlah surat suara yang tidak sah. Jika ada pola-pola tertentu dalam distribusi suara, maka tidak semua varian distribusinya dimungkinkan. Berdasarkan materi pemilu yang paling banyak berbagai negara hubungan statistik terungkap yang ada antara jumlah suara yang diterima dalam pemilihan oleh berbagai kandidat dan partai. Ditemukan bahwa hubungan ini dijelaskan oleh hubungan sederhana berikut:

Jika pada satu sumbu kita plot jumlah suara N(i) yang diterima oleh masing-masing calon pada skala logaritma, dan pada sumbu lainnya, juga pada skala logaritmik, tempat i ditempati oleh calon yang sama selama pemilihan, maka poin diperoleh dengan pendekatan yang cukup terletak di sepanjang garis lurus:

ln N(i) = A - B x lni (1)

Validitas persamaan di atas dikonfirmasi dalam serangkaian karya Spesialis Rusia dalam Ilmu Politik Matematika (Sobyanin, Sukhovolsky, 1995), yang menganalisis hasil pemilihan wakil rakyat Rusia tahun 1990, pemilihan Presiden Rusia tahun 1991 dan 1996, serta data pemilihan umum di sejumlah negara , dimulai dengan pemilihan presiden di Prancis pada tahun 1848, di mana Louis Napoleon Bonaparte dikalahkan.

Ini hasil matematika sifatnya nontrivial. Spesialis - fisikawan, ahli kimia, ahli metalurgi, ahli demografi, ekologi, dan perwakilan dari banyak bidang pengetahuan lain yang berurusan dengan sejumlah besar data statistik, sangat menyadari bahwa keteraturan numerik yang ditunjukkan adalah karakter umum dan menggambarkan situasi "bebas" kompetisi"untuk distribusi sejumlah terbatas "barang" bersyarat apa pun. Ternyata semua variasi objek, situasi, dan hubungan sebab-akibat yang mungkin tidak mengubah sifat ketergantungan ini: segera setelah ada persaingan bebas, hasilnya dalam hal apapun cocok pada "garis lurus logaritmik" - hanya konstanta A dan kemiringan garis lurus B yang berubah. di negara-negara ini populasi mengarah di negara-negara beradab ke ketergantungan seperti itu. Sementara itu, di Uni Soviet, kota-kota seperti itu seperti Moskow, Leningrad dan beberapa pusat lainnya menyimpang secara signifikan dari "persaingan bebas langsung" - karena pembatasan administratif yang terkait dengan rezim paspor.persaingan mengarah pada hubungan yang sama antara ukuran kekayaan terbesar dan "tempat" yang ditempati oleh pemiliknya dalam daftar negara bagian tersebut - tentu saja, di bagian dunia di mana daftar tersebut ada. Persis sama diketahui oleh ahli zoologi hukum distribusi pemangsa berdasarkan massa (dengan tidak adanya faktor antropogenik), dll.

Untuk pertama kalinya, keteraturan semacam ini ditetapkan oleh sosiolog dan matematikawan Italia V. Pareto, yang terlibat dalam distribusi penduduk negara menurut kekayaan mereka; kemudian, ahli bahasa Amerika J.K. Zipf, mempelajari distribusi frekuensi penggunaan kata dalam teks. Berbagai pilihan Rasio yang ditulis di atas disebut hukum Zipf-Pareto. Metode analisis yang berkaitan dengan studi distribusi pangkat banyak digunakan dalam linguistik, scientometrics, dan ekologi. Kepatuhan terhadap hubungan (1) untuk proses pemilihan berarti bahwa ada "persaingan bebas" dari semua calon yang memiliki kesempatan untuk secara bebas menjelaskan kepada pemilih pilihan mereka. Pandangan politik dan platform politik.

Pemenuhan undang-undang Zipf-Pareto untuk proses pemilu berarti bahwa setiap calon, masing-masing partai dan kelompok politik pemilih memberikan suara sesuai dengan tipe tertentu, memiliki platform politiknya sendiri, tidak tumpang tindih dengan yang lain. Kandidat yang tersedia harus mencakup semua kemungkinan preferensi pemilih; maka proporsi pemilih yang mencari pilihannya di luar daftar calon yang diajukan cukup kecil, dan persamaan (1) menggambarkan distribusi suara dengan akurasi tinggi. Jika tidak, "relung" kosong mungkin muncul dalam distribusi (1), dan seluruh analisis menjadi lebih rumit.

Parameter A dan B yang termasuk dalam persamaan (1) dihitung berdasarkan data jumlah pemilih yang memilih calon yang berbeda atau kelompok politik yang berbeda dengan menggunakan metode analisis regresi. Parameter A pada persamaan (1) adalah logaritma dari jumlah pemilih yang memberikan suara untuk calon utama. Nilai B, koefisien preferensi, mencirikan kemiringan garis lurus (1) dan berfungsi sebagai ukuran numerik homogenitas pilihan pemilih. Jika B = 0, ini berarti bahwa pemilih tidak memiliki preferensi untuk beberapa partai atau kandidat di atas yang lain, dan bahwa mereka semua diterima dalam pemilihan. nomor yang sama suara. Sebaliknya, pada nilai besar kecuraman B, pihak luar menerima suara yang sangat sedikit dibandingkan dengan partai-partai terkemuka (namun, dalam praktiknya parameter B hampir tidak pernah lebih besar dari satu). Jika penyimpangan dari garis lurus tipe (1) diperhatikan, maka berdasarkan asumsi yang dibuat di atas, ini menunjukkan tidak adanya kondisi persaingan politik yang bebas. Ini dapat disebabkan oleh kehadiran beberapa akting tambahan faktor eksternal, misalnya, intimidasi pemilih dengan kemungkinan represi politik dan ekonomi jika memilih (atau tidak memilih) untuk kandidat tertentu, atau pemalsuan langsung hasil pemilu selama penghitungan suara di komisi pemilu level yang berbeda. Gambar 2 menunjukkan grafik tipikal distribusi peringkat jumlah pemilih dalam pemilu di Rusia. Seperti yang Anda lihat, di antara angka-angka berbagai kelompok pemilih dan peringkat kelompok-kelompok ini (yaitu, tempat kandidat) dalam koordinat logaritmik (sepanjang kedua sumbu), praktis ada hubungan linier.

Jenis distribusi suara untuk kandidat atau partai yang berbeda membantu mengidentifikasi kecurangan pemilu. Dalam kasus pemalsuan yang paling sederhana, jika sejumlah surat suara yang diisi untuk mendukung beberapa kandidat atau partai dimasukkan ke dalam kotak suara, ternyata distribusi peringkat jumlah suara yang dikeluarkan untuk calon perseorangan tidak digambarkan secara lurus. Tetapi jika kita mengecualikan data tentang kandidat yang mendukung pemalsuan, maka untuk kandidat (atau partai) yang tersisa distribusi peringkat akan sesuai dengan teori. Dalam hal yang dipertimbangkan, jumlah surat suara yang dipasang dapat diperkirakan dari selisih antara jumlah suara yang diterima oleh calon menurut data resmi dan jumlah yang ditemukan dari persamaan distribusi kepangkatan setelah mengecualikan data yang terkait dengan calon tersebut. Gambar 3 menunjukkan distribusi suara - menurut komisi pemilihan - untuk calon kepala administrasi Wilayah Lipetsk dalam pemilihan umum yang diadakan pada musim semi 1993. Distribusi ini jelas jauh dari garis lurus. Dalam kasus ini, persidangan yang berlangsung pada 1995 itu menegaskan adanya pemalsuan yang menguntungkan calon juara pertama.

George Zipfu

Teks adalah sumber informasi utama di Internet. Secara alami, promosi situs di TOP pencarian sebagian besar terkait dengan ejaan yang benar konten serupa. Tetapi menulis teks saja tidak cukup - Anda juga perlu mengaturnya sesuai dengan berbagai aturan dan rekomendasi SEO. Dari jumlah tersebut, yang paling populer dan banyak digunakan dapat dibedakan:

  • Minimal mual, air dan spam.
  • Struktur yang benar dari bahan yang ditempatkan (judul, daftar).
  • Memasukkan kunci.

Ini semua adalah dasar-dasarnya, jadi dia menggunakannya kebanyakan pengoptimal Tetapi ada semakin banyak situs di Internet, sehingga beberapa pemiliknya mencari opsi lain untuk berhasil mempromosikan produk mereka. Dan di sini beberapa dari mereka mengingat hukum Zipf tertentu. Tapi mereka tidak hanya mulai mengasah tulisan mereka sendiri untuk sebuah layanan berdasarkan pernyataan seorang ilmuwan Inggris yang hidup entah berapa tahun yang lalu, mereka juga membuat copywriter sewaan memutar otak mereka untuk itu!

Tetapi Dr. Aytupit waspada, oleh karena itu, seperti Black Cloak, ia bergegas membantu peretasan Internet untuk mengatasi efisiensi metode ini untuk mempromosikan situs di Tops mesin pencari paling terkenal.

Tes hukum Zipf

Sebenarnya, hanya dua karakteristik penting:

  • Mual konten yang diperiksa.
  • kealamian.

Kerugian pertama dari produk ini justru terletak pada indikator mual: pengembang jelas tidak memperhitungkan bahwa ada variasi klasik dan akademis dari karakteristik SEO ini. Dan kebanyakan orang yang bekerja di bidang ini tahu bahwa metode yang sama sekali berbeda digunakan untuk mengurangi kinerja setiap opsi. cara yang berbeda(Dr. Aitupit akan mencoba menceritakan hal ini di salah satu tulisannya berikutnya). Tetapi layanan Tsipfo tidak memberi tahu penggunanya tentang hal ini, yang terkadang dapat menyebabkan beberapa kesulitan. Saya tidak akan menyiksa Anda untuk waktu yang lama dan saya akan mengatakan itu di kasus ini hanya mual klasik yang tersirat.

Mari beralih ke Alam. Apa itu? Saya telah lama mencari informasi yang memadai tentang masalah ini. Tetapi saya hanya menemukan penulisan ulang yang konstan dari beberapa kata yang sulit dipahami, yang artinya tidak mungkin dipahami tanpa beberapa botol bir. Tidak, tentu saja, saya mungkin bodoh, tetapi Anda masing-masing dapat memahami ini:

“..pola empiris distribusi frekuensi kata bahasa alami: jika semua kata bahasa (atau cukup teks panjang) dalam urutan menurun frekuensi penggunaannya, maka frekuensi kata ke-n dalam daftar tersebut akan kira-kira berbanding terbalik dengannya nomor seri n (yang disebut peringkat kata ini, lihat skala urutan). Misalnya, kata kedua yang paling sering digunakan sekitar dua kali lebih jarang daripada yang pertama, yang ketiga tiga kali lebih jarang daripada yang pertama, dan seterusnya..”

Empiris, sialan, keteraturan ... Seharusnya ditulis seperti itu! Yah, oke - Setan tidak akan memaafkannya. Ini bukan yang paling menarik! Sangat menarik bahwa penulis pepatah ini adalah seorang ahli bahasa Amerika yang hidup di pertengahan abad terakhir, ketika hanya George Lucas dan Leonid Ilyich Brezhnev yang tahu tentang Internet. Artinya, adakah orang yang percaya bahwa mesin pencari modern hanya wajib melakukan analisis menurut hukum Zipf? Maaf, Monsieur, tapi kenapa sih? ..

Mungkin, setelah kata-kata di atas, beberapa pembaca akan memutuskan bahwa penulis karya ini adalah balabol yang khas? Saya akan mencoba memberikan argumen yang layak untuk meyakinkan Anda!

– Persyaratan bahwa parameter teks mematuhi hukum Zipf atau, tepatnya, dengan segala macam "layanan" yang diduga memeriksa teks untuk kepatuhan tersebut adalah palsu air paling murni. Kondisi demikian tidak ada artinya baik dari segi kualitas teks maupun dari segi optimalisasinya untuk mesin pencari.

- Cek Zipf mirip dengan jimat SEO dan feng shui - Saya mendengar dering, tapi saya tidak tahu di mana itu. Dan karena ada banyak mistifikasi pseudoscientific di SEO secara umum karena kedekatan awal algoritma mesin pencari, cek Zipf sangat harmonis menggabungkan indikator kualitas yang lebih relevan - kepadatan dan keunikan kunci, yang hasilnya, pada gilirannya, juga harus diterima sejauh.

Tidak ada spekulasi di pihak saya - kata-kata yang dikomunikasikan dengan jujur ​​​​tentang hukum ini!

Dan saya siap untuk berlangganan setiap kata dari Zheka dan Advego. Mari kita berfantasi. Bayangkan ada mesin di depan Anda. Anda perlu mendekati dan menekan kombinasi angka yang sewenang-wenang di papan skornya. nomor yang benar tidak ada yang tahu, jadi setiap kali jumlah kemenangan berbeda. Beberapa orang hanya memasukkan nilai dan pergi, yang lain mulai menciptakan semacam sistem: mereka menari rumba, meludah tiga kali dengan sudut lima belas derajat, makan kambing yang mengering tiga hari yang lalu, dan seterusnya. Dan kemudian salah satu yang beruntung terakhir - dia memecahkan jackpot! Mengapa dia beruntung - dia tahu. Mungkin dia hanya menebak kombinasinya, atau mungkin kambing itu ajaib. Tetapi keesokan harinya, orang ini datang ke mesin dan menyiapkan meja di dekatnya, di mana dia mengundang semua orang untuk mencoba tekniknya sebelum memutar nomor ...

Masih belum yakin? Lalu saya akan menggunakan artileri berat - saya akan melakukan percobaan.

Pemeriksaan visual teks menurut hukum Zipf

Untuk pekerjaan yang akan datang, saya memutuskan untuk mengambil beberapa yang berbeda frase kunci dan periksa teks untuk kepatuhan dengan hukum Zipf, yang terletak di berbagai tempat di TOP mesin pencari domestik kami Yandex. Mari kita mulai.

Kunci pertama adalah "Membangun rumah dari bar".

Saya memilih situs yang terletak di peringkat teratas pencarian, saya melakukan analisis:

Apa yang kita miliki: kealamian - 80, mual - 5.9.

Saya membuka halaman di bawah ini di mesin pencari, memilih situs dari selusin ketiga, dan melakukan analisis:

Hasil: kealamian - 82, mual - 6.16.

Saya turun selusin posisi di bawah ini dan mengulangi prosedurnya:

Hasil: E - 86, T - 8.6.

Tetapi di TOP sesuatu yang lain sangat berharga! Sedikit? Kami ulangi pemeriksaan. Kami mengambil kunci berikutnya. Misalkan - pengobatan wasir.

Hasil : E - 70, T - 11.23.

Di bawah dua lusin posisi:

Hasil: E - 91, T - 4.90.

Halaman lain di bawah ini:

Hasil: E - 91, T - 4.12.

Kesimpulan

Seperti dapat dilihat dari analisis, indikator terbaik kealamian bahan teks menurut hukum Zipf sama sekali tidak menjamin keberhasilan persaingan dengan teks yang terletak di sumber daya Internet lainnya. Namun, terserah Anda untuk memutuskan ...


Halo semua! PADA baru-baru ini semakin sering saya mendengar dari rekan-rekan tentang persyaratan dalam TOR untuk mengevaluasi kualitas teks menurut hukum Zipf. Dan tidak semua orang mengerti cara mengedit teks untuk undang-undang ini. Dalam artikel hari ini saya akan mencoba memberi tahu Anda bagaimana caranya secara sederhana tingkatkan parameternya, dan juga jelaskan alasannya penulis yang baik sebenarnya tidak diperlukan.

Anda dapat menentukan kualitas teks menurut hukum Zipf menggunakan beberapa layanan. Tapi, saya menganggap PR-CY sebagai yang paling memadai, menggabungkan rumus yang benar dengan antarmuka yang sederhana dan jelas. Itulah yang saya gunakan dalam penyusunan materi ini.

Apa itu Hukum Zipf?

Untuk memulainya, ada baiknya memahami apa itu. Menurut Wikipedia, Jean-Baptiste Estoux merumuskan pola ini pada tahun 1908, undang-undang ini awalnya mengacu pada steno. Penerapan pertama dari keteraturan yang diketahui masyarakat umum berkaitan dengan demografi, dan lebih tepatnya pada persebaran penduduk di kota-kota, digunakan oleh Felix Auerbach.

Pola ini menerima nama modernnya pada tahun 1949 berkat ahli bahasa George Zipf. Dia menunjukkan dengan bantuannya gradasi distribusi kekayaan di antara penduduk. Dan baru kemudian hukum mulai diterapkan untuk menentukan keterbacaan teks.

Bagaimana cara menghitungnya?

Untuk menggunakan hukum ini dengan benar, Anda perlu memahami cara kerjanya. Mari kita menganalisis rumus untuk perhitungannya.

  • F adalah frekuensi penggunaan kata;
  • R adalah nomor seri;
  • C- konstan(angka yang menunjukkan jumlah pengulangan kata terbesar).

Dalam praktiknya, formula lain ternyata lebih nyaman, terlihat lebih jelas.

Pendekatan ini lebih nyaman, karena kami memiliki data tentang jumlah pengulangan kata yang paling umum. Dari kuantitas inilah mereka ditolak.

Untuk menyederhanakan, dalam teks kita, kata kedua yang paling sering muncul harus dua kali lebih jarang dari yang pertama. Datang di tempat ketiga, tiga kali dan seterusnya.

Contoh pas teks

Teori telah ditangani dengan sedikit. Masih berurusan dengan latihan. Sebagai teks percobaan, saya mengambil artikel dari T-Zh. Kenapa dari sana? Semuanya sederhana. Saat ini, ini adalah salah satu contoh terbaik dari gaya info yang disukai banyak orang. Nah, menarik apa yang akan ditunjukkan oleh teks yang ditulis di bawah arahan Maxim Ilyakhov. Saya akan segera mengatakan bahwa teks untuk indikator ini berada pada level, meskipun, setelah menyekop lebih dari 40 situs, saya tidak menemukan satu artikel pun dengan kealamian yang buruk sama sekali. Juga, saya akan segera melompat ke depan dan mengatakan bahwa teks eksperimental setelah pemasangan menjadi jauh lebih buruk, meskipun skor Zipf meningkat, Anda tidak perlu terlalu repot dengan peningkatan kealamian yang berlebihan.

Inilah yang ditunjukkan oleh penganalisis kepada kami setelah memeriksa.

Mari kita lihat apa saja yang ada di dalamnya. Seperti yang Anda lihat, ada kolom dengan kata-kata, serta angka yang tidak bisa dipahami. Kolom "kejadian" (1) menunjukkan berapa kali bentuk kata muncul dalam teks. Di kolom Zipf (2) adalah jumlah entri yang disarankan. Penanda 3 dan 4 menandai indikator ideal untuk posisi kedua dan ketiga. Anda juga harus memperhatikan rekomendasi, ini menunjukkan berapa banyak kata yang perlu Anda hapus untuk mencapai kombinasi yang sempurna.

Untuk pemahaman yang lebih baik, mari kita analisis apa yang dihitung oleh penganalisis. Kami mengambil angka 39 (C) sebagai dasar, kami juga membutuhkan nomor seri, perhatikan posisi 2 (F). Kami mengambil rumusnya.

Pengganti.

F=39/2=19.5

Kami mengumpulkan dan mendapatkan 20, ini akan menjadi jumlah yang diperlukan kejadian. Ini dikonfirmasi oleh penganalisa. Di negara kita, kata paling populer kedua digunakan 28 kali, masing-masing, 8 pengulangan perlu dihapus atau diganti.

Setelah berurusan dengan prinsip hukum, kami mulai mengedit. Untuk melakukan ini, kami menghapus atau mengganti dengan kata-kata sinonim yang memiliki kemunculan lebih dari yang dibutuhkan oleh Zipf. Hasilnya, kami mendapatkan gambar ini.

Seperti yang Anda lihat, saya berhasil meningkatkan tarif dari 83% menjadi 88%. Namun, kualitas teks mengalami penurunan yang signifikan. Anda tidak harus berusaha untuk meningkatkan angka ini menjadi 100%. Bahkan, jika Anda sudah memiliki 75%, ini sangat bagus dan Anda tidak boleh menyimpang lebih jauh.

Saran yang berguna

Perhatikan tidak hanya pada baris pertama. Mulai cocok dengan posisi terakhir terdaftar, mereka sering menyediakan pengaruh yang lebih besar pada skor total daripada sepuluh kata pertama.

Zipf dan SEO

Sekarang mari kita beralih ke mengapa seorang copywriter perlu mengetahui pola ini. Saat memesan teks, SEO berusaha menjadikannya yang paling nyaman untuk mesin telusur. Diyakini (meskipun tidak jelas oleh siapa) bahwa hukum Zipf digunakan secara aktif oleh algoritma pencarian. Sulit untuk membuktikan atau menyangkal pernyataan ini. Saya tidak dapat menemukan penelitian dan eksperimen yang waras tentang topik ini.

Memutuskan untuk memeriksanya sendiri. Untuk melakukan ini, saya mengambil hasil untuk kueri "jendela plastik" yang kompetitif, Yandex mengambil hasil Moskow, saya harus menyulap di Google, dan tampaknya juga mengidentifikasi saya sebagai penduduk ibukota (menurut paling sedikit menunjukkan kepada saya sebuah iklan dengan geolokasi Moskow). Saya mengambil halaman pertama dari masalah ini, ditambah tempat ke-49. Ini adalah bagaimana tanda itu ternyata.

Jika Anda melihat lebih dekat, Anda dapat melihat bahwa di Yandex outputnya lebih merata, jika Anda melihat pola yang kita pelajari. Tapi, sementara lagi tingkat tinggi tidak menjamin kemenangan dalam perebutan tempat pertama di atas.

Berdasarkan hal tersebut, dapat dikatakan bahwa jika mesin pencari menggunakan hukum ini, hanya salah satu faktornya. Dan bukan yang utama.

kesimpulan

OK semuanya berakhir Sekarang. Sekarang Anda tahu seperti apa kualitas teks menurut hukum Zipf, dan Anda juga dapat menyesuaikan indikator ini. Faktanya, tidak ada yang rumit di sini, semuanya cukup sederhana. Cukup memahami prinsip pengoperasian keteraturan ini sekali.

kata-kata dari bahasa alami: jika semua kata dari suatu bahasa (atau hanya teks yang cukup panjang) diurutkan dalam urutan menurun dari frekuensi penggunaannya, maka frekuensi n-kata dalam daftar seperti itu kira-kira berbanding terbalik dengan nomor urutnya n(disebut pangkat kata ini, lihat skala keteraturan). Misalnya, kata kedua yang paling sering digunakan kira-kira dua kali lebih jarang daripada yang pertama, yang ketiga tiga kali lebih jarang daripada yang pertama, dan seterusnya.

Sejarah penciptaan[ | ]

Penulis penemuan pola tersebut adalah seorang stenografer Prancis (fr. Jean-Baptiste Estoup), yang menggambarkannya pada tahun 1908 dalam The Range of Shorthand. Hukum ini pertama kali diterapkan untuk menggambarkan distribusi ukuran kota oleh fisikawan Jerman Felix Auerbach dalam karyanya "The Law of Population Concentration" pada tahun 1913 dan menyandang nama ahli bahasa Amerika George Zipf, yang pada tahun 1949 secara aktif mempopulerkan keteraturan ini, pertama mengusulkan untuk menggunakannya untuk menggambarkan distribusi kekuatan ekonomi dan status sosial.

Penjelasan hukum Zipf berdasarkan sifat korelasi rantai Markov aditif (dengan fungsi memori langkah) diberikan pada tahun 2005.

Hukum Zipf secara matematis dijelaskan oleh distribusi Pareto. Ini adalah salah satu hukum dasar yang digunakan dalam infometrik.

Aplikasi hukum[ | ]

George Zipf pada tahun 1949 untuk pertama kalinya menunjukkan distribusi pendapatan orang menurut ukurannya: orang terkaya memiliki dua kali lipat uang lebih daripada orang kaya berikutnya, dan seterusnya. Pernyataan ini ternyata benar untuk sejumlah negara (Inggris, Prancis, Denmark, Belanda, Finlandia, Jerman, AS) pada periode 1926 hingga 1936.

Undang-undang ini juga berlaku dalam kaitannya dengan distribusi sistem kota: kota yang paling banyak populasi besar di negara mana pun dua kali lebih besar dari kota terbesar berikutnya, dan seterusnya. Jika Anda mengatur semua kota di negara tertentu dalam daftar dalam urutan populasi yang menurun, maka setiap kota dapat diberi peringkat tertentu, yaitu jumlah yang diterimanya dalam daftar ini. Pada saat yang sama, ukuran dan peringkat populasi mengikuti pola sederhana yang dinyatakan oleh rumus:

P n = P 1 / n (\displaystyle P_(n)=P_(1)/n),

di mana P n (\gaya tampilan P_(n))- penduduk kota n peringkat -th; P 1 (\gaya tampilan P_(1))- populasi kota utama negara itu (peringkat 1).

Penelitian empiris menegaskan pernyataan ini.

Pada tahun 1999, ekonom Xavier Gabet menggambarkan hukum Zipf sebagai contoh hukum kekuatan: jika kota tumbuh secara acak dengan standar deviasi yang sama, maka pada batas distribusi akan menyatu dengan hukum Zipf.

Menurut temuan para peneliti sehubungan dengan pemukiman perkotaan di Federasi Rusia, sesuai dengan hukum Zipf:

  • sebagian besar kota-kota Rusia terletak di atas kurva Zipf yang ideal, sehingga tren yang diharapkan adalah penurunan terus-menerus dalam jumlah dan populasi kota-kota menengah dan kecil karena migrasi ke kota-kota besar. kota-kota besar;
  • masing-masing 7 juta lebih kota (St. Petersburg, Novosibirsk, Yekaterinburg, Nizhny Novgorod, Kazan, Chelyabinsk, Omsk), yang berada di bawah kurva Zipf yang ideal, memiliki cadangan pertumbuhan penduduk yang signifikan dan mengharapkan pertumbuhan penduduk;
  • ada risiko depopulasi kota pertama di peringkat (Moskow), karena kota kedua (St. Petersburg) dan kota-kota besar berikutnya jauh di belakang kurva Zipf yang ideal karena penurunan permintaan tenaga kerja dengan peningkatan simultan dalam biaya hidup, termasuk, pertama-tama, biaya pembelian dan sewa perumahan.

Kritik [ | ]

ahli bioinformatika Amerika mengusulkan penjelasan statistik hukum Zipf, membuktikan bahwa urutan karakter acak juga mematuhi hukum ini. Penulis menyimpulkan bahwa hukum Zipf, tampaknya, adalah fenomena statistik murni yang tidak ada hubungannya dengan semantik teks dan memiliki hubungan yang dangkal dengan linguistik.