Hukum Zipf: apa itu dan mengapa itu berhasil. Hukum Zipf dan sifat fraktal dari fenomena sosial dan ekonomi

kata-kata dari bahasa alami: jika semua kata dari suatu bahasa (atau hanya teks yang cukup panjang) diurutkan dalam urutan menurun dari frekuensi penggunaannya, maka frekuensi n-kata dalam daftar seperti itu kira-kira berbanding terbalik dengan nomor urutnya n(disebut pangkat kata ini, lihat skala keteraturan). Misalnya, kata kedua yang paling sering digunakan kira-kira dua kali lebih jarang daripada yang pertama, kata ketiga tiga kali lebih jarang daripada yang pertama, dan seterusnya.

Sejarah penciptaan[ | ]

Penulis penemuan pola tersebut adalah seorang stenografer Prancis (fr. Jean-Baptiste Estoup), yang menggambarkannya pada tahun 1908 dalam The Range of Shorthand. Hukum ini pertama kali diterapkan untuk menggambarkan distribusi ukuran kota oleh fisikawan Jerman Felix Auerbach dalam karyanya "The Law of Population Concentration" pada tahun 1913 dan dinamai ahli bahasa Amerika George Zipf, yang pada tahun 1949 secara aktif mempopulerkan pola ini, pertama kali mengusulkan menggunakannya untuk menggambarkan distribusi kekuatan ekonomi dan status sosial.

Penjelasan hukum Zipf berdasarkan sifat korelasi rantai Markov aditif (dengan fungsi memori langkah) diberikan pada tahun 2005.

Hukum Zipf secara matematis dijelaskan oleh distribusi Pareto. Ini adalah salah satu hukum dasar yang digunakan dalam infometrik.

Aplikasi hukum[ | ]

George Zipf pada tahun 1949 pertama kali menunjukkan distribusi pendapatan orang menurut ukurannya: orang terkaya memiliki uang dua kali lebih banyak daripada orang terkaya berikutnya, dan seterusnya. Pernyataan ini ternyata benar untuk sejumlah negara (Inggris, Prancis, Denmark, Belanda, Finlandia, Jerman, AS) pada periode 1926 hingga 1936.

Hukum ini juga berlaku dalam kaitannya dengan distribusi sistem kota: kota dengan populasi terbesar di negara mana pun adalah dua kali lebih besar dari kota terbesar berikutnya, dan seterusnya. Jika Anda mengatur semua kota di negara tertentu dalam daftar dalam urutan populasi yang menurun, maka setiap kota dapat diberi peringkat tertentu, yaitu jumlah yang diterimanya dalam daftar ini. Pada saat yang sama, ukuran dan peringkat populasi mengikuti pola sederhana yang dinyatakan dengan rumus:

P n = P 1 / n (\displaystyle P_(n)=P_(1)/n),

di mana P n (\gaya tampilan P_(n))- penduduk kota n peringkat -th; P 1 (\gaya tampilan P_(1))- populasi kota utama negara itu (peringkat 1).

Studi empiris mendukung pernyataan ini.

Pada tahun 1999, ekonom Xavier Gabet menggambarkan hukum Zipf sebagai contoh hukum kekuatan: jika kota tumbuh secara acak dengan standar deviasi yang sama, maka pada batas distribusi akan menyatu dengan hukum Zipf.

Menurut temuan para peneliti sehubungan dengan pemukiman perkotaan di Federasi Rusia, sesuai dengan hukum Zipf:

  • sebagian besar kota di Rusia terletak di atas kurva Zipf yang ideal, sehingga tren yang diharapkan adalah penurunan terus-menerus dalam jumlah dan populasi kota-kota menengah dan kecil karena migrasi ke kota-kota besar;
  • karenanya, lebih dari 7 juta kota (St. Petersburg, Novosibirsk, Yekaterinburg, Nizhny Novgorod, Kazan, Chelyabinsk, Omsk), yang berada di bawah kurva Zipf yang ideal, memiliki cadangan pertumbuhan penduduk yang signifikan dan mengharapkan pertumbuhan penduduk;
  • ada risiko depopulasi kota pertama di peringkat (Moskow), karena kota kedua (St. Petersburg) dan kota-kota besar berikutnya jauh di belakang kurva Zipf yang ideal karena penurunan permintaan tenaga kerja dengan peningkatan simultan dalam biaya hidup, termasuk, pertama-tama, biaya pembelian dan sewa perumahan.

Kritik [ | ]

ahli bioinformatika Amerika mengusulkan penjelasan statistik hukum Zipf, membuktikan bahwa urutan karakter acak juga mematuhi hukum ini. Penulis menyimpulkan bahwa hukum Zipf, tampaknya, adalah fenomena statistik murni yang tidak ada hubungannya dengan semantik teks dan memiliki hubungan yang dangkal dengan linguistik.

Selama proses pemilihan, pemilih mengekspresikan sikap mereka terhadap tokoh atau partai politik tertentu, memberikan suara mereka untuk kandidat atau partai ini atau itu. Timbul pertanyaan - apakah ada pola yang menggambarkan distribusi suara antara kandidat atau partai yang berbeda? Jika tidak ada keteraturan, maka dimungkinkan adanya korelasi antara jumlah suara yang diterima oleh calon atau partai, serta antara jumlah suara tersebut dan, misalnya, jumlah pemilih atau jumlah surat suara yang tidak sah. Jika ada pola-pola tertentu dalam distribusi suara, maka tidak semua varian distribusinya dimungkinkan. Berdasarkan materi banyak pemilu di berbagai negara, terungkap hubungan statistik yang ada antara jumlah suara yang diterima dalam pemilu oleh berbagai kandidat dan partai. Ditemukan bahwa hubungan ini dijelaskan oleh hubungan sederhana berikut:

Jika pada satu sumbu jumlah suara N(i) yang diterima oleh masing-masing calon diplot pada skala logaritma, dan pada sumbu lainnya, juga pada skala logaritma, tempat i ditempati oleh calon yang sama pada saat pemilihan, maka poin diperoleh dengan pendekatan yang cukup terletak di sepanjang garis lurus:

ln N(i) = A - B x lni (1)

Validitas persamaan di atas dikonfirmasi dalam serangkaian karya spesialis Rusia dalam ilmu politik matematika (Sobyanin, Sukhovolsky, 1995), yang menganalisis hasil pemilihan wakil rakyat Rusia pada tahun 1990, pemilihan Presiden Rusia pada tahun 1991 dan 1996, serta data pemilu di sejumlah negara, dimulai dengan pemilihan Presiden Prancis pada tahun 1848, di mana Louis-Napoleon Bonaparte menang.

Hasil matematika ini bersifat non-sepele. Spesialis - fisikawan, ahli kimia, ahli metalurgi, ahli demografi, ekologi dan perwakilan dari banyak bidang pengetahuan lain yang berurusan dengan sejumlah besar data statistik, sangat menyadari bahwa keteraturan numerik yang ditunjukkan bersifat umum dan menggambarkan situasi "persaingan bebas" untuk distribusi “barang” dalam jumlah terbatas atau bersyarat. Ternyata semua variasi objek, situasi, dan hubungan sebab akibat yang mungkin tidak mengubah sifat ketergantungan ini: segera setelah ada persaingan bebas, hasilnya dalam hal apa pun sesuai dengan "garis lurus logaritmik" - hanya konstanta A dan kemiringan garis lurus B berubah. Dan sebaliknya: segera setelah ada penyimpangan dari kondisi persaingan bebas, poin pasti menyimpang dari garis lurus - dan semakin jauh, semakin signifikan "faktor ketidakbebasan". Jadi, misalnya, "persaingan" kota-kota untuk jumlah orang yang tinggal di dalamnya menyebabkan ketergantungan semacam itu di negara-negara beradab. Sementara itu, di Uni Soviet, kota-kota seperti Moskow, Leningrad dan beberapa pusat lainnya menyimpang secara signifikan dari "persaingan bebas langsung" - karena pembatasan administratif yang terkait dengan rezim paspor. Demikian pula, persaingan bebas mengarah pada hubungan yang sama antara ukuran kekayaan terbesar dan "tempat" yang ditempati oleh pemiliknya dalam daftar kekayaan tersebut - tentu saja, di bagian dunia di mana daftar tersebut ada. Hukum distribusi pemangsa berdasarkan massa yang diketahui ahli zoologi adalah persis sama (tanpa adanya faktor antropogenik), dan seterusnya.

Untuk pertama kalinya, keteraturan semacam ini ditetapkan oleh sosiolog dan matematikawan Italia V. Pareto, yang terlibat dalam distribusi penduduk negara itu menurut kekayaan mereka; kemudian, ahli bahasa Amerika J.K. Zipf, mempelajari distribusi frekuensi penggunaan kata dalam teks. Berbagai varian rasio yang tertulis di atas disebut hukum Zipf-Pareto. Metode analisis yang berkaitan dengan studi distribusi pangkat banyak digunakan dalam linguistik, scientometrics, dan ekologi. Kepatuhan terhadap hubungan (1) untuk proses pemilu berarti bahwa ada "persaingan bebas" dari semua kandidat yang memiliki kesempatan untuk secara bebas menjelaskan pandangan politik dan platform politiknya kepada pemilih.

Pemenuhan undang-undang Zipf-Pareto untuk proses pemilu berarti bahwa setiap calon, masing-masing partai dan kelompok politik pemilih yang memilih menurut jenis tertentu, memiliki platform politiknya sendiri, yang tidak tumpang tindih dengan yang lain. Kandidat yang tersedia harus mencakup semua kemungkinan preferensi pemilih; maka proporsi pemilih yang mencari pilihannya di luar daftar calon yang diajukan cukup kecil, dan persamaan (1) menggambarkan distribusi suara dengan akurasi tinggi. Jika tidak, "relung" kosong mungkin muncul dalam distribusi (1), dan seluruh analisis menjadi lebih rumit.

Parameter A dan B yang termasuk dalam persamaan (1) dihitung berdasarkan data jumlah pemilih yang memilih calon yang berbeda atau kelompok politik yang berbeda dengan menggunakan metode analisis regresi. Parameter A pada persamaan (1) adalah logaritma dari jumlah pemilih yang memberikan suara untuk calon utama. Nilai B, koefisien preferensi, mencirikan kemiringan garis lurus (1) dan berfungsi sebagai ukuran numerik homogenitas pilihan pemilih. Jika B = 0, ini berarti pemilih tidak memiliki preferensi untuk satu partai atau kandidat di atas yang lain, dan bahwa mereka semua menerima jumlah suara yang sama dalam pemilihan. Sebaliknya, untuk nilai kecuraman B yang besar, pihak luar memperoleh suara yang sangat sedikit dibandingkan dengan partai pimpinan (namun dalam praktiknya parameter B hampir tidak pernah lebih besar dari satu). Jika penyimpangan dari garis lurus tipe (1) diperhatikan, maka berdasarkan asumsi yang dibuat di atas, ini menunjukkan tidak adanya kondisi persaingan politik yang bebas. Hal ini dapat disebabkan oleh adanya beberapa faktor eksternal tambahan, misalnya intimidasi pemilih dengan kemungkinan represi politik dan ekonomi dalam hal memilih (atau tidak memilih) untuk calon tertentu, atau oleh pemalsuan langsung hasil pemilihan selama penghitungan suara di komisi pemilihan dari berbagai tingkatan. Gambar 2 menunjukkan grafik tipikal distribusi peringkat jumlah pemilih dalam pemilu di Rusia. Seperti dapat dilihat, antara ukuran kelompok pemilih yang berbeda dan peringkat kelompok ini (yaitu, tempat calon) dalam koordinat logaritmik (sepanjang kedua sumbu), praktis ada hubungan linier.

Jenis distribusi suara untuk kandidat atau partai yang berbeda membantu mengidentifikasi kecurangan pemilu. Dalam kasus pemalsuan yang paling sederhana, jika sejumlah surat suara yang diisi untuk mendukung beberapa kandidat atau partai dimasukkan ke dalam kotak suara, ternyata distribusi peringkat jumlah suara yang dikeluarkan untuk calon perseorangan tidak digambarkan secara lurus. Tetapi jika kita mengecualikan data tentang kandidat yang mendukung pemalsuan, maka untuk kandidat (atau partai) yang tersisa, distribusi peringkat akan sesuai dengan yang teoretis. Dalam hal dipertimbangkan, jumlah surat suara yang ditanam dapat diperkirakan dari selisih antara jumlah suara yang diterima oleh calon menurut data resmi dan jumlah yang ditemukan dari persamaan distribusi kepangkatan setelah mengecualikan data yang berkaitan dengan calon tersebut. Gambar 3 menunjukkan distribusi suara yang diberikan - menurut komisi pemilihan - untuk calon kepala administrasi wilayah Lipetsk dalam pemilihan yang diadakan pada musim semi 1993. Distribusi ini jelas jauh dari garis lurus. Dalam kasus ini, persidangan yang berlangsung pada 1995 itu menegaskan adanya pemalsuan yang menguntungkan calon juara pertama.

Mengapa Hukum Zipf tidak berfungsi di Rusia? 11 Maret 2017

Hukum Zipf pertama kali diterapkan untuk menggambarkan distribusi ukuran kota oleh fisikawan Jerman Felix Auerbach dalam karyanya The Law of Population Concentration pada tahun 1913. Ini menyandang nama ahli bahasa Amerika George Zipf, yang pada tahun 1949 secara aktif mempopulerkan pola ini, pertama kali mengusulkan untuk menggunakannya untuk menggambarkan distribusi kekuatan ekonomi dan status sosial.

Di Rusia, undang-undang ini tidak berfungsi.


Mari kita kembali ke tahun 1949. Ahli bahasa George Zipf (Zipf) memperhatikan tren aneh dalam penggunaan kata-kata tertentu oleh orang-orang dalam bahasa tersebut. Dia menemukan bahwa sejumlah kecil kata digunakan terus-menerus, dan sebagian besar sangat jarang digunakan. Jika kita mengevaluasi kata berdasarkan popularitas, hal yang mencolok terungkap: kata peringkat pertama selalu digunakan dua kali lebih sering daripada kata peringkat kedua dan tiga kali lebih sering daripada kata peringkat ketiga.

Zipf menemukan bahwa aturan yang sama berlaku untuk distribusi pendapatan masyarakat di suatu negara: orang terkaya memiliki uang dua kali lebih banyak daripada orang terkaya berikutnya, dan seterusnya.

Belakangan menjadi jelas bahwa undang-undang ini juga berlaku dalam kaitannya dengan ukuran kota. Kota dengan populasi terbesar di negara mana pun adalah dua kali ukuran kota terbesar berikutnya, dan seterusnya. Luar biasa, hukum Zipf telah beroperasi di semua negara di dunia selama satu abad terakhir.

Lihat saja daftar kota terbesar di Amerika Serikat. Jadi, menurut sensus 2010, penduduk kota terbesar AS, New York, adalah 8.175.133 orang. Nomor dua adalah Los Angeles dengan populasi 3.792.621. Tiga kota berikutnya, Chicago, Houston dan Philadelphia memiliki populasi masing-masing 2.695.598, 2.100.263 dan 1.526.006. Jelas, angka-angka ini tidak akurat, tetapi mereka secara mengejutkan konsisten dengan hukum Zipf.

Paul Krugman, yang menulis tentang penerapan hukum Zipf untuk kota, dengan terkenal mencatat bahwa teori ekonomi sering dituduh menciptakan model yang sangat disederhanakan dari realitas yang kompleks dan kacau. Hukum Zipf menunjukkan bahwa kebalikannya yang benar: kita menggunakan model yang terlalu rumit dan berantakan, dan kenyataannya sangat rapi dan sederhana.

hukum kekuatan

Pada tahun 1999, ekonom Xavier Gabet menulis sebuah makalah ilmiah di mana ia menggambarkan hukum Zipf sebagai "hukum kekuatan."

Gabet mencatat bahwa undang-undang ini tetap ada bahkan jika kota tumbuh dengan cara yang kacau. Tetapi struktur yang rata ini rusak segera setelah Anda pindah ke kota-kota non-metropolitan. Kota-kota kecil dengan populasi sekitar seratus ribu tampaknya mengikuti hukum yang berbeda dan menunjukkan distribusi ukuran yang lebih dapat dimengerti.

Orang mungkin bertanya-tanya apa yang dimaksud dengan istilah "kota"? Lagi pula, misalnya, Boston dan Cambridge dianggap sebagai dua kota yang berbeda, seperti San Francisco dan Auckland, dipisahkan oleh air. Dua ahli geografi Swedia juga memiliki pertanyaan ini, dan mereka mulai mempertimbangkan apa yang disebut kota "alami", disatukan oleh populasi dan koneksi jalan, dan bukan oleh motif politik. Dan mereka menemukan bahwa bahkan kota-kota "alami" seperti itu mematuhi hukum Zipf.


Mengapa hukum Zipf bekerja di kota?

Jadi apa yang membuat kota begitu mudah diprediksi dalam hal populasi? Tidak ada yang benar-benar bisa menjelaskannya. Kita tahu bahwa kota-kota berkembang karena imigrasi, imigran berduyun-duyun ke kota-kota besar karena ada lebih banyak peluang. Tetapi imigrasi tidak cukup untuk menjelaskan undang-undang ini.

Ada juga motif ekonomi, karena kota-kota besar menghasilkan banyak uang, dan hukum Zipf juga berfungsi untuk distribusi pendapatan. Namun, ini masih belum memberikan jawaban yang jelas untuk pertanyaan itu.

Tahun lalu, sekelompok peneliti menemukan bahwa ada pengecualian untuk hukum Zipf: hukum hanya berfungsi jika kota-kota tersebut terhubung secara ekonomi. Ini menjelaskan mengapa undang-undang tersebut valid, misalnya, untuk satu negara Eropa, tetapi tidak untuk seluruh UE.

Bagaimana kota tumbuh?

Ada aturan aneh lain yang berlaku untuk kota yang berkaitan dengan bagaimana kota mengkonsumsi sumber daya ketika mereka tumbuh. Sebagai kota tumbuh, mereka menjadi lebih stabil. Misalnya, jika sebuah kota berukuran dua kali lipat, jumlah pompa bensin yang dibutuhkannya tidak berlipat ganda.

Kota ini akan hidup cukup nyaman jika jumlah SPBU meningkat sekitar 77%. Sementara hukum Zipf mengikuti hukum sosial tertentu, hukum ini lebih dekat dengan hukum alam, seperti bagaimana hewan mengkonsumsi energi seiring bertambahnya usia.

Ahli matematika Stephen Strogatz menggambarkannya seperti ini:

Berapa banyak kalori per hari yang dibutuhkan tikus dibandingkan dengan gajah? Keduanya adalah mamalia, sehingga dapat diasumsikan bahwa pada tingkat sel mereka seharusnya tidak jauh berbeda. Memang, jika sel dari sepuluh mamalia berbeda ditumbuhkan di laboratorium, semua sel ini akan memiliki tingkat metabolisme yang sama, mereka tidak ingat pada tingkat genetik seberapa besar inang mereka sebenarnya.

Tetapi jika kita menganggap gajah atau tikus sebagai hewan yang lengkap, sekelompok miliaran sel yang berfungsi, maka sel-sel gajah akan menghabiskan lebih sedikit energi untuk tindakan yang sama daripada sel-sel tikus. Hukum metabolisme, yang disebut Hukum Kleiber, menyatakan bahwa kebutuhan metabolisme mamalia meningkat sebanding dengan berat tubuhnya dengan faktor 0,74.

0,74 ini sangat dekat dengan 0,77 yang terlihat dengan undang-undang yang mengatur jumlah pompa bensin di kota. Kebetulan? Mungkin, tapi kemungkinan besar tidak.

Di Rusia, populasi kota terbesar, Moskow, secara resmi sekitar 11,5 juta orang. Populasi kota kedua, Sankt Peterburg, adalah 5,2 juta.Seperti yang kita lihat, rasio populasi kedua kota kira-kira sesuai dengan "hukum Zipf". Menurutnya, kota terbesar ketiga di Rusia seharusnya memiliki sekitar 4 juta orang, dan yang keempat - sekitar 3 juta Namun, tidak ada kota seperti itu di Rusia. Pada kenyataannya, kota ketiga di Rusia, Novosibirsk, memiliki populasi 1,6 juta orang (2,5 kali lebih sedikit dari norma), dan yang keempat, Yekaterinburg, 1,4 juta, yang juga 2 kali lebih rendah dari norma "Zipf".

Mengapa "hukum Zipf" tidak berfungsi di Rusia? Sosiolog Amerika Richard Florida menjawab pertanyaan ini dalam bukunya The Creative Class. Dia menulis bahwa "hukum Zipf" tidak berlaku di imperium (atau negara yang memiliki imperium kambuh) dan ekonomi terencana. Dia menyebutkan tiga pengecualian negara tersebut: Inggris (di mana setelah London bahkan tidak ada kota kedua, 2 kali lebih kecil dalam populasi), Rusia dan Cina.

Sebuah studi tentang "hukum Zipf" juga dilakukan oleh Universitas Keuangan di bawah Pemerintah Rusia. Kesimpulannya adalah ini:

“Distribusi riil kota-kota Rusia berdasarkan populasi tidak sepenuhnya sesuai dengan kurva Zipf baik untuk negara maju maupun negara berkembang. Bagian dari kurva Zipf nyata untuk Rusia terletak di atas yang ideal, yang sesuai dengan distribusi kota di negara maju, dan bagian di bawahnya sesuai dengan distribusi kota di negara berkembang. Jadi, menurut aturan Zipf, ternyata di Rusia kota-kota terbesar dan lebih dari jutaan kota memainkan peran dominan. Penyimpangan kurva riil dari ideal disebabkan oleh luasnya wilayah negara dan berbagai faktor sosial ekonomi dan iklim alam.

Dua kota besar dan kota kecil dan menengah (hingga 250.000 orang) sangat cocok dengan jenis urbanisasi barat. Tetapi kota-kota besar dan lebih dari jutaan kota tidak demikian.

Temuan dari studi lain:

“Tren yang terungkap tidak sesuai dengan asumsi yang diungkapkan dalam literatur bahwa alasan penyimpangan Rusia dari pola Zipf adalah perencanaan pembangunan spasial yang terpusat, yang mencakup dukungan untuk kota-kota menengah dan kecil selama periode Soviet. Transisi ke pasar seharusnya menghilangkan distorsi ini dan membawa hubungan ukuran peringkat lebih dekat ke bentuk kanonik, namun, terlepas dari keterlibatan mekanisme pasar dalam pembentukan ruang untuk kegiatan ekonomi, penyimpangan lebih lanjut dari itu diamati di negara.


(Lingkaran menunjukkan populasi wilayah Rusia)

Itu. penyimpangan dari "hukum Zipf" di Rusia bukanlah hasil dari ekonomi terencana (seperti di Cina), tetapi konsekuensi dari imperialisme negara (ketika satu atau dua kota memainkan peran metropolis).

Berdasarkan tren tersebut, kemungkinan perkembangan/regresi perkotaan di Rusia adalah sebagai berikut:

Sebagian besar kota-kota Rusia terletak di atas kurva Zipf yang ideal, sehingga tren yang diharapkan adalah penurunan terus-menerus dalam jumlah dan populasi kota-kota menengah dan kecil karena migrasi ke kota-kota besar.

— 7 juta lebih kota (St. Petersburg, Novosibirsk, Yekaterinburg, Nizhny Novgorod, Kazan, Chelyabinsk, Omsk), yang berada di bawah kurva Zipf yang ideal, memiliki cadangan pertumbuhan penduduk yang signifikan dan mengharapkan pertumbuhan penduduk.

— Ada risiko depopulasi kota pertama di peringkat (Moskow), karena kota kedua (St. Petersburg) dan kota-kota besar berikutnya jauh di belakang kurva Zipf yang ideal karena penurunan permintaan tenaga kerja dengan peningkatan simultan dalam biaya hidup, termasuk, pertama-tama, biaya membeli dan menyewa rumah.

(Di Uni Soviet, "hukum Zipf" juga tidak berfungsi - Anda dapat melihat penyimpangan kota dari kurva Zipf, di mana mereka seharusnya berada)

Richard Florida dalam The Creative Class mencatat perbedaan lain antara kota-kota Amerika dan Rusia. Di Amerika Serikat, konsentrasi kelas kreatif berada di kota-kota menengah yang tersebar di seluruh negeri. Dengan demikian, proporsi tertinggi kelas kreatif di kota-kota seperti San Jose, Boulder (Colorado), Huntsville (Alabama), Corvallis (Oregon), dll. - di dalamnya bagian ini adalah 40-48%. Tetapi kota terbesar di Amerika Serikat, New York, termasuk di antara petani menengah dalam hal pangsa kelas kreatif - 35% dari total jumlah karyawan dan peringkat ke-34, kota kedua di negara itu, Los Angeles , umumnya ke-60. Tren serupa diamati di negara-negara lain di mana "hukum Zipf" bekerja (Jerman, Prancis, Italia, Swedia, dll.).

Di Rusia, hampir seluruh kelas kreatif negara itu terkonsentrasi di Moskow, sementara kota-kota lainnya tetap menjadi zona waktu industri pertengahan abad ke-20.

Semua ini sangat menarik, tetapi mungkin kurang misterius daripada hukum Zipf. Tidak begitu sulit untuk memahami mengapa sebuah kota, yang sebenarnya merupakan ekosistem, meskipun dibangun oleh manusia, harus mematuhi hukum alam. Tapi hukum Zipf tidak memiliki analog di alam. Ini adalah fenomena sosial dan baru terjadi selama seratus tahun terakhir.

Yang kita tahu adalah bahwa hukum Zipf berlaku untuk sistem sosial lainnya, termasuk sistem ekonomi dan bahasa. Jadi, mungkin ada beberapa aturan sosial umum yang menciptakan hukum aneh ini, dan suatu saat kita akan dapat memahaminya. Siapa pun yang memecahkan teka-teki ini dapat menemukan kunci untuk memprediksi hal-hal yang jauh lebih penting daripada pertumbuhan kota. Hukum Zipf mungkin hanya aspek kecil dari aturan global dinamika sosial yang mengatur cara kita berkomunikasi, berdagang, membentuk komunitas, dan banyak lagi.

P.S. Secara pribadi, menurut saya undang-undang dengan asumsi perkiraan untuk angka dan banyak pengecualian seperti itu umumnya sulit untuk disebut undang-undang. Hanya kebetulan yang tidak disengaja.

Bagaimana menurutmu?

sumber

Halo! Belakangan ini, semakin sering saya mendengar dari rekan-rekan tentang persyaratan dalam TOR untuk mengevaluasi kualitas teks menurut hukum Zipf. Dan tidak semua orang mengerti cara mengedit teks untuk undang-undang ini. Dalam artikel hari ini saya akan mencoba memberi tahu Anda cara meningkatkan parameter dengan cara paling sederhana, dan juga menjelaskan mengapa penulis yang baik tidak benar-benar membutuhkannya.

Anda dapat menentukan kualitas teks menurut hukum Zipf menggunakan beberapa layanan. Tapi, menurut saya PR-CY adalah yang paling memadai, menggabungkan formula yang tepat dengan antarmuka yang sederhana dan mudah dipahami. Itulah yang saya gunakan dalam penyusunan materi ini.

Apa itu hukum Zipf?

Untuk memulainya, ada baiknya memahami apa itu. Menurut Wikipedia, Jean-Baptiste Estoux merumuskan pola ini pada tahun 1908, undang-undang ini awalnya mengacu pada steno. Penerapan pertama dari keteraturan yang diketahui masyarakat umum berkaitan dengan demografi, dan lebih tepatnya pada persebaran penduduk di kota-kota, digunakan oleh Felix Auerbach.

Pola ini menerima nama modernnya pada tahun 1949 berkat ahli bahasa George Zipf. Dia menunjukkan dengan bantuannya gradasi distribusi kekayaan di antara penduduk. Dan baru kemudian hukum mulai diterapkan untuk menentukan keterbacaan teks.

Bagaimana cara menghitungnya?

Untuk menggunakan hukum ini dengan benar, Anda perlu memahami cara kerjanya. Mari kita menganalisis rumus untuk perhitungannya.

  • F adalah frekuensi penggunaan kata;
  • R adalah nomor seri;
  • C adalah nilai konstan (angka yang menunjukkan kata terbesar dalam hal jumlah pengulangan).

Dalam praktiknya, formula lain ternyata lebih nyaman, terlihat lebih jelas.

Pendekatan ini lebih nyaman, karena kami memiliki data tentang jumlah pengulangan kata yang paling umum. Dari kuantitas inilah mereka ditolak.

Untuk menyederhanakan, dalam teks kita, kata kedua yang paling sering muncul harus dua kali lebih jarang dari yang pertama. Datang di tempat ketiga, tiga kali dan seterusnya.

Contoh pas teks

Teori telah ditangani dengan sedikit. Masih berurusan dengan latihan. Sebagai teks percobaan, saya mengambil artikel dari T-Zh. Kenapa dari sana? Semuanya sederhana. Saat ini, ini adalah salah satu contoh terbaik dari gaya info yang disukai banyak orang. Nah, menarik apa yang akan ditunjukkan oleh teks yang ditulis di bawah arahan Maxim Ilyakhov. Saya akan segera mengatakan bahwa teks untuk indikator ini berada pada level, meskipun, setelah menyekop lebih dari 40 situs, saya tidak menemukan satu artikel pun dengan kealamian yang buruk sama sekali. Juga, saya akan segera melompat ke depan dan mengatakan bahwa teks eksperimental setelah pemasangan menjadi jauh lebih buruk, meskipun skor Zipf meningkat, Anda tidak perlu terlalu repot dengan peningkatan kealamian yang berlebihan.

Inilah yang ditunjukkan oleh penganalisis kepada kami setelah memeriksa.

Mari kita lihat apa saja yang ada di dalamnya. Seperti yang Anda lihat, ada kolom dengan kata-kata, serta angka yang tidak bisa dipahami. Kolom "kejadian" (1) menunjukkan berapa kali bentuk kata muncul dalam teks. Di kolom Zipf (2) adalah jumlah entri yang disarankan. Penanda 3 dan 4 menandai indikator ideal untuk posisi kedua dan ketiga. Anda juga harus memperhatikan rekomendasi, ini menunjukkan berapa banyak kata yang perlu Anda hapus untuk mencapai kombinasi yang sempurna.

Untuk pemahaman yang lebih baik, mari kita analisis apa yang dihitung oleh penganalisis. Kami mengambil angka 39 (C) sebagai dasar, kami juga membutuhkan nomor seri, perhatikan posisi 2 (F). Kami mengambil rumusnya.

Pengganti.

F=39/2=19.5

Kami mengumpulkan dan mendapatkan 20, ini akan menjadi jumlah kemunculan yang diperlukan. Ini dikonfirmasi oleh penganalisa. Di negara kita, kata paling populer kedua digunakan 28 kali, masing-masing, 8 pengulangan perlu dihapus atau diganti.

Setelah berurusan dengan prinsip hukum, kami mulai mengedit. Untuk melakukan ini, kami menghapus atau mengganti dengan kata-kata sinonim yang memiliki kemunculan lebih dari yang dibutuhkan oleh Zipf. Hasilnya, kami mendapatkan gambar ini.

Seperti yang Anda lihat, saya berhasil meningkatkan tarif dari 83% menjadi 88%. Namun, kualitas teks mengalami penurunan yang signifikan. Anda tidak harus berusaha untuk meningkatkan angka ini menjadi 100%. Sebenarnya, jika Anda sudah memiliki 75%, ini sangat bagus dan Anda tidak boleh menyimpang lebih jauh.

Saran yang bermanfaat

Perhatikan tidak hanya pada baris pertama. Mulai pas dari posisi terakhir dalam daftar, mereka sering memiliki dampak yang lebih besar pada skor keseluruhan daripada sepuluh kata pertama.

Zipf dan SEO

Sekarang mari kita beralih ke mengapa seorang copywriter perlu mengetahui pola ini. Saat memesan teks, SEO berusaha menjadikannya yang paling nyaman untuk mesin telusur. Diyakini (meskipun tidak jelas oleh siapa) bahwa hukum Zipf digunakan secara aktif oleh algoritma pencarian. Sulit untuk membuktikan atau menyangkal pernyataan ini. Saya tidak dapat menemukan penelitian dan eksperimen yang waras tentang topik ini.

Memutuskan untuk memeriksanya sendiri. Untuk melakukan ini, saya mengambil masalah untuk pertanyaan kompetitif seperti "jendela plastik", Yandex mengambil masalah Moskow, saya harus menyulap di Google, dan dia juga sepertinya mengidentifikasi saya sebagai penduduk ibukota (setidaknya dia menunjukkan kepada saya iklan dengan geolokasi Moskow). Saya mengambil halaman pertama dari masalah ini, ditambah tempat ke-49. Ini adalah bagaimana tanda itu ternyata.

Jika Anda melihat lebih dekat, Anda dapat melihat bahwa di Yandex outputnya lebih merata, jika Anda melihat pola yang kita pelajari. Namun, pada saat yang sama, angka yang lebih tinggi tidak menjamin kemenangan dalam perebutan tempat pertama di puncak.

Berdasarkan hal ini, dapat dikatakan bahwa jika mesin pencari menerapkan undang-undang ini, itu hanya salah satu faktornya. Dan bukan yang utama.

temuan

Itu dia. Sekarang Anda tahu seperti apa kualitas teks menurut hukum Zipf, dan Anda juga dapat menyesuaikan indikator ini. Faktanya, tidak ada yang rumit di sini, semuanya cukup sederhana. Cukup memahami prinsip pengoperasian keteraturan ini sekali.

Selama satu abad terakhir, fenomena matematika misterius yang disebut hukum Zipf telah mampu memprediksi dengan sangat akurat bagaimana ukuran kota-kota raksasa di seluruh dunia akan berubah. Masalahnya adalah tidak ada yang mengerti bagaimana dan mengapa hukum ini bekerja ...

Mari kita kembali ke tahun 1949. Ahli bahasa George Zipf (Zipf) memperhatikan tren aneh dalam penggunaan kata-kata tertentu oleh orang-orang dalam bahasa tersebut. Dia menemukan bahwa sejumlah kecil kata digunakan terus-menerus, dan sebagian besar - sangat jarang. Jika kita mengevaluasi kata berdasarkan popularitas, hal yang mencolok terungkap: kata peringkat pertama selalu digunakan dua kali lebih sering daripada kata peringkat kedua dan tiga kali lebih sering daripada kata peringkat ketiga.
Zipf menemukan bahwa aturan yang sama berlaku untuk distribusi pendapatan masyarakat di suatu negara: orang terkaya memiliki uang dua kali lebih banyak daripada orang terkaya berikutnya, dan seterusnya.
Belakangan menjadi jelas bahwa undang-undang ini juga berlaku dalam kaitannya dengan ukuran kota. Kota dengan populasi terbesar di negara mana pun adalah dua kali ukuran kota terbesar berikutnya, dan seterusnya. Luar biasa, hukum Zipf telah beroperasi di semua negara di dunia selama satu abad terakhir.

Lihat saja jumlah kota terbesar di Rusia. Populasi Moskow kira-kira 2 kali lebih besar dari St. Petersburg.
Paul Krugman, yang menulis tentang penerapan hukum Zipf untuk kota, dengan terkenal mencatat bahwa teori ekonomi sering dituduh menciptakan model yang sangat disederhanakan dari realitas yang kompleks dan kacau. Hukum Zipf menunjukkan bahwa kebalikannya yang benar: kita menggunakan model yang terlalu rumit dan berantakan, dan kenyataannya sangat rapi dan sederhana.

hukum kekuatan

Pada tahun 1999, ekonom Xavier Gabet menulis sebuah makalah ilmiah di mana ia menggambarkan hukum Zipf sebagai "hukum kekuatan."
Gabet mencatat bahwa undang-undang ini tetap ada bahkan jika kota tumbuh dengan cara yang kacau. Tetapi struktur yang rata ini rusak segera setelah Anda pindah ke kota-kota non-metropolitan. Kota-kota kecil dengan populasi sekitar seratus ribu tampaknya mengikuti hukum yang berbeda dan menunjukkan distribusi ukuran yang lebih dapat dimengerti.

Orang mungkin bertanya-tanya apa yang dimaksud dengan istilah "kota"? Lagi pula, misalnya, Boston dan Cambridge dianggap sebagai dua kota yang berbeda, seperti San Francisco dan Auckland, dipisahkan oleh air. Dua ahli geografi Swedia juga memiliki pertanyaan ini, dan mereka mulai mempertimbangkan apa yang disebut kota "alami", disatukan oleh populasi dan koneksi jalan, dan bukan oleh motif politik. Dan mereka menemukan bahwa bahkan kota-kota "alami" seperti itu mematuhi hukum Zipf.

Mengapa hukum Zipf bekerja di kota?

Jadi apa yang membuat kota begitu mudah diprediksi dalam hal populasi? Tidak ada yang benar-benar bisa menjelaskannya. Kita tahu bahwa kota-kota berkembang karena imigrasi, imigran berduyun-duyun ke kota-kota besar karena ada lebih banyak peluang. Tetapi imigrasi tidak cukup untuk menjelaskan undang-undang ini.
Ada juga motif ekonomi, karena kota-kota besar menghasilkan banyak uang, dan hukum Zipf juga berfungsi untuk distribusi pendapatan. Namun, ini masih belum memberikan jawaban yang jelas untuk pertanyaan itu.
Tahun lalu, sekelompok peneliti menemukan bahwa ada pengecualian untuk hukum Zipf: hukum hanya berfungsi jika kota-kota tersebut terhubung secara ekonomi. Ini menjelaskan mengapa undang-undang tersebut valid, misalnya, untuk satu negara Eropa, tetapi tidak untuk seluruh UE.

Bagaimana kota tumbuh?

Ada aturan aneh lain yang berlaku untuk kota yang berkaitan dengan bagaimana kota mengkonsumsi sumber daya ketika mereka tumbuh. Sebagai kota tumbuh, mereka menjadi lebih stabil. Misalnya, jika sebuah kota berukuran dua kali lipat, jumlah pompa bensin yang dibutuhkannya tidak berlipat ganda.
Kota ini akan hidup cukup nyaman jika jumlah SPBU meningkat sekitar 77%. Sementara hukum Zipf mengikuti hukum sosial tertentu, hukum ini lebih dekat dengan hukum alam, seperti bagaimana hewan mengkonsumsi energi seiring bertambahnya usia.

Ahli matematika Stephen Strogatz menggambarkannya seperti ini:
Berapa banyak kalori per hari yang dibutuhkan tikus dibandingkan dengan gajah? Keduanya adalah mamalia, sehingga dapat diasumsikan bahwa pada tingkat sel mereka seharusnya tidak jauh berbeda. Memang, jika sel dari sepuluh mamalia berbeda ditumbuhkan di laboratorium, semua sel ini akan memiliki tingkat metabolisme yang sama, mereka tidak ingat pada tingkat genetik seberapa besar inang mereka sebenarnya.
Tetapi jika kita menganggap gajah atau tikus sebagai hewan yang lengkap, sekelompok miliaran sel yang berfungsi, maka sel-sel gajah akan menghabiskan lebih sedikit energi untuk tindakan yang sama daripada sel-sel tikus. Hukum metabolisme, yang disebut Hukum Kleiber, menyatakan bahwa kebutuhan metabolisme mamalia meningkat sebanding dengan berat tubuhnya dengan faktor 0,74. 0,74 ini sangat dekat dengan 0,77 yang terlihat dengan undang-undang yang mengatur jumlah pompa bensin di kota.
Kebetulan? Mungkin, tapi kemungkinan besar tidak.
Semua ini sangat menarik, tetapi mungkin kurang misterius daripada hukum Zipf. Tidak begitu sulit untuk memahami mengapa sebuah kota, yang sebenarnya merupakan ekosistem, meskipun dibangun oleh manusia, harus mematuhi hukum alam. Tapi hukum Zipf tidak memiliki analog di alam. Ini adalah fenomena sosial dan baru terjadi selama seratus tahun terakhir.
Yang kita tahu adalah bahwa hukum Zipf berlaku untuk sistem sosial lainnya, termasuk sistem ekonomi dan bahasa. Jadi, mungkin ada beberapa aturan sosial umum yang menciptakan hukum aneh ini, dan suatu saat kita akan dapat memahaminya. Siapa pun yang memecahkan teka-teki ini dapat menemukan kunci untuk memprediksi hal-hal yang jauh lebih penting daripada pertumbuhan kota. Hukum Zipf mungkin hanya aspek kecil dari aturan global dinamika sosial yang mengatur cara kita berkomunikasi, berdagang, membentuk komunitas, dan banyak lagi.