Batas ng Zipf: ano ito at bakit ito gumagana. Ang batas ng Zipf at ang fractal na katangian ng panlipunan at pang-ekonomiyang phenomena

mga salita ng isang natural na wika: kung ang lahat ng mga salita ng isang wika (o isang sapat na mahabang teksto) ay inayos sa pababang pagkakasunud-sunod ng kanilang dalas ng paggamit, kung gayon ang dalas n-ika salita sa naturang listahan ay humigit-kumulang inversely proportional sa ordinal na numero nito n(ang tinatawag na ranggo ng salitang ito, tingnan ang sukat ng pagkakasunud-sunod). Halimbawa, ang pangalawang pinaka ginagamit na salita ay halos dalawang beses na mas karaniwan kaysa sa una, ang pangatlo ay tatlong beses na mas karaniwan kaysa sa una, at iba pa.

Kasaysayan ng paglikha[ | ]

Ang may-akda ng pagtuklas ng pattern ay isang French stenographer (fr. Jean-Baptiste Estoup), na inilarawan ito noong 1908 sa The Range of Shorthand. Ang batas ay unang inilapat upang ilarawan ang pamamahagi ng mga sukat ng lungsod ng German physicist na si Felix Auerbach sa kanyang akdang "The Law of Population Concentration" noong 1913 at dinala ang pangalan ng American linguist na si George Zipf, na noong 1949 ay aktibong nagpasikat ng pattern na ito, una. nagmumungkahi na gamitin ito upang ilarawan ang pamamahagi ng mga puwersang pang-ekonomiya at katayuan sa lipunan.

Ang isang paliwanag ng batas ng Zipf batay sa mga katangian ng ugnayan ng mga additive Markov chain (na may step memory function) ay ibinigay noong 2005.

Ang batas ng Zipf ay inilarawan sa matematika ng pamamahagi ng Pareto. Isa ito sa mga pangunahing batas na ginagamit sa infometrics.

Mga aplikasyon ng batas[ | ]

Unang ipinakita ni George Zipf noong 1949 ang pamamahagi ng mga kita ng mga tao ayon sa kanilang laki: ang pinakamayamang tao ay may dalawang beses na mas maraming pera kaysa sa susunod na pinakamayaman, at iba pa. Ang pahayag na ito ay naging totoo para sa ilang bansa (England, France, Denmark, Holland, Finland, Germany, USA) sa panahon mula 1926 hanggang 1936.

Gumagana rin ang batas na ito kaugnay ng pamamahagi ng sistema ng lungsod: ang lungsod na may pinakamalaking populasyon sa alinmang bansa ay doble ang laki ng susunod na pinakamalaking lungsod, at iba pa. Kung ayusin mo ang lahat ng mga lungsod ng isang partikular na bansa sa listahan sa pababang pagkakasunud-sunod ng populasyon, kung gayon ang bawat lungsod ay maaaring italaga ng isang tiyak na ranggo, iyon ay, ang numero na natatanggap nito sa listahang ito. Kasabay nito, ang laki at ranggo ng populasyon ay sumusunod sa isang simpleng pattern na ipinahayag ng formula:

P n = P 1 / n (\displaystyle P_(n)=P_(1)/n),

saan P n (\displaystyle P_(n))- populasyon ng lungsod n-ika ranggo; P 1 (\displaystyle P_(1))- populasyon ng pangunahing lungsod ng bansa (1st rank).

Sinusuportahan ng mga empirical na pag-aaral ang assertion na ito.

Noong 1999, inilarawan ng ekonomista na si Xavier Gabet ang batas ng Zipf bilang isang halimbawa ng batas ng kapangyarihan: kung random na lumalaki ang mga lungsod na may parehong standard deviation, kung gayon sa limitasyon ang pamamahagi ay magsasama sa batas ng Zipf.

Ayon sa mga natuklasan ng mga mananaliksik na may kaugnayan sa urban settlement sa Russian Federation, alinsunod sa batas ng Zipf:

  • karamihan sa mga lungsod sa Russia ay nasa itaas ng perpektong Zipf curve, kaya ang inaasahang trend ay isang patuloy na pagbaba sa bilang at populasyon ng katamtaman at maliliit na lungsod dahil sa paglipat sa malalaking lungsod;
  • nang naaayon, 7 milyon-plus na mga lungsod (St. Petersburg, Novosibirsk, Yekaterinburg, Nizhny Novgorod, Kazan, Chelyabinsk, Omsk), na mas mababa sa perpektong Zipf curve, ay may malaking reserbang paglaki ng populasyon at inaasahan ang paglaki ng populasyon;
  • may mga panganib ng depopulasyon ng unang lungsod sa ranggo (Moscow), dahil ang pangalawang lungsod (St. Petersburg) at kasunod na malalaking lungsod ay malayo sa likod ng perpektong Zipf curve dahil sa pagbaba ng demand para sa paggawa na may sabay-sabay na pagtaas sa gastos sa pamumuhay, kasama, una sa lahat, ang halaga ng pagbili at pagpapaupa ng pabahay.

Pagpuna [ | ]

Amerikanong bioinformatician nagmungkahi ng istatistikal na paliwanag ng batas ni Zipf, na nagpapatunay na ang isang random na pagkakasunud-sunod ng mga character ay sumusunod din sa batas na ito. Napagpasyahan ng may-akda na ang batas ni Zipf, tila, ay isang purong istatistikal na kababalaghan na walang kinalaman sa semantika ng teksto at may mababaw na kaugnayan sa linggwistika.

Sa panahon ng proseso ng halalan, ang mga botante ay nagpapahayag ng kanilang saloobin sa ilang mga pulitikal na pigura o partido, na bumoto para dito o sa kandidato o partidong iyon. Ang tanong ay lumitaw - mayroon bang anumang mga pattern na naglalarawan sa pamamahagi ng mga boto sa pagitan ng iba't ibang mga kandidato o partido? Kung walang mga regularidad, kung gayon ang anumang ugnayan sa pagitan ng mga bilang ng mga boto na natanggap ng mga kandidato o partido, gayundin sa pagitan ng mga bilang ng mga boto na ito at, halimbawa, ang turnout ng mga botante o ang bilang ng mga di-wastong balota, ay posible. Kung mayroong ilang mga pattern sa pamamahagi ng mga boto, hindi lahat ng mga variant ng kanilang pamamahagi ay posible. Batay sa materyal ng maraming halalan sa iba't ibang bansa, isang istatistikal na relasyon ang nahayag na umiiral sa pagitan ng mga bilang ng mga boto na natanggap sa mga halalan ng iba't ibang kandidato at partido. Napag-alaman na ang relasyong ito ay inilalarawan ng sumusunod na simpleng relasyon:

Kung sa isang axis ay i-plot namin ang bilang ng mga boto N(i) na natanggap ng bawat kandidato sa isang logarithmic scale, at sa kabilang axis, din sa isang logarithmic scale, ang lugar na inokupahan ko ng parehong kandidato sa panahon ng halalan, pagkatapos ay ang mga puntos nakuha na may sapat na approximation ay matatagpuan sa isang tuwid na linya:

ln N(i) = A - B x lni (1)

Ang bisa ng equation sa itaas ay nakumpirma sa isang serye ng mga gawa ng mga espesyalista sa Russia sa agham pampulitika ng matematika (Sobyanin, Sukhovolsky, 1995), na sinuri ang mga resulta ng mga halalan ng mga kinatawan ng mga tao ng Russia noong 1990, ang mga halalan ng Pangulo ng Russia noong 1991 at 1996, pati na rin ang data sa mga halalan sa ilang bansa, simula sa halalan ng Pangulo ng France noong 1848, kung saan nanalo si Louis-Napoleon Bonaparte.

Ang mathematical na resulta na ito ay hindi mahalaga sa kalikasan. Mga Espesyalista - ang mga physicist, chemist, metallurgist, demographer, ecologist at kinatawan ng maraming iba pang larangan ng kaalaman na nakikitungo sa malaking halaga ng istatistikal na data, ay lubos na nakakaalam na ang ipinahiwatig na pagiging regular ng numero ay isang pangkalahatang kalikasan at naglalarawan ng isang sitwasyon ng "malayang kumpetisyon" para sa ang pamamahagi ng isang may hangganang bilang ng o may kondisyong "mga kalakal". Ito ay lumiliko na ang lahat ng naiisip na iba't ibang mga bagay, sitwasyon at sanhi ng mga relasyon ay hindi nagbabago sa likas na katangian ng pag-asa na ito: sa sandaling mayroong libreng kumpetisyon, ang mga resulta nito sa anumang kaso ay umaangkop sa "logarithmic straight line" - tanging ang pare-parehong A at nagbabago ang slope ng tuwid na linya B. At kabaliktaran: sa sandaling may mga paglihis mula sa mga kondisyon ng libreng kompetisyon, ang mga puntos ay hindi maaaring hindi lumihis mula sa tuwid na linya - at higit pa, mas makabuluhan ang "mga kadahilanan ng kawalan ng kalayaan". Kaya, halimbawa, ang "kumpetisyon" ng mga lungsod para sa bilang ng mga taong naninirahan sa mga ito ay humahantong sa mga sibilisadong bansa sa gayong pag-asa. Samantala, sa USSR, ang mga lungsod tulad ng Moscow, Leningrad at ilang iba pang mga sentro ay lumihis nang malaki mula sa "direktang libreng kumpetisyon" - dahil sa mga paghihigpit sa administratibo na nauugnay sa rehimeng pasaporte. Katulad nito, ang libreng kumpetisyon ay humahantong sa parehong relasyon sa pagitan ng laki ng pinakamalaking kapalaran at ang "lugar" na inookupahan ng kanilang mga may-ari sa listahan ng mga naturang kapalaran - siyempre, sa mga bahagi ng mundo kung saan umiiral ang mga naturang listahan. Ang batas ng pamamahagi ng mga mandaragit ayon sa masa na kilala ng mga zoologist ay eksaktong pareho (sa kawalan ng mga anthropogenic na kadahilanan), at iba pa.

Sa unang pagkakataon, ang mga regularidad ng ganitong uri ay itinatag ng Italian sociologist at mathematician na si V. Pareto, na nakikibahagi sa pamamahagi ng mga naninirahan sa bansa ayon sa kanilang kayamanan; kasunod nito, ang American linguist na si J.K. Zipf, pag-aaral sa pamamahagi ng dalas ng paggamit ng mga salita sa mga teksto. Ang iba't ibang variant ng ratio na nakasulat sa itaas ay tinatawag na batas ng Zipf-Pareto. Ang mga paraan ng pagsusuri na nauugnay sa pag-aaral ng mga distribusyon ng ranggo ay malawakang ginagamit sa linggwistika, scientometrics, at ekolohiya. Ang pagsunod sa kaugnayan (1) para sa proseso ng elektoral ay nangangahulugan na mayroong "malayang kumpetisyon" ng lahat ng kandidato na may pagkakataong malayang ipaliwanag ang kanilang pampulitikang pananaw at politikal na plataporma sa mga botante.

Ang katuparan ng batas ng Zipf-Pareto para sa proseso ng elektoral ay nangangahulugan na ang bawat isa sa mga kandidato, bawat isa sa mga partido at pampulitikang grupo ng mga botante na bumoboto ayon sa isang partikular na uri, ay may sariling pampulitikang plataporma na hindi nagsasapawan sa lahat ng iba pa. Dapat sakupin ng mga available na kandidato ang lahat ng posibleng kagustuhan ng mga botante; kung gayon ang proporsyon ng mga botante na naghahanap ng kanilang pagpili sa labas ng iminungkahing listahan ng mga kandidato ay medyo maliit, at ang equation (1) ay naglalarawan ng pamamahagi ng mga boto na may mataas na katumpakan. Kung hindi, maaaring lumitaw ang mga walang laman na "niches" sa pamamahagi (1), at ang buong pagsusuri ay magiging mas kumplikado.

Ang mga parameter A at B na kasama sa equation (1) ay kinakalkula batay sa data sa bilang ng mga botante na bumoto para sa iba't ibang kandidato o para sa iba't ibang grupong pampulitika gamit ang mga pamamaraan ng pagsusuri ng regression. Ang Parameter A sa equation (1) ay ang logarithm ng bilang ng mga botante na bumoto para sa nangungunang kandidato. Ang value B, ang preference coefficient, ay nagpapakilala sa slope ng tuwid na linya (1) at nagsisilbing numerical measure ng homogeneity ng pagpili ng mga botante. Kung B = 0, nangangahulugan ito na ang mga botante ay walang kagustuhan para sa isang partido o kandidato kaysa sa iba, at lahat sila ay nakatanggap ng parehong bilang ng mga boto sa halalan. Sa kabaligtaran, para sa malalaking halaga ng steepness B, ang mga panlabas na partido ay tumatanggap ng napakakaunting mga boto kumpara sa mga nangungunang partido (gayunpaman, sa pagsasagawa, ang parameter B ay halos hindi hihigit sa isa). Kung ang mga paglihis mula sa tuwid na linya ng uri (1) ay napansin, pagkatapos ay sa ilalim ng mga pagpapalagay na ginawa sa itaas, ito ay nagpapahiwatig ng kawalan ng mga kondisyon para sa libreng kumpetisyon sa pulitika. Ito ay maaaring sanhi ng alinman sa pagkakaroon ng ilang karagdagang panlabas na salik, halimbawa, pananakot sa mga botante sa pamamagitan ng posibleng pampulitika at pang-ekonomiyang panunupil sa kaganapan ng pagboto (o hindi pagboto) para sa isang partikular na kandidato, o sa pamamagitan ng direktang palsipikasyon ng mga resulta ng halalan sa panahon ng ang pagbibilang ng mga boto sa mga komisyon sa halalan ng iba't ibang antas. Ipinapakita ng Figure 2 ang isang tipikal na graph ng pamamahagi ng ranggo ng bilang ng mga botante sa mga halalan sa Russia. Tulad ng makikita, sa pagitan ng mga sukat ng iba't ibang grupo ng mga botante at ng mga ranggo ng mga pangkat na ito (i.e., ang mga lugar ng mga kandidato) sa logarithmic coordinate (kasama ang parehong mga palakol), mayroong halos isang linear na relasyon.

Ang uri ng pamamahagi ng mga boto para sa iba't ibang kandidato o partido ay nakakatulong upang matukoy ang pandaraya sa elektoral. Sa pinakasimpleng kaso ng palsipikasyon, kung ang isang tiyak na bilang ng mga balotang napunan pabor sa ilang kandidato o partido ay itinapon sa mga kahon ng balota, lumalabas na ang pamamahagi ng ranggo ng bilang ng mga boto na inihagis para sa mga indibidwal na kandidato ay hindi itinatanghal nang diretso. Ngunit kung ibubukod natin ang data sa kandidato kung saan ginawa ang mga falsification ng pabor, kung gayon para sa natitirang mga kandidato (o partido) ang pamamahagi ng ranggo ay tumutugma sa teoretikal. Sa kasong isinasaalang-alang, ang bilang ng mga naitanim na balota ay maaaring tantiyahin mula sa pagkakaiba sa pagitan ng bilang ng mga boto na natanggap ng naturang kandidato ayon sa opisyal na datos at ang bilang na natagpuan mula sa equation ng pamamahagi ng ranggo pagkatapos na ibukod ang data na may kaugnayan sa nabanggit na kandidato. Ipinapakita ng Figure 3 ang pamamahagi ng mga boto na inihagis - ayon sa komisyon ng halalan - para sa mga kandidato para sa posisyon ng pinuno ng administrasyon ng rehiyon ng Lipetsk sa mga halalan na ginanap noong tagsibol ng 1993. Ang pamamahagi na ito ay malinaw na malayo sa isang tuwid na linya. Sa kasong ito, kinumpirma ng paglilitis, na naganap noong 1995, ang pagkakaroon ng mga falsification na pabor sa kandidatong nanalo sa unang pwesto.

Bakit hindi gumagana ang Zipf's Law sa Russia? ika-11 ng Marso, 2017

Ang Zipf's Law ay unang inilapat upang ilarawan ang laki ng pamamahagi ng mga lungsod ng German physicist na si Felix Auerbach sa kanyang akdang The Law of Population Concentration noong 1913. Taglay nito ang pangalan ng Amerikanong linguist na si George Zipf, na noong 1949 ay aktibong nagpasikat sa pattern na ito, unang nagmungkahi na gamitin ito upang ilarawan ang pamamahagi ng kapangyarihang pang-ekonomiya at katayuan sa lipunan.

Sa Russia, ang batas na ito ay hindi gumagana.


Bumalik tayo sa 1949. Napansin ng linguist na si George Zipf (Zipf) ang kakaibang takbo sa paggamit ng mga tao ng ilang salita sa wika. Nalaman niya na ang isang maliit na bilang ng mga salita ay palaging ginagamit, at ang karamihan ay ginagamit na napakabihirang. Kung susuriin natin ang mga salita sa pamamagitan ng katanyagan, isang kapansin-pansing bagay ang mabubunyag: ang salita ng unang ranggo ay palaging ginagamit nang dalawang beses nang mas madalas kaysa sa salita ng pangalawang ranggo at tatlong beses na mas madalas kaysa sa salita ng ikatlong ranggo.

Nalaman ng Zipf na ang parehong panuntunan ay nalalapat sa pamamahagi ng mga kita ng mga tao sa isang bansa: ang pinakamayamang tao ay may dobleng halaga ng pera kaysa sa susunod na pinakamayamang tao, at iba pa.

Nang maglaon ay naging malinaw na ang batas na ito ay gumagana din na may kaugnayan sa laki ng mga lungsod. Ang lungsod na may pinakamalaking populasyon sa anumang bansa ay doble ang laki ng susunod na pinakamalaking lungsod, at iba pa. Hindi kapani-paniwala, ang batas ng Zipf ay gumana sa ganap na lahat ng mga bansa sa mundo sa nakalipas na siglo.

Tingnan lamang ang listahan ng mga pinakamalaking lungsod sa Estados Unidos. Kaya, ayon sa census noong 2010, ang populasyon ng pinakamalaking lungsod sa US, ang New York, ay 8,175,133 katao. Pangalawa ang Los Angeles na may populasyon na 3,792,621. Ang susunod na tatlong lungsod, Chicago, Houston at Philadelphia ay ipinagmamalaki ang populasyon na 2,695,598, 2,100,263 at 1,526,006, ayon sa pagkakabanggit. Malinaw, ang mga numerong ito ay hindi tumpak, ngunit ang mga ito ay nakakagulat na pare-pareho sa batas ng Zipf gayunpaman.

Si Paul Krugman, na nagsusulat sa aplikasyon ng batas ni Zipf sa mga lungsod, ay tanyag na nabanggit na ang teoryang pang-ekonomiya ay madalas na inakusahan ng paglikha ng lubos na pinasimple na mga modelo ng isang kumplikado, magulong katotohanan. Ipinapakita ng batas ng Zipf na ang eksaktong kabaligtaran ay totoo: gumagamit kami ng masyadong kumplikado, magulo na mga modelo, at ang katotohanan ay kamangha-mangha na malinis at simple.

batas ng lakas

Noong 1999, sumulat ang ekonomista na si Xavier Gabet ng isang siyentipikong papel kung saan inilarawan niya ang batas ng Zipf bilang "batas ng puwersa."

Nabanggit ni Gabet na ang batas na ito ay nagpapatuloy kahit na ang mga lungsod ay lumago sa isang magulong paraan. Ngunit ang istrakturang ito ay masisira sa sandaling lumipat ka sa mga hindi metropolitan na lungsod. Ang mga maliliit na bayan na may populasyon na humigit-kumulang 100,000 ay tila sumusunod sa ibang batas at nagpapakita ng mas nauunawaang pamamahagi ng laki.

Maaaring magtaka ang isa kung ano ang ibig sabihin ng salitang "lungsod"? Pagkatapos ng lahat, halimbawa, ang Boston at Cambridge ay itinuturing na dalawang magkaibang lungsod, tulad ng San Francisco at Auckland, na pinaghihiwalay ng tubig. Dalawang Swedish geographer din ang may tanong na ito, at sinimulan nilang isaalang-alang ang tinatawag na "natural" na mga lungsod, na pinagsama ng populasyon at mga koneksyon sa kalsada, at hindi ng mga motibong pampulitika. At nalaman nila na kahit ang mga "natural" na lungsod ay sumusunod sa batas ni Zipf.


Bakit gumagana ang batas ni Zipf sa mga lungsod?

Kaya bakit ang mga lungsod ay nahuhulaan sa mga tuntunin ng populasyon? Wala talagang makapagpaliwanag nito. Alam natin na ang mga lungsod ay lumalawak dahil sa immigration, dumagsa ang mga imigrante sa malalaking lungsod dahil mas maraming pagkakataon. Ngunit ang imigrasyon ay hindi sapat upang ipaliwanag ang batas na ito.

Mayroon ding mga pang-ekonomiyang motibo, dahil kumikita ng malaking pera ang malalaking lungsod, at gumagana rin ang batas ng Zipf para sa pamamahagi ng kita. Gayunpaman, hindi pa rin ito nagbibigay ng malinaw na sagot sa tanong.

Noong nakaraang taon, natuklasan ng isang pangkat ng mga mananaliksik na may mga pagbubukod sa batas ng Zipf: gumagana lamang ang batas kung ang mga lungsod na pinag-uusapan ay konektado sa ekonomiya. Ipinapaliwanag nito kung bakit wasto ang batas, halimbawa, para sa isang bansa sa Europa, ngunit hindi para sa buong EU.

Paano lumalaki ang mga lungsod?

May isa pang kakaibang panuntunan na nalalapat sa mga lungsod na may kinalaman sa kung paano kumokonsumo ng mga mapagkukunan ang mga lungsod kapag sila ay lumago. Habang lumalaki ang mga lungsod, nagiging mas matatag ang mga ito. Halimbawa, kung doble ang laki ng isang lungsod, hindi doble ang bilang ng mga istasyon ng gasolina na kailangan nito.

Ang lungsod ay mabubuhay nang kumportable kung ang bilang ng mga gasolinahan ay tataas ng humigit-kumulang 77%. Bagama't ang batas ng Zipf ay sumusunod sa ilang partikular na batas sa lipunan, ang batas na ito ay mas malapit na nauugnay sa kalikasan, gaya ng kung paano kumonsumo ng enerhiya ang mga hayop habang sila ay tumatanda.

Inilarawan ito ng matematiko na si Stephen Strogatz sa ganitong paraan:

Ilang calories bawat araw ang kailangan ng mouse kumpara sa isang elepante? Pareho silang mga mammal, kaya maaari itong ipagpalagay na sa antas ng cellular ay hindi sila dapat magkaiba. Sa katunayan, kung ang mga cell ng sampung iba't ibang mammal ay lumaki sa isang laboratoryo, ang lahat ng mga cell na ito ay magkakaroon ng parehong metabolic rate, hindi nila matandaan sa genetic level kung gaano kalaki ang kanilang host.

Ngunit kung gagawin natin ang isang elepante o isang daga bilang isang ganap na hayop, isang gumaganang kumpol ng bilyun-bilyong mga selula, kung gayon ang mga selula ng elepante ay gugugol ng mas kaunting enerhiya sa parehong pagkilos kaysa sa mga selula ng isang daga. Ang batas ng metabolismo, na tinatawag na Kleiber's Law, ay nagsasaad na ang metabolic na pangangailangan ng isang mammal ay tumataas sa proporsyon sa timbang ng katawan nito sa pamamagitan ng isang kadahilanan na 0.74.

Ang 0.74 na ito ay napakalapit sa 0.77 na nakikita sa batas na namamahala sa bilang ng mga gasolinahan sa lungsod. Pagkakataon? Siguro, ngunit malamang na hindi.

Sa Russia, ang populasyon ng pinakamalaking lungsod, ang Moscow, ay opisyal na humigit-kumulang 11.5 milyong katao. Ang populasyon ng pangalawang lungsod, St. Petersburg, ay 5.2 milyon. Gaya ng nakikita natin, ang ratio ng populasyon ng dalawang lungsod ay humigit-kumulang tumutugma sa "batas ng Zipf". Ayon dito, ang ikatlong pinakamalaking lungsod sa Russia ay dapat magkaroon ng tungkol sa 4 na milyong tao, at ang ikaapat - tungkol sa 3 milyon. Gayunpaman, walang ganoong mga lungsod sa Russia. Sa katotohanan, ang ikatlong lungsod sa Russia, Novosibirsk, ay may populasyon na 1.6 milyong tao (2.5 beses na mas mababa kaysa sa karaniwan), at ang ikaapat, Yekaterinburg, 1.4 milyon, na 2 beses na mas mababa kaysa sa pamantayan ng Zipf.

Bakit hindi gumagana ang "Zipf's law" sa Russia? Sinasagot ng American sociologist na si Richard Florida ang tanong na ito sa kanyang aklat na The Creative Class. Isinulat niya na ang "batas ng Zipf" ay hindi gumagana sa mga imperyo (o mga bansang nagbalik ng mga imperyo) at mga nakaplanong ekonomiya. Pinangalanan niya ang tatlong naturang mga bansa-pagbubukod: England (kung saan pagkatapos ng London ay walang kahit isang pangalawang lungsod, 2 beses na mas maliit sa populasyon), Russia at China.

Ang isang pag-aaral sa "Zipf's law" ay isinagawa din ng Financial University sa ilalim ng Gobyerno ng Russia. Ang konklusyon nito ay ganito:

"Ang tunay na pamamahagi ng mga lungsod sa Russia ayon sa populasyon ay hindi ganap na tumutugma sa kurba ng Zipf para sa alinman sa mga binuo o umuunlad na bansa. Ang bahagi ng totoong Zipf curve para sa Russia ay matatagpuan sa itaas ng perpektong isa, na tumutugma sa pamamahagi ng mga lungsod sa mga binuo na bansa, at ang bahagi sa ibaba nito ay tumutugma sa pamamahagi ng mga lungsod sa mga umuunlad na bansa. Kaya, ayon sa panuntunan ni Zipf, lumalabas na sa Russia ang pinakamalaking mga lungsod at milyon-plus na mga lungsod ay gumaganap ng nangingibabaw na papel. Ang paglihis ng tunay na kurba mula sa ideal ay dahil sa malawak na teritoryo ng bansa at iba't ibang salik na sosyo-ekonomiko at natural-klima.

Dalawang megacities at maliliit at katamtamang laki ng mga lungsod (hanggang sa 250,000 katao) ang akmang-akma sa uri ng western urbanization. Ngunit ang malalaking lungsod at milyong-plus na mga lungsod ay hindi.

Mga natuklasan mula sa isa pang pag-aaral:

"Ang ipinahayag na mga uso ay hindi tumutugma sa mga pagpapalagay na ipinahayag sa panitikan na ang dahilan ng paglihis ng Russia mula sa pattern ng Zipf ay ang sentralisadong pagpaplano ng spatial na pag-unlad, na kasama ang suporta para sa katamtaman at maliliit na bayan sa panahon ng Sobyet. Ang paglipat sa merkado ay dapat na alisin ang mga pagbaluktot na ito at dalhin ang rank-size na relasyon na mas malapit sa canonical form, gayunpaman, sa kabila ng paglahok ng mga mekanismo ng merkado sa pagbuo ng espasyo ng pang-ekonomiyang aktibidad, isang karagdagang paglihis mula dito ay naobserbahan sa ang bansa.


(Ang mga bilog ay nagpapahiwatig ng populasyon ng mga rehiyon ng Russia)

Yung. Ang paglihis sa "Zipf's law" sa Russia ay hindi bunga ng isang nakaplanong ekonomiya (tulad ng sa China), ngunit bunga ng imperyalismo ng bansa (kapag ang isa o dalawang lungsod ay gumaganap ng papel ng isang metropolis).

Batay sa mga usong ito, ang posibilidad ng pag-unlad/pagbabalik ng lunsod sa Russia ay ang mga sumusunod:

Karamihan sa mga lungsod ng Russia ay nasa itaas ng perpektong kurba ng Zipf, kaya ang inaasahang trend ay isang patuloy na pagbaba sa bilang at populasyon ng mga katamtaman at maliliit na bayan dahil sa paglipat sa malalaking lungsod.

— 7 milyon-plus na mga lungsod (St. Petersburg, Novosibirsk, Yekaterinburg, Nizhny Novgorod, Kazan, Chelyabinsk, Omsk), na nasa ibaba ng perpektong Zipf curve, ay may malaking reserba ng paglaki ng populasyon at inaasahan ang paglaki ng populasyon.

— May mga panganib ng depopulasyon ng unang lungsod sa ranggo (Moscow), mula noong ikalawang lungsod (St. pagbili at pagrenta ng bahay.

(Sa USSR, ang "batas ng Zipf" ay hindi rin gumana - makikita mo ang paglihis ng mga lungsod mula sa Zipf curve, kung saan sila dapat naroroon)

Si Richard Florida sa The Creative Class ay nagtala ng isa pang pagkakaiba sa pagitan ng mga lungsod ng Amerika at Russia. Sa Estados Unidos, ang konsentrasyon ng creative class ay nasa medium-sized na mga lungsod na nakakalat sa buong bansa. Kaya, ang pinakamataas na proporsyon ng creative class sa mga lungsod tulad ng San Jose, Boulder (Colorado), Huntsville (Alabama), Corvallis (Oregon), atbp. - sa kanila ang bahaging ito ay 40-48%. Ngunit ang pinakamalaking lungsod sa Estados Unidos, New York, ay kabilang sa mga gitnang magsasaka sa mga tuntunin ng bahagi ng malikhaing uri - 35% ng kabuuang bilang ng mga empleyado at ika-34 sa ranggo, ang pangalawang lungsod sa bansa, Los Angeles , sa pangkalahatan ay ika-60. Ang isang katulad na kalakaran ay sinusunod sa ibang mga bansa kung saan gumagana ang "batas ng Zip" (Germany, France, Italy, Sweden, atbp.).

Sa Russia, halos ang buong malikhaing klase ng bansa ay puro sa Moscow, habang ang natitirang mga lungsod ay nananatiling zone ng pang-industriya na oras sa kalagitnaan ng ika-20 siglo.

Ang lahat ng ito ay lubhang kapana-panabik, ngunit marahil ay hindi gaanong mahiwaga kaysa sa batas ni Zipf. Ito ay hindi napakahirap na maunawaan kung bakit ang isang lungsod, na kung saan ay, sa katunayan, isang ecosystem, kahit na itinayo ng mga tao, ay dapat sumunod sa mga likas na batas ng kalikasan. Ngunit ang batas ni Zipf ay walang pagkakatulad sa kalikasan. Ito ay isang panlipunang kababalaghan at ito ay nagaganap lamang sa nakalipas na daang taon.

Ang alam lang natin ay nalalapat ang batas ng Zipf sa iba pang sistemang panlipunan, kabilang ang mga sistemang pang-ekonomiya at linggwistika. Kaya, marahil mayroong ilang pangkalahatang mga patakaran sa lipunan na lumikha ng kakaibang batas na ito, at balang araw ay mauunawaan natin ang mga ito. Ang sinumang makalutas ng palaisipang ito ay maaaring mahanap ang susi sa paghula ng mas mahahalagang bagay kaysa sa paglago ng mga lungsod. Ang Batas ng Zipf ay maaaring isang maliit na aspeto lamang ng pandaigdigang tuntunin ng panlipunang dinamika na namamahala sa kung paano tayo nakikipag-usap, nakikipagkalakalan, bumubuo ng mga komunidad, at higit pa.

P.S. Sa personal, tila sa akin na ang isang batas na may mga tinatayang mga pagpapalagay para sa mga numero at isang grupo ng mga pagbubukod ay karaniwang mahirap tumawag ng isang batas. Random coincidence lang.

Ano sa tingin mo?

pinagmumulan

Kamusta kayong lahat! Kamakailan, mas at mas madalas kong marinig mula sa mga kasamahan ang tungkol sa kinakailangan sa TOR upang suriin ang kalidad ng teksto ayon sa batas ng Zipf. At hindi lahat ay nauunawaan kung paano i-edit ang teksto para sa batas na ito. Sa artikulong ngayon ay susubukan kong sabihin sa iyo kung paano pagbutihin ang parameter sa pinakasimpleng paraan, at linawin din kung bakit hindi ito kailangan ng mabubuting may-akda.

Maaari mong matukoy ang kalidad ng teksto ayon sa batas ng Zipf gamit ang ilang mga serbisyo. Ngunit, sa tingin ko ang PR-CY ay ang pinaka-sapat, pinagsasama nito ang tamang formula na may simple at naiintindihan na interface. Iyan ang ginamit ko sa paghahanda ng materyal na ito.

Ano ang batas ni Zipf

Upang magsimula, ito ay nagkakahalaga ng pag-unawa kung ano ito. Ayon sa Wikipedia, binuo ni Jean-Baptiste Estoux ang pattern na ito noong 1908, ang batas na ito ay orihinal na tinutukoy sa shorthand. Ang unang aplikasyon ng regularidad na alam ng pangkalahatang publiko ay nauugnay sa demograpiya, at mas tiyak sa distribusyon ng populasyon sa mga lungsod, ay ginamit ni Felix Auerbach.

Natanggap ng pattern ang modernong pangalan nito noong 1949 salamat sa linguist na si George Zipf. Ipinakita niya sa tulong nito ang gradasyon ng pamamahagi ng yaman sa populasyon. At pagkatapos lamang ang batas ay nagsimulang ilapat upang matukoy ang pagiging madaling mabasa ng mga teksto.

Paano ito kinakalkula

Upang maayos na magamit ang batas na ito, kailangan mong maunawaan kung paano ito gumagana. Suriin natin ang formula para sa pagkalkula.

  • Ang F ay ang dalas ng paggamit ng salita;
  • R ay serial number;
  • Ang C ay isang pare-parehong halaga (isang numero na nagpapahiwatig ng pinakamalaking salita sa mga tuntunin ng bilang ng mga pag-uulit).

Sa pagsasagawa, ang isa pang formula ay lumalabas na mas maginhawa, mukhang mas malinaw.

Ang diskarte na ito ay mas maginhawa, dahil mayroon kaming data sa bilang ng mga pag-uulit ng pinakakaraniwang salita. Ito ay mula sa dami na sila ay tinataboy.

Upang gawing simple, sa aming teksto ang pangalawang pinakamadalas na salita ay dapat na dalawang beses na mas bihira kaysa sa una. Dumating sa ikatlong puwesto, tatlong beses at iba pa.

Halimbawa ng angkop na teksto

Ang teorya ay tinalakay ng kaunti. Ito ay nananatiling humarap sa pagsasanay. Bilang isang pang-eksperimentong teksto, kumuha ako ng isang artikulo mula sa T-Zh. Bakit galing dun? Ang lahat ay simple. Sa ngayon, isa ito sa mga pinakamahusay na halimbawa ng istilo ng impormasyon na minamahal ng marami. Buweno, kawili-wili kung ano ang ipapakita ng tekstong nakasulat sa ilalim ng direksyon ni Maxim Ilyakhov. Sasabihin ko kaagad na ang mga teksto para sa tagapagpahiwatig na ito ay nasa antas, bagaman, sa pagkakaroon ng pala ng higit sa 40 na mga site, wala akong nakitang isang artikulo na may mahinang pagiging natural. Gayundin, agad akong susulong at sasabihin na ang pang-eksperimentong teksto pagkatapos ng pag-akma ay naging mas masahol pa, sa kabila ng pinahusay na marka ng Zipf, hindi ka dapat mag-abala nang labis sa labis na pagtaas sa pagiging natural.

Ito ang ipinakita sa amin ng analyzer pagkatapos suriin.

Tingnan natin kung ano ang nasa loob. Tulad ng nakikita mo, mayroong isang haligi na may mga salita, pati na rin ang mga hindi maunawaan na mga numero. Ang "pangyayari" na hanay (1) ay nagpapahiwatig kung gaano karaming beses naganap ang mga anyo ng salita sa teksto. Sa hanay ng Zipf (2) ay ang inirerekomendang bilang ng mga entry. Ang mga marker 3 at 4 ay nagmamarka ng perpektong tagapagpahiwatig para sa pangalawa at pangatlong posisyon. Dapat mo ring bigyang pansin ang mga rekomendasyon, ipinapahiwatig nito kung gaano karaming mga salita ang kailangan mong alisin upang makamit ang perpektong kumbinasyon.

Para sa isang mas mahusay na pag-unawa, suriin natin kung ano ang binibilang ng analyzer. Kinukuha namin ang numero 39 (C) bilang batayan, kailangan din namin ng isang serial number, bigyang-pansin ang posisyon ng 2 (F). Kinukuha namin ang formula.

Kapalit.

F=39/2=19.5

Nag-round up kami at nakakuha ng 20, ito ang magiging kinakailangang bilang ng mga pangyayari. Kinumpirma ito ng analyzer. Sa ating bansa, ang pangalawang pinakasikat na salita ay ginagamit ng 28 beses, ayon sa pagkakabanggit, 8 pag-uulit ay kailangang alisin o palitan.

Ang pagkakaroon ng pakikitungo sa prinsipyo ng batas, nagsisimula kaming mag-edit. Upang gawin ito, tinatanggal o pinapalitan namin ng mga salitang magkasingkahulugan na mas maraming paglitaw kaysa kinakailangan ng Zipf. Bilang isang resulta, nakuha namin ang larawang ito.

Tulad ng nakikita mo, nagawa kong taasan ang rate mula 83% hanggang 88%. Gayunpaman, ang kalidad ng teksto ay lubhang nagdusa. Hindi ka dapat magsikap na taasan ang bilang na ito sa 100%. Sa katunayan, kung mayroon ka nang 75%, ito ay napakahusay at hindi mo na dapat pasukin pa.

Kapaki-pakinabang na payo

Bigyang-pansin hindi lamang ang mga unang linya. Magsimulang umangkop mula sa mga huling posisyon sa listahan, kadalasan ay may mas malaking epekto ang mga ito sa kabuuang marka kaysa sa unang sampung salita.

Zipf at SEO

Ngayon ay lumipat tayo sa kung bakit kailangang malaman ng isang copywriter ang pattern na ito. Kapag nag-order ng mga teksto, sinisikap ng mga SEO na gawing pinaka-maginhawa ang mga ito para sa mga search engine. Ito ay pinaniniwalaan (bagaman hindi malinaw kung kanino) ang batas ng Zipf ay aktibong ginagamit ng mga algorithm sa paghahanap. Mahirap patunayan o pabulaanan ang pahayag na ito. Wala akong mahanap na anumang matino na pananaliksik at mga eksperimento sa paksang ito.

Nagpasya na suriin ito sa aking sarili. Upang gawin ito, kinuha ko ang isyu para sa isang mapagkumpitensyang query na "plastic windows", kinuha ni Yandex ang isyu sa Moscow, kinailangan kong mag-conjure sa Google, at tila nakilala rin niya ako bilang isang residente ng kabisera (hindi bababa sa ipinakita niya sa akin isang ad na may Moscow geolocation). Kinuha ko ang unang pahina ng isyu, kasama ang ika-49 na lugar. Ganito ang naging tanda.

Kung titingnan mo nang mas malapit, makikita mo na sa Yandex ang output ay mas pantay, kung titingnan mo ang pattern na aming pinag-aaralan. Ngunit, sa parehong oras, ang isang mas mataas na numero ay hindi ginagarantiyahan ang tagumpay sa paglaban para sa unang lugar sa tuktok.

Batay dito, masasabing kung ilalapat ng mga search engine ang batas na ito, isa lamang ito sa mga salik. At hindi ang pangunahing isa.

mga konklusyon

OK tapos na ang lahat Ngayon. Ngayon alam mo na kung ano ang kalidad ng teksto ayon sa batas ng Zipf, at maaari mo ring ayusin ang indicator na ito. Sa katunayan, walang kumplikado dito, ang lahat ay medyo simple. Ito ay sapat na upang maunawaan ang prinsipyo ng pagpapatakbo ng regular na ito nang isang beses.

Sa nakalipas na siglo, ang isang mahiwagang mathematical phenomenon na tinatawag na Zipf's law ay nagawang tumpak na mahulaan ang laki ng mga higanteng lungsod sa buong mundo. Ang bagay ay walang nakakaunawa kung paano at bakit gumagana ang batas na ito ...

Bumalik tayo sa 1949. Napansin ng linguist na si George Zipf (Zipf) ang kakaibang takbo sa paggamit ng mga tao ng ilang salita sa wika. Nalaman niya na ang isang maliit na bilang ng mga salita ay patuloy na ginagamit, at ang karamihan - napakabihirang. Kung susuriin natin ang mga salita sa pamamagitan ng katanyagan, isang kapansin-pansing bagay ang mabubunyag: ang salita ng unang ranggo ay palaging ginagamit nang dalawang beses nang mas madalas kaysa sa salita ng pangalawang ranggo at tatlong beses na mas madalas kaysa sa salita ng ikatlong ranggo.
Nalaman ng Zipf na ang parehong panuntunan ay nalalapat sa pamamahagi ng mga kita ng mga tao sa isang bansa: ang pinakamayamang tao ay may dobleng halaga ng pera kaysa sa susunod na pinakamayamang tao, at iba pa.
Nang maglaon ay naging malinaw na ang batas na ito ay gumagana din na may kaugnayan sa laki ng mga lungsod. Ang lungsod na may pinakamalaking populasyon sa anumang bansa ay doble ang laki ng susunod na pinakamalaking lungsod, at iba pa. Hindi kapani-paniwala, ang batas ng Zipf ay gumana sa ganap na lahat ng mga bansa sa mundo sa nakalipas na siglo.

Tingnan lamang ang bilang ng mga pinakamalaking lungsod sa Russia. Ang populasyon ng Moscow ay humigit-kumulang 2 beses na mas malaki kaysa sa St. Petersburg.
Si Paul Krugman, na nagsusulat sa aplikasyon ng batas ni Zipf sa mga lungsod, ay tanyag na nabanggit na ang teoryang pang-ekonomiya ay madalas na inakusahan ng paglikha ng lubos na pinasimple na mga modelo ng isang kumplikado, magulong katotohanan. Ipinapakita ng batas ng Zipf na ang eksaktong kabaligtaran ay totoo: gumagamit kami ng masyadong kumplikado, magulo na mga modelo, at ang katotohanan ay kamangha-mangha na malinis at simple.

batas ng lakas

Noong 1999, sumulat ang ekonomista na si Xavier Gabet ng isang siyentipikong papel kung saan inilarawan niya ang batas ng Zipf bilang "batas ng puwersa."
Nabanggit ni Gabet na ang batas na ito ay nagpapatuloy kahit na ang mga lungsod ay lumago sa isang magulong paraan. Ngunit ang istrakturang ito ay masisira sa sandaling lumipat ka sa mga hindi metropolitan na lungsod. Ang mga maliliit na bayan na may populasyon na humigit-kumulang 100,000 ay tila sumusunod sa ibang batas at nagpapakita ng mas nauunawaang pamamahagi ng laki.

Maaaring magtaka ang isa kung ano ang ibig sabihin ng salitang "lungsod"? Pagkatapos ng lahat, halimbawa, ang Boston at Cambridge ay itinuturing na dalawang magkaibang lungsod, tulad ng San Francisco at Auckland, na pinaghihiwalay ng tubig. Dalawang Swedish geographer din ang may tanong na ito, at sinimulan nilang isaalang-alang ang tinatawag na "natural" na mga lungsod, na pinagsama ng populasyon at mga koneksyon sa kalsada, at hindi ng mga motibong pampulitika. At nalaman nila na kahit ang mga "natural" na lungsod ay sumusunod sa batas ni Zipf.

Bakit gumagana ang batas ni Zipf sa mga lungsod?

Kaya bakit ang mga lungsod ay nahuhulaan sa mga tuntunin ng populasyon? Wala talagang makapagpaliwanag nito. Alam natin na ang mga lungsod ay lumalawak dahil sa immigration, dumagsa ang mga imigrante sa malalaking lungsod dahil mas maraming pagkakataon. Ngunit ang imigrasyon ay hindi sapat upang ipaliwanag ang batas na ito.
Mayroon ding mga pang-ekonomiyang motibo, dahil kumikita ng malaking pera ang malalaking lungsod, at gumagana rin ang batas ng Zipf para sa pamamahagi ng kita. Gayunpaman, hindi pa rin ito nagbibigay ng malinaw na sagot sa tanong.
Noong nakaraang taon, natuklasan ng isang pangkat ng mga mananaliksik na may mga pagbubukod sa batas ng Zipf: gumagana lamang ang batas kung ang mga lungsod na pinag-uusapan ay konektado sa ekonomiya. Ipinapaliwanag nito kung bakit wasto ang batas, halimbawa, para sa isang bansa sa Europa, ngunit hindi para sa buong EU.

Paano lumalaki ang mga lungsod?

May isa pang kakaibang panuntunan na nalalapat sa mga lungsod na may kinalaman sa kung paano kumokonsumo ng mga mapagkukunan ang mga lungsod kapag sila ay lumago. Habang lumalaki ang mga lungsod, nagiging mas matatag ang mga ito. Halimbawa, kung doble ang laki ng isang lungsod, hindi doble ang bilang ng mga istasyon ng gasolina na kailangan nito.
Ang lungsod ay mabubuhay nang kumportable kung ang bilang ng mga gasolinahan ay tataas ng humigit-kumulang 77%. Bagama't ang batas ng Zipf ay sumusunod sa ilang partikular na batas sa lipunan, ang batas na ito ay mas malapit na nauugnay sa kalikasan, gaya ng kung paano kumonsumo ng enerhiya ang mga hayop habang sila ay tumatanda.

Inilarawan ito ng matematiko na si Stephen Strogatz sa ganitong paraan:
Ilang calories bawat araw ang kailangan ng mouse kumpara sa isang elepante? Pareho silang mga mammal, kaya maaari itong ipagpalagay na sa antas ng cellular ay hindi sila dapat magkaiba. Sa katunayan, kung ang mga cell ng sampung iba't ibang mammal ay lumaki sa isang laboratoryo, ang lahat ng mga cell na ito ay magkakaroon ng parehong metabolic rate, hindi nila matandaan sa genetic level kung gaano kalaki ang kanilang host.
Ngunit kung gagawin natin ang isang elepante o isang daga bilang isang ganap na hayop, isang gumaganang kumpol ng bilyun-bilyong mga selula, kung gayon ang mga selula ng elepante ay gugugol ng mas kaunting enerhiya sa parehong pagkilos kaysa sa mga selula ng isang daga. Ang batas ng metabolismo, na tinatawag na Kleiber's Law, ay nagsasaad na ang metabolic na pangangailangan ng isang mammal ay tumataas sa proporsyon sa timbang ng katawan nito sa pamamagitan ng isang kadahilanan na 0.74. Ang 0.74 na ito ay napakalapit sa 0.77 na nakikita sa batas na namamahala sa bilang ng mga gasolinahan sa lungsod.
Pagkakataon? Siguro, ngunit malamang na hindi.
Ang lahat ng ito ay lubhang kapana-panabik, ngunit marahil ay hindi gaanong mahiwaga kaysa sa batas ni Zipf. Ito ay hindi napakahirap na maunawaan kung bakit ang isang lungsod, na kung saan ay, sa katunayan, isang ecosystem, kahit na itinayo ng mga tao, ay dapat sumunod sa mga likas na batas ng kalikasan. Ngunit ang batas ni Zipf ay walang pagkakatulad sa kalikasan. Ito ay isang panlipunang kababalaghan at ito ay nagaganap lamang sa nakalipas na daang taon.
Ang alam lang natin ay nalalapat ang batas ng Zipf sa iba pang mga sistemang panlipunan, kabilang ang mga sistemang pang-ekonomiya at linguistic. Kaya, marahil mayroong ilang pangkalahatang mga patakaran sa lipunan na lumikha ng kakaibang batas na ito, at balang araw ay mauunawaan natin ang mga ito. Ang sinumang makalutas ng palaisipang ito ay maaaring mahanap ang susi sa paghula ng mas mahahalagang bagay kaysa sa paglago ng mga lungsod. Ang Batas ng Zipf ay maaaring isang maliit na aspeto lamang ng pandaigdigang tuntunin ng panlipunang dinamika na namamahala sa kung paano tayo nakikipag-usap, nakikipagkalakalan, bumubuo ng mga komunidad, at higit pa.