Zipfin laki: mikä se on ja miksi se toimii. Zipfin laki ja sosiaalisten ja taloudellisten ilmiöiden fraktaaliluonne

luonnollisen kielen sanat: jos kaikki kielen sanat (tai vain riittävän pitkä teksti) on järjestetty niiden käyttötiheyden mukaan laskevaan järjestykseen, niin tiheys n-. sana tällaisessa luettelossa on suunnilleen kääntäen verrannollinen sen järjestysnumeroon n(niin kutsuttu sijoitus tämän sanan kohdalla, katso järjestysasteikko). Esimerkiksi toiseksi eniten käytetty sana on noin kaksi kertaa harvinaisempi kuin ensimmäinen, kolmas on kolme kertaa vähemmän yleinen kuin ensimmäinen ja niin edelleen.

Luomisen historia[ | ]

Kuvion löydön kirjoittaja on ranskalainen pikakirjoittaja (fr. Jean-Baptiste Estoup), joka kuvaili sitä vuonna 1908 teoksessa The Range of Shorthand. Saksalainen fyysikko Felix Auerbach sovelsi ensimmäistä kertaa kaupunkien kokojakaumaa kuvaamaan lakia teoksessaan "Väestökeskittymän laki" vuonna 1913, ja se on nimetty amerikkalaisen kielitieteilijän George Zipfin mukaan, joka vuonna 1949 suositteli tätä mallia aktiivisesti ja ehdotti ensin. käyttää sitä kuvaamaan taloudellisten voimien jakautumista ja sosiaalista asemaa.

Vuonna 2005 annettiin selvitys Zipfin laista, joka perustuu additiivisten Markov-ketjujen korrelaatioominaisuuksiin (askelmuistitoiminnolla).

Zipfin laki kuvataan matemaattisesti Pareton jakaumalla. Se on yksi infometriikassa käytetyistä perussäännöistä.

Lain sovellukset[ | ]

George Zipf esitti vuonna 1949 ensimmäisen kerran ihmisten tulojen jakautumisen koon mukaan: rikkaimmalla on kaksi kertaa enemmän rahaa kuin seuraavaksi rikkaimmalla ja niin edelleen. Tämä väite osoittautui todeksi useissa maissa (Englanti, Ranska, Tanska, Hollanti, Suomi, Saksa, USA) vuosina 1926-1936.

Tämä laki toimii myös kaupunkijärjestelmän jakautumisen suhteen: minkään maan suurimman asukkaan kaupunki on kaksi kertaa seuraavaksi suurimman kaupungin koko ja niin edelleen. Jos järjestät luettelossa kaikki tietyn maan kaupungit laskevaan väestön määrään, kullekin kaupungille voidaan määrittää tietty sijoitus, toisin sanoen numero, jonka se saa tässä luettelossa. Samanaikaisesti väestön koko ja sijoitus noudattavat yksinkertaista kaavaa ilmaistavaa kaavaa:

P n = P 1 / n (\displaystyle P_(n)=P_(1)/n),

missä P n (\displaystyle P_(n))- kaupungin väestö n-th ranking; P 1 (\displaystyle P_(1))- maan pääkaupungin väestö (1. sija).

Empiiriset tutkimukset tukevat tätä väitettä.

Taloustieteilijä Xavier Gabet kuvaili vuonna 1999 Zipfin lakia esimerkkinä valtalaista: jos kaupungit kasvavat satunnaisesti samalla keskihajonnalla, niin jakauma suppenee rajalla Zipfin lain mukaiseksi.

Venäjän federaation kaupunkiasutusta koskevien tutkijoiden havaintojen mukaan Zipfin lain mukaisesti:

  • useimmat Venäjän kaupungit sijaitsevat ihanteellisen Zipf-käyrän yläpuolella, joten odotettu suuntaus on keskisuurten ja pienten kaupunkien määrän ja väestön jatkuva väheneminen suuriin kaupunkeihin siirtymisen vuoksi;
  • vastaavasti yli 7 miljoonalla kaupungilla (Pietari, Novosibirsk, Jekaterinburg, Nižni Novgorod, Kazan, Tšeljabinsk, Omsk), jotka ovat ihanteellisen Zipf-käyrän alapuolella, on merkittävä väestönkasvureservi ja ne odottavat väestönkasvua;
  • on olemassa riski luokan ensimmäisestä kaupungista (Moskova) väestökato, koska toinen kaupunki (Pietari) ja sitä seuraavat suuret kaupungit ovat kaukana ihanteellisesta Zipf-käyrästä, koska työvoiman kysyntä vähenee ja samalla lisääntyy elinkustannukset, mukaan lukien ennen kaikkea asunnon osto- ja vuokrakustannukset.

Kritiikkiä [ | ]

Amerikkalainen bioinformaatikko ehdotti tilastollista selitystä Zipfin laille, mikä osoittaa, että myös satunnainen merkkijono noudattaa tätä lakia. Kirjoittaja päättelee, että Zipfin laki on ilmeisesti puhtaasti tilastollinen ilmiö, jolla ei ole mitään tekemistä tekstin semantiikan kanssa ja jolla on pinnallinen suhde kielitieteeseen.

Äänestäjät ilmaisevat vaaliprosessin aikana asenteensa tiettyjä poliittisia hahmoja tai puolueita kohtaan antamalla äänensä tälle tai toiselle ehdokkaalle tai puolueelle. Herää kysymys - onko olemassa kaavoja, jotka kuvaavat äänten jakautumista eri ehdokkaiden tai puolueiden kesken? Jos säännönmukaisuuksia ei ole, on mahdollinen korrelaatio ehdokkaiden tai puolueiden saamien äänimäärien sekä näiden äänimäärien ja esimerkiksi äänestysaktiivisuuden tai virheellisten äänestyslippujen määrän välillä. Jos äänten jakautumisessa on tiettyjä kaavoja, niin kaikki vaihtoehdot niiden jakautumisesta eivät ole mahdollisia. Useiden eri maiden vaalien aineiston perusteella paljastettiin tilastollinen suhde eri ehdokkaiden ja puolueiden vaaleissa saamien äänimäärien välillä. Havaittiin, että tätä suhdetta kuvaa seuraava yksinkertainen suhde:

Jos yhdelle akselille piirretään logaritmisella asteikolla kunkin ehdokkaan saamien äänten määrä N(i) ja toiselle akselille, myös logaritmisella asteikolla, paikka i, jonka sama ehdokas valtasi vaalien aikana, niin pisteet riittävällä approksimaatiolla saadut sijaitsevat suoralla linjalla:

ln N(i) = A - B x lni (1)

Yllä olevan yhtälön pätevyys vahvistettiin useissa venäläisten matemaattisen valtiotieteen asiantuntijoiden teoksissa (Sobjanin, Sukhovolsky, 1995), jotka analysoivat vuoden 1990 Venäjän kansanedustajavaalien tuloksia, Venäjän presidentin vaaleja. vuosina 1991 ja 1996, sekä tiedot useiden maiden vaaleista, alkaen Ranskan presidentin vaaleista vuonna 1848, jolloin Louis-Napoleon Bonaparte voitti.

Tämä matemaattinen tulos ei ole luonteeltaan triviaali. Asiantuntijat - fyysikot, kemistit, metallurgit, väestötieteilijät, ekologit ja monien muiden tietoalojen edustajat, jotka käsittelevät suuria määriä tilastotietoa, tietävät hyvin, että esitetty numeerinen säännöllisyys on luonteeltaan yleinen ja kuvaa "vapaan kilpailun" tilannetta. rajallisen määrän tai ehdollisen "tavaroiden" jakelu. Osoittautuu, että kaikki kuviteltavissa olevat esineet, tilanteet ja kausaaliset suhteet eivät muuta tämän riippuvuuden luonnetta: heti kun on vapaa kilpailu, sen tulokset sopivat joka tapauksessa "logaritmiselle suoralle" - vain vakio A ja suoran B kaltevuus muuttuu. Ja päinvastoin: heti kun on poikkeamia vapaan kilpailun ehdoista, pisteet väistämättä poikkeavat suoralta - ja mitä pidemmälle, sitä tärkeämpiä ovat "epävapaustekijät". Joten esimerkiksi kaupunkien "kilpailu" niissä asuvien ihmisten määrästä johtaa sivistyneessä maassa juuri sellaiseen riippuvuuteen. Samaan aikaan Neuvostoliitossa kaupungit, kuten Moskova, Leningrad ja jotkut muut keskukset, poikkesivat merkittävästi "suorasta vapaasta kilpailusta" - passijärjestelmään liittyvien hallinnollisten rajoitusten vuoksi. Samoin vapaa kilpailu johtaa samaan suhteeseen suurimpien omaisuuksien koon ja omistajiensa "paikan" välillä tällaisten omaisuuksien luettelossa - tietysti niissä osissa maailmaa, joissa tällaisia ​​luetteloita on. Eläintieteen tutkijoiden tiedossa oleva petoeläinten massan jakautumislaki on täsmälleen sama (ilman ihmisperäisiä tekijöitä) ja niin edelleen.

Ensimmäistä kertaa tämänkaltaiset säännönmukaisuudet vahvistivat italialainen sosiologi ja matemaatikko V. Pareto, joka osallistui maan asukkaiden jakautumiseen varallisuuden mukaan; myöhemmin amerikkalainen lingvisti J.K. Zipf, tutkii sanojen käyttötiheyden jakautumista teksteissä. Useita yllä kirjoitetun suhteen muunnelmia kutsutaan Zipf-Pareton laiksi. Arvojakaumien tutkimukseen liittyviä analyysimenetelmiä käytetään laajalti lingvistiikassa, skientometriassa ja ekologiassa. Suhteen (1) noudattaminen vaaliprosessissa tarkoittaa "vapaata kilpailua" kaikkien ehdokkaiden kesken, joilla on mahdollisuus vapaasti selittää poliittisia näkemyksiään ja poliittista perustaa äänestäjille.

Zipf-Pareto-lain täyttäminen vaaliprosessissa tarkoittaa, että jokaisella ehdokkaalla, jokaisella puolueella ja äänestäjäryhmällä, joka äänestää tietyn tyypin mukaan, on oma poliittinen alustansa, joka ei mene päällekkäin kaikkien muiden kanssa. Käytettävissä olevien ehdokkaiden tulee kattaa kaikki äänestäjien mahdolliset mieltymykset; silloin ehdotetun ehdokaslistan ulkopuolelta valintaansa hakevien äänestäjien osuus on melko pieni, ja yhtälö (1) kuvaa äänten jakautumista suurella tarkkuudella. Muuten jakeluun (1) voi ilmaantua tyhjiä "rakoalueita", jolloin koko analyysi monimutkaistuu.

Yhtälöön (1) sisältyvät parametrit A ja B on laskettu regressioanalyysimenetelmillä eri ehdokkaita tai eri poliittisia ryhmiä äänestäneiden äänestäjien lukumäärän perusteella. Yhtälön (1) parametri A on johtavaa ehdokasta äänestäneiden äänestäjien lukumäärän logaritmi. Arvo B, mieltymyskerroin, kuvaa suoran (1) kaltevuutta ja toimii numeerisena mittana äänestäjien valinnan homogeenisuudesta. Jos B = 0, tämä tarkoittaa, että äänestäjät eivät suosi yhtä puoluetta tai ehdokasta toiseen nähden ja että he kaikki saivat vaaleissa saman määrän ääniä. Päinvastoin, suurilla jyrkkyyden B arvoilla ulkopuoliset puolueet saavat hyvin vähän ääniä johtaviin puolueisiin verrattuna (käytännössä parametri B ei kuitenkaan ole koskaan suurempi kuin yksi). Jos havaitaan poikkeamia tyypin (1) suorasta viivasta, tämä osoittaa edellä tehtyjen oletusten mukaan vapaan poliittisen kilpailun ehtojen puuttumista. Tämä voi johtua joko joidenkin muiden ulkoisten tekijöiden läsnäolosta, kuten äänestäjien pelottelemisesta mahdollisilla poliittisilla ja taloudellisilla sorroilla, jos äänestää (tai ei äänestä) tiettyä ehdokasta, tai vaalitulosten suorasta väärentämisestä vaalikauden aikana. ääntenlaskenta eri tasoisissa vaalilautakunnissa. Kuvassa 2 on tyypillinen kaavio Venäjän vaalien äänestäjien lukumäärän sijoitusjakaumasta. Kuten voidaan nähdä, eri äänestäjäryhmien kokojen ja näiden ryhmien sijoituksien (eli ehdokkaiden paikkojen) välillä logaritmisissa koordinaateissa (molempia akseleita pitkin) on käytännössä lineaarinen suhde.

Eri ehdokkaille tai puolueille annettujen äänten jakautumisen tyyppi auttaa tunnistamaan vaalipetokset. Yksinkertaisimmassa väärennöstapauksessa, jos tietty määrä jonkun ehdokkaan tai puolueen hyväksi täytettyjä äänestyslippuja heitetään äänestyslaatikoihin, käy ilmi, että yksittäisten ehdokkaiden äänten järjestysjakauma ei ole kuvattu suoraan. Mutta jos jätetään pois tiedot ehdokkaasta, jonka hyväksi väärennöksiä tehtiin, jäljellä olevien ehdokkaiden (tai puolueiden) sijoitus vastaa teoreettista. Käsiteltävänä olevassa tapauksessa istutettujen äänestyslippujen määrä voidaan arvioida tällaisen ehdokkaan virallisten tietojen mukaan saamien äänten ja sijoitusyhtälöstä saadun äänten erotuksesta, kun kyseistä ehdokasta koskevat tiedot on jätetty pois. Kuvassa 3 on esitetty äänten jakautuminen - vaalilautakunnan mukaan - Lipetskin alueen hallinnon johtajaehdokkaille keväällä 1993 pidetyissä vaaleissa. Tämä jakauma on selvästi kaukana suorasta linjasta. Tässä tapauksessa vuonna 1995 pidetty oikeudenkäynti vahvisti väärennösten olemassaolon ensimmäisen sijan voittaneen ehdokkaan hyväksi.

Miksi Zipfin laki ei toimi Venäjällä? 11. maaliskuuta 2017

Saksalainen fyysikko Felix Auerbach sovelsi Zipfin lakia kuvaamaan kaupunkien kokojakaumaa ensimmäisen kerran teoksessaan The Law of Population Concentration vuonna 1913. Se kantaa nimeä amerikkalainen kielitieteilijä George Zipf, joka vuonna 1949 aktiivisesti popularisoi tätä mallia ehdottaen ensin sen käyttöä kuvaamaan taloudellisen vallan ja sosiaalisen aseman jakautumista.

Venäjällä tämä laki ei toimi.


Palataanpa vuoteen 1949. Kielitieteilijä George Zipf (Zipf) huomasi oudon suuntauksen ihmisten käyttäessä tiettyjä sanoja kielessä. Hän havaitsi, että pientä määrää sanoja käytetään jatkuvasti, ja suurinta osaa käytetään erittäin harvoin. Jos arvioimme sanoja suosion mukaan, paljastuu silmiinpistävä asia: ensimmäisen luokan sanaa käytetään aina kaksi kertaa useammin kuin toisen luokan sanaa ja kolme kertaa useammin kuin kolmannen luokan sanaa.

Zipf havaitsi, että sama sääntö pätee ihmisten tulojen jakautumiseen maassa: rikkaimmalla ihmisellä on kaksi kertaa enemmän rahaa kuin seuraavaksi rikkaimmalla ja niin edelleen.

Myöhemmin kävi selväksi, että tämä laki toimii myös kaupunkien koon suhteen. Minkään maan suurimman väkiluvun kaupunki on kaksi kertaa koko seuraavaksi suurin kaupunki ja niin edelleen. Uskomatonta, että Zipfin laki on toiminut ehdottomasti kaikissa maailman maissa viimeisen vuosisadan aikana.

Katso vain luettelo Yhdysvaltojen suurimmista kaupungeista. Joten vuoden 2010 väestönlaskennan mukaan Yhdysvaltain suurimman kaupungin New Yorkin väkiluku on 8 175 133 ihmistä. Toinen on Los Angeles, jonka väkiluku on 3 792 621. Kolmessa seuraavassa kaupungissa, Chicagossa, Houstonissa ja Philadelphiassa, on 2 695 598, 2 100 263 ja 1 526 006 asukasta. Ilmeisesti nämä luvut ovat epätarkkoja, mutta ne ovat yllättävän yhdenmukaisia ​​Zipfin lain kanssa.

Paul Krugman, kirjoittaessaan Zipfin lain soveltamisesta kaupunkeihin, totesi tunnetusti, että talousteoriaa syytetään usein erittäin yksinkertaistettujen mallien luomisesta monimutkaisesta, kaoottisesta todellisuudesta. Zipfin laki osoittaa, että asia on juuri päinvastoin: käytämme liian monimutkaisia, sotkuisia malleja, ja todellisuus on hämmästyttävän siisti ja yksinkertainen.

voiman laki

Vuonna 1999 taloustieteilijä Xavier Gabet kirjoitti tieteellisen artikkelin, jossa hän kuvaili Zipfin lakia "voiman laiksi".

Gabet huomautti, että tämä laki säilyy, vaikka kaupungit kasvavat kaoottisella tavalla. Mutta tämä tasainen rakenne hajoaa heti, kun siirryt muihin kuin suurkaupunkikaupunkeihin. Pienet, noin 100 000 asukkaan kaupungit näyttävät noudattavan eri lakia ja osoittavan ymmärrettävämpää kokojakaumaa.

Voidaan ihmetellä, mitä tarkoitetaan termillä "kaupunki"? Loppujen lopuksi esimerkiksi Bostonia ja Cambridgeä pidetään kahtena eri kaupungina, aivan kuten San Francisco ja Auckland, joita erottaa vesi. Myös kahdella ruotsalaisella maantieteilijällä oli tämä kysymys, ja he alkoivat pohtia niin sanottuja "luonnollisia" kaupunkeja, joita yhdistävät väestö- ja tieyhteydet eivätkä poliittiset motiivit. Ja he havaitsivat, että jopa tällaiset "luonnolliset" kaupungit noudattavat Zipfin lakia.


Miksi Zipfin laki toimii kaupungeissa?

Joten mikä tekee kaupungeista niin ennustettavia väestön suhteen? Kukaan ei oikein osaa selittää sitä. Tiedämme, että kaupungit laajenevat maahanmuuton takia, maahanmuuttajat ryntäävät suuriin kaupunkeihin, koska siellä on enemmän mahdollisuuksia. Mutta maahanmuutto ei riitä selittämään tätä lakia.

On myös taloudellisia motiiveja, koska suuret kaupungit tienaavat paljon rahaa, ja Zipfin laki toimii myös tulonjaossa. Tämä ei kuitenkaan vielä anna selkeää vastausta kysymykseen.

Viime vuonna joukko tutkijoita havaitsi, että Zipfin laista on poikkeuksia: laki toimii vain, jos kyseessä olevat kaupungit ovat taloudellisesti yhteydessä toisiinsa. Tämä selittää, miksi laki pätee esimerkiksi yhteen Euroopan maahan, mutta ei koko EU:hun.

Miten kaupungit kasvavat?

On toinenkin outo sääntö, joka koskee kaupunkeja ja liittyy siihen, kuinka kaupungit kuluttavat resursseja kasvaessaan. Kun kaupungit kasvavat, ne muuttuvat vakaammiksi. Jos esimerkiksi kaupunki kaksinkertaistuu, sen tarvitsemien huoltoasemien määrä ei kaksinkertaistu.

Kaupunki elää varsin mukavasti, jos huoltoasemien määrä kasvaa noin 77 %. Vaikka Zipfin laki noudattaa tiettyjä sosiaalisia lakeja, tämä laki liittyy läheisemmin luontoon, kuten siihen, kuinka eläimet kuluttavat energiaa vanhetessaan.

Matemaatikko Stephen Strogatz kuvailee sitä näin:

Kuinka monta kaloria päivässä hiiri tarvitsee verrattuna norsuun? Molemmat ovat nisäkkäitä, joten voidaan olettaa, että solutasolla niiden ei pitäisi olla kovin erilaisia. Todellakin, jos kymmenen eri nisäkkään soluja kasvatetaan laboratoriossa, kaikilla näillä soluilla on sama aineenvaihduntanopeus, he eivät muista geneettisellä tasolla, kuinka suuri isäntänsä todella on.

Mutta jos otamme elefantin tai hiiren täysimittaisena eläimenä, toimivana miljardeista soluista koostuvana ryhmänä, elefantin solut kuluttavat paljon vähemmän energiaa samaan toimintaan kuin hiiren solut. Aineenvaihduntalaki, nimeltään Kleiberin laki, sanoo, että nisäkkään aineenvaihduntatarpeet lisääntyvät suhteessa sen ruumiinpainoon kertoimella 0,74.

Tämä 0,74 on hyvin lähellä 0,77:ää, joka nähdään kaupungin huoltoasemien lukumäärää säätelevän lain yhteydessä. Yhteensattuma? Ehkä, mutta todennäköisesti ei.

Venäjällä suurimman kaupungin Moskovan väkiluku on virallisesti noin 11,5 miljoonaa ihmistä. Toisen kaupungin, Pietarin, väkiluku on 5,2 miljoonaa. Kuten näemme, näiden kahden kaupungin väkiluku vastaa suunnilleen "Zipfin lakia". Sen mukaan Venäjän kolmanneksi suurimmassa kaupungissa pitäisi olla noin 4 miljoonaa asukasta ja neljännessä noin 3 miljoonaa.Tällaisia ​​kaupunkeja Venäjällä ei kuitenkaan ole. Todellisuudessa Venäjän kolmannessa kaupungissa, Novosibirskissä, asuu 1,6 miljoonaa ihmistä (2,5 kertaa vähemmän kuin normaalisti) ja neljännessä, Jekaterinburgissa, 1,4 miljoonaa, mikä on myös 2 kertaa pienempi kuin Zipf-normi.

Miksi "Zipfin laki" ei toimi Venäjällä? Amerikkalainen sosiologi Richard Florida vastaa tähän kysymykseen kirjassaan The Creative Class. Hän kirjoittaa, että "Zipfin laki" ei toimi imperiumeissa (tai maissa, joissa imperiumit ovat romahtaneet) ja suunnitelmatalouksissa. Hän nimeää kolme tällaista maata - poikkeusta: Englanti (jossa Lontoon jälkeen ei ole edes toista kaupunkia, 2 kertaa pienempi väkiluku), Venäjä ja Kiina.

Myös Venäjän hallituksen alainen Finanssiyliopisto teki tutkimuksen "Zipfin laista". Sen johtopäätös oli tämä:

”Venäjän kaupunkien todellinen väestöjakauma ei täysin vastaa kehittyneiden tai kehitysmaiden Zipf-käyrää. Osa Venäjän todellisesta Zipf-käyrästä sijaitsee ideaalin yläpuolella, joka vastaa kaupunkien jakautumista kehittyneissä maissa, ja sen alapuolella oleva osa vastaa kehitysmaiden kaupunkien jakautumista. Siten Zipfin säännön mukaan käy ilmi, että Venäjällä suurimmat kaupungit ja yli miljoonakaupungit ovat hallitsevassa roolissa. Todellisen käyrän poikkeama ihanteesta johtuu maan laajasta alueesta ja erilaisista sosioekonomisista ja luonnollisista ilmastotekijöistä.

Kaksi megakaupunkia sekä pieniä ja keskisuuria kaupunkeja (jopa 250 000 ihmistä) sopivat täydellisesti länsimaisen kaupungistumisen tyyppiin. Mutta suuret kaupungit ja miljoonakaupungit eivät ole.

Toisen tutkimuksen tulokset:

”Paljastuneet trendit eivät vastaa kirjallisuudessa esitettyjä oletuksia, joiden mukaan syynä Venäjän poikkeamiseen Zipf-kuviosta on aluekehityksen keskitetty suunnittelu, joka sisälsi neuvostokauden keskisuurten ja pienten kaupunkien tukemisen. Markkinoille siirtymisen piti poistaa nämä vääristymät ja tuoda arvokokosuhde lähemmäksi kanonista muotoa, mutta huolimatta markkinamekanismien osallistumisesta taloudellisen toiminnan tilan muodostumiseen, siitä havaittiin poikkeama edelleen maa.


(Ympyrät osoittavat Venäjän alueiden väestön)

Nuo. "Zipfin laista" poikkeaminen Venäjällä ei ole seurausta suunnitelmataloudesta (kuten Kiinassa), vaan seurausta maan imperialismista (kun yksi tai kaksi kaupunkia toimii metropolina).

Näiden trendien perusteella kaupunkikehityksen/taantumisen todennäköisyys Venäjällä on seuraava:

Suurin osa Venäjän kaupungeista sijaitsee ihanteellisen Zipf-käyrän yläpuolella, joten odotettu trendi on keskisuurten ja pienten kaupunkien määrän ja väestön jatkuva väheneminen suuriin kaupunkeihin siirtymisen vuoksi.

— Yli 7 miljoonan kaupungin (Pietari, Novosibirsk, Jekaterinburg, Nižni Novgorod, Kazan, Tšeljabinsk, Omsk), jotka ovat ihanteellisen Zipf-käyrän alapuolella, on merkittävä väestönkasvureservi ja ne odottavat väestönkasvua.

— On olemassa riski luokan ensimmäisestä kaupungista (Moskova), koska toinen kaupunki (Pietari) ja sitä seuraavat suuret kaupungit ovat kaukana ihanteellisesta Zipf-käyrästä johtuen työvoiman kysynnän laskusta ja samalla kasvusta. elinkustannukset, mukaan lukien ennen kaikkea asunnon osto- ja vuokrakustannukset.

(Neuvostoliitossa "Zipfin laki" ei myöskään toiminut - näet kaupunkien poikkeaman Zipf-käyrästä, missä niiden olisi pitänyt olla)

Richard Florida kirjassaan The Creative Class panee merkille toisen eron amerikkalaisten ja venäläisten kaupunkien välillä. Yhdysvalloissa luova luokka on keskittynyt keskikokoisiin kaupunkeihin, jotka ovat hajallaan ympäri maata. Näin ollen suurin osuus luovasta luokasta sellaisissa kaupungeissa kuin San Jose, Boulder (Colorado), Huntsville (Alabama), Corvallis (Oregon) jne. - heillä tämä osuus on 40-48%. Mutta Yhdysvaltojen suurin kaupunki New York on luovan luokan osuudella mitattuna keskitalonpoikien joukossa - 35% työntekijöiden kokonaismäärästä ja 34. sijalla, maan toinen kaupunki, Los Angeles , on yleensä 60. Samanlainen suuntaus on havaittavissa muissa maissa, joissa "Zipfin laki" toimii (Saksa, Ranska, Italia, Ruotsi jne.).

Venäjällä lähes koko maan luova luokka on keskittynyt Moskovaan, kun taas muut kaupungit ovat edelleen 1900-luvun puolivälin teollisen ajan vyöhyke.

Kaikki tämä on hirveän jännittävää, mutta ehkä vähemmän salaperäistä kuin Zipfin laki. Ei ole niin vaikeaa ymmärtää, miksi kaupungin, joka on itse asiassa ekosysteemi, vaikkakin ihmisten rakentama, pitäisi noudattaa luonnon luonnonlakeja. Mutta Zipfin lailla ei ole luonnossa analogia. Tämä on yhteiskunnallinen ilmiö, ja sitä on tapahtunut vasta viimeisen sadan vuoden aikana.

Tiedämme vain, että Zipfin laki koskee muita sosiaalisia järjestelmiä, mukaan lukien taloudelliset ja kielelliset järjestelmät. Näin ollen ehkä on olemassa joitakin yleisiä sosiaalisia sääntöjä, jotka luovat tämän oudon lain, ja jonain päivänä voimme ymmärtää ne. Se, joka ratkaisee tämän pulman, saattaa löytää avaimen ennustaa paljon tärkeämpiä asioita kuin kaupunkien kasvu. Zipfin laki saattaa olla vain pieni osa sosiaalisen dynamiikan globaalia sääntöä, joka hallitsee tapaamme kommunikoida, käydä kauppaa, muodostaa yhteisöjä ja paljon muuta.

P.S. Henkilökohtaisesti minusta vaikuttaa siltä, ​​että lakia, jossa on noin likimääräisiä lukuoletuksia ja joukko poikkeuksia, on yleensä vaikea kutsua laiksi. Pelkkää sattumaa.

Mitä mieltä sinä olet?

lähteet

Hei! Viime aikoina kuulen yhä useammin kollegoilta TOR:n vaatimuksesta arvioida tekstin laatu Zipfin lain mukaisesti. Ja kaikki eivät ymmärrä kuinka muokata tämän lain tekstiä. Tämän päivän artikkelissa yritän kertoa sinulle kuinka parantaa parametria yksinkertaisimmalla tavalla, ja myös selventää, miksi hyvät kirjoittajat eivät todellakaan tarvitse sitä.

Voit määrittää tekstin laadun Zipf-lain mukaan useiden palveluiden avulla. Mutta mielestäni PR-CY on sopivin, se yhdistää oikean kaavan yksinkertaiseen ja ymmärrettävään käyttöliittymään. Sitä käytin tämän materiaalin valmistuksessa.

Mikä on Zipfin laki

Aluksi on syytä ymmärtää, mikä se on. Wikipedian mukaan Jean-Baptiste Estoux muotoili tämän mallin vuonna 1908, tämä laki viittasi alun perin pikakirjoitukseen. Ensimmäinen suuren yleisön tunteman säännönmukaisuuden sovellus liittyy demografiaan ja tarkemmin sanottuna väestön jakautumiseen kaupungeissa, jota käytti Felix Auerbach.

Malli sai nykyaikaisen nimensä vuonna 1949 kielitieteilijä George Zipfin ansiosta. Hän osoitti avullaan varallisuuden jakautumisen astetta väestön kesken. Ja vasta sitten lakia alettiin soveltaa tekstien luettavuuden määrittämiseen.

Miten se lasketaan

Jotta voit käyttää tätä lakia oikein, sinun on ymmärrettävä, miten se toimii. Analysoidaan laskennan kaava.

  • F on sanan käyttötiheys;
  • R on sarjanumero;
  • C on vakioarvo (luku, joka ilmaisee suurimman sanan toistojen lukumäärällä mitattuna).

Käytännössä toinen kaava osoittautuu kätevämmäksi, se näyttää selkeämmältä.

Tämä lähestymistapa on kätevämpi, koska meillä on tietoa yleisimmän sanan toistojen määrästä. Juuri tästä määrästä ne karkotetaan.

Yksinkertaistaaksemme tekstissämme toiseksi yleisimmän sanan tulisi olla kaksi kertaa harvinaisempi kuin ensimmäinen. Kolmannelle sijalle, kolme kertaa ja niin edelleen.

Esimerkki tekstin sovituksesta

Teoriaa on käsitelty vähän. Jäljelle jää harjoittelu. Kokeelliseksi tekstiksi otin artikkelin T-Zh:stä. Miksi sieltä? Kaikki on yksinkertaista. Tällä hetkellä tämä on yksi parhaista esimerkeistä monien rakastamasta infotyylistä. No, oli mielenkiintoista, mitä Maxim Iljahovin johdolla kirjoitettu teksti näyttäisi. Sanon heti, että tämän indikaattorin tekstit ovat tasolla, vaikka lapioittuani yli 40 sivustoa en löytänyt yhtään artikkelia, jolla olisi huono luonnollisuus. Lisäksi hyppään heti eteenpäin ja sanon, että kokeellinen teksti sovituksen jälkeen muuttui paljon huonommaksi, parantuneesta Zipf-pisteestä huolimatta ei kannata liikaa vaivata luonnollisuuden lisääntymistä.

Tämän analysaattori näytti meille tarkastuksen jälkeen.

Katsotaanpa mitä siellä on. Kuten näet, siellä on sarake, jossa on sanoja sekä käsittämättömiä numeroita. Sarake "esiintyminen" (1) osoittaa, kuinka monta kertaa sanamuodot esiintyvät tekstissä. Zipf-sarakkeessa (2) on suositeltu merkintöjen määrä. Markkerit 3 ja 4 merkitsevät ihanteellisia indikaattoreita toiselle ja kolmannelle sijalle. Sinun tulee myös kiinnittää huomiota suosituksiin, se osoittaa, kuinka monta sanaa sinun on poistettava täydellisen yhdistelmän saavuttamiseksi.

Paremman ymmärtämisen vuoksi analysoidaan, mitä analysaattori laski. Otamme perustana numeron 39 (C), tarvitsemme myös sarjanumeron, kiinnitä huomiota 2 (F) -asentoon. Otamme kaavan.

Korvaava.

F = 39/2 = 19,5

Pyöristämme ja saamme 20, tämä on tarvittava määrä esiintymiä. Tämän vahvistaa analysaattori. Maassamme toiseksi suosituinta sanaa käytetään 28 kertaa, vastaavasti 8 toistoa on poistettava tai korvattava.

Käsiteltyään lain periaatetta, alamme muokata. Tätä varten poistamme tai korvaamme synonyymeillä sanoja, joilla on enemmän esiintymiä kuin Zipf vaatii. Tuloksena saamme tämän kuvan.

Kuten näette, onnistuin nostamaan koron 83 prosentista 88 prosenttiin. Tekstin laatu kuitenkin kärsi huomattavasti. Sinun ei pitäisi pyrkiä nostamaan tätä lukua 100 prosenttiin. Itse asiassa, jos sinulla on jo 75%, tämä on erinomaista, eikä sinun pidä perverssiä enempää.

Hyödyllinen neuvo

Älä kiinnitä huomiota vain ensimmäisiin riveihin. Aloita sovittaminen listan viimeisistä paikoista, niillä on usein suurempi vaikutus kokonaispistemäärään kuin ensimmäisillä kymmenellä sanalla.

Zipf ja SEO

Siirrytään nyt siihen, miksi copywriterin on tiedettävä tämä malli. Hakukoneoptimoijat pyrkivät tilaaessaan tekstejä tekemään niistä hakukoneille sopivimmat. Uskotaan (vaikka ei ole selvää, kenen toimesta), että hakualgoritmit käyttävät aktiivisesti Zipf-lakia. Tätä väitettä on vaikea todistaa tai kumota. En löytänyt järkevää tutkimusta ja kokeilua tästä aiheesta.

Päätin tarkistaa asian itse. Tätä varten otin ongelman sellaiseen kilpailulliseen kyselyyn "muoviikkunat", Yandex otti Moskovan ongelman, minun piti loihtia Googlessa, ja hän näytti myös tunnistavan minut pääkaupungin asukkaaksi (ainakin hän näytti minulle mainos, jossa on Moskovan maantieteellinen sijainti). Otin numeron ensimmäisen sivun ja 49. sijan. Sellainen merkki osoittautui.

Jos katsot tarkemmin, voit nähdä, että Yandexissä tulos on tasaisempi, jos katsot tutkimaamme mallia. Mutta samaan aikaan korkeampi luku ei takaa voittoa taistelussa huipulta.

Tämän perusteella voidaan sanoa, että jos hakukoneet soveltavat tätä lakia, se on vain yksi tekijöistä. Eikä pääasiallinen.

löydöksiä

Se siitä. Nyt tiedät, mikä on tekstin laatu Zipfin lain mukaan, ja voit myös säätää tätä ilmaisinta. Itse asiassa tässä ei ole mitään monimutkaista, kaikki on melko yksinkertaista. Riittää, kun ymmärrät tämän säännöllisyyden toimintaperiaatteen kerran.

Viime vuosisadan ajan salaperäinen matemaattinen ilmiö nimeltä Zipfin laki on kyennyt ennustamaan tarkasti jättiläiskaupunkien koon ympäri maailmaa. Asia on siinä, että kukaan ei ymmärrä miten ja miksi tämä laki toimii...

Palataanpa vuoteen 1949. Kielitieteilijä George Zipf (Zipf) huomasi oudon suuntauksen ihmisten käyttäessä tiettyjä sanoja kielessä. Hän havaitsi, että pientä määrää sanoja käytetään jatkuvasti ja suurinta osaa - erittäin harvoin. Jos arvioimme sanoja suosion mukaan, paljastuu silmiinpistävä asia: ensimmäisen luokan sanaa käytetään aina kaksi kertaa useammin kuin toisen luokan sanaa ja kolme kertaa useammin kuin kolmannen luokan sanaa.
Zipf havaitsi, että sama sääntö pätee ihmisten tulojen jakautumiseen maassa: rikkaimmalla ihmisellä on kaksi kertaa enemmän rahaa kuin seuraavaksi rikkaimmalla ja niin edelleen.
Myöhemmin kävi selväksi, että tämä laki toimii myös kaupunkien koon suhteen. Minkään maan suurimman väkiluvun kaupunki on kaksi kertaa koko seuraavaksi suurin kaupunki ja niin edelleen. Uskomatonta, että Zipfin laki on toiminut ehdottomasti kaikissa maailman maissa viimeisen vuosisadan aikana.

Katsokaa vain Venäjän suurimpien kaupunkien määrää. Moskovan väkiluku on noin 2 kertaa suurempi kuin Pietarissa.
Paul Krugman, kirjoittaessaan Zipfin lain soveltamisesta kaupunkeihin, totesi tunnetusti, että talousteoriaa syytetään usein erittäin yksinkertaistettujen mallien luomisesta monimutkaisesta, kaoottisesta todellisuudesta. Zipfin laki osoittaa, että asia on juuri päinvastoin: käytämme liian monimutkaisia, sotkuisia malleja, ja todellisuus on hämmästyttävän siisti ja yksinkertainen.

voiman laki

Vuonna 1999 taloustieteilijä Xavier Gabet kirjoitti tieteellisen artikkelin, jossa hän kuvaili Zipfin lakia "voiman laiksi".
Gabet huomautti, että tämä laki säilyy, vaikka kaupungit kasvavat kaoottisella tavalla. Mutta tämä tasainen rakenne hajoaa heti, kun siirryt muihin kuin suurkaupunkikaupunkeihin. Pienet, noin 100 000 asukkaan kaupungit näyttävät noudattavan eri lakia ja osoittavan ymmärrettävämpää kokojakaumaa.

Voidaan ihmetellä, mitä tarkoitetaan termillä "kaupunki"? Loppujen lopuksi esimerkiksi Bostonia ja Cambridgeä pidetään kahtena eri kaupungina, aivan kuten San Francisco ja Auckland, joita erottaa vesi. Myös kahdella ruotsalaisella maantieteilijällä oli tämä kysymys, ja he alkoivat pohtia niin sanottuja "luonnollisia" kaupunkeja, joita yhdistävät väestö- ja tieyhteydet eivätkä poliittiset motiivit. Ja he havaitsivat, että jopa tällaiset "luonnolliset" kaupungit noudattavat Zipfin lakia.

Miksi Zipfin laki toimii kaupungeissa?

Joten mikä tekee kaupungeista niin ennustettavia väestön suhteen? Kukaan ei oikein osaa selittää sitä. Tiedämme, että kaupungit laajenevat maahanmuuton takia, maahanmuuttajat ryntäävät suuriin kaupunkeihin, koska siellä on enemmän mahdollisuuksia. Mutta maahanmuutto ei riitä selittämään tätä lakia.
On myös taloudellisia motiiveja, koska suuret kaupungit tienaavat paljon rahaa, ja Zipfin laki toimii myös tulonjaossa. Tämä ei kuitenkaan vielä anna selkeää vastausta kysymykseen.
Viime vuonna joukko tutkijoita havaitsi, että Zipfin laista on poikkeuksia: laki toimii vain, jos kyseessä olevat kaupungit ovat taloudellisesti yhteydessä toisiinsa. Tämä selittää, miksi laki pätee esimerkiksi yhteen Euroopan maahan, mutta ei koko EU:hun.

Miten kaupungit kasvavat?

On toinenkin outo sääntö, joka koskee kaupunkeja ja liittyy siihen, kuinka kaupungit kuluttavat resursseja kasvaessaan. Kun kaupungit kasvavat, ne muuttuvat vakaammiksi. Jos esimerkiksi kaupunki kaksinkertaistuu, sen tarvitsemien huoltoasemien määrä ei kaksinkertaistu.
Kaupunki elää varsin mukavasti, jos huoltoasemien määrä kasvaa noin 77 %. Vaikka Zipfin laki noudattaa tiettyjä sosiaalisia lakeja, tämä laki liittyy läheisemmin luontoon, kuten siihen, kuinka eläimet kuluttavat energiaa vanhetessaan.

Matemaatikko Stephen Strogatz kuvailee sitä näin:
Kuinka monta kaloria päivässä hiiri tarvitsee verrattuna norsuun? Molemmat ovat nisäkkäitä, joten voidaan olettaa, että solutasolla niiden ei pitäisi olla kovin erilaisia. Todellakin, jos kymmenen eri nisäkkään soluja kasvatetaan laboratoriossa, kaikilla näillä soluilla on sama aineenvaihduntanopeus, he eivät muista geneettisellä tasolla, kuinka suuri isäntänsä todella on.
Mutta jos otamme elefantin tai hiiren täysimittaisena eläimenä, toimivana miljardeista soluista koostuvana ryhmänä, elefantin solut kuluttavat paljon vähemmän energiaa samaan toimintaan kuin hiiren solut. Aineenvaihduntalaki, nimeltään Kleiberin laki, sanoo, että nisäkkään aineenvaihduntatarpeet lisääntyvät suhteessa sen ruumiinpainoon kertoimella 0,74. Tämä 0,74 on hyvin lähellä 0,77:ää, joka nähdään kaupungin huoltoasemien lukumäärää säätelevän lain yhteydessä.
Yhteensattuma? Ehkä, mutta todennäköisesti ei.
Kaikki tämä on hirveän jännittävää, mutta ehkä vähemmän salaperäistä kuin Zipfin laki. Ei ole niin vaikeaa ymmärtää, miksi kaupungin, joka on itse asiassa ekosysteemi, vaikkakin ihmisten rakentama, pitäisi noudattaa luonnon luonnonlakeja. Mutta Zipfin lailla ei ole luonnossa analogia. Tämä on yhteiskunnallinen ilmiö, ja sitä on tapahtunut vasta viimeisen sadan vuoden aikana.
Tiedämme vain, että Zipfin laki koskee muita sosiaalisia järjestelmiä, mukaan lukien taloudelliset ja kielelliset järjestelmät. Näin ollen ehkä on olemassa joitakin yleisiä sosiaalisia sääntöjä, jotka luovat tämän oudon lain, ja jonain päivänä voimme ymmärtää ne. Se, joka ratkaisee tämän pulman, saattaa löytää avaimen ennustaa paljon tärkeämpiä asioita kuin kaupunkien kasvu. Zipfin laki saattaa olla vain pieni osa sosiaalisen dynamiikan globaalia sääntöä, joka hallitsee tapaamme kommunikoida, käydä kauppaa, muodostaa yhteisöjä ja paljon muuta.