Das Zipfsche Gesetz: Was es ist und warum es funktioniert. Das Gesetz von Zipf und die fraktale Natur sozialer und wirtschaftlicher Phänomene

Wörter einer natürlichen Sprache: Wenn alle Wörter einer Sprache (oder nur ein ausreichend langer Text) nach absteigender Häufigkeit ihrer Verwendung geordnet sind, dann die Häufigkeit n-te Wort in einer solchen Liste ist ungefähr umgekehrt proportional zu seiner Ordnungszahl n(die sogenannte Rang dieses Wortes siehe Ordnungsskala). Beispielsweise ist das am zweithäufigsten verwendete Wort etwa zweimal seltener als das erste, das dritte dreimal seltener als das erste und so weiter.

Geschichte der Schöpfung[ | ]

Der Autor der Entdeckung des Musters ist ein französischer Stenograph (fr. Jean Baptiste Estoup), der es 1908 in The Range of Shorthand beschrieb. Das Gesetz wurde erstmals 1913 vom deutschen Physiker Felix Auerbach in seiner Arbeit „Das Gesetz der Bevölkerungskonzentration“ zur Beschreibung der Verteilung von Stadtgrößen angewendet und ist nach dem amerikanischen Linguisten George Zipf benannt, der dieses Muster 1949 aktiv populär machte und als erster vorschlug damit die Verteilung der wirtschaftlichen Kräfte und des sozialen Status zu beschreiben.

Eine Erklärung des Zipfschen Gesetzes basierend auf den Korrelationseigenschaften additiver Markov-Ketten (mit Stufenspeicherfunktion) wurde 2005 gegeben.

Das Zipfsche Gesetz wird mathematisch durch die Pareto-Verteilung beschrieben. Es ist eines der Grundgesetze der Infometrie.

Anwendungen des Gesetzes[ | ]

George Zipf zeigte 1949 erstmals die Einkommensverteilung der Menschen nach ihrer Körpergröße: Der Reichste hat doppelt so viel Geld wie der Nächstreichste und so weiter. Diese Aussage bewahrheitete sich für eine Reihe von Ländern (England, Frankreich, Dänemark, Holland, Finnland, Deutschland, USA) im Zeitraum von 1926 bis 1936.

Dieses Gesetz funktioniert auch in Bezug auf die Verteilung des Städtesystems: Die Stadt mit der größten Bevölkerung in einem Land ist doppelt so groß wie die nächstgrößte Stadt und so weiter. Ordnet man in der Liste alle Städte eines bestimmten Landes nach absteigender Einwohnerzahl an, dann kann jeder Stadt ein bestimmter Rang, also die Zahl, die sie in dieser Liste erhält, zugeordnet werden. Gleichzeitig gehorchen Bevölkerungsgröße und Rang einem einfachen Muster, das durch die Formel ausgedrückt wird:

Pn = P1 / n (\displaystyle P_(n)=P_(1)/n),

wo Pn (\displaystyle P_(n))- Stadtbevölkerung n-ter Rang; P1 (\displaystyle P_(1))- Bevölkerung der Hauptstadt des Landes (1. Rang).

Empirische Studien stützen diese Behauptung.

1999 beschrieb der Ökonom Xavier Gabet das Zipfsche Gesetz als Beispiel für ein Potenzgesetz: Wenn Städte zufällig mit der gleichen Standardabweichung wachsen, dann konvergiert die Verteilung am Limit gegen das Zipfsche Gesetz.

Nach den Erkenntnissen von Forschern in Bezug auf die städtische Besiedlung in der Russischen Föderation gemäß dem Zipf-Gesetz:

  • Die meisten Städte in Russland liegen oberhalb der idealen Zipf-Kurve, daher ist der erwartete Trend ein anhaltender Rückgang der Zahl und Bevölkerung mittlerer und kleiner Städte aufgrund der Abwanderung in die Großstädte.
  • entsprechend haben über 7 Millionen Städte (St. Petersburg, Nowosibirsk, Jekaterinburg, Nischni Nowgorod, Kasan, Tscheljabinsk, Omsk), die unterhalb der idealen Zipf-Kurve liegen, eine erhebliche Bevölkerungswachstumsreserve und erwarten ein Bevölkerungswachstum;
  • Es bestehen Abwanderungsrisiken der ersten Stadt im Rang (Moskau), da die zweite Stadt (St. Petersburg) und nachfolgende Großstädte aufgrund eines Rückgangs der Nachfrage nach Arbeitskräften bei gleichzeitigem Anstieg der ZIPF-Kurve weit hinter der idealen Zipf-Kurve zurückbleiben Lebenshaltungskosten, darunter vor allem die Kosten für Kauf und Mietwohnungen.

Kritik [ | ]

US-amerikanischer Bioinformatiker schlugen eine statistische Erklärung des Zipfschen Gesetzes vor und bewiesen, dass eine zufällige Folge von Zeichen auch diesem Gesetz gehorcht. Der Autor kommt zu dem Schluss, dass das Zipfsche Gesetz offenbar ein rein statistisches Phänomen ist, das nichts mit der Semantik des Textes zu tun hat und einen oberflächlichen Bezug zur Linguistik hat.

Während des Wahlvorgangs drücken die Wähler ihre Haltung gegenüber bestimmten politischen Persönlichkeiten oder Parteien aus, indem sie ihre Stimme für diesen oder jenen Kandidaten oder diese Partei abgeben. Es stellt sich die Frage – gibt es Muster, die die Stimmenverteilung zwischen verschiedenen Kandidaten oder Parteien beschreiben? Liegen keine Regelmäßigkeiten vor, so ist eine Korrelation zwischen den Stimmenzahlen der Kandidaten oder Parteien sowie zwischen diesen Stimmenzahlen und beispielsweise der Wahlbeteiligung oder der Zahl der ungültigen Stimmzettel möglich. Gibt es bestimmte Muster in der Stimmenverteilung, dann sind nicht alle Varianten ihrer Verteilung möglich. Auf der Grundlage des Materials vieler Wahlen in verschiedenen Ländern wurde ein statistischer Zusammenhang festgestellt, der zwischen den Stimmenzahlen verschiedener Kandidaten und Parteien bei Wahlen besteht. Es wurde festgestellt, dass diese Beziehung durch die folgende einfache Beziehung beschrieben wird:

Trägt man auf der einen Achse logarithmisch die Stimmenzahl N(i) jedes Kandidaten auf und auf der anderen Achse ebenfalls logarithmisch den Platz i, den derselbe Kandidat bei der Wahl einnimmt, dann die Punkte mit hinreichender Näherung erhalten werden, liegen entlang einer Geraden :

ln N(i) = A - B x lni (1)

Die Gültigkeit der obigen Gleichung wurde in einer Reihe von Arbeiten russischer Spezialisten für mathematische Politikwissenschaft (Sobyanin, Sukhovolsky, 1995) bestätigt, die die Ergebnisse der Wahlen der Volksdeputierten Russlands im Jahr 1990, der Wahlen des russischen Präsidenten, analysierten in den Jahren 1991 und 1996 sowie Daten zu Wahlen in einer Reihe von Ländern, beginnend mit der Wahl des französischen Präsidenten 1848, bei der Louis-Napoleon Bonaparte gewann.

Dieses mathematische Ergebnis ist nicht trivialer Natur. Fachleuten – Physikern, Chemikern, Metallurgen, Demografen, Ökologen und Vertretern vieler anderer Wissensgebiete, die sich mit großen Mengen statistischer Daten befassen, ist bewusst, dass die angegebene numerische Regelmäßigkeit allgemeiner Natur ist und eine Situation des „freien Wettbewerbs“ beschreibt die Verteilung einer endlichen Anzahl von oder bedingten "Gütern". Es stellt sich heraus, dass alle denkbare Vielfalt von Objekten, Situationen und kausalen Zusammenhängen nichts an dieser Abhängigkeit ändert: Sobald es freie Konkurrenz gibt, passen ihre Ergebnisse ohnehin auf die „logarithmische Gerade“ – nur die Konstante A und die Steigung der Geraden B. Und umgekehrt: Sobald es zu Abweichungen von den Bedingungen des freien Wettbewerbs kommt, weichen die Punkte zwangsläufig von der Geraden ab – und je weiter, desto stärker die „Unfreiheitsfaktoren“. So führt beispielsweise der "Konkurrenzkampf" der Städte um die Anzahl der in ihnen lebenden Menschen in zivilisierten Ländern zu einer solchen Abhängigkeit. Unterdessen wichen in der UdSSR Städte wie Moskau, Leningrad und einige andere Zentren erheblich vom "direkten freien Wettbewerb" ab - aufgrund von administrativen Beschränkungen im Zusammenhang mit dem Passregime. In ähnlicher Weise führt der freie Wettbewerb zu demselben Verhältnis zwischen der Größe der größten Vermögen und dem "Platz", den ihre Besitzer in der Liste solcher Vermögen einnehmen - natürlich in den Teilen der Welt, in denen solche Listen existieren. Genau das gleiche ist den Zoologen für die Massenverteilung von Raubtieren (in Abwesenheit anthropogener Faktoren) und so weiter bekannt.

Regelmäßigkeiten dieser Art wurden erstmals von dem italienischen Soziologen und Mathematiker V. Pareto festgestellt, der sich mit der Verteilung der Einwohner des Landes nach ihrem Vermögen beschäftigte; später hat der amerikanische Linguist J.K. Zipf, Untersuchung der Verteilung der Häufigkeit der Verwendung von Wörtern in Texten. Verschiedene Varianten des oben beschriebenen Verhältnisses werden als Zipf-Pareto-Gesetz bezeichnet. Analysemethoden im Zusammenhang mit der Untersuchung von Rangverteilungen werden in der Linguistik, Szientometrie und Ökologie häufig verwendet. Die Einhaltung von Beziehung (1) für das Wahlverfahren bedeutet, dass es einen "freien Wettbewerb" aller Kandidaten gibt, die die Möglichkeit haben, ihre politischen Ansichten und ihr politisches Programm den Wählern frei zu erklären.

Die Erfüllung des Zipf-Pareto-Gesetzes für den Wahlprozess bedeutet, dass jeder der Kandidaten, jede der Parteien und politischen Wählergruppen, die nach einem bestimmten Typ wählen, eine eigene politische Plattform hat, die sich nicht mit allen anderen überschneidet. Verfügbare Kandidaten sollten alle möglichen Präferenzen der Wähler abdecken; dann ist der Anteil der Wähler, die ihre Wahl außerhalb der vorgeschlagenen Kandidatenliste suchen, recht gering, und Gleichung (1) beschreibt die Stimmenverteilung mit hoher Genauigkeit. Andernfalls können leere "Nischen" in der Verteilung (1) auftreten, und die gesamte Analyse wird komplizierter.

Die in Gleichung (1) enthaltenen Parameter A und B werden basierend auf Daten über die Anzahl der Wähler, die für verschiedene Kandidaten oder für verschiedene politische Gruppen gestimmt haben, unter Verwendung von Regressionsanalyseverfahren berechnet. Parameter A in Gleichung (1) ist der Logarithmus der Anzahl der Wähler, die für den Spitzenkandidaten gestimmt haben. Der Wert B, der Präferenzkoeffizient, charakterisiert die Steigung der Geraden (1) und dient als numerisches Maß für die Homogenität der Wählerauswahl. Wenn B = 0, bedeutet dies, dass die Wähler keine Partei oder einen Kandidaten gegenüber einer anderen bevorzugen und dass sie alle die gleiche Anzahl von Stimmen bei der Wahl erhalten haben. Im Gegensatz dazu erhalten die Außenseiterparteien bei großen Werten der Steilheit B sehr wenige Stimmen im Vergleich zu den führenden Parteien (in der Praxis ist der Parameter B jedoch fast nie größer als eins). Werden Abweichungen von der Geraden vom Typ (1) festgestellt, so deutet dies unter den oben getroffenen Annahmen auf das Fehlen von Bedingungen für freien politischen Wettbewerb hin. Dies kann entweder durch das Vorhandensein einiger zusätzlicher externer Faktoren verursacht werden, z. B. Einschüchterung von Wählern durch mögliche politische und wirtschaftliche Repressionen im Falle der Stimmabgabe (oder Nichtwahl) für einen bestimmten Kandidaten, oder durch direkte Fälschung von Wahlergebnissen während der Wahl die Auszählung von Stimmen in Wahlkommissionen verschiedener Ebenen. Abbildung 2 zeigt eine typische Grafik der Rangverteilung der Wählerzahlen bei Wahlen in Russland. Wie man sieht, besteht zwischen der Größe verschiedener Wählergruppen und den Rängen dieser Gruppen (also den Plätzen der Kandidaten) in logarithmischen Koordinaten (entlang beider Achsen) praktisch ein linearer Zusammenhang.

Die Art der Verteilung der abgegebenen Stimmen auf unterschiedliche Kandidaten oder Parteien hilft, Wahlbetrug zu erkennen. Wird im einfachsten Fall einer Fälschung eine bestimmte Anzahl von Stimmzetteln zugunsten eines Kandidaten oder einer Partei in die Wahlurnen geworfen, so stellt sich heraus, dass die Rangverteilung der abgegebenen Stimmenzahl für einzelne Kandidaten nicht geradlinig abgebildet wird. Zieht man aber die Daten des Kandidaten heraus, zu dessen Gunsten gefälscht wurde, dann entspricht die Rangverteilung für die übrigen Kandidaten (bzw. Parteien) der theoretischen. Im betrachteten Fall kann die Zahl der abgegebenen Stimmzettel aus der Differenz zwischen der Zahl der Stimmen, die ein solcher Kandidat nach offiziellen Angaben erhalten hat, und der Zahl geschätzt werden, die sich aus der Rangverteilungsgleichung ergibt, nachdem die Daten, die sich auf diesen Kandidaten beziehen, ausgeschlossen wurden. Abbildung 3 zeigt die nach Angaben der Wahlkommission abgegebene Stimmenverteilung der Kandidaten für das Amt des Leiters der Verwaltung des Gebiets Lipezk bei den im Frühjahr 1993 abgehaltenen Wahlen. Diese Verteilung ist offensichtlich weit von einer geraden Linie entfernt. In diesem Fall bestätigte der Prozess, der 1995 stattfand, das Vorliegen von Fälschungen zugunsten des Erstplatzierten.

Warum funktioniert Zipfs Gesetz in Russland nicht? 11. März 2017

Das Zipfsche Gesetz wurde erstmals 1913 vom deutschen Physiker Felix Auerbach in seiner Arbeit The Law of Population Concentration zur Beschreibung der Größenverteilung von Städten angewendet. Es trägt den Namen des amerikanischen Linguisten George Zipf, der dieses Muster 1949 aktiv populär machte und erstmals vorschlug, es zur Beschreibung der Verteilung von wirtschaftlicher Macht und sozialem Status zu verwenden.

In Russland funktioniert dieses Gesetz nicht.


Gehen wir zurück ins Jahr 1949. Der Linguist George Zipf (Zipf) bemerkte einen seltsamen Trend in der Verwendung bestimmter Wörter in der Sprache. Er stellte fest, dass eine kleine Anzahl von Wörtern ständig verwendet wird und die überwiegende Mehrheit sehr selten verwendet wird. Wenn wir Wörter nach Beliebtheit auswerten, zeigt sich Auffälliges: Das Wort des ersten Ranges wird immer doppelt so oft verwendet wie das Wort des zweiten Ranges und dreimal häufiger als das Wort des dritten Ranges.

Zipf fand heraus, dass für die Einkommensverteilung in einem Land die gleiche Regel gilt: Der Reichste hat doppelt so viel Geld wie der Nächstreichste und so weiter.

Später wurde klar, dass dieses Gesetz auch in Bezug auf die Größe von Städten funktioniert. Die Stadt mit der größten Bevölkerung in einem beliebigen Land ist doppelt so groß wie die nächstgrößte Stadt und so weiter. Unglaublicherweise hat Zipfs Gesetz im letzten Jahrhundert in absolut allen Ländern der Welt funktioniert.

Werfen Sie einfach einen Blick auf die Liste der größten Städte in den Vereinigten Staaten. Laut der Volkszählung von 2010 beträgt die Einwohnerzahl der größten US-Stadt New York also 8.175.133 Menschen. Nummer zwei ist Los Angeles mit 3.792.621 Einwohnern. Die nächsten drei Städte Chicago, Houston und Philadelphia haben jeweils 2.695.598, 2.100.263 und 1.526.006 Einwohner. Offensichtlich sind diese Zahlen ungenau, aber sie stimmen dennoch überraschenderweise mit Zipfs Gesetz überein.

Paul Krugman, der über die Anwendung von Zipfs Gesetz auf Städte schrieb, bemerkte bekanntermaßen, dass der Wirtschaftstheorie oft vorgeworfen wird, stark vereinfachte Modelle einer komplexen, chaotischen Realität zu schaffen. Das Zipfsche Gesetz zeigt, dass genau das Gegenteil der Fall ist: Wir verwenden zu komplexe, chaotische Modelle, und die Realität ist erstaunlich übersichtlich und einfach.

Gesetz der Stärke

1999 schrieb der Ökonom Xavier Gabet eine wissenschaftliche Arbeit, in der er das Zipfsche Gesetz als „das Gesetz der Kraft“ beschrieb.

Gabet merkte an, dass dieses Gesetz auch dann bestehen bleibt, wenn Städte chaotisch wachsen. Diese gleichmäßige Struktur bricht jedoch zusammen, sobald Sie sich in nicht-metropolische Städte bewegen. Kleinstädte mit etwa 100.000 Einwohnern scheinen einer anderen Gesetzmäßigkeit zu folgen und zeigen eine verständlichere Größenverteilung.

Man könnte sich fragen, was mit dem Begriff „Stadt“ gemeint ist? Schließlich gelten zum Beispiel Boston und Cambridge als zwei verschiedene Städte, genau wie San Francisco und Auckland, die durch Wasser getrennt sind. Diese Frage hatten auch zwei schwedische Geographen, und sie begannen, die sogenannten "natürlichen" Städte zu betrachten, die durch Bevölkerung und Straßenverbindungen und nicht durch politische Motive verbunden sind. Und sie fanden heraus, dass selbst solche "natürlichen" Städte Zipfs Gesetz gehorchen.


Warum funktioniert Zipfs Gesetz in Städten?

Was also macht Städte in Bezug auf die Bevölkerung so vorhersehbar? Niemand kann es wirklich erklären. Wir wissen, dass Städte aufgrund von Einwanderung expandieren, Einwanderer strömen in große Städte, weil es mehr Möglichkeiten gibt. Aber Einwanderung reicht nicht aus, um dieses Gesetz zu erklären.

Es gibt auch wirtschaftliche Motive, da große Städte viel Geld verdienen und das Zipfsche Gesetz auch für die Einkommensverteilung funktioniert. Damit ist die Frage aber noch nicht eindeutig beantwortet.

Im vergangenen Jahr fand eine Gruppe von Forschern heraus, dass es Ausnahmen von Zipfs Gesetz gibt: Das Gesetz funktioniert nur, wenn die betreffenden Städte wirtschaftlich miteinander verbunden sind. Das erklärt, warum das Gesetz beispielsweise für ein einzelnes europäisches Land gilt, aber nicht für die gesamte EU.

Wie wachsen Städte?

Es gibt eine weitere seltsame Regel, die für Städte gilt und damit zu tun hat, wie Städte beim Wachstum Ressourcen verbrauchen. Wenn Städte wachsen, werden sie stabiler. Wenn sich beispielsweise eine Stadt verdoppelt, verdoppelt sich die Anzahl der benötigten Tankstellen nicht.

Die Stadt wird ziemlich komfortabel leben, wenn die Zahl der Tankstellen um etwa 77% steigt. Während das Gesetz von Zipf bestimmten sozialen Gesetzen folgt, ist dieses Gesetz enger mit der Natur verbunden, z. B. wie Tiere mit zunehmendem Alter Energie verbrauchen.

Der Mathematiker Stephen Strogatz beschreibt es so:

Wie viele Kalorien pro Tag braucht eine Maus im Vergleich zu einem Elefanten? Beide sind Säugetiere, daher ist davon auszugehen, dass sie auf zellulärer Ebene nicht sehr unterschiedlich sein sollten. In der Tat, wenn Zellen von zehn verschiedenen Säugetieren in einem Labor gezüchtet werden, haben alle diese Zellen die gleiche Stoffwechselrate, sie erinnern sich auf genetischer Ebene nicht daran, wie groß ihr Wirt wirklich ist.

Aber wenn wir einen Elefanten oder eine Maus als vollwertiges Tier betrachten, eine funktionierende Ansammlung von Milliarden von Zellen, dann werden die Zellen des Elefanten viel weniger Energie für die gleiche Aktion aufwenden als die Zellen einer Maus. Das Stoffwechselgesetz, Kleibersches Gesetz genannt, besagt, dass der Stoffwechselbedarf eines Säugetiers proportional zu seinem Körpergewicht um den Faktor 0,74 ansteigt.

Dieser Wert von 0,74 liegt sehr nahe an dem Wert von 0,77, der durch das Gesetz über die Anzahl der Tankstellen in der Stadt erreicht wird. Zufall? Vielleicht, aber höchstwahrscheinlich nicht.

In Russland beträgt die Einwohnerzahl der größten Stadt Moskau offiziell etwa 11,5 Millionen Menschen. Die Einwohnerzahl der zweitgrößten Stadt, St. Petersburg, beträgt 5,2 Mio. Wie wir sehen, entspricht das Bevölkerungsverhältnis der beiden Städte in etwa dem „Zipfschen Gesetz“. Demnach soll die drittgrößte Stadt Russlands etwa 4 Millionen Einwohner haben und die viertgrößte Stadt etwa 3 Millionen, aber solche Städte gibt es in Russland nicht. In Wirklichkeit hat die drittgrößte Stadt Russlands, Nowosibirsk, 1,6 Millionen Einwohner (2,5-mal weniger als die Norm) und die vierte, Jekaterinburg, 1,4 Millionen, was ebenfalls 2-mal weniger als die Zipf-Norm ist.

Warum funktioniert das "Zipfsche Gesetz" in Russland nicht? Diese Frage beantwortet der amerikanische Soziologe Richard Florida in seinem Buch The Creative Class. Er schreibt, dass „Zipfs Gesetz“ in Imperien (oder Ländern, die rückfällige Imperien haben) und Planwirtschaften nicht funktioniert. Er nennt drei solche Länder-Ausnahmen: England (wo es nach London nicht einmal eine zweite Stadt gibt, die doppelt so viele Einwohner hat), Russland und China.

Eine Studie über das „Zipf-Gesetz“ wurde auch von der Finanzuniversität unter der Regierung Russlands durchgeführt. Seine Schlussfolgerung lautete:

„Die reale Verteilung der russischen Städte nach Bevölkerung entspricht nicht vollständig der Zipf-Kurve für Industrie- oder Entwicklungsländer. Ein Teil der realen Zipf-Kurve für Russland liegt über der idealen, was der Verteilung von Städten in entwickelten Ländern entspricht, und der Teil darunter entspricht der Verteilung von Städten in Entwicklungsländern. So stellt sich nach Zipfs Regel heraus, dass in Russland die größten Städte und Millionenstädte die dominierende Rolle spielen. Die Abweichung der realen Kurve vom Ideal ist auf das riesige Territorium des Landes und verschiedene sozioökonomische und natürlich-klimatische Faktoren zurückzuführen.

Zwei Megacitys und kleine und mittlere Städte (bis zu 250.000 Einwohner) passen perfekt in die Art der westlichen Urbanisierung. Aber Großstädte und Millionenstädte sind es nicht.

Erkenntnisse aus einer anderen Studie:

„Die aufgedeckten Trends entsprechen nicht den in der Literatur geäußerten Annahmen, dass der Grund für die Abweichung Russlands vom Zipf-Muster in der zentralisierten Planung der Raumentwicklung liegt, die die Unterstützung von Mittel- und Kleinstädten während der Sowjetzeit beinhaltete. Der Übergang zum Markt sollte diese Verzerrungen beseitigen und das Rang-Größen-Verhältnis der kanonischen Form näher bringen, jedoch wurde trotz der Einbeziehung von Marktmechanismen in die Bildung eines Raums für wirtschaftliche Aktivität eine weitere Abweichung davon beobachtet das Land.


(Die Kreise geben die Bevölkerung der Regionen Russlands an)

Jene. Die Abweichung vom "Zipfschen Gesetz" ist in Russland nicht das Ergebnis einer Planwirtschaft (wie in China), sondern eine Folge des Imperialismus des Landes (wenn ein oder zwei Städte die Rolle einer Metropole spielen).

Basierend auf diesen Trends ist die Wahrscheinlichkeit einer Stadtentwicklung/-regression in Russland wie folgt:

Die meisten russischen Städte liegen oberhalb der idealen Zipf-Kurve, sodass der erwartete Trend ein anhaltender Rückgang der Zahl und Bevölkerung von Mittel- und Kleinstädten aufgrund der Abwanderung in Großstädte ist.

— Mehr als 7 Millionen Städte (St. Petersburg, Nowosibirsk, Jekaterinburg, Nischni Nowgorod, Kasan, Tscheljabinsk, Omsk), die unterhalb der idealen Zipf-Kurve liegen, haben eine erhebliche Reserve an Bevölkerungswachstum und erwarten ein Bevölkerungswachstum.

— Es besteht die Gefahr der Entvölkerung der ersten Stadt im Rang (Moskau), da die zweite Stadt (St. Petersburg) und nachfolgende Großstädte aufgrund eines Rückgangs der Nachfrage nach Arbeitskräften bei gleichzeitigem Anstieg weit hinter der idealen Zipf-Kurve zurückbleiben die Lebenshaltungskosten, darunter vor allem die Kosten für den Kauf und die Anmietung einer Wohnung.

(In der UdSSR hat das "Zipf-Gesetz" auch nicht funktioniert - Sie können die Abweichung der Städte von der Zipf-Kurve sehen, wo sie hätten sein sollen)

Richard Florida stellt in The Creative Class einen weiteren Unterschied zwischen amerikanischen und russischen Städten fest. In den Vereinigten Staaten konzentriert sich die kreative Klasse auf mittelgroße Städte, die über das ganze Land verstreut sind. So ist der höchste Anteil der kreativen Klasse in Städten wie San Jose, Boulder (Colorado), Huntsville (Alabama), Corvallis (Oregon) etc. - bei ihnen beträgt dieser Anteil 40-48%. Aber die größte Stadt der Vereinigten Staaten, New York, gehört in Bezug auf den Anteil der kreativen Klasse zu den Mittelbauern - 35% der Gesamtzahl der Beschäftigten und Platz 34 in der Rangliste, die zweitgrößte Stadt des Landes, Los Angeles , ist in der Regel 60. Ein ähnlicher Trend ist in anderen Ländern zu beobachten, in denen das „Zipfsche Gesetz“ funktioniert (Deutschland, Frankreich, Italien, Schweden usw.).

In Russland konzentriert sich fast die gesamte kreative Klasse des Landes in Moskau, während der Rest der Städte die Zone der Industriezeit der Mitte des 20. Jahrhunderts bleibt.

All dies ist furchtbar aufregend, aber vielleicht weniger mysteriös als Zipfs Gesetz. Es ist nicht so schwer zu verstehen, warum eine Stadt, die eigentlich ein Ökosystem ist, wenn auch von Menschen gebaut, den natürlichen Naturgesetzen gehorchen sollte. Aber Zipfs Gesetz hat kein Analogon in der Natur. Dies ist ein soziales Phänomen, das erst in den letzten hundert Jahren stattgefunden hat.

Alles, was wir wissen, ist, dass das Gesetz von Zipf auch für andere soziale Systeme gilt, einschließlich wirtschaftlicher und sprachlicher Systeme. Vielleicht gibt es also einige allgemeine soziale Regeln, die dieses seltsame Gesetz schaffen, und eines Tages werden wir in der Lage sein, sie zu verstehen. Wer dieses Rätsel löst, findet möglicherweise den Schlüssel, um viel wichtigere Dinge vorherzusagen als das Wachstum von Städten. Zipfs Gesetz ist möglicherweise nur ein kleiner Aspekt der globalen Regel der sozialen Dynamik, die regelt, wie wir kommunizieren, Handel treiben, Gemeinschaften bilden und vieles mehr.

P.S. Mir persönlich scheint es, dass ein Gesetz mit solch ungefähren Annahmen für Zahlen und einer Reihe von Ausnahmen im Allgemeinen schwer als Gesetz zu bezeichnen ist. Nur ein zufälliger Zufall.

Was denkst du?

Quellen

Hallo! In letzter Zeit höre ich immer öfter von Kollegen von der Forderung im TOR, die Qualität des Textes nach dem Zipfschen Gesetz zu bewerten. Und nicht jeder versteht, wie man den Text für dieses Gesetz bearbeitet. Im heutigen Artikel werde ich versuchen, Ihnen zu erklären, wie Sie den Parameter auf einfachste Weise verbessern können, und auch klären, warum gute Autoren ihn nicht wirklich brauchen.

Über mehrere Dienste können Sie die Qualität des Textes nach dem Zipf-Gesetz ermitteln. Aber ich denke, PR-CY ist am besten geeignet, es kombiniert die richtige Formel mit einer einfachen und verständlichen Oberfläche. Das habe ich bei der Vorbereitung dieses Materials verwendet.

Was ist das Zipfsche Gesetz?

Zunächst lohnt es sich zu verstehen, was es ist. Laut Wikipedia hat Jean-Baptiste Estoux dieses Muster 1908 formuliert, dieses Gesetz bezog sich ursprünglich auf Kurzschrift. Die erste allgemein bekannte Anwendung der Regularität bezieht sich auf die Demographie, genauer gesagt auf die Verteilung der Bevölkerung in Städten, wurde von Felix Auerbach verwendet.

Seinen heutigen Namen erhielt das Muster 1949 durch den Linguisten George Zipf. Er zeigte mit seiner Hilfe die Abstufung der Vermögensverteilung in der Bevölkerung. Und erst dann wurde das Gesetz angewendet, um die Lesbarkeit von Texten zu bestimmen.

Wie wird es berechnet

Um dieses Gesetz richtig anzuwenden, müssen Sie verstehen, wie es funktioniert. Lassen Sie uns die Formel für die Berechnung analysieren.

  • F ist die Häufigkeit der Verwendung des Wortes;
  • R ist die Seriennummer;
  • C ist ein konstanter Wert (eine Zahl, die das größte Wort in Bezug auf die Anzahl der Wiederholungen angibt).

In der Praxis erweist sich eine andere Formel als bequemer, sie sieht übersichtlicher aus.

Dieser Ansatz ist bequemer, da wir Daten über die Anzahl der Wiederholungen des häufigsten Wortes haben. Von dieser Menge werden sie abgestoßen.

Zur Vereinfachung soll in unserem Text das zweithäufigste Wort doppelt so selten sein wie das erste. Dreimal Dritter werden und so weiter.

Beispiel für die Textanpassung

Die Theorie wurde ein wenig abgehandelt. Es bleibt, sich mit der Praxis zu befassen. Als experimentellen Text habe ich einen Artikel von T-Zh genommen. Warum von dort? Alles ist einfach. Im Moment ist dies eines der besten Beispiele für den von vielen geliebten Info-Stil. Nun, es war interessant, was der unter der Leitung von Maxim Ilyakhov geschriebene Text zeigen würde. Ich werde gleich sagen, dass die Texte für diesen Indikator auf dem Niveau sind, obwohl ich, nachdem ich mehr als 40 Websites geschaufelt hatte, überhaupt keinen einzigen Artikel mit schlechter Natürlichkeit gefunden habe. Außerdem greife ich gleich vor und sage, dass der experimentelle Text nach dem Fitting deutlich schlechter geworden ist, trotz verbessertem Zipf-Score sollte man sich nicht allzu sehr um eine übermäßige Steigerung der Natürlichkeit kümmern.

Das hat uns der Analysator nach der Überprüfung angezeigt.

Schauen wir uns an, was da drin ist. Wie Sie sehen können, gibt es eine Spalte mit Wörtern sowie unverständlichen Zahlen. Die Spalte „Vorkommen“ (1) gibt an, wie oft die Wortformen im Text vorkommen. In der Zipf-Spalte (2) steht die empfohlene Anzahl an Einträgen. Die Markierungen 3 und 4 markieren ideale Indikatoren für die zweite und dritte Position. Sie sollten auch auf die Empfehlungen achten, sie geben an, wie viele Wörter Sie entfernen müssen, um die perfekte Kombination zu erreichen.

Lassen Sie uns zum besseren Verständnis analysieren, was der Analysator gezählt hat. Wir nehmen die Nummer 39 (C) als Grundlage, wir brauchen auch eine Seriennummer, achten Sie auf die 2 (F) Position. Wir nehmen die Formel.

Ersatz.

F=39/2=19,5

Wir runden auf und erhalten 20, dies ist die erforderliche Anzahl von Vorkommen. Dies wird vom Analysator bestätigt. In unserem Land wird das zweitbeliebteste Wort 28 Mal verwendet, 8 Wiederholungen müssen entfernt oder ersetzt werden.

Nachdem wir uns mit dem Prinzip des Gesetzes befasst haben, beginnen wir mit der Bearbeitung. Dazu löschen oder ersetzen wir durch Synonyme Wörter, die häufiger vorkommen als von Zipf gefordert. Als Ergebnis erhalten wir dieses Bild.

Wie Sie sehen können, ist es mir gelungen, die Rate von 83 % auf 88 % zu erhöhen. Allerdings litt die Qualität des Textes erheblich. Sie sollten nicht danach streben, diese Zahl auf 100 % zu erhöhen. In der Tat, wenn Sie bereits 75% haben, ist dies ausgezeichnet und Sie sollten nicht weiter pervertieren.

Hilfreicher Rat

Achten Sie nicht nur auf die ersten Zeilen. Beginnen Sie mit der Anpassung an den letzten Positionen in der Liste, sie haben oft einen größeren Einfluss auf die Gesamtpunktzahl als die ersten zehn Wörter.

Zipf und SEO

Kommen wir nun dazu, warum ein Texter dieses Muster kennen muss. Bei der Bestellung von Texten bemühen sich SEOs, sie für Suchmaschinen so bequem wie möglich zu gestalten. Es wird angenommen (es ist jedoch nicht klar, von wem), dass das Gesetz von Zipf aktiv von Suchalgorithmen verwendet wird. Es ist schwierig, diese Aussage zu beweisen oder zu widerlegen. Ich konnte keine vernünftigen Forschungen und Experimente zu diesem Thema finden.

Beschlossen, es selbst zu überprüfen. Dazu nahm ich das Thema für eine solche Konkurrenzanfrage „Plastikfenster“, Yandex nahm das Moskauer Thema, ich musste in Google zaubern, und er schien mich auch als Einwohner der Hauptstadt zu identifizieren (zumindest zeigte er es mir eine Anzeige mit Moskauer Geolokalisierung). Ich belegte die erste Seite der Ausgabe, plus Platz 49. So ist das Schild geworden.

Wenn Sie genauer hinschauen, können Sie sehen, dass die Ausgabe in Yandex gleichmäßiger ist, wenn Sie sich das Muster ansehen, das wir untersuchen. Gleichzeitig garantiert eine höhere Zahl jedoch keinen Sieg im Kampf um den ersten Platz an der Spitze.

Darauf basierend kann gesagt werden, dass, wenn Suchmaschinen dieses Gesetz anwenden, dies nur einer der Faktoren ist. Und nicht die Hauptsache.

Ergebnisse

Das ist es. Jetzt wissen Sie, wie die Qualität des Textes nach dem Zipf-Gesetz ist, und Sie können diesen Indikator auch anpassen. Tatsächlich ist hier nichts kompliziert, alles ist ganz einfach. Es genügt, das Funktionsprinzip dieser Regelmäßigkeit einmal zu verstehen.

Im vergangenen Jahrhundert war ein mysteriöses mathematisches Phänomen namens Zipfs Gesetz in der Lage, mit großer Genauigkeit vorherzusagen, wie sich die Größe von Riesenstädten auf der ganzen Welt verändern wird. Die Sache ist, dass niemand versteht, wie und warum dieses Gesetz funktioniert ...

Gehen wir zurück ins Jahr 1949. Der Linguist George Zipf (Zipf) bemerkte einen seltsamen Trend in der Verwendung bestimmter Wörter in der Sprache. Er stellte fest, dass eine kleine Anzahl von Wörtern ständig verwendet wird und die überwiegende Mehrheit - sehr selten. Wenn wir Wörter nach Beliebtheit auswerten, zeigt sich Auffälliges: Das Wort des ersten Ranges wird immer doppelt so oft verwendet wie das Wort des zweiten Ranges und dreimal häufiger als das Wort des dritten Ranges.
Zipf fand heraus, dass für die Einkommensverteilung in einem Land die gleiche Regel gilt: Der Reichste hat doppelt so viel Geld wie der Nächstreichste und so weiter.
Später wurde klar, dass dieses Gesetz auch in Bezug auf die Größe von Städten funktioniert. Die Stadt mit der größten Bevölkerung in einem beliebigen Land ist doppelt so groß wie die nächstgrößte Stadt und so weiter. Unglaublicherweise hat Zipfs Gesetz im letzten Jahrhundert in absolut allen Ländern der Welt funktioniert.

Schauen Sie sich einfach die Anzahl der größten Städte in Russland an. Die Bevölkerung von Moskau ist etwa 2-mal so groß wie die von St. Petersburg.
Paul Krugman, der über die Anwendung von Zipfs Gesetz auf Städte schrieb, bemerkte bekanntermaßen, dass der Wirtschaftstheorie oft vorgeworfen wird, stark vereinfachte Modelle einer komplexen, chaotischen Realität zu schaffen. Das Zipfsche Gesetz zeigt, dass genau das Gegenteil der Fall ist: Wir verwenden zu komplexe, chaotische Modelle, und die Realität ist erstaunlich übersichtlich und einfach.

Gesetz der Stärke

1999 schrieb der Ökonom Xavier Gabet eine wissenschaftliche Arbeit, in der er das Zipfsche Gesetz als „das Gesetz der Kraft“ beschrieb.
Gabet merkte an, dass dieses Gesetz auch dann bestehen bleibt, wenn Städte chaotisch wachsen. Diese gleichmäßige Struktur bricht jedoch zusammen, sobald Sie sich in nicht-metropolische Städte bewegen. Kleinstädte mit etwa 100.000 Einwohnern scheinen einer anderen Gesetzmäßigkeit zu folgen und zeigen eine verständlichere Größenverteilung.

Man könnte sich fragen, was mit dem Begriff „Stadt“ gemeint ist? Schließlich gelten zum Beispiel Boston und Cambridge als zwei verschiedene Städte, genau wie San Francisco und Auckland, die durch Wasser getrennt sind. Diese Frage hatten auch zwei schwedische Geographen, und sie begannen, die sogenannten "natürlichen" Städte zu betrachten, die durch Bevölkerung und Straßenverbindungen und nicht durch politische Motive verbunden sind. Und sie fanden heraus, dass selbst solche "natürlichen" Städte Zipfs Gesetz gehorchen.

Warum funktioniert Zipfs Gesetz in Städten?

Was also macht Städte in Bezug auf die Bevölkerung so vorhersehbar? Niemand kann es wirklich erklären. Wir wissen, dass Städte aufgrund von Einwanderung expandieren, Einwanderer strömen in große Städte, weil es mehr Möglichkeiten gibt. Aber Einwanderung reicht nicht aus, um dieses Gesetz zu erklären.
Es gibt auch wirtschaftliche Motive, da große Städte viel Geld verdienen und das Zipfsche Gesetz auch für die Einkommensverteilung funktioniert. Damit ist die Frage aber noch nicht eindeutig beantwortet.
Im vergangenen Jahr fand eine Gruppe von Forschern heraus, dass es Ausnahmen von Zipfs Gesetz gibt: Das Gesetz funktioniert nur, wenn die betreffenden Städte wirtschaftlich miteinander verbunden sind. Das erklärt, warum das Gesetz beispielsweise für ein einzelnes europäisches Land gilt, aber nicht für die gesamte EU.

Wie wachsen Städte?

Es gibt eine weitere seltsame Regel, die für Städte gilt und damit zu tun hat, wie Städte beim Wachstum Ressourcen verbrauchen. Wenn Städte wachsen, werden sie stabiler. Wenn sich beispielsweise eine Stadt verdoppelt, verdoppelt sich die Anzahl der benötigten Tankstellen nicht.
Die Stadt wird ziemlich komfortabel leben, wenn die Zahl der Tankstellen um etwa 77% steigt. Während das Gesetz von Zipf bestimmten sozialen Gesetzen folgt, ist dieses Gesetz enger mit der Natur verbunden, z. B. wie Tiere mit zunehmendem Alter Energie verbrauchen.

Der Mathematiker Stephen Strogatz beschreibt es so:
Wie viele Kalorien pro Tag braucht eine Maus im Vergleich zu einem Elefanten? Beide sind Säugetiere, daher ist davon auszugehen, dass sie auf zellulärer Ebene nicht sehr unterschiedlich sein sollten. In der Tat, wenn Zellen von zehn verschiedenen Säugetieren in einem Labor gezüchtet werden, haben alle diese Zellen die gleiche Stoffwechselrate, sie erinnern sich auf genetischer Ebene nicht daran, wie groß ihr Wirt wirklich ist.
Aber wenn wir einen Elefanten oder eine Maus als vollwertiges Tier betrachten, eine funktionierende Ansammlung von Milliarden von Zellen, dann werden die Zellen des Elefanten viel weniger Energie für die gleiche Aktion aufwenden als die Zellen einer Maus. Das Stoffwechselgesetz, Kleibersches Gesetz genannt, besagt, dass der Stoffwechselbedarf eines Säugetiers proportional zu seinem Körpergewicht um den Faktor 0,74 ansteigt. Dieser Wert von 0,74 liegt sehr nahe an dem Wert von 0,77, der durch das Gesetz über die Anzahl der Tankstellen in der Stadt erreicht wird.
Zufall? Vielleicht, aber höchstwahrscheinlich nicht.
All dies ist furchtbar aufregend, aber vielleicht weniger mysteriös als Zipfs Gesetz. Es ist nicht so schwer zu verstehen, warum eine Stadt, die eigentlich ein Ökosystem ist, wenn auch von Menschen gebaut, den natürlichen Naturgesetzen gehorchen sollte. Aber Zipfs Gesetz hat kein Analogon in der Natur. Dies ist ein soziales Phänomen, das erst in den letzten hundert Jahren stattgefunden hat.
Alles, was wir wissen, ist, dass das Gesetz von Zipf auch für andere soziale Systeme gilt, einschließlich wirtschaftlicher und sprachlicher Systeme. Vielleicht gibt es also einige allgemeine soziale Regeln, die dieses seltsame Gesetz schaffen, und eines Tages werden wir in der Lage sein, sie zu verstehen. Wer dieses Rätsel löst, findet möglicherweise den Schlüssel, um viel wichtigere Dinge vorherzusagen als das Wachstum von Städten. Zipfs Gesetz ist möglicherweise nur ein kleiner Aspekt der globalen Regel der sozialen Dynamik, die regelt, wie wir kommunizieren, Handel treiben, Gemeinschaften bilden und vieles mehr.