Co může odhalit analýza více než 2 milionů názvů ulic?

Přípona „Road“ dominuje součtu (s 775 537), následovaným Lane a ulicí s frekvencí 238726 a 213881. Můžeme se podívat podle toho, jak jsou tyto názvy geograficky distribuovány. Zde agregujeme všechny přípony podle měst a v každém městě používáme nejfrekventovanější názvy přípon. Výsledek je docela odhalující.

Mapa ukazuje velikost silnic používaných jako přípona ve všech okresech. Ve skutečnosti existuje pouze 18 okresů, jejichž přípona „Silnice“ není nahoře. Zde jsou názvy všech těchto 18 okresů a nejčastěji používaná přípona.

genderová nerovnováha v názvech ulic

Názvy ulic nám také umožňují mapovat nerovnováhu mezi pohlavími. Genderový aspekt je jedinečnou příležitostí, protože je často těžké najít indikátory genderové nerovnováhy na úrovni města.

Ke klasifikaci jmen podle pohlaví jsem použil službu Genderize, která vám umožňuje kódovat a genderizovat 1000 jmen za den volně. Počítal jsem každé jméno a jeho výskyt, roztřídil jsem je podle jejich vzhledu a vzal prvních 1000. Existuje výhoda ve výběru nejslavnějších jmen podle jejich celkového počtu přítomností. I když v datové sadě je 99 088 jedinečných názvů ulic tím, že pouze genderizujeme prvních 1000, pokryjeme téměř 50% datové sady. To však má také svou nevýhodu, protože ponechává méně známá jména, která mohou přinést různé výsledky.

Pohlaví klasifikace pro 1000 nejčastěji používaných názvů ulic

Graf výše ukazuje významné pohlaví nerovnováha v názvech ulic. Většina populárních názvů ulic je pojmenována podle mužského utajovaného jména.

Pro lepší pochopení a kvůli omezení API genderizace jsem vzal město Liverpool a roztřídil všechny názvy ulic. Zde je mapa s procentuálním zastoupením podle pohlaví.

Výsledky v Liverpoolu také jasně poukázat na nerovnováhu pohlaví v názvech ulic. Bylo by zajímavé podívat se také na jiná města a zjistit výsledky.

4. Náboženství

Kolik náboženského vlivu mají názvy ulic? Můžeme je kvantifikovat? Abychom to zjistili, můžeme předpokládat, že komunita se silnými náboženskými sklony má tendenci pojmenovat více míst s náboženskými jmény.

Pomocí metodiky Oto ‐ Peralias můžeme měřit religiozitu města následovně:

Religiosity = R / N x 100

Kde je čitatel, R je počet ulic obsahujících některá z následujících náboženských jmen ve městě.

Ačkoli hledané výrazy nejsou komplexní seznam všech náboženských jmen. Je to zdaleka nejpoužívanější názvy ulic.

Jmenovatel N obsahuje celkový počet ulic v každém městě.

Výsledek této analýzy je zobrazen na následující mapě.

Write a Comment

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *