Hva kan analysering av mer enn 2 millioner gatenavn avsløre?

Suffikset «Road» dominerer stemmetallet (med 775 537) etterfulgt av Lane og street med henholdsvis 238726 og 213881. Vi kan se hvordan disse navnene fordeles geografisk. Her samler vi alt suffiks per by og tar det hyppigste gatesuffiksnavnet i hver by. Resultatet er ganske avslørende.

Kartet viser størrelsen på «Veier» brukt som et suffiks i alle distrikter. Faktisk er det bare 18 distrikter som suffikset «Veien» ikke er i toppen. Her er navnene på alle disse 18 distriktene og det øverste suffikset som brukes ofte.

Kjønnsubalanse i gatenavn

Gatenavn kan også tillate oss å kartlegge kjønnsbalansen. Kjønnsaspektet er en unik mulighet, da det ofte er vanskelig å finne indikatorer for kjønnsubalanser på bynivå.

For å klassifisere navn etter kjønn brukte jeg Genderize-tjenesten som lar deg kode og kjønnsfordele 1000 navn per dag fritt. Jeg telte hvert navn og dets forekomst, sorterte dem etter utseendet og tok de første 1000. Det er en fordel å velge de mest kjente navnene i henhold til deres totale antall tilstedeværende. Mens det er 99 088 unike gatenavn i datasettet , ved bare å kjønnsbestemme de første 1000, dekker vi nesten 50% av datasettet. Dette har imidlertid også sin ulempe da det etterlater mindre kjente navn som kan gi forskjellige resultater.

Kjønnsklassifisering for de høyeste 1000 hyppig brukte gatenavnene

Grafen over viser et betydelig kjønn ubalanse i gatenavn. Flertallet av populære gatenavn er oppkalt etter et mannlig klassifisert navn.

For en dypere forståelse og på grunn av kjønnsdypende API-begrensning, tok jeg Liverpool by og klassifiserte alle gatenavnene. Her er et kart med en prosentandel av kjønnsklassifiseringer.

Resultatene i Liverpool er også tydelig påpeke kjønnsubalansen i gatenavn. Det ville også være interessant å se på andre byer og finne ut resultatene.

4.Religiøsitet

Hvor mye religiøs innflytelse har gatenavn? Kan vi tallfeste dem? For å finne ut av det, kan vi anta at samfunn med sterke religiøse tilbøyeligheter har en tendens til å navngi flere steder med religiøse navn. >

Religiosity = R / N x 100

Hvor telleren, R er antall gater som inneholder et av følgende religiøse navn i byen.

Selv om de søkte ordene ikke er en omfattende liste over alle religiøse navn. Det er den langt mest brukte gatenavn.

Nevneren, N, inneholder det totale antallet gater i hver by.

Resultatet av denne analysen er vist i det følgende kartet.

Write a Comment

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *