Co może ujawnić analiza ponad 2 milionów nazw ulic?

Sufiks „Droga” dominuje na liście (775,537), a następnie Lane i ulica z częstotliwościami odpowiednio 238726 i 213881. Możemy spojrzeć o tym, jak te nazwy są rozmieszczone geograficznie. Tutaj gromadzimy wszystkie sufiksy według miasta i bierzemy nazwy sufiksów o największej częstotliwości występowania w każdym mieście. Wynik jest dość pouczający.

Mapa pokazuje wielkość „Drogi” używanej jako przyrostek we wszystkich dzielnicach. W rzeczywistości istnieje tylko 18 dzielnic, w których przyrostek „Droga” nie znajduje się na górze. Oto nazwy wszystkich tych 18 dzielnic i najczęściej używany sufiks.

Nierównowaga płci w nazwach ulic

Nazwy ulic mogą również pozwolić nam zmapować nierównowagę płci. Aspekt płci to wyjątkowa okazja, ponieważ często trudno jest znaleźć wskaźniki nierównowagi płci na poziomie miasta.

Aby sklasyfikować imiona według płci, skorzystałem z usługi Genderize, która pozwala zakodować i ujednolicić 1000 nazwisk dziennie swobodnie. Policzyłem każdą nazwę i jej wystąpienie, posortowałem je według wyglądu i wziąłem pierwsze 1000. Wybranie najbardziej znanych nazwisk na podstawie ich całkowitej liczby obecności jest korzystne. Chociaż w zbiorze danych znajduje się 99 088 unikalnych nazw ulic , tylko przez podział na płeć pierwszych 1000, uwzględniamy prawie 50% zbioru danych. Ma to jednak również swoją wadę, ponieważ pozostawia mniej znane nazwiska, które mogą dać inne wyniki.

Klasyfikacja płci dla 1000 najczęściej używanych nazw ulic.

Powyższy wykres pokazuje istotną płeć brak równowagi w nazwach ulic. Większość popularnych nazw ulic nosi imię sklasyfikowane jako męskie.

Aby lepiej zrozumieć i ze względu na ograniczenia API związane z płeć, wybrałem miasto Liverpool i sklasyfikowałem wszystkie jego nazwy ulic. Oto mapa z procentem klasyfikacji płci.

Wyniki w Liverpoolu również wyraźnie zwrócić uwagę na brak równowagi płci w nazwach ulic. Ciekawie byłoby również przyjrzeć się innym miastom i poznać wyniki.

4.Religijność

Jak duży wpływ religijny mają nazwy ulic? Czy możemy je określić ilościowo? Aby się tego dowiedzieć, możemy założyć, że społeczność o silnych skłonnościach religijnych ma tendencję do nazywania większej liczby miejsc nazwami religijnymi.

Stosując metodologię Oto-Peralias, możemy zmierzyć religijność miasta w następujący sposób:

Religiosity = R / N x 100

Gdzie licznik, R to liczba ulic zawierających dowolne z następujących nazw religijnych w mieście.

Chociaż wyszukiwane terminy nie są wyczerpująca lista wszystkich nazw religijnych. To zdecydowanie najczęściej używane nazwy ulic.

Mianownik N zawiera całkowitą liczbę ulic w każdym mieście.

Wynik tej analizy pokazano na poniższej mapie.

Write a Comment

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *