200万を超える通りの名前を分析すると何が明らかになりますか?

「Road」接尾辞が集計(775,537)を支配し、次に車線と通りがそれぞれ238726と213881の頻度で続きます。これらの名前が地理的にどのように分布しているかを確認します。ここでは、都市ごとにすべての接尾辞を集計し、各都市で最も頻度の高い通りの接尾辞名を使用します。結果は非常にわかりやすくなっています。

この地図は、すべての地区で接尾辞として使用されている「道路」の大きさを示しています。実際、「道路」という接尾辞が一番上にない地区は18しかありません。これらすべての18の地区の名前と、よく使用される接尾辞の上位を示します。

通りの名前の性別の不均衡

通りの名前を使用すると、性別の不均衡をマッピングすることもできます。都市レベルで性別の不均衡の指標を見つけるのは難しい場合が多いため、性別の側面はユニークな機会です。

名前を性別で分類するために、1日あたり1000の名前をコーディングして性別化できるGenderizeサービスを使用しました。私はそれぞれの名前とその出現を数え、それらを外観に従ってソートし、最初の1000を取りました。存在の総数に従って最も有名な名前を選択することには利点があります。データセットには99,088の一意の道路名があります。 、最初の1000を性別化するだけで、ほぼカバーしますデータセットの50%。ただし、これには、異なる結果をもたらす可能性のあるあまり有名でない名前が残るため、欠点もあります。

頻繁に使用される上位1000のストリート名の性別分類

上のグラフは、重要な性別を示しています通りの名前の不均衡。人気のある通りの名前の大部分は、男性の分類名にちなんで名付けられています。

理解を深めるため、またAPIの性別による制限のため、リバプール市を選び、すべての通りの名前を分類しました。性別分類の割合を示すマップを次に示します。

リバプールでの結果も明確通りの名前の性別の不均衡を指摘します。他の都市を見て結果を調べることも興味深いでしょう。

4。宗教

通りの名前にはどの程度の宗教的影響がありますか?それらを定量化できますか?調べるために、強い宗教的傾向を持つコミュニティは、より多くの場所に宗教的な名前を付ける傾向があると推測できます。

Oto-Peralias手法を使用すると、都市の宗教性を次のように測定できます。

Religiosity = R / N x 100

分子の場合、Rは、町内の次の宗教名のいずれかを含む通りの数です。

検索された用語は、そうではありませんがすべての宗教名の包括的なリスト。これは、群を抜いて最も広く使用されている通りの名前です。

分母Nには、各都市の通りの総数が含まれています。

結果この分析の結果を次のマップに示します。

Write a Comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です