Street names and geometries are are extracted from OpenStreetMap. See pipeline/pipeline.sh
for data processing steps.
In a nutshell, it extracts genders from street names following these steps:
- Removing Portuguese stopwords from the street name.
- Removing street types from the name (e.g. Street, Avenue, Alley).
- Removing titles and professions from street names (e.g. Governor, Mayor, Pope).
- Defining gender based on this table extracted from the Brazilian Census.
After that, I extract a geojson, convert it to mbtiles and upload it to Mapbox.
Based on Road Orientations Map, built by Vladimir Agafonkin.
Os dado de nomes e geometrias de ruas são extraídos do OpenStreetMap. Veja o arquivo pipeline/pipeline.sh
para o processo.
Basicamente, tentamos extrair o gênero dos nomes de ruas da seguinte maneira:
- Removendo palavras do nome como
da|do|das|dos|de
. - Removendo tipos do nome como
acesso|alameda|avenida|beco|caminho
. - Extraíndo títulos do nome como
ábade|agricultor|agrimensor|agente
, e atribuindo gênero baseado nesses, quando existem. - Atribuindo gênero para os restantes baseado nessa base de dados de nomes por gênero do IBGE.
Depois, extraímos um geojson, convertemos para mbtiles e fazemos upload para o Mapbox.