Colaboradores:
- Producto Owner: Juchniewicz Federico
- Scrum Master: Zelarayán Román
- Team:
Profesores:
Silvia Perotti
Hector Prado
Link Trello: https://trello.com/w/ghjjkz6pitscdiaalfa/home
Link repositorio GITHUB: https://github.com/ispc-programador2022/GHJJKZ6
Librerías Utilizadas -bs4 BeatifulSoup -Requests -Pandas -Pathlib -matplotlib -seaborn -numpy -pymysql
Origen de Datos para el Proyecto:
Realizamos Web Scraping para extraer datos de páginas web relacionadas con la contaminación a nivel mundial.
Paginas utilizadas:
https://www.liderempresarial.com/las-10-empresas-que-mas-contaminan-el-mundo/
https://datosmacro.expansion.com/energia-y-medio-ambiente/emisiones-co2?anio=2021
https://www.iqair.com/es/world-most-polluted-countries
Mediante el conocimiento del cursado de Programación de TSCDIA y curso Cisco de Python, realizamos:
- Creación de repositorio en GitHub.
- Técnicas Agiles de Scrum en Trello.
- Desde Visual Code realizamos la creación y programación de los archivos.py para el proyecto.
- Programamos incluyendo librerías para la obtención de datos del as paginas relacionadas a la contaminación de pasases y Empresas a nivel global.
- Técnica de Scrum en Trello para el seguimiento del proyecto.
- Una vez realizada la extracción de datos se exportan a csv, donde se realizan graficas de resultados obtenidos.
- Creamos Base de Datos "db_paises.sql"
- Creamos Tabla "paisest_co2"
- Realizamos una consulta a tabla "paisest_co2", donde filtramos los paises que en 2021 aumentaron un 10% las emisiones per cápita de CO2 con respecto al año anterior.
- Se obtiene tres tablas:
-
Empresas con mayor contaminación con plástico en el mundo
-
Países con mayor emisión de dióxido de carbon
-
Países y regiones con mayor contaminación del mundo en calidad de aire (datos históricos entre 2018-2021)