Skip to content

Extração e processamento dos dados referentes a série histórica do DI desde 04/07/1994 à 26/07/2021

License

Notifications You must be signed in to change notification settings

dahn94/di-spark

Repository files navigation

di-spark

Extração e processamento dos dados referentes a série histórica do DI desde 04/07/1994 à 26/07/2021

Configuração necessária para rodar o projeto

  1. Clone o repositório contendo imagens dockers prontas para rodar o projeto:
$ git clone https://github.com/jupyter/docker-stacks.git
  1. Execute a seguinte imagem:
$ cd docker-stacks
$ docker run -p 8888:8888 jupyter/pyspark-notebook
  1. No terminal do container fazer o clone do projeto:
$ git clone https://github.com/dahn94/di-spark.git
  1. Instale algumas dependencias:
$ pip install -r requirements.txt
  1. Realize a extração dos dados:
$ python3 extract.py
  1. Realize o processamento dos dados e salve em formato data-table.
$ python3 spark_processing.py

About

Extração e processamento dos dados referentes a série histórica do DI desde 04/07/1994 à 26/07/2021

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published