Visando estimular a nossa participação no Wids Datathon edição 2020 promoveremos sessões semanais de live coding para aprender sobre ferramentas e tópicos de Data Science.
As ferramentas e tecnologias utilizadas serão:
- Jupyter Notebook no Google Colab
- Python como a linguagem de programação
- Pandas para manipular os dados
- Scikit-learn para treinar os modelos de Aprendizagem de Máquina
Sessão | Data | Slides | Tópicos | Notebook do código no Colab | Vídeo no YouTube |
---|---|---|---|---|---|
01 | 14/12/2019 | Sessão 01 | O que faz uma cientista de dados, introdução ao pandas e ao scikit-learn | Link do notebook | Link do vídeo |
02 | 21/12/2019 | Sessão 02 | Explorando dados com o pandas e usando o scikit-learn para selecionar as melhores features para treinar um modelo | Link do notebook | Link do vídeo |
03 | 04/01/2020 | Sessão 03 | Métricas e formas de avaliar um modelo | Link do notebook | Link do vídeo |
04 | 11/01/2020 | Sessão 04 | Viés e variância | Link do notebook | Link do vídeo |
05 | 18/01/2020 | Sessão 05 | Visualização de dados com o Seaborn | Link do notebook | Link do vídeo |
06 | 25/01/2020 | Sessão 06 | XGBoost | Link do notebook | Link do vídeo |
07 | 01/02/2020 | Sessão 07 | Pipelines do Scikit-learn | Link do notebook | Link do vídeo |
07 | 01/02/2020 | Sessão 08 | Feature engineering | Link do notebook | Link do vídeo |
- Acessar o link do notebook
- Ir em File > Save a copy in Drive...
- Uma nova aba irá abrir com a cópia do notebook salva no seu Google Drive, lá você já pode "dar play" em cada célula para rodar o código
- Você também pode ver todos os notebooks salvos no seu Drive na pasta Colab Notebooks no https://drive.google.com/ (pasta com ícone amarelo)