Esse repositório é uma versão em português brasileiro da estrutura de projeto para o Team Data Science Process desenvolvido pela Microsoft, ele fornece uma estrutura de projeto genérica para o TDSP além de conter modelos para vários documentos que são recomendados como parte da execução de um projeto de ciência de dados usando essa metodologia.
NOTA: O nome de todos os diretórios foram mantidos em inglês, apenas os documentos/artefatos foram traduzidos e adaptados.
TDSP é uma metodologia de ciência de dados ágil e iterativa para melhorar a colaboração e aprendizado em equipe. Ela possui uma definição de ciclo de vida, estrutura de projeto padrão, modelos de artefatos e ferramentas para ciência de dados.
NOTA: Nessa estrutura de diretórios, a pasta Sample_Data não deve conter arquivos de dados brutos grandes. Apenas pequenas amostras de dados, que podem ser utilizadas para testar o código.
Ambos os documentos em Docs/Project, Termo de Abertura de Projeto e Relatório de Entrega são particularmente importantes. Eles ajudam a definir o projeto no início de um engajamento, e providenciam um relatório final para o cliente.
NOTA: Em alguns projetos, ex. Uma PoC ou PoV, pode ser relativamente demorado criar todos os documentos e artefatos recomendados. Nesses casos, pelo menos o Termo de Abertura de Projeto e Relatório de Entrega devem ser criados e entregues ao cliente. Conforme necessário, organizações podem modificar certas seções dos documentos. Mas é recomendável que o conteúdo dos documentos sejam mantidos, pois, eles fornecem informações importantes sobre o projeto e as entregas.