Skip to content

Análisis descriptivo e inferencial del consumo de clientes estadounidenses, con el objetivo de predecir la probabilidad de suscripción a servicios empresariales y segmentarlos en grupos personalizados.

Notifications You must be signed in to change notification settings

No-Country-simulation/Equipo-c20-78-t-data-bi

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

37 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Estructura de directorios y archivos

La estructura de directorios sigue una jerarquía organizada y modular para facilitar la reproducibilidad y la colaboración. Cada etapa del pipeline de datos está claramente separada según el principio de bronze-silver-gold para garantizar calidad y trazabilidad de los datos.

analisis_comportamiento_del_consumidor/
│
├── data/                          # Directorio principal de los datos
│   ├── 1_bronze/                  # Datos crudos (brutos) directamente obtenidos de las fuentes
│   ├── 2_silver/                  # Datos procesados y transformados (listos para ML y EDA)
│   └── 3_gold/                    # Datos finales, listos para la visualización o análisis avanzado
│
├── models/                        # Modelos entrenados (mejores modelos para predecir la variable target)
│
├── notebooks/                     # Cuadernos Jupyter de cada fase del proceso CRISP-DM
│   ├── 1_extraccion_comprension.ipynb  # Extracción y comprensión inicial de los datos
│   ├── 2_tratamiento.ipynb             # Tratamiento de datos: limpieza y preprocesamiento
│   ├── 3_eda.ipynb                     # Análisis exploratorio de los datos (EDA)
│   ├── 4_visualizacion.pbix            # Visualización interactiva de los resultados (Power BI)
│   └── 5_ml.ipynb                      # Modelado predictivo usando Machine Learning
│
└── requirements.txt               # Dependencias del proyecto (Python)

Tecnologías Utilizadas

  • Python
    • Bibliotecas para análisis de datos:
      • NumPy
      • pandas
      • missingno
    • Bibliotecas para visualización de datos:
      • Seaborn
      • matplotlib
    • Bibliotecas para aprendizaje automático:
      • scikit-learn
      • joblib
    • Bibliotecas para gestion de directorios y archivos
      • os

Metodología

La metodologia de este proyecto se basa en CRISP-DM (Cross Industry Standard Process for Data Mining), y consiste en las siguientes fases:

  1. Comprensión del Negocio: Definir los objetivos y las preguntas clave para el análisis.
  2. Comprensión de los Datos: Recopilar y explorar los datos disponibles.
  3. Tratamiento de los Datos: Realizar la limpieza, transformación y preprocesamiento de los datos.
  4. Análisis Exploratorio de Datos: Realizar una exploración descriptiva.
  5. Modelado y Evaluación: Crear, evaluar, optimizar y seleccionar modelos de machine learning para predecir la probabilidad de suscripción a servicios personalizados.
  6. Visualización Ejecutiva: Presentar visualizaciones y recomendaciones ejecutivas con accionables para el negocio.

Instalación y Configuración

Para ejecutar este proyecto localmente, sigue estos pasos:

  1. Clona este repositorio:
    git clone https://github.com/c20-78-t/analisis_comportamiento_del_consumidor.git

    cd analisis_comportamiento_del_consumidor
  1. Instala las dependencias necesarias:
    pip install -r requirements.txt
  1. Ejecuta los notebooks en el orden establecido para replicar el análisis.

Estado del proyecto:

  • En proceso -> 80% completado (MVP completado)

About

Análisis descriptivo e inferencial del consumo de clientes estadounidenses, con el objetivo de predecir la probabilidad de suscripción a servicios empresariales y segmentarlos en grupos personalizados.

Resources

Stars

Watchers

Forks

Contributors 4

  •  
  •  
  •  
  •