Skip to content

lgomezt/Intro_Python

Repository files navigation

Proyectos de Analítica en Python🐍

Este repositorio contiene el material de las clases del programa Proyectos de Analítica en Python el cual contiene dos modulos: Introducción al análisis de datos en Python y Machine Learning para Business Intelligence.

Requisitos computacionales🕹

Para ejecutar los códigos de la clase, la opción más sencilla es instalar Anaconda en su computador. Esta es una plataforma que le incluirá todos los softwares necesarios en su camino por la ciencia de datos. Por un lado, Anaconda instalará la última versión estable de Python, también a través de su gestor de paquetes Conda, le incluirá las principales bibliotecas y además le instalará algunos IDEs que serán su interfaz gráfica para programar. Lo mejor de todo es que esta solución es grátis. A continuación, le explicaremos paso a paso lo que debe hacer.

  • Instalar Anaconda
  1. Visita el sitio web de Anaconda y descarga la versión adecuada de Anaconda para tu sistema operativo.
  2. Ejecuta el instalador de Anaconda y sigue las instrucciones en pantalla. Asegúrate de agregar Anaconda al PATH y aceptar la opción predeterminada para instalar Python.
  3. Después de la instalación, abre Anaconda Navigator para confirmar que la instalación fue exitosa.
  • Actualizar Anaconda
  1. Abre Anaconda Navigator y selecciona el entorno que deseas actualizar.
  2. Haz clic en "Actualizar" en la sección de "Acciones" de la pestaña "Inicio" para actualizar todos los paquetes en el entorno seleccionado.
  • Instalar Jupyter Notebook
  1. Abre Anaconda Navigator y selecciona el entorno que deseas utilizar para Jupyter Notebook.
  2. Haz clic en "Instalar" en la sección de "Acciones" de la pestaña "Inicio".
  3. Busca "Jupyter Notebook" en la barra de búsqueda y haz clic en "Instalar" junto a él.
  4. Espera a que la instalación termine.

Este último paso no es necesario, pero es altamente recomendable. Visual Studio Code es un IDE que le permitirá correr los cuadernos de la clase de una forma más amigable.

  • Instalar Visual Studio Code
  1. Visita el sitio web de Visual Studio Code y descarga la versión adecuada para tu sistema operativo.
  2. Ejecuta el instalador de Visual Studio Code y sigue las instrucciones en pantalla.
  3. Después de la instalación, abre Visual Studio Code para confirmar que la instalación fue exitosa.
  4. Configurar Visual Studio Code para utilizar Anaconda
  5. Abre Visual Studio Code y haz clic en "Archivo" -> "Preferencias" -> "Configuración".
  6. Busca "python.condaPath" y establece el valor en la ubicación de la instalación de Anaconda. Por ejemplo, "C:\ProgramData\Anaconda3\condabin\conda.exe".
  7. Busca "python.pythonPath" y establece el valor en la ubicación de la instalación de Python en tu entorno Anaconda. Por ejemplo, "C:\ProgramData\Anaconda3\envs\myenv\python.exe".

Introducción al Análisis de Datos en Python📈

Este primer modulo esta compuesto por siete sesiones en los que se busca familiazar al estudiante con el uso de Python para el análisis de datos. Se estudiarán los principales paquetes como los son NumPy, pandas, matplotlib, seaborn, entre muchos otros.

Tópicos por Modulos Material de la clase
  • ¿Qué es y por qué Python?
  • Jupyter Notebook
  • Tipos de variables y Casting
  • Operaciones
  • Listas, Tuplas y Diccionarios
  • Control Flow
  • Loops
  • Funciones
  • Magic Functions
  • Lambda functions
  • Recursividad/Recursión
  • Introducción a Pandas
  • Indexación y ejes
  • Métodos
  • .loc y .iloc
  • Estadísticas Descriptivas
  • Unión de bases
  • Group by
  • Taller de Pandas
  • Visualizaciones
  • Matplotlib
  • Seaborn
  • Taller
  • Regresión lineal
  • Introducción al Webscraping

Machine Learning para Business Intelligence🤖

Clase Tópicos
Sesión 1
  • ¿Qué es el Machine Learning? ¿Qué es la Inteligencia Artificial? ¿Cuál es la diferencia entre ambos conceptos?
  • ¿Cuáles son las diferentes ramas de Machine Learning? ¿Cuáles vamos a aprender en el curso?
  • ¿Cuáles son los tipos de problemas que vamos a resolver en el curso?
  • Contexto histórico: ¿Estamos ante una Cuarta Revolución Industrial?
  • Fronteras y dilemas éticos del Machine Learning
Sesión 2
  • Estadísticas descriptivas
  • Construcción de variables
  • ¿Cómo lidiar con valores faltantes?
  • Visualizaciones
Sesión 3
  • K-Vecinos más cercanos
  • Introducción a Scikit-Learn
  • Modelos lineales
  • Validación Cruzada
Sesión 4
  • Fine tuning
  • Trade-off entre sesgo y varianza
  • Grid search
  • Métricas de evaluación
Sesión 5
  • Regularización
  • Ridge
  • Lasso
  • Elastic Net
Sesión 6
  • Modelos de clasificación
  • Árboles
  • Bosques Aleatorios
  • Importancia de variables
Sesión 7
  • Boosting
  • Análisis No Supervisado
  • PCA
Sesión 8
  • K-Medias
  • Silhouette
Sesión 9
  • LLM
  • Chat-GPT
  • Prompt Engineering

Agradecimientos🫂

El material acá consignado ha sido el esfuerzo colaborativo de varias generaciones de Quantileros. En esta sección se le quiere hacer una mención especial a Julian Chitiva y a Juan Sebastian Moreno por la estructuración de gran parte del material del curso.

Nota: Este repositorio no reemplaza el curso pues carece de sesiones de clase sincronicas, el contenido audiovisual asincronico, el trabajo en equipo y las retroalimentaciones del equipo docente. No obstante, el material acá consignado es una buena introducción para todo aquel que desee aprender Python.