Skip to content

arturtcoelho/data_science_python

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Python para Data Science

Nivel: Introductorio - Intermedio
Requisitos: Conocimientos básicos de programación


Sesión 1: Fundamentos de Python

Objetivos de aprendizaje

  • Comprender la sintaxis básica de Python
  • Trabajar con estructuras de datos fundamentales
  • Manipular archivos del sistema

Contenido

1. Introducción a Python

  • ¿Qué es Python y por qué es ideal para Data Science?
  • Configuración del entorno (Python, VS Code)
  • Tu primer script en Python

2. Estructuras de Datos

  • Variables y tipos de datos: int, float, str, bool
  • Colecciones:
    • Listas: creación, indexación, slicing, métodos principales
    • Tuplas: inmutabilidad y casos de uso
    • Diccionarios: clave-valor, operaciones CRUD
    • Sets: eliminación de duplicados y operaciones de conjunto
  • Control de flujo: if/elif/else, bucles for/while, comprehensions

3. Funciones y Módulos

  • Definición y llamada de funciones
  • Parámetros posicionales y nombrados
  • Importación de módulos estándar

4. Archivos y Entrada/Salida

  • Leer y escribir archivos de texto (.txt, .csv)
  • Manejo de rutas con pathlib
  • Context managers (with statement)
  • Trabajo con JSON

Sesión 2: Python para Data Science

Objetivos de aprendizaje

  • Procesar y analizar datos con pandas
  • Crear visualizaciones efectivas
  • Construir modelos de machine learning básicos
  • Integrar herramientas de IA para automatización

Contenido

1. pandas: El núcleo del análisis de datos

  • Series y DataFrames: creación y manipulación
  • Importación de datos: CSV, Excel, JSON
  • Limpieza de datos:
    • Manejo de valores nulos
    • Eliminación de duplicados
    • Transformación de tipos
  • Selección y filtrado: loc, iloc, boolean indexing
  • Agrupaciones y agregaciones: groupby, pivot tables
  • Combinations de datos: merge, concat, join

2. Visualización de Datos

  • Matplotlib: figuras, subplots, personalización
  • Seaborn: gráficos estadísticos atractivos
  • Plotly: visualizaciones interactivas
  • Mejores prácticas para comunicar resultados

3. Machine Learning con Scikit-Learn

  • Introducción al ML: tipos de aprendizaje
  • Preprocesamiento: escalado, encoding, train/test split
  • Modelos básicos:
    • Regresión lineal
    • Clasificación (KNN, Árboles de decisión)
  • Evaluación de modelos: métricas comunes
  • Pipeline de ML end-to-end

4. IA y Automatización con LangGraph

  • ¿Qué son los agentes de IA?
  • Introducción a LangGraph para flujos de trabajo
  • Casos de uso en Data Science
  • Demo: automatizando análisis con agentes

Extra: Asistentes de Código

Herramientas recomendadas para mejorar tu productividad como desarrollador Python.

Provider Herramienta Extensión VS Code TUI / App Plan Gratuito Plan de Pago
Anthropic Claude Code TUI Limitado (API-based) Claude Pro ($20/mes), Max ($150/mes)
OpenCode OpenCode TUI Ilimitado (Local) Zen (Pay-as-you-go)
OpenAI Codex (2026) macOS App/CLI Sí (generoso para Plus) $20 (Plus) / $200 (Pro)
Anysphere Cursor N/A (IDE) IDE 2000 completions $20/mes
Google Gemini Code Assist N/A Alto (vía GCP) $19/mes
Microsoft GitHub Copilot N/A Limitado (Estudiantes/OSS) ~$10-20/mes

Recursos Adicionales

Bibliotecas esenciales para Data Science

  • NumPy: Computación numérica
  • SciPy: Estadística y científica
  • Statsmodels: Modelos estadísticos
  • XGBoost/LightGBM: Gradient boosting
  • NetworkX: Análisis de redes

Entornos de desarrollo recomendados

  • VS Code: Editor polivalente con extensiones
  • Jupyter Notebook/Lab: Ideal para análisis exploratorio
  • Google Colab: Notebooks en la nube gratuitos

data_science_python

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages