Skip to content
View fmr693's full-sized avatar

Block or report fmr693

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
fmr693/README.md

Michael Rodrigo

Ingeniería de Datos · Inteligencia Artificial · Desarrollo de Software — Bilbao, España

Soy desarrollador de software y construyo sistemas de datos e IA de extremo a extremo: ingesta y orquestación de datos, fine-tuning de LLMs y despliegue en local. Vengo del desarrollo full-stack, lo que me da soltura en todas las capas de un producto, y soy bilingüe español-inglés.

Actualmente curso la especialización Data Engineering e Inteligencia Artificial (IFCD0077, 960 h): Apache Spark, Kafka, Deep Learning, NLP, MLOps y Cloud. Los proyectos de abajo están construidos de extremo a extremo siguiendo buenas prácticas: testing, CI, Docker y documentación.

Proyectos destacados

Proyecto Qué hace Stack
Motor de LoRAs Fábrica local de fine-tuning y despliegue de LLMs: 18 formatos de datos → LoRA → GGUF → servidor OpenAI-compatible en GPU, con agente ReAct y RAG. 511 tests, CI, Docker. Caso de estudio medido: su VLM afinado supera en +8,7 pts de F1 al pipeline clásico de EXIST 2025. (Repo privado, publicación próxima) PyTorch · PEFT/TRL · llama.cpp · FastAPI · ChromaDB
EXIST 2025 Detección multimodal de sexismo en memes (shared task CLEF 2025): OCR propio, XLM-RoBERTa + ResNet50 con ensembles, y fine-tuning VLM con LoRA. Evaluación con holdout estricto PyTorch · Transformers · EasyOCR
Pipeline Medallón AEMET Pipeline de datos meteorológicos en tiempo real con arquitectura medallón (bronze/silver/gold) Kafka · MinIO (S3) · MongoDB · DuckDB · Streamlit · Docker
Crypto Data Pipeline ELT del mercado cripto cada 5 minutos con el modern data stack y tests de calidad en el DAG Airflow · dbt · PostgreSQL · Metabase · Docker
IoT Streaming Pipeline Ingesta IoT end-to-end: sensor simulado → broker → procesamiento en streaming → data lake MQTT · Kafka · Spark Structured Streaming · MinIO/Parquet
LLM Abliteration Toolkit Interpretabilidad mecanicista: localizar y neutralizar la dirección de rechazo de un LLM sin reentrenarlo (Arditi et al. 2024). Diff-Means, whitened SVD, COSMIC, steering vectors PyTorch · Transformers

Stack técnico

Ingeniería de datos — Python · SQL · Apache Kafka · Apache Spark (PySpark) · Apache Airflow · dbt · PostgreSQL · MongoDB · DuckDB · MinIO/S3 · Docker

IA / ML — PyTorch · Hugging Face (Transformers, PEFT/TRL) · LLMs · Fine-tuning LoRA · RAG · Agentes (ReAct) · LangChain · llama.cpp/GGUF · TensorFlow/Keras

Desarrollo web — JavaScript/TypeScript · React · Angular · Node.js · Laravel

BI y visualización — Power BI · Tableau · Streamlit · Metabase

Metodología — Git · CI (GitHub Actions) · Testing · Docker · Desarrollo asistido por IA

Contacto

LinkedIn · fmr693@gmail.com

Pinned Loading

  1. EXIST-2025 EXIST-2025 Public

    Sexism detection in social networks - EXIST 2025 shared task: transformer fine-tuning in Python (F1 +4.8% over baseline)

    Python

  2. llm-abliteration-toolkit llm-abliteration-toolkit Public

    Mechanistic interpretability toolkit for LLM refusal: locate and ablate the linear refusal direction (Arditi et al. 2024) without retraining. Diff-Means, whitened SVD, COSMIC layer selection, rever…

    Python

  3. crypto-data-pipeline crypto-data-pipeline Public

    Real-time crypto market analytics - automated ELT every 5 min with the modern data stack and data-quality tests baked into the Airflow DAG (CoinGecko -> Airflow -> dbt -> PostgreSQL -> Metabase). F…

    Python

  4. Pipeline-medallon-bronze-silver-gold-AETMET Pipeline-medallon-bronze-silver-gold-AETMET Public

    Real-time weather analytics on a medallion architecture (bronze/silver/gold) - streaming ingestion from the Spanish met agency (AEMET) through Kafka into a MinIO data lake, with DuckDB/MongoDB serv…

    Python

  5. iot-streaming-pipeline iot-streaming-pipeline Public

    End-to-end IoT telemetry pipeline: a simulated ESP32 sensor streams temperature over MQTT into Kafka, processed in real time with Spark Structured Streaming and landed as Parquet in a MinIO data la…

    Python