Construyo los canales, los modelos y la infraestructura para el análisis de datos.

Como Ingeniero de Sistemas con enfoque en ingeniería de datos. Combino una sólida formación analítica con habilidades de comunicación, trabajo en equipo y pensamiento crítico. Cuento con experiencia práctica en proyectos de ciencia de datos, donde he demostrado mis conocimientos técnicos en Python, SQL, ETL, visualización de datos con Power BI, análisis exploratorio con Pandas y Matplotlib. Aunque no tengo experiencia laboral formal en IT, me he actualizado a través de cursos, certificaciones y un bootcamp intensivo en ciencia de datos, obteniendo habilidades en Cloud Computing, Spark, sistemas de ingesta de datos, y metodologías ágiles.

me

Hola 👋, Soy David Gonzalez...

"Ingeniero de pipelines de datos / Arquitecto de infraestructura analítica ubicado en Cali, Colombia".

Como Ingeniero de Datos, mi experiencia radica en proyectos personales y prácticas profesionales, donde he adquirido un sólido dominio en la integración de APIs y la implementación de soluciones en la nube. Mi enfoque se centra en diseñar, construir y mantener pipelines de alto rendimiento para el flujo y transformación de datos. Mi competencia en herramientas como Apache Spark y Hadoop me capacita para enfrentar desafíos de datos con confianza, y he demostrado habilidades en la extracción de datos, limpieza y estructuración, así como en la carga en data warehouses o lakes. Mi destreza en Python y SQL me permite crear soluciones personalizadas y mi habilidad para comunicar insights se refleja en la creación de visualizaciones atractivas.

Asimismo, como Arquitecto de Infraestructura Analítica he diseñado soluciones escalables en la nube para sustentar iniciativas de Big Data y machine learning. Me apasiona crear infraestructuras sólidas, seguras y flexibles para potenciar el valor de los datos en las organizaciones.

"El mejor material no es nada sin una visión y un diseño competente." -Gail Kelly

Mis habilidades

Aunque aún estoy dando mis primeros pasos como ingeniero de datos, he desarrollado un sólido conjunto de habilidades técnicas y de comunicación a través de proyectos propios alojados en GitHub. Allí dejo en evidencia mi capacidad de resolver problemas de análisis de datos del mundo real mediante la construcción de ETLs y pipelines efectivos. Si bien me falta experiencia trabajando en equipos corporativos, mi proactividad para crear soluciones concretas demuestra mi potencial. Poseo pensamiento analítico para traducir necesidades en arquitecturas técnicas escalables, a la vez que habilidades para explicar esas soluciones en términos sencillos a audiencias no técnicas. busco una primera oportunidad formal donde pueda seguir creciendo y nutriendo esta combinación de habilidades técnicas, de negocios y comunicacionales.

SQL y bases de datos relacionales

Exp GitHub

ETL y pipelines de datos

Exp GitHub

Arquitecturas Big Data

Exp GitHub

Habilidades en programación

Me desempeño con soltura en Python para análisis de datos, modelado estadístico y machine learning, manejando algoritmos como regresión logística, árboles de decisión, SVM y redes neuronales. Poseo sólidos conocimientos en SQL y bases de datos relacionales, optimizando queries, tuning y análisis de rendimiento. Cuento con experiencia en diseño e implementación de robustos pipelines de ETL usando tecnologías como Airflow. Conozco sistemas de procesamiento distribuido y paralelo como Spark y Kafka para arquitecturas Big Data. Me mantengo actualizado en tecnologías cloud de AWS, GCP y Azure. En resumen, dominio un amplio stack de herramientas para ingeniería de datos, con capacidad de aprender y adoptar rápidamente.




Python
90% Complete
SQL
80% Complete
Spark
75% Complete
AWS
75% Complete

Experiencia


2 Años de Experiencia!

Si bien aún no cuento con experiencia profesional formal, he desarrollado sólidas habilidades prácticas a través de proyectos personales en GitHub, donde evidencio capacidades de resolver problemas de ingeniería de datos del mundo real. Asimismo, completé con éxito un bootcamp intensivo de ciencia de datos de más de 700 horas, donde realicé prácticas guiadas y desarrollé soluciones utilizando Python, SQL, AWS y las últimas herramientas en ciencia de datos. Este entrenamiento acelerado me aportó experiencia técnica a la vez que me permitió crecer mis habilidades para el análisis de datos y machine learning. Con estas prácticas he podido obtener un conocimiento profundo que ahora busco seguir profundizando en el campo laboral.

Name

ETLs

Proyectos personales: 1 año

Name

SoyHenry

Bootcamp de ciencia de datos: 7 meses

Name

Bootcamp

Prácticas profesionales: 2 meses

Name

Cursos de especialización: 5 meses

Portafolio

Mi portafolio presenta proyectos de ingeniería y ciencia de datos implementando pipelines de ETL, visualización de datos con Power BI, modelado predictivo mediante algoritmos de Machine Learning como regresión logística y random forest, y uso de servicios cloud de AWS, GCP y Azure para almacenamiento, ETL y orquestación. A través de estas iniciativas prácticas demuestro mi capacidad de resolver el ciclo completo de análisis de datos, desde la recolección e integración de fuentes heterogéneas, pasando por el análisis descriptivo y predictivo de datos, hasta la implementación de sistemas de procesamiento distribuido en la nube, evidenciando mis habilidades integrales en data engineering y data science..

¡Mantengámonos en contacto!

Gracias por visitar mi perfil. Si desea ponerse en contacto conmigo, complete el siguiente formulario.

Direccion:

Cali, Colombia COL

WhatsApp:

+57-318-6796130