Cómo construir una gran cartera de ciencia de datos (con ejemplos)
La ciencia de los datos es uno de los campos más apasionantes y de mayor crecimiento de los últimos 10 años. Como resultado, hay muchos programas universitarios, bootcamps de ciencia de datos y cursos en línea disponibles para cualquiera que desee introducirse en este campo. Estos programas son una forma excelente de aprender las habilidades necesarias, pero cuando se trata de conseguir un puesto, es importante demostrar que tienes las habilidades adecuadas, ya que muchos empresarios buscan experiencia práctica. Un portafolio eficaz te permitirá mostrar, en lugar de decir, a tu posible empleador que tienes la competencia necesaria para tener éxito en un puesto de ciencia de datos.
Hoy en día, la mayoría de los científicos de datos tienen una cartera, pero muy pocos destacan. Si tu portafolio parece demasiado genérico, no contiene proyectos interesantes o carece de explicaciones, puede resultar difícil para tus lectores seguirlo y mantener el interés. Para asegurarte de que tu público aprecia plenamente tu duro trabajo, aquí tienes unos sencillos consejos sobre cómo convertir un buen portafolio en uno excepcional.
¿Por qué invertir en una cartera de ciencia de datos?
Como aspirante a científico de datos, hay un "por qué" obvio a la hora de invertir en un portafolio: ayudarte a conseguir un puesto demostrando tus habilidades, incluso antes de que el director de contratación te someta a una prueba técnica. Sin embargo, encontrar un nuevo puesto es una recompensa externa. Encontrar la motivación interna es crucial para que la satisfacción derivada de desarrollar una cartera dependa de ti, y no de un proceso de entrevistas que no puedes controlar. También ayudará a que tu portafolio parezca más auténtico y te motivará para presentar el mejor trabajo que puedas.
He aquí algunas razones clave por las que merece la pena dedicar tiempo a crear una cartera de alta calidad.
Conseguir el trabajo de tus sueños
Un portafolio suele ser una herramienta clave en el proceso de contratación de la ciencia de datos. Los responsables técnicos de contratación y los científicos de datos que te entrevisten lo revisarán para evaluar tus aptitudes, experiencia e intereses, y pueden hacerte preguntas al respecto.
Proporcionándote una experiencia práctica esencial
Aunque aprender la teoría que hay detrás de un algoritmo de aprendizaje automático es un paso esencial para introducirse en la ciencia de datos, la verdadera prueba es aplicar las habilidades que aprendes a un caso de uso. Trabajar en un proyecto en su totalidad consolidará lo que has aprendido y garantizará que puedas hablar de ello con confianza.
Conocer a la comunidad de datos
A los científicos de datos les gusta mirar lo que han hecho otros científicos de datos. No hay una forma "correcta" de hacerlo todo y promover y debatir tu proyecto con la comunidad es una forma estupenda de desarrollar soluciones interesantes a un problema.
Tu propio disfrute
Ésta es una de las razones más importantes para crear una cartera; después de todo, ¡la ciencia de datos es divertida! Si disfrutas de verdad con el proyecto en el que trabajas, eso te motivará a esforzarte al máximo, y es más probable que los demás se identifiquen con tu pasión.
¿Cuáles son los distintos tipos de proyectos de cartera?
Los proyectos de portafolio no sólo tienen que ver con habilidades técnicas, como demostrar tu capacidad para codificar. Los proyectos basados en el contenido también son una forma fantástica de mostrar tu comprensión de un tema y demostrar tus habilidades comunicativas, que son atributos clave que buscan los entrevistadores. De hecho, todo proyecto de cartera técnica debe tener una explicación clara dirigida a un público no técnico. A continuación encontrarás algunos ejemplos de los distintos tipos de proyectos de cartera. Tener una combinación de ambas en tu cartera es esencial para demostrar el conjunto de habilidades polifacéticas que suelen requerir los puestos de la ciencia de datos.
Proyectos basados en código
Los proyectos basados en el código son el tipo más común de proyecto de cartera. En pocas palabras, reproduce proyectos de ciencia de datos del mundo real tomando un conjunto de datos y resolviendo un problema en torno a él. Algunos ejemplos de proyectos basados en código son
- Recoger un conjunto de datos y realizar algún análisis o entrenar un modelo
- Construir un cuadro de mando en torno a un conjunto de datos o tema específico
- Crear un sitio web o una aplicación con la que alguien pueda interactuar.
- Analizar datos sobre un tema de tendencia, como un programa de televisión o una noticia popular
Proyectos basados en contenidos
Los proyectos basados en contenidos suelen considerarse menos proyectos de portafolio, pero son muy eficaces para demostrar tus habilidades comunicativas y de redacción. Algunos ejemplos de proyectos basados en contenidos son
- Entradas de blog y tutoriales de codificación que expliquen conceptos a otros científicos de datos o a audiencias no técnicas
- Tutoriales en vídeo que muestran cómo funciona una herramienta concreta
- Participar en un podcast - o presentar el tuyo propio en el que entrevistes a científicos de datos y profesionales
Construye tu cartera de datos
Muestra tus habilidades y proyectos en cuestión de minutos.
7 formas de crear una cartera de datos excepcional
1. Sé auténtico y persigue tu pasión
Los mejores proyectos de portafolio no son los que utilizan las herramientas y modelos más recientes o complejos. En cambio, los proyectos de portafolio que captan la mayor atención son los que proceden de un lugar de auténtica pasión: si has recopilado minuciosamente un conjunto de datos para una tarea específica, has escrito una historia convincente o has creado algo que habla al mundo de tu pasión, la gente lo reconocerá. Nick Singh, coautor de Acing the Data Science Interview, va un paso más allá en este episodio de DataFramed y sugiere que la pasión por tu propio trabajo puede ser tan contagiosa que hará creer a los jefes de contratación que te apasiona todo lo relacionado con la ciencia de datos, incluida su empresa y el puesto que solicitas.
Los proyectos de portafolio de ciencia de datos no son fáciles de terminar. Chocarás contra varios muros, tendrás que hacer malabarismos con otros compromisos, y completar el último 10% puede parecerte como volver a hacer todo el proyecto. Trabajar en algo que te apasione te ayudará a superar tus dificultades y a crear un proyecto del que te sientas orgulloso.
2. Cuenta una historia
Dedicar tiempo y pasión a un proyecto puede convertirte en un experto, pero es importante que te asegures de que tus lectores podrán seguir tu viaje de principio a fin con el contenido que has puesto a su disposición. Recuerda que muchas personas mirarán tu portafolio sin tener conocimiento previo de tus proyectos ni tiempo para investigar más. Por eso, una historia concisa pero cautivadora es esencial en un proyecto de portafolio. Tanto si lo publicas en la página Léame de un repositorio de GitHub como debajo del título de un tablero, asegúrate de explicar por qué el lector debería estar interesado en tu proyecto, tu motivación para hacerlo y la pregunta central a la que responde. Esto también sirve para captar la atención de los lectores y llamar su atención sobre tu cuaderno, modelo o tablero.
Una historia convincente es una de las partes más importantes de un portafolio, ya que muestra tu genuina empatía, curiosidad y pasión. Llevar a los lectores por un viaje atractivo hará que tus proyectos destaquen.
3. Demuestra tus habilidades técnicas, pero evita que se te vaya de las manos
Un buen proyecto de portafolio demuestra tus habilidades técnicas, pero eso no significa que tengas que aplicar todas las habilidades técnicas que tengas. Por ejemplo, si has dedicado horas a desarrollar una herramienta avanzada de scraping, no tienes por qué ampliar aún más el alcance de tu proyecto para dar cabida a las técnicas de modelado más avanzadas.
Un buen enfoque consiste en centrar tu proyecto en torno a un dominio técnico y aplicar los fundamentos en el resto del proyecto. Si el objetivo de tu proyecto es, por ejemplo, demostrar tu capacidad de limpieza y recopilación de datos, no pasa nada si no consigues la mayor precisión de predicción posible utilizando los modelos más vanguardistas. Limitar el alcance de tu proyecto es una forma estupenda de contar una historia concisa, pero interesante, que demuestre claramente distintos aspectos de tus habilidades técnicas.
Otra forma estupenda de demostrar tus habilidades técnicas es asegurarte de que tu código también es legible y está bien documentado. Asegúrate de que los cuadernos tienen títulos y explicaciones y revisa tu código y añade comentarios a las funciones. Las personas que se toman la molestia de hojear un cuaderno tomarán nota de los comentarios y de los nombres claros de las variables.
4. Evita los proyectos estereotipados
Los conjuntos de datos como Titanic, MNIST o Iris deben evitarse en la medida de lo posible. Se trata de grandes conjuntos de datos para aprender y probar modelos, pero son muy utilizados por los científicos de datos principiantes y los cursos en línea, hasta el punto de que los reclutadores y los directores de contratación pueden suponer que estás mucho antes en tu viaje por la ciencia de datos de lo que realmente estás. Además, no te ayudan a demostrar tu pasión por la ciencia de datos y el tipo de proyectos en los que estarías realmente interesado.
Mostrar en tu portafolio un proyecto comúnmente realizado es arriesgado. Es posible que muchas de las personas que miren tu portafolio hayan realizado el proyecto ellas mismas, lo que podría hacerles perder el interés, sobre todo porque hay muchos tutoriales disponibles públicamente en torno a estos conjuntos de datos.
5. No descuides tus habilidades interpersonales
Una gran narración no es la única "habilidad blanda" que debes intentar transmitir en un proyecto de portafolio. Explicar un problema complejo de forma sencilla y concisa es una habilidad importante para cualquier lugar de trabajo, y una que deberías destacar en tus proyectos de portafolio. Además, tu portafolio puede ser una oportunidad para contribuir a la comunidad de la ciencia de datos y enseñar a tus lectores nuevas habilidades. Otro atributo esencial en la ciencia de datos es la curiosidad, ya que a menudo es necesario escarbar en artículos o entradas de blog para encontrar soluciones a un problema concreto, y esto es algo que buscan los empleadores.
Generar ideas a partir de conjuntos de datos novedosos, y explicar cómo resolviste los retos únicos que encontraste en tu proyecto de cartera, son formas fantásticas de demostrar tu curiosidad y creatividad; habilidades que son difíciles de aprender.
6. Diseña para tus lectores
La experiencia de usuario de tus lectores es tan importante para tu cartera como para cualquier aplicación o sitio web. Es esencial guiar a los lectores hacia la información relevante sin abrumarlos, al tiempo que se les ofrece la oportunidad de profundizar si lo desean.
No escatimes en el diseño de tu proyecto: Una estética llamativa mantendrá el interés del lector y ayudará a que tu portafolio destaque. Un portafolio de aspecto limpio puede incluso ayudar a los lectores que no estén familiarizados con la terminología técnica a seguir tu historia. Además, puedes adaptar el estilo de diseño de tu proyecto como plantilla para futuros proyectos y enlazar entre ellos para guiar sin problemas a los usuarios a más contenidos tuyos.
7. Comercializa tu marca personal
Tu portafolio no es la única información que la gente puede encontrar sobre ti. Una simple búsqueda en Google probablemente sacará a relucir tu perfil de LinkedIn, sitio web, blog, GitHub y otros medios sociales. Debes asegurarte de que tu imagen, estilo de redacción y contenido son coherentes en todos estos canales y de que todos ellos enlazan entre sí. Asegúrate de incluir enlaces a tu portafolio en tu firma de correo electrónico y en tu CV o currículum. Una marca personal fuerte te ayuda a destacar como individuo. Una buena marca personal debe destacar tu habilidad clave, tus logros y mostrar a la gente lo que haces.
Ejemplos de una gran cartera de ciencia de datos
Si te interesa ver cómo se aplican estos principios en la práctica, aquí tienes una lista de carteras y proyectos de ciencia de datos de primer nivel en los que inspirarte:
Nikolaos Christoforidis: Pasión por el deporte
El proyecto de Nikolaos está repleto de código desde el principio y muestra claramente su gran dominio de Pandas y Scikit-learn. También hace un gran trabajo al crear un cuaderno atractivo trabajando con un conjunto de datos familiar para el público en general. A muchos de nosotros nos apasionan los deportes, y hoy en día existe una gran cantidad de conjuntos de datos interesantes. Un proyecto sobre un deporte puede atraer fácilmente a personas afines para que lo lean hasta el final, sobre todo si combina un conjunto de datos y una pregunta interesantes con visualizaciones geniales que capten elementos del propio deporte. También es una forma estupenda de garantizar que tu pasión se refleje claramente en tu trabajo, ¡lo que puede incluso atraer el interés de personas que no siguen el deporte!
Yan Holtz: Diseño fantástico
Si buscas inspiración para el diseño de tu portafolio, no busques más. El diseño del portafolio de Yan rezuma pasión y elegancia, sobre todo la animación de la parte superior de la página, que reacciona al puntero del ratón. Es imposible no seguir desplazándose hasta llegar a algunos de los propios proyectos. Cada proyecto tiene una visualización única que te atrae aún más, mientras que al hacer clic aparece una explicación sucinta.
Samuel Verevis: Personalidad
Aunque los conjuntos de datos sobre el vino son habituales en las carteras, Samuel aporta algo completamente nuevo a la historia mediante títulos de sección humorísticos y visualizaciones excepcionales. Los gráficos combinan la frescura con la claridad, mostrando una clara comprensión de cómo contar una historia y mantener el interés del lector. Es una forma estupenda de mostrar autenticidad, habilidades y pasión, incluso en un conjunto de datos que suele utilizarse en otros proyectos de la cartera.
Philipp Schöttler: Volverse viral
Datos de Bitcoin y atractivos proyectos de cartera; una combinación perfecta. Está claro que Phillipp es un apasionado y un gran conocedor del tema, y ha sido capaz de elaborar una lectura completa e interesante sobre Bitcoin, al tiempo que muestra su profundo conocimiento de los mercados financieros. Esta es una gran demostración de cómo crear contenido sobre un tema que es popular sin dejar de aportar valor a una serie de audiencias como otros científicos de datos, inversores, entusiastas del blockchain y personas que buscan aprender.
Saber más
Aunque mirar ejemplos es estupendo para inspirarse, y leer guías como ésta puede ayudarte a seguir el camino correcto, lo más importante que debes tener en cuenta es que tu portafolio debe reflejarte a ti: tus habilidades, tus intereses y tu personalidad. Al fin y al cabo, éste es tu viaje en la ciencia de datos. A continuación encontrarás más recursos para guiarte en tu viaje:
Check out our latest jobs
blog
¿Qué es la gestión de datos? Guía práctica con ejemplos
Tim Lu
12 min
blog
Cómo convertirse en científico de datos en 8 pasos
blog
¿Qué es el análisis de datos? Una guía experta con ejemplos
blog
¿Qué es la ciencia de datos? Definición, ejemplos, herramientas y más
blog
Las 15 mejores habilidades de los científicos de datos para 2024
blog