Como criar um excelente portfólio de ciência de dados (com exemplos)
A ciência de dados é um dos campos mais empolgantes e de crescimento mais rápido dos últimos 10 anos. Como resultado, muitos programas universitários, bootcamps de ciência de dados e cursos on-line estão disponíveis para quem deseja ingressar na área. Esses programas são uma excelente maneira de aprender as habilidades necessárias, mas quando se trata de conseguir um cargo, é importante demonstrar que você tem o conjunto certo de habilidades, pois muitos empregadores procuram experiência prática. Um portfólio eficaz permitirá que você mostre ao empregador em potencial, em vez de dizer, que você tem a proficiência necessária para ter sucesso em uma função de ciência de dados.
Atualmente, a maioria dos cientistas de dados tem um portfólio, mas poucos se destacam. Se seu portfólio parecer muito genérico, não contiver projetos interessantes ou não tiver explicações, pode ser difícil para seus leitores acompanharem e se manterem interessados. Para garantir que seu trabalho árduo seja totalmente apreciado pelo público, aqui estão algumas dicas simples sobre como transformar um bom portfólio em um portfólio excepcional.
Por que investir em um portfólio de ciência de dados?
Como aspirante a cientista de dados, há um "porquê" óbvio quando se trata de investir em um portfólio: para ajudá-lo a conseguir um cargo demonstrando suas habilidades, mesmo antes de o gerente de contratação submetê-lo a um teste técnico. Entretanto, encontrar uma nova função é uma recompensa externa. Encontrar motivação interna é fundamental para que a satisfação decorrente do desenvolvimento de um portfólio dependa de você, e não de um processo de entrevista que você não pode controlar. Isso também fará com que seu portfólio pareça mais genuíno e o motivará a apresentar o melhor trabalho possível.
Aqui estão alguns dos principais motivos pelos quais vale a pena dedicar seu tempo à criação de um portfólio de alta qualidade.
Conseguir o cargo dos seus sonhos
O portfólio costuma ser uma ferramenta fundamental no processo de contratação da ciência de dados. Os gerentes técnicos de contratação e os cientistas de dados que o entrevistarem darão uma olhada nele para avaliar suas habilidades, experiência e interesses, e poderão fazer perguntas sobre ele.
Proporcionando a você uma experiência prática essencial
Embora aprender a teoria por trás de um algoritmo de aprendizado de máquina seja uma etapa essencial para entrar na ciência de dados, o verdadeiro teste é aplicar as habilidades que você aprendeu a um caso de uso. Trabalhar em um projeto em sua totalidade consolidará o que você aprendeu e garantirá que você possa falar sobre ele com confiança.
Conhecendo a comunidade de dados
Os cientistas de dados gostam de ver o que outros cientistas de dados fizeram. Não há uma maneira "certa" de fazer tudo, e promover e discutir seu projeto com a comunidade é uma ótima maneira de desenvolver soluções interessantes para um problema.
Seu próprio prazer
Esse é um dos motivos mais importantes para criar um portfólio; afinal de contas, a ciência de dados é divertida! Se você realmente gostar do projeto em que está trabalhando, isso o motivará a dar o melhor de si, e é mais provável que outras pessoas se identifiquem com sua paixão.
Quais são os diferentes tipos de projetos de portfólio?
Os projetos de portfólio não se referem apenas a habilidades técnicas, como demonstrar sua capacidade de codificar. Os projetos baseados em conteúdo também são uma maneira fantástica de mostrar sua compreensão de um tópico e demonstrar suas habilidades de comunicação, que são atributos importantes que os entrevistadores procuram. De fato, todo projeto de portfólio técnico deve ter uma explicação clara destinada a um público não técnico. Abaixo estão alguns exemplos dos diferentes tipos de projetos de portfólio. Ter uma combinação de ambos em seu portfólio é essencial para demonstrar o conjunto de habilidades multifacetadas que as funções de ciência de dados geralmente exigem.
Projetos baseados em código
Os projetos baseados em código são o tipo mais comum de projeto de portfólio. Em resumo, ele replica projetos de ciência de dados do mundo real, pegando um conjunto de dados e resolvendo um problema em torno dele. Exemplos de projetos baseados em código incluem:
- Extrair um conjunto de dados e realizar alguma análise ou treinar um modelo
- Criar um painel em torno de um conjunto de dados ou tópico específico
- Criar um site ou aplicativo com o qual alguém possa interagir.
- Análise de dados sobre um tópico de tendência, como um programa de TV popular ou uma notícia
Projetos baseados em conteúdo
Os projetos baseados em conteúdo são geralmente menos vistos como projetos de portfólio, mas são extremamente eficazes para mostrar suas habilidades de comunicação e redação. Exemplos de projetos baseados em conteúdo incluem
- Publicações em blogs e tutoriais de codificação que explicam conceitos para outros cientistas de dados ou para públicos não técnicos
- Tutoriais em vídeo que mostram como uma determinada ferramenta funciona
- Participar de um podcast - ou apresentar o seu próprio podcast, no qual você entrevista cientistas de dados e profissionais
7 maneiras de criar um portfólio de dados excepcional
1. Seja autêntico e busque sua paixão
Os melhores projetos de portfólio não são aqueles que usam as ferramentas e os modelos mais recentes ou mais complexos. Em vez disso, os projetos de portfólio que chamam mais a atenção são aqueles que vêm de um lugar de paixão autêntica. Se você tiver extraído meticulosamente um conjunto de dados para uma tarefa específica, escrito uma história convincente ou criado algo que fale ao mundo sobre sua paixão, as pessoas reconhecerão isso. Nick Singh, coautor do livro Acing the Data Science Interview, vai um passo além neste episódio do DataFramed e sugere que a paixão pelo seu próprio trabalho pode ser tão contagiante que fará com que os gerentes de contratação acreditem que você é apaixonado por tudo relacionado à ciência de dados, inclusive pela empresa deles e pela função para a qual você está se candidatando.
Os projetos de portfólio de ciência de dados não são fáceis de concluir. Você atingirá várias barreiras, terá que fazer malabarismos com outros compromissos e concluir os últimos 10% pode parecer como se estivesse fazendo todo o projeto novamente. Trabalhar em algo pelo qual você é apaixonado o ajudará a superar suas dificuldades e a garantir que você crie um projeto do qual se orgulhe.
2. Conte uma história
Dedicar tempo e paixão a um projeto pode torná-lo um especialista, mas é importante garantir que seus leitores possam acompanhar sua jornada do início ao fim com o conteúdo que você disponibilizou. Lembre-se de que muitas pessoas estarão analisando seu portfólio sem conhecimento prévio de seus projetos e sem tempo para fazer pesquisas adicionais. Por esse motivo, uma história concisa, mas cativante, é essencial em um projeto de portfólio. Quer você o publique na página leia-me de um repositório do GitHub ou abaixo do título de um painel, certifique-se de explicar por que o leitor deve se interessar pelo seu projeto, sua motivação para fazê-lo e a pergunta principal que ele responde. Isso também serve como uma forma de capturar a atenção dos leitores e chamar a atenção deles para seu notebook, modelo ou painel.
Uma história convincente é uma das partes mais importantes de um portfólio, pois mostra sua empatia, curiosidade e paixão genuínas. Levar os leitores em uma jornada envolvente fará com que seus projetos se destaquem.
3. Mostre suas habilidades técnicas, mas evite o desvio de escopo
Um bom projeto de portfólio demonstra suas habilidades técnicas, mas isso não significa que você precisa aplicar todas as habilidades técnicas que possui. Por exemplo, se você passou horas desenvolvendo uma ferramenta de raspagem avançada, não precisa expandir ainda mais o escopo do seu projeto para acomodar técnicas de modelagem de última geração.
Uma boa abordagem é centralizar seu projeto em um domínio técnico e aplicar os fundamentos em todo o restante do projeto. Se o objetivo do seu projeto for demonstrar suas habilidades de limpeza e coleta de dados, por exemplo, não há problema se você não produzir a melhor precisão de previsão possível usando os modelos mais avançados. Limitar o escopo do seu projeto é uma ótima maneira de contar uma história concisa, mas interessante, que demonstre claramente diferentes aspectos do seu conjunto de habilidades técnicas.
Outra ótima maneira de mostrar suas habilidades técnicas é garantir que seu código também seja legível e bem documentado. Certifique-se de que os cadernos tenham títulos e explicações e analise seu código e adicione comentários às funções. As pessoas que dedicam algum tempo para examinar um notebook anotam os comentários e os nomes claros das variáveis.
4. Evite projetos padronizados
Conjuntos de dados como Titanic, MNIST ou Iris devem ser evitados, se possível. Esses são ótimos conjuntos de dados para aprender e testar modelos, mas são amplamente usados por cientistas de dados iniciantes e cursos on-line, a ponto de os recrutadores e gerentes de contratação presumirem que você está muito mais adiantado em sua jornada de ciência de dados do que realmente está. Além disso, eles não o ajudam a mostrar sua paixão pela ciência de dados e o tipo de projetos nos quais você estaria realmente interessado.
Apresentar um projeto comumente realizado em seu portfólio é arriscado. Muitas pessoas que olham seu portfólio podem ter feito o projeto elas mesmas, o que pode fazer com que percam o interesse, especialmente porque há muitos tutoriais disponíveis publicamente sobre esses conjuntos de dados.
5. Não negligencie suas habilidades interpessoais
Uma boa narração não é a única "habilidade interpessoal" que você deve tentar transmitir em um projeto de portfólio. Explicar um problema complexo de forma simples e concisa é uma habilidade importante para qualquer local de trabalho e que deve ser destacada em seus projetos de portfólio. Além disso, seu portfólio pode ser uma oportunidade de contribuir com a comunidade de ciência de dados e ensinar novas habilidades aos seus leitores. Outro atributo essencial na ciência de dados é a curiosidade, pois muitas vezes é necessário pesquisar em artigos ou postagens de blogs para encontrar soluções para um problema específico, e isso é algo que os empregadores procuram.
Gerar percepções a partir de conjuntos de dados novos e explicar como você resolveu os desafios exclusivos que encontrou no projeto do portfólio são maneiras fantásticas de demonstrar sua curiosidade e criatividade, habilidades que são difíceis de aprender.
6. Design para seus leitores
A experiência do usuário dos seus leitores é tão importante para o seu portfólio quanto para qualquer aplicativo ou site. É essencial orientar os leitores para as informações relevantes sem sobrecarregá-los e, ao mesmo tempo, oferecer a oportunidade de se aprofundarem, se desejarem.
Não economize no design de seu projeto: Uma estética atraente manterá o interesse do leitor e ajudará seu portfólio a se destacar. Um portfólio de aparência limpa pode até mesmo ajudar os leitores que não estão familiarizados com a terminologia técnica a acompanhar sua história. Além disso, você pode adaptar o estilo de design do seu projeto como um modelo para projetos futuros e vincular-se a eles para guiar os usuários a mais conteúdo.
7. Divulgue sua marca pessoal
Seu portfólio não é a única informação que as pessoas podem encontrar sobre você. Uma simples pesquisa no Google provavelmente exibirá seu perfil no LinkedIn, site, blog, GitHub e outras mídias sociais. Você deve garantir que sua imagem, seu estilo de redação e seu conteúdo sejam consistentes em todos esses canais e que todos estejam vinculados uns aos outros. Certifique-se de incluir links para seu portfólio em sua assinatura de e-mail e em seu CV ou currículo. Uma marca pessoal forte ajuda você a se destacar como indivíduo. Uma boa marca pessoal deve destacar suas principais habilidades, suas realizações e mostrar às pessoas o que você faz.
Exemplos de um excelente portfólio de ciência de dados
Se você estiver interessado em ver como esses princípios são aplicados na prática, aqui está uma lista de portfólios e projetos de ciência de dados de alto nível para se inspirar:
Nikolaos Christoforidis: Paixão por esportes
O projeto de Nikolaos tem muito código desde o início e mostra claramente sua alta proficiência em Pandas e Scikit-learn. Ele também faz um ótimo trabalho ao criar um notebook envolvente, trabalhando em um conjunto de dados que é familiar para o público em geral. Muitos de nós são apaixonados por esportes e, atualmente, há uma grande quantidade de conjuntos de dados interessantes disponíveis. Um projeto sobre um esporte pode facilmente atrair pessoas que pensam da mesma forma a ler até o fim, principalmente se combinar um conjunto de dados e uma pergunta interessantes com visualizações interessantes que capturam elementos do próprio esporte. Essa também é uma ótima maneira de garantir que sua paixão transpareça claramente em seu trabalho, o que pode até mesmo atrair o interesse de pessoas que não acompanham o esporte!
Yan Holtz: Design fantástico
Se estiver procurando inspiração para o design de seu portfólio, não procure mais. O design do portfólio de Yan exala paixão e suavidade, especialmente a animação na parte superior da página que reage ao ponteiro do mouse. É impossível não continuar rolando a tela até chegar a alguns dos projetos em si. Cada projeto tem uma visualização exclusiva que o atrai ainda mais, enquanto um clique traz uma explicação sucinta.
Samuel Verevis: Personalidade
Embora os conjuntos de dados de vinho sejam comuns em portfólios, Samuel traz algo completamente novo para a história por meio de títulos de seção bem-humorados e visualizações excepcionais. Os gráficos aqui combinam frescor com clareza, demonstrando uma compreensão clara de como contar uma história e manter o leitor interessado. Essa é uma ótima maneira de mostrar autenticidade, habilidades e paixão, mesmo em um conjunto de dados que é frequentemente usado em outros projetos de portfólio.
Philipp Schöttler: Viralização
Dados de Bitcoin e projetos de portfólio envolventes; uma combinação perfeita. Phillipp é claramente apaixonado e conhecedor do assunto e conseguiu produzir uma leitura completa e interessante sobre o Bitcoin e, ao mesmo tempo, mostrar seu profundo conhecimento dos mercados financeiros. Essa é uma ótima demonstração de como criar conteúdo sobre um tópico popular e, ao mesmo tempo, fornecer valor para uma variedade de públicos, como outros cientistas de dados, investidores, entusiastas de blockchain e pessoas que desejam aprender.
Saiba mais
Embora a observação de exemplos seja ótima para inspiração e a leitura de guias como este possa ajudá-lo a seguir o caminho certo, o mais importante a ter em mente é que seu portfólio deve refletir você - suas habilidades, seus interesses e sua personalidade. Afinal de contas, essa é sua jornada na ciência de dados. Você pode encontrar mais recursos para orientá-lo em sua jornada abaixo:
Check out our latest jobs
blog
Como criar um currículo de cientista de dados de destaque [Guia definitivo]
blog
Guia de casos de uso de ciência de dados
blog
Como se tornar um cientista de dados em 8 etapas
blog
O que é ciência de dados? Definição, exemplos, ferramentas e mais
blog
As 15 principais habilidades do cientista de dados para 2024
blog