Pular para o conteúdo principal
InicioBlogCiência de dados

Um roteiro de ciência de dados para 2024

Você quer começar ou crescer no campo da ciência de dados? Este roteiro de ciência de dados ajuda você a entender e a começar no cenário da ciência de dados.
abr. de 2024  · 10 min leer

Independentemente de você ser um estudante, um aspirante a cientista de dados ou um profissional em busca de uma mudança de carreira, se quiser se tornar um cientista de dados experiente, você precisa seguir um caminho. Isso nem sempre é fácil, pois o cenário da ciência de dados se tornou bastante amplo e, como resultado, há diferentes tipos de profissionais de ciência de dados com diferentes atividades e conjuntos de habilidades.

Para se aproximar de um caminho da ciência de dados, este artigo oferece uma visão geral do cenário da ciência de dados para que você possa ver quais funções correspondem às suas ambições. Além disso, ele fornece dicas sobre como entrar ou crescer em direção a diferentes funções dentro desse cenário, respondendo a perguntas como: Que habilidades você deve desenvolver e com quais métodos deve se familiarizar?

Vamos começar com nosso roteiro de ciência de dados.

1. Entendendo os fundamentos da ciência de dados

O que é ciência de dados?

Para entender o contexto de um roteiro de ciência de dados, é fundamental ter uma ideia do que é ciência de dados. Temos um guia completo sobre as definições e explicações da ciência de dados, mas, para fins deste artigo, consideraremos a ciência de dados como o conjunto de atividades destinadas a resolver problemas usando dados.

Um problema que ocorre com muita frequência é "tenho uma pergunta, mas não sei a resposta", portanto, se você executar uma consulta SQL em um banco de dados de vendas para descobrir a receita que uma organização obteve no mês passado, você é um cientista de dados!

Muitas vezes, os problemas/soluções são mais complexos e exigem um conjunto mais diversificado de habilidades. Para poder discutir essa ampla gama de funções e habilidades de ciência de dados ao longo deste roteiro de ciência de dados, usaremos um ciclo de vida de projeto de ciência de dados como um portmanteau. Isso nos permitirá mapear as diferentes atividades e funções e servirá de base para definir os terrenos da ciência de dados.

2. Familiarização com o ciclo de vida do projeto de ciência de dados

Os projetos de ciência de dados começam, em sua maioria, com uma questão ou um problema comercial. Um problema desencadeia uma fase de iniciação, na qual um conjunto de soluções possíveis é definido e a viabilidade inicial é avaliada. A coleta inicial de dados ou uma análise exploratória dos dados disponíveis é feita para ver o que é possível e o que não é. Os dados são suficientemente ricos? Ele contém recursos suficientes?

Iniciação e exploração

Quando todas as luzes estiverem verdes, começamos a desenvolver um modelo preditivo. O modelo usará os dados para prever os resultados. Inicialmente, isso pode ser apenas um modelo único, treinado, testado e validado em um conjunto de validação cruzada k-fold (uma técnica de aprendizado de máquina para avaliar a probabilidade de um modelo ter um bom desempenho em dados não vistos). Esse é o trabalho normalmente realizado pelos cientistas de dados clássicos. Quando o modelo tiver um desempenho suficientemente bom, é hora de começar a produzi-lo e colocá-lo em um pipeline na infraestrutura existente, onde o desempenho será monitorado e o modelo será retreinado quando necessário.

Cada uma dessas fases requer habilidades diferentes. Durante a fase de iniciação, as pessoas precisam ter visão de negócios, estar familiarizadas com a transformação de dados, limpeza, estatística descritiva e estatística inferencial básica. Esse é um trabalho que pode ser feito por um analista de dados e/ou um cientista de dados.

Desenvolvimento e produção de modelos

Na fase de modelagem, é necessário criar modelos preditivos. Modelos simples, como regressões, podem ser criados por um analista de dados, mas, se ficarem mais complexos, você precisará de um cientista de dados para criar um modelo usando um algoritmo existente ou até mesmo um engenheiro de aprendizado de máquina para alterar os algoritmos atuais ou criar novos algoritmos.

Ao implantar e produzir o modelo, você entra no domínio do engenheiro de aprendizado de máquina ou do engenheiro de dados. Ao contrário dos estágios anteriores, não há necessariamente um vínculo estreito com os negócios, e a tarefa em questão girava em torno da criação e do monitoramento de um pipeline em torno do modelo preditivo para fornecer resultados confiáveis aos sistemas-alvo corretos.

Durante todo o processo, todos os dados devem estar disponíveis nos locais certos com as meta-informações corretas, que é a função do arquiteto de dados. À medida que novos dados são ingeridos ou que os dados existentes são transformados em novas informações, eles também garantem que os dados acabem no lugar certo.

Integração de funções e colaboração multifuncional

A maneira como as diferentes funções contribuem nas diferentes fases do ciclo de vida é ilustrada na imagem abaixo. Como diferentes funções contribuem em diferentes estágios, elas exigem diferentes habilidades.

As funções no início do ciclo de vida exigem mais perspicácia comercial e menos engenharia, enquanto as fases posteriores exigem menos perspicácia comercial e mais engenharia e otimização de algoritmos. Para ilustrar o ponto, como cientista de dados, você pode se dar bem com um desempenho computacional abaixo do ideal para mostrar o valor e o desempenho do seu modelo. Mas assim que você for responsável pela produção de modelos, precisará ser capaz de otimizar a complexidade computacional para garantir que seu pipeline seja (custo)eficiente.

O nível de contribuição das diferentes funções de ciência de dados em um projeto de ciência de dados (DAn - analista de dados, DS - cientista de dados, MLE - engenheiro de aprendizado de máquina, DE - engenheiro de dados, DAr - arquiteto de dados) - Imagem do autor

O nível de contribuição das diferentes funções de ciência de dados em um projeto de ciência de dados (DAn - analista de dados, DS - cientista de dados, MLE - engenheiro de aprendizado de máquina, DE - engenheiro de dados, DAr - arquiteto de dados) - Imagem do autor

É importante saber que os limites entre as funções não são rígidos. Muitos cientistas de dados já pensam nos sistemas de origem/destino e na eficiência computacional corretos e os consideram em seu código. Um engenheiro de aprendizado de máquina pode perceber que determinadas abordagens de geração de recursos podem melhorar o desempenho do modelo. Um analista de dados pode ter boas recomendações sobre onde armazenar, no catálogo de dados, os recursos gerados para o arquiteto de dados. Em outras palavras, todas as funções devem, até certo ponto, estar cientes do trabalho das outras funções, mas não precisam entender profundamente as responsabilidades umas das outras.

Habilidades e ferramentas essenciais

Com relação às habilidades e ferramentas de que você precisará, há uma base clara. Independentemente da etapa do ciclo de vida de um projeto de ciência de dados em que você contribua, será necessário ter algum conhecimento básico de matemática e estatística, desenvolvimento de software colaborativo e manipulação de dados. Em linhas gerais, o início de qualquer roteiro de ciência de dados consiste em:

Existem diferentes tipos de funções de ciência de dados com diferentes requisitos de habilidades: um analista de dados precisará de um conhecimento mais profundo de SQL do que um engenheiro de dados. Um cientista de dados precisa conhecer o aprendizado de máquina melhor do que um arquiteto de dados. Portanto, é aqui que o roteiro da ciência de dados se divide: dependendo de onde estão suas ambições no cenário da ciência de dados, você precisará aprender habilidades diferentes. As seções a seguir descreverão as diferentes ramificações do roteiro em que você pode pensar.

3. Mergulhando mais fundo na análise e visualização de dados

Análise exploratória de dados (EDA)

Independentemente do estágio em que se encontra o roteiro da ciência de dados, seja você um veterano experiente ou alguém que está apenas começando, todos os projetos de ciência de dados começam com a compreensão dos dados.

Obter uma compreensão completa de seus dados é fundamental para avaliar a viabilidade de seu projeto. Começando com perguntas básicas, como "quais variáveis eu tenho?" e "quantas observações eu tenho?" e terminando com perguntas mais complexas, como "quais são as relações entre as variáveis?

Muitas vezes, os resultados de uma EDA podem ser a resposta para as perguntas de suas partes interessadas. Quando devidamente visualizados e apresentados de forma coerente, por exemplo, em um painel, os resultados de uma simples análise de dados podem ser usados para responder a perguntas complexas. Isso, no entanto, depende da habilidade de visualização de dados.

Mas só de mostrar por meio de sua EDA que, por exemplo, existem diferentes segmentos de visitantes do site, você já contribuiu com valor de uma forma científica de dados.

Há várias maneiras de visualizar seus resultados. Em bibliotecas/pacotes de visualização na linguagem que você usa (como ggplot2 do R e matplotlib do Python) ou em ferramentas dedicadas de visualização de dados (como PowerBI, Tableau ou até mesmo Excel)

Domínio da visualização de dados

Especialmente quando nos concentramos mais nas tarefas de um analista de dados, ter uma compreensão mais profunda da visualização de dados ajuda.

Para a maioria das funções de ciência de dados, as visualizações podem servir para verificar suposições por meio de gráficos de dispersão e histogramas, mas quando a análise em si é o produto final, como no caso de um analista de dados, você se deparará com situações em que desejará tornar os resultados da análise agradáveis de digerir.

Pense em estilos de casa personalizados, novas visualizações ou infográficos para servir de insumo para uma unidade de tomada de decisões. Nessas situações, é útil poder criar uma visualização de dados que seja praticamente uma obra de arte. Understanding Data Visualization é um curso que realmente ajuda a aprofundar suas competências em visualização de dados.

Um roteiro de ciência de dados visualizado como mapa de metrô, mostrando a base que todas as funções de ciência de dados têm em comum e as habilidades específicas para as diferentes funções. - Imagem do autor

Um roteiro de ciência de dados visualizado como mapa de metrô, mostrando a base que todas as funções de ciência de dados têm em comum e as habilidades específicas para as diferentes funções. - Imagem do autor

4. Construindo uma base em estatística e matemática

Estatística descritiva e inferencial

Outra das primeiras paradas em um roteiro de ciência de dados é a estatística. Alguns conceitos estatísticos básicos devem ser uma segunda natureza para qualquer tipo de cientista de dados.

A qualquer momento, você terá que ser capaz de descrever seus dados e subgrupos em seus dados. Qual é a renda média em seu conjunto de dados? Quais são as rendas mínima e máxima? O que é o desvio padrão ou quais são outras medidas de dispersão? E se você tiver valores categóricos, quantos valores exclusivos existem? Qual é a mais frequente? Todos os valores ocorrem com a mesma frequência ou são distribuídos de maneira menos uniforme?

Responder a perguntas com análises descritivas sobre grupos/subgrupos já pode fornecer insights valiosos, mas, na maioria das vezes, é preciso observar a relação entre as variáveis em seu conjunto de dados e passar para as estatísticas inferenciais.

A parte desafiadora e interessante da estatística inferencial são os diferentes tipos de valores categóricos e numéricos e as relações entre eles. Esses exemplos incluem:

  • Correlações; a relação entre valores numéricos, como "qual é a relação entre idade e renda?".
  • A relação entre categórico e numérico para investigar a pergunta: "Como a renda se compara entre homens e mulheres?" (com o gênero como valor de entrada categórico e a renda como valor-alvo numérico),
  • Ou o contrário: "As pessoas mais velhas são mais propensas a se divorciar?" (com idade como valor de entrada numérico e divorciado como valor de destino categórico).
  • Relações entre variáveis categóricas, "Os homens são mais frequentemente divorciados do que as mulheres?"

Para poder responder a essas perguntas, você precisa conhecer os diferentes tipos de testes estatísticos, desde o mais simples teste T até métodos mais complexos, como regressões lineares multivariadas ou análise de séries temporais.

Você pode fazer cursos relevantes para aprofundar seu conhecimento de estatística: Python, R e até mesmo ferramentas independentes. Esses cursos fornecem uma base adequada para começar a trabalhar com aprendizado de máquina. Ao compreender estatisticamente a relação entre preditores e variáveis-alvo, você entende os princípios dos algoritmos usados para criar modelos de aprendizado supervisionado.

A profundidade com que você deseja se aprofundar nessa área depende, mais uma vez, de onde você quer chegar no roteiro da ciência de dados. Se o seu objetivo é ser um analista de dados, entender os conceitos básicos de estatística pode ser suficiente. Os arquitetos de dados podem não precisar de nenhum conhecimento estatístico. Mas os cientistas de dados e os engenheiros de aprendizado de máquina certamente se depararão com situações em que terão de confiar em seus conhecimentos estatísticos.

Conceitos matemáticos para ciência de dados

A ciência de dados é construída com base em números e cálculos e, consequentemente, a matemática desempenha um papel importante. Embora um diploma de matemática avançada não seja uma parada necessária em um roteiro de ciência de dados, entender álgebra e cálculo o ajudará a compreender conceitualmente vários métodos usados com frequência na ciência de dados. A maioria das abordagens de redução de dimensionalidade (como PCA e Fatoração de Matriz) depende de Álgebra Linear, e muitos algoritmos de otimização (como descida de gradiente) dependem de Cálculo.

E, assim como acontece com a estatística e a análise de dados, esse conhecimento não é necessariamente relevante para todas as funções de ciência de dados. Se o seu objetivo é se tornar um engenheiro de aprendizado de máquina, não há como evitar a matemática. Mas a maioria das outras funções - até mesmo um cientista de dados - pode se safar sem saber álgebra e cálculo.

Para saber mais e entender os conceitos algébricos, confira nosso curso sobre Álgebra linear para ciência de dados em R

5. Explorando tópicos avançados: Aprendizado de máquina e IA

Introdução ao aprendizado de máquina

O aprendizado de máquina é a arte de criar software que aprende com os dados. É realmente o pão e a manteiga para cientistas de dados, engenheiros de aprendizado de máquina e até mesmo engenheiros de dados. A parte de sua solução que fornece a receita de vendas esperada para sua empresa, com base em seu estoque e preços? Isso é feito por meio do aprendizado de máquina!

O nível mínimo de conhecimento de que você precisa como cientista de dados é ser capaz de treinar e avaliar modelos. Em determinadas situações, talvez você queira se aprofundar mais e aprender a alterar os algoritmos existentes ou até mesmo escrever novos algoritmos, entrando no campo do engenheiro de aprendizado de máquina.

Você tem muita liberdade na forma como faz seu aprendizado de máquina. Você pode codificar tudo sozinho (em Python, R, C# ou Java, com bibliotecas relevantes), pode usar pacotes de software locais (como Weka e RapidMiner) ou pode usar soluções em nuvem (como Databricks e AWS SageMaker). Embora isso dificulte a decisão sobre o que aprender, a experiência que você desenvolve é transferida com bastante facilidade. Uma boa ideia para decidir qual kit de ferramentas de aprendizado de máquina começar a usar seria começar com uma linguagem que você já conhece ou verificar quais ferramentas as pessoas usam no setor em que você está interessado.

Você pode começar com nosso curso de carreira de Cientista de Aprendizado de Máquina com Python, que abrange muitos dos fundamentos necessários para iniciar sua carreira.

Aprofundando a aprendizagem profunda e a IA

A relação entre aprendizado de máquina, aprendizado profundo e IA é discutível.

Na época em que eu ensinava aprendizado de máquina, minha primeira aula era sempre um debate animado sobre a afirmação: "O aprendizado de máquina é uma forma de IA". Embora às vezes eles sejam usados de forma intercambiável, acredito firmemente que o aprendizado de máquina possibilita a IA, mas isso não significa que, se você usar o aprendizado de máquina, terá criado a IA.

Para que um aplicativo de dados se torne IA, é essencial que haja um ciclo de feedback no qual o aplicativo ou modelo aprenda com seus resultados. Nesse caso, um algoritmo de aprendizado supervisionado de uma só vez não é necessariamente IA. Se você retroalimentar o resultado do modelo para o modelo (como no aprendizado por reforço), você obtém IA, pois tem um sistema que continua aprendendo automaticamente com suas previsões corretas e incorretas.

A aprendizagem profunda não é muito mais do que redes neurais com esteroides. O que torna as aplicações interessantes é que a aprendizagem profunda permite resultados super tangíveis, pois esses modelos podem gerar texto, imagens e fala. Se você trabalha em um projeto de ciência de dados em que é essencial que os modelos produzam algo que possa ser percebido ou experimentado por usuários finais humanos, entender a aprendizagem profunda pode ser uma vantagem real. Um curso que é um ótimo ponto de partida é o Introduction to Deep Learning in Python.

6. Aplicativos práticos e projetos do mundo real

Implementação de projetos de ciência de dados

Nenhum esforço de ciência de dados vive em um vácuo. À medida que você avança em seu caminho, é importante manter e exibir os artefatos que produz. Parte de ser um cientista de dados é ser capaz de demonstrar o que você pode fazer.

Para mim, a parte mais interessante da ciência de dados é que você não precisa de muito. Você só precisa de um conjunto de dados públicos e de um pouco de criatividade para criar uma pergunta interessante e, em seguida, responder a essa pergunta usando os dados. Ou você pode simplesmente acessar o DataLab ou o Kaggle e começar a trabalhar nas tarefas e/ou concursos, inspirando-se em outros envios.

Como alternativa, você pode coletar e usar seus próprios dados. Analisei meus dados de ciclismo baixados do Strava e extraí dados de imóveis para me ajudar em minha pesquisa do mercado imobiliário.

A parte mais importante é que você documente o que faz. Tente tornar seu trabalho reproduzível, explique as etapas realizadas, compartilhe seu código e compartilhe o resultado de sua análise ou sistema. Quem sabe? Talvez seu exercício prático seja a solução exata para o problema de alguém.

image3.png

Exemplos de projetos

Em minha opinião, os projetos mais interessantes são aqueles que surgem de suas próprias paixões e interesses. Se você usar um conjunto de dados de algum lugar que conhece bem, é provável que consiga criar perguntas exclusivas e interessantes. Você conhece o domínio e conhece os dados... Mas se você realmente começar do zero, há muitas coisas em que pode começar a trabalhar, incluindo aplicativos de namoro, comércio e esportes.

Você também pode encontrar uma grande variedade de projetos de ciência de dados no DataCamp, que permitem que você se familiarize com esse tipo de trabalho. Seja começando com alguns projetos de análise de dados ou trabalhando em projetos específicos de Python, você pode trabalhar até o aprendizado de máquina e até mesmo projetos de IA. Há muitas opções para ajudá-lo a começar.

Se, apesar de tudo o que existe, você não conseguir encontrar uma maneira de começar, outra alternativa útil pode ser participar de hackathons. Muitos institutos de pesquisa e empresas maiores organizam hackathons periódicos.

Esses hackathons geralmente têm o objetivo de fazer com que as equipes de cientistas de dados contribuam com um problema relevante e, assim, oferecem uma oportunidade de colaborar e aprender com outros profissionais de ciência de dados. Isso permite que você crie uma rede de contatos e seja notado por possíveis empregadores enquanto adquire experiência útil.

Desenvolvimento de portfólio

Hoje em dia, é difícil imaginar um cientista de dados que não tenha um portfólio no GitHub, no DataCamp, uma página no Medium ou um blog com código. Um portfólio é algo crucial na ciência de dados, assim como em outros setores criativos.

Ser capaz de demonstrar projetos anteriores é uma ótima maneira de convencer as pessoas de que você tem o que é necessário. É por isso que vale a pena começar a documentar seu trabalho em um portfólio. Como alternativa, você pode documentar seu trabalho e seus pontos de vista em postagens de blog ou até mesmo em publicações acadêmicas. Confira nossa postagem sobre como mostrar sua experiência em dados com um portfólio para obter inspiração.

Independentemente da sua escolha, certifique-se de manter uma visão geral apresentável dos projetos em que você trabalhou.

7. Navegando no cenário de carreiras em ciência de dados

Oportunidades de carreira em ciência de dados

Toda esta postagem destacou as diferentes habilidades, conhecimentos e ferramentas que estão disponíveis para um cientista de dados. Mas por onde começar ao decidir sobre uma carreira?

Em minha opinião, isso realmente depende de onde estão suas ambições. Até agora, esta postagem deve ter deixado claro que não acredito que exista um roteiro de ciência de dados único para todos.

É claro que toda função de ciência de dados tem como base a estatística, a manipulação de dados, o aprendizado de máquina e a engenharia de software. Mas, fora isso, depende muito.

Um cientista de dados usa algoritmos, enquanto um engenheiro de aprendizado de máquina altera ou cria algoritmos. Assim, o cientista de dados pode se contentar em conhecer muitos algoritmos e saber quando aplicá-los, enquanto o engenheiro de aprendizado de máquina precisa realmente entender os conceitos matemáticos por trás dos algoritmos.

Da mesma forma, se você obtém sua energia compartilhando resultados de análises, como um cientista ou analista de dados, provavelmente se beneficiará mais de um conhecimento profundo de visualização de dados e EDA do que de ser muito bom em modelagem de dados.

Assim, o roteiro da ciência de dados tem várias bifurcações, e você pode decidir por si mesmo o nível de aprofundamento que deseja obter nos diferentes ramos da ciência de dados.

Preparação para entrevistas de ciência de dados

Apesar das diferenças entre as funções, em qualquer entrevista você será testado quanto às habilidades técnicas e interpessoais. Esses testes serão diferentes para a função que você está buscando.

Se você não estiver procurando uma função como engenheiro de dados ou de aprendizado de máquina, provavelmente não receberá perguntas como "Como você otimizaria o algoritmo A ou B?". Portanto, é importante se concentrar nas habilidades e, portanto, nas questões que você espera e deseja trabalhar. Receber perguntas sobre tópicos com os quais você não está familiarizado pode ser um sinal de que a função não é para você.

Como nesse campo relativamente novo, especialmente em empresas em que os dados são relativamente novos, há muitas concepções errôneas sobre o que são os cientistas de dados ou o que eles fazem.

Sei que já me candidatei a uma função de cientista de dados em que o entrevistador usava cientista de dados e engenheiro de aprendizado de máquina de forma intercambiável. Portanto, é bem possível que o gerente de contratação tenha cometido um erro se lhe fizerem perguntas que você não pode responder. Dificilmente um engenheiro de dados deve ser questionado sobre como ele faria o gerenciamento das partes interessadas em um projeto, por exemplo.

Felizmente, há vários recursos disponíveis para ajudar a se preparar para entrevistas na área, dependendo da função para a qual você está se candidatando:

8. Educação Continuada e Aprendizagem ao Longo da Vida

Manter-se atualizado com as tendências

O campo da ciência de dados é muito dinâmico, e é fundamental manter-se atualizado com as últimas tendências. Com o ChatGPT, a IA generativa se tornou popular, e agora é difícil imaginar um cientista de dados que não tenha pelo menos alguma noção de token embeddings e/ou modelos de atenção. Da mesma forma, a introdução dos MLOps torna difícil imaginar um engenheiro de dados verificando manualmente o desempenho e o desvio do modelo.

Com esse crescimento dinâmico, diferentes aspectos da IA se tornam importantes. Atualmente, é dada muita atenção aos aspectos éticos e legais da IA, conforme demonstrado por vários debates acadêmicos e políticos que, entre outros, resultaram em novas regras e regulamentações.

Independentemente das decisões dos governos com relação à IA, ninguém quer ser responsável pelo próximo escândalo na ciência de dados. A única maneira de evitar isso é manter-se ciente dos limites éticos e legais. Ou melhor ainda, como profissional de ciência de dados, você pode começar a contribuir para esses desenvolvimentos usando sua experiência, formando e expressando uma opinião.

Há muitas maneiras de se manter atualizado. É claro que existe o DataCamp como plataforma, mas você também pode começar a procurar e seguir profissionais inspiradores de ciência de dados em sua área. Verifique se eles têm blogs, postagens no X ou Medium ou qualquer outra coisa em que você possa ter uma ideia de como eles veem o cenário dinâmico e em constante mudança.

image5.png

Recursos avançados de aprendizado

Como destacamos ao longo deste artigo, há muitos recursos disponíveis para qualquer pessoa que queira começar ou crescer no campo da ciência de dados. Como alternativa, se você quiser estar realmente próximo da fonte, pode procurar conferências técnicas como NeurIPS, ICML ou KDD. Confira essas e outras informações em nossa lista das principais conferências de ciência de dados para 2024.

Conclusão e próximas etapas

Embora existam muitas paradas no roteiro da ciência de dados, não há um único caminho para a ciência de dados. Para navegar no cenário da ciência de dados, é necessário que você tenha 1) uma ideia do cenário (que, esperamos, você tenha obtido nesta publicação) e 2) uma ideia dos seus pontos fortes, pontos fracos e interesses, para que possa decidir o que buscar.

Se você tiver essas características, pode contar com este artigo para orientá-lo na direção certa e saber em quais habilidades deve dar ênfase durante o treinamento. Felizmente, existem alguns recursos úteis para você começar, como as trilhas de carreira do DataCamp, que o equipam com as habilidades necessárias para começar a explorar diferentes profissões:

Temas

Comece sua jornada de ciência de dados hoje mesmo!

Course

Understanding Data Science

2 hr
587.4K
An introduction to data science with no coding involved.
See DetailsRight Arrow
Start Course
Veja MaisRight Arrow
Relacionado

blog

As 32 principais perguntas e respostas da entrevista da AWS para 2024

Um guia completo para explorar as perguntas básicas, intermediárias e avançadas das entrevistas da AWS, juntamente com perguntas baseadas em situações do mundo real. Ele abrange todas as áreas, garantindo uma estratégia de preparação completa.
Zoumana Keita 's photo

Zoumana Keita

15 min

blog

O guia completo da certificação Docker (DCA) para 2024

Libere seu potencial no Docker e na ciência de dados com nosso guia abrangente. Explore as certificações do Docker, os caminhos de aprendizado e as dicas práticas.
Matt Crabtree's photo

Matt Crabtree

8 min

blog

As 10 principais ferramentas de ciência de dados a serem usadas em 2024

As ferramentas essenciais de ciência de dados para iniciantes e profissionais de dados, para que possam ingerir, processar, analisar, visualizar e modelar os dados com eficiência.
Abid Ali Awan's photo

Abid Ali Awan

9 min

tutorial

Tutorial do Chroma DB: Um guia passo a passo

Com o Chroma DB, você pode gerenciar facilmente documentos de texto, converter texto em embeddings e fazer pesquisas de similaridade.
Abid Ali Awan's photo

Abid Ali Awan

10 min

tutorial

Guia do cientista de dados para processamento de sinais

Descubra insights acionáveis ocultos em dados de sinais complexos filtrando ruídos, escolhendo visualizações apropriadas, encontrando padrões no domínio do tempo e da frequência e muito mais usando o processamento de sinais.
Amberle McKee's photo

Amberle McKee

25 min

tutorial

Tutorial de introdução ao JupyterLab

Neste artigo, apresentaremos a você o JupyterLab, um dos IDEs mais populares para ciência de dados.
Javier Canales Luna's photo

Javier Canales Luna

7 min

See MoreSee More