Curso
A ciência de dados é uma das áreas que mais cresce hoje em dia. Organizações em todo o mundo estão aproveitando o poder dos dados para apoiar a tomada de decisões e oferecer experiências inovadoras às suas partes interessadas. Como o campo está sempre mudando, os livros sobre ciência de dados são uma ótima maneira para os profissionais aprimorarem seus conhecimentos básicos e ficarem por dentro das técnicas e métodos mais recentes.
Neste artigo, a gente preparou uma visão geral completa dos melhores livros sobre ciência de dados, que abrangem programação, estatística, visualização de dados e muito mais. Vamos começar!
Os melhores livros sobre ciência de dados para quem tá começando
Os melhores livros de programação para ciência de dados
1. Ciência de dados do zero: Princípios básicos com Python, por Joel Grus

Data Science from Scratch é um livro perfeito para quem está começando. Depois do sucesso da primeira edição do livro, Joel Grus lançou uma versão revisada que fala sobre o básico da ciência de dados usando a linguagem de programação Python 3.
Focado em problemas reais da ciência de dados, o livro fala sobre os conceitos mais importantes da área, implementando soluções do zero, usando uma mistura tranquila de estatística e programação.
Mesmo que você não precise saber usar Python antes pra conseguir todos os resultados que quer com este livro, ter algum conhecimento da linguagem vai facilitar seu aprendizado. A gente recomenda dar uma olhada no curso Introdução ao Python do DataCamp pra começar a aprender Python.
2. Python Data Science Handbook by Jake VanderPlas

Esse livro completo, escrito por Jake VanderPlas, traz guias passo a passo pra usar as ferramentas e pacotes mais populares no mundo da ciência de dados em Python. Isso inclui Jupyter, iPython, NumPy, pandas, scikit-learn, matplotlib e outras bibliotecas. Você vai aprender com exemplos que dá pra reproduzir facilmente.
Desde que saiu em 2016, o Python Data Science Handbook virou rapidinho uma referência pra computação científica em Python. A boa notícia é que uma edição revisada está prevista para o final de 2022. Você também pode ouvir Jake VanderPlas falando sobre o livro, entre outros assuntos, no podcast DataFramed.
3. R para Ciência de Dados: Importar, organizar, transformar, visualizar e modelar dados, por Garrett Grolemund e Hadley Wickham

Se você é um programador R e quer entrar na área de ciência de dados, este livro é pra você. Escrito pelas estrelas do R, Hadley Wickham e Garret Grolemnd, com R para Ciência de Dados, você vai aprender o básico dessa disciplina usando a linguagem de programação versátil R e o RStudio.
Em vez de ensinar conceitos avançados de estatística do zero, o livro vai focar em como usar o R para análise de dados, pra você se familiarizar com pacotes populares, como ggplot2, tidyr e outros. Resumindo, uma leitura obrigatória para qualquer cientista de dados que queira aprimorar seus conhecimentos básicos em R.
Os melhores livros de estatística para ciência de dados
4. Think Stats, de Allen B. Downey

Para transformar dados em insights, você precisa saber não só como programar, mas também como usar diferentes métodos de probabilidade e estatística. Aprender estatística é super importante pra ter sucesso como cientista de dados. Felizmente, este livro mostra que aprender estatística pode ser fácil e divertido.
Think Stats é uma introdução à Probabilidade e Estatística para programadores Python. Ao trabalhar com um único estudo de caso ao longo do livro, você aprenderá os diferentes métodos estatísticos usados nas diferentes etapas do fluxo de trabalho da ciência de dados.
O livro fala sobre os principais conceitos de estatística, como estatística descritiva, distribuições, regras de probabilidade, visualização e muito mais. Você também pode conferir o livro de Allen Downey no DataCamp — Análise Exploratória em Python.
5. Uma introdução à aprendizagem estatística: Com aplicações em R, por Gareth James, Daniela Witten, Trevor Hastie e Robert Tibshirani

Feito tanto para quem curte estatística quanto para quem não é muito fã, o livro “An Introduction to Statistical Learning” dá uma visão geral fácil de entender sobre o campo da estatística para análise de dados.
Inclui uma abordagem abrangente e acessível de alguns dos principais tópicos da aprendizagem estatística, incluindo regressão linear, classificação, métodos de reamostragem, abordagens de contração, métodos baseados em árvores, máquinas de vetores de suporte, agrupamento e muito mais. Você também pode conferir o programa Fundamentos de Estatística com R para acompanhar seu aprendizado.
6. Estatística prática para cientistas de dados: Mais de 50 conceitos essenciais usando R e Python, de Peter Bruce, Andrew Bruce e Peter Gedeck

A estatística é uma parte essencial da ciência de dados. Mas, como dizem os autores do livro, muitos cientistas de dados não têm formação formal em estatística. Estatística Prática para Cientistas de Dados é um ótimo recurso para preencher essa lacuna.
Esse livro incrível dá dicas práticas sobre como usar métodos estatísticos na ciência de dados. Ele foca em como evitar o uso errado de estatísticas no fluxo de trabalho da ciência de dados e dá dicas sobre as técnicas estatísticas mais usadas. A segunda edição traz novos exemplos em Python e R.
Os melhores livros sobre machine learning para ciência de dados
7. Introdução ao machine learning com Python: Um guia para cientistas de dados, por Andreas C. Müller e Sarah Guido

Machine learning é parte integrante do conjunto de ferramentas da ciência de dados. Se você é um programador Python interessado em aprender sobre machine learning, este livro vai te dar tudo o que você precisa.
Introdução ao Machine Learning com Python é o livro ideal para começar sua jornada no mundo do machine learning. Escrito por um dos principais desenvolvedores do pacote scikit-learn, este livro fala sobre todos os detalhes da criação de modelos de machine learning no pacote scikit-learn do Python.
8. Aprendizado prático de machine learning com Scikit-Learn, Keras e TensorFlow: Conceitos, ferramentas e técnicas para construir sistemas inteligentes, por Aurélien Géron

Neste livro, Aurelien Geron explica as técnicas básicas de machine learning com base em ferramentas e estruturas populares do Python, como scikit-learn, Keras e Tensorflow.
O livro aborda o machine learning de um jeito prático e evita sobrecarregar você com a teoria por trás de muitos modelos de machine learning. Ele também explica conceitos mais avançados, como aprendizado profundo e redes neurais. Tem exercícios em cada capítulo pra você poder colocar os exemplos em prática e aprender com eles.
9. O livro de cem páginas de machine learning, de Andriy Burkov

Se você está apenas curioso sobre machine learning e quer começar a se interessar pela disciplina sem entrar em detalhes técnicos, ou se você é um profissional de machine learning que deseja revisitar os conceitos básicos, você deve optar pelo livro de cem páginas sobre machine learning.
Resumir uma disciplina tão complexa e extensa em apenas 100 páginas é um esforço impressionante, no qual Andriy Burkov é bem-sucedido. Depois de ler, você vai entender os diferentes tipos de machine learning, os conceitos básicos do design e da implantação de modelos preditivos e o que é preciso para começar uma aplicação baseada em machine learning.
Outro ótimo recurso para aprender os fundamentos teóricos do machine learning é o curso Entendendo o Machine Learning.
Os melhores livros sobre visualização de dados para ciência de dados
10. A Arte Funcional, de Alberto Cairo

Em The Functional Art, o jornalista de dados Alberto Cairo fala sobre como tornar funcional a arte por trás da visualização de dados. Em outras palavras, como criar visualizações bonitas sem comprometer a utilidade e os insights.
Partindo de uma visão geral detalhada das melhores práticas em visualização de dados, Cairo resume as peculiaridades do nosso cérebro e como elas influenciam a maneira como percebemos e lembramos informações gráficas. Depois de ler este livro, a sua abordagem à visualização de dados mudará para sempre.
11. Design do painel de informações: Exibindo dados para monitoramento rápido por Stephen Few

Os painéis são uma das maneiras mais eficazes de visualizar dados de diferentes fontes rapidamente. Eles se tornaram um elemento central na infraestrutura das empresas que trabalham com dados, permitindo que tanto quem usa os dados quanto quem trabalha com eles possam acessar os dados e os KPIs ao mesmo tempo. Mas, como o Stephen Few fala no livro dele, os painéis de controle muitas vezes são feitos de um jeito complicado e ineficiente.
O Information Dashboard Design foi pensado como um guia prático para criar painéis atraentes. Partindo dos princípios da teoria do design e da visualização de dados, o livro apresenta as melhores práticas do setor para projetar painéis. Ele também traz vários exemplos de como passar da teoria para a prática sem complicações.
12. Narração eficaz de dados: Como impulsionar mudanças com dados, narrativas e recursos visuais, por Brent Dykes

A capacidade de se comunicar de forma eficaz com dados é uma habilidade essencial para qualquer pessoa que trabalhe com ciência de dados. A visualização de dados pode nos ajudar nessa tarefa. Mas, se a gente quer garantir que nossas ideias sobre os dados se transformem em ação, precisamos pensar em outros recursos e coisas que influenciam a comunicação. Essa é a ideia por trás da narrativa eficaz de dados.
No seu livro, Brent Dykes — que apareceu no episódio do podcast DataFrame “” (Contar histórias eficazes com dados: o que os profissionais de marketing precisam saber) — Como transformar insights em ações— Dykes criou uma estrutura para contar histórias com dados, uma abordagem que junta três elementos principais: dados, narrativa e recursos visuais. Resumindo, este livro é um recurso indispensável para qualquer pessoa que se comunica regularmente com dados.
13. Gráficos informativos por Sandra Rendgen e Julius Wiedemann

Information Graphics é um livro lindo e super bem feito que mostra como a comunicação visual evoluiu na era do big data. Tem uma série de ensaios sobre a história da visualização de dados e 400 exemplos reais de projetos gráficos que abrangem vários domínios da nossa sociedade. Qualquer pessoa que curta a história e a prática da comunicação visual moderna vai achar isso útil.
14. Presente além da medida, por Lea Pica
Present Beyond Measure é um guia completo sobre visualização de dados que atende a um público diversificado, incluindo analistas de dados, profissionais de marketing e muito mais. Cobrindo pontos importantes como acabar com o excesso de dados, dominar o design de slides e usar técnicas cinematográficas de contar histórias, o livro dá dicas práticas para criar narrativas de dados interessantes e apresentações envolventes. Com foco no Protocolo PICA e na fórmula Chart Detox™, que é uma criação da Lea, ele oferece uma abordagem direta, mas completa, para contar histórias com dados de forma clear as data. Ótimo para todo mundo, desde executivos até consultores, esse recurso traz dicas e insights valiosos para criar visualizações de dados que chamam a atenção e apresentá-las com confiança.
Livros bônus sobre ciência de dados
15. Armas de Destruição Matemática, de Cathy O’Neill

Publicado em 2016, Weapons of Math Destruction abriu caminho para um debate necessário sobre as implicações éticas do big data. De acordo com Cathy O'Neill, os algoritmos estão perpetuando preconceitos prejudiciais. Ilustrando esses preconceitos com exemplos reais, O’Neill termina o livro argumentando que a transparência e as auditorias de algoritmos serão necessárias para um futuro mais justo. Ouça Cathy O’Neil falando sobre seu livro no podcast DataFramed.
16. Todo mundo mente: Big Data, novos dados e o que a Internet pode nos dizer sobre quem realmente somos, por Seth Stephens-Davidowitz

Os motores de busca são um dos maiores impulsionadores do big data. Todo dia, a gente gera bilhões de terabytes de dados só digitando consultas nos mecanismos de busca. Essas informações podem revelar muito sobre nosso comportamento, preconceitos e medos. No best-seller Everybody lies(Todo mundo mente), Stephens-Davidowitz analisa os dados de pesquisa do Google e dá respostas reveladoras para perguntas sobre economia, ética, política, raça, gênero e muito mais.
17. Algoritmos de opressão: Como os motores de busca reforçam o racismo, pelo Dr. Safiya U. Nobre

Em Algoritmos da Opressão, Safiya U. Noble investiga a fundo como os motores de busca apresentam resultados tendenciosos às consultas. Ela diz que a combinação de incentivos para promover certos resultados, junto com o monopólio de um número relativamente pequeno de mecanismos de busca na internet, levou a algoritmos racistas e sexistas que perpetuam estereótipos prejudiciais na internet. Esse livro mostra como a ciência de dados pode ajudar a diminuir e também reforçar o racismo.
18. 97 coisas sobre ética que todo mundo na ciência de dados deveria saber, por Bill Franks

A maioria dos casos de grande repercussão sobre impactos reais ou aparentes da ciência de dados não é motivada por más intenções. Na verdade, eles geralmente acontecem porque não se faz uma análise ética cuidadosa durante o processo de criação e implementação. O objetivo das 97 coisas sobre ética que todo mundo na ciência de dados deveria saber é identificar as melhores práticas éticas para integrar ao fluxo de trabalho de análise de dados. O livro é baseado nas opiniões dos melhores profissionais da área de ciência de dados.
19. Estatísticas nuas e cruas: Tirando o medo dos dados, por Charles Wheelan

Os leitores vão curtir essa visão provocativa e ilustrativa sobre como as estatísticas são usadas hoje pelas empresas para manipular nosso comportamento. Com uma mistura equilibrada de teoria e exemplos reais de boas e, principalmente, más práticas, o famoso autor Charles Wheelan dá dicas para entender melhor nossa sociedade e defende uma melhor alfabetização estatística.
20. Não confie na sua intuição: Usando dados para conseguir o que você realmente quer na vida, por Seth Stephens-Davidowitz

A maioria dos livros sobre big data costuma focar nas aplicações dos dados para ajudar nas decisões de negócios, esquecendo que os dados também podem ajudar no nosso dia a dia. Não confie na sua intuição para resolver isso. Ele traz um guia prático sobre como os dados podem funcionar melhor do que a intuição para ajudar nas grandes e pequenas escolhas que todos nós temos que fazer ao longo da vida.
21. Introdução ao Processamento de Linguagem Natural Por Jacob Eisenstein

Se você já tem um conhecimento básico de programação e estatística e quer dar um salto na carreira na área de processamento de linguagem natural, esse livro é pra você. A introdução ao processamento de linguagem natural, de Jacob Einstein, traz uma visão técnica sobre o NLP, ligando as técnicas atuais de machine learning com as bases linguísticas e computacionais da área.
22. Big Data na prática: Como 45 empresas de sucesso usaram a análise de Big Data para alcançar resultados incríveis, por Bernard Marr

O título já diz tudo. O autor best-seller Bernard Marr escreveu este livro único e prático sobre como 45 das empresas mais renomadas estão usando big data em suas operações diárias. Ele é uma grande inspiração para outras organizações que querem usar dados de forma eficaz e mostra algumas das armadilhas que devem ser evitadas na implementação dessas soluções.
23. Big Data: Entendendo como os dados impulsionam os grandes negócios, por Bill Schmarzo

Escrito por um dos maiores especialistas em Big Data, Big Data: Entendendo como os dados impulsionam os grandes negócios nos dá uma visão geral abrangente sobre o que são os dados e como eles são usados. O livro está cheio de dicas práticas, ideias, técnicas, metodologias e exemplos reais que mostram como as ferramentas e tecnologias de big data podem acelerar o valor dos negócios.
Saiba mais sobre ciência de dados
Esperamos que você tenha achado essa lista útil. Os livros são um ótimo recurso para aprender ciência de dados, seja para começar em um novo tópico ou para se tornar um especialista. Mas se você não tiver tempo pra ler um livro, a gente ainda tem uma solução pra você. Dá uma olhada nos recursos a seguir e começa hoje mesmo!
- Um catálogo enorme com mais de 380 cursos de ciência de dados, que abrangem programação, estatística, visualização e muito mais.
- Inscreva-se no nosso blog para receber as últimas novidades
- Inscreva-se no podcast DataFramed
- Dá uma olhada nas nossas folhas de referência sobre ciência de dados.