Pular para o conteúdo principal
InícioPython

Raspagem da Web em Python

Aprenda a obter e analisar informações da internet usando a biblioteca Python scrapy.

Comece O Curso Gratuitamente
4 horas17 vídeos56 exercícios80.300 aprendizesTrophyDeclaração de Realização

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.
Group

Treinar 2 ou mais pessoas?

Tentar DataCamp for Business

Amado por alunos de milhares de empresas


Descrição do Curso

A capacidade de criar ferramentas capazes de recuperar e analisar informações armazenadas na internet foi e continua sendo valiosa em muitas áreas da ciência de dados. Neste curso, você aprenderá a navegar e analisar códigos html e a criar ferramentas para rastrear sites automaticamente. Embora nossa raspagem seja realizada usando a versátil biblioteca Python scrapy, muitas das técnicas que você aprenderá neste curso também podem ser aplicadas a outras bibliotecas Python bem conhecidas, como BeautifulSoup e Selenium. Após a conclusão deste curso, você terá um modelo mental eficaz da estrutura html, será capaz de criar ferramentas para analisar códigos html e acessar as informações desejadas, além de criar um spider scrapy simples para rastrear a web em escala.
Para Empresas

Treinar 2 ou mais pessoas?

Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.
DataCamp Para EmpresasPara uma solução sob medida , agende uma demonstração.

Nas seguintes faixas

Desenvolvedor Python

Ir para a trilha
  1. 1

    Introdução ao HTML

    Gratuito

    Aprenda a estrutura do HTML. Começaremos explicando por que a raspagem da web pode ser um acréscimo valioso à sua caixa de ferramentas de ciência de dados e, em seguida, nos aprofundaremos em alguns conceitos básicos de HTML. Encerramos o capítulo com uma breve introdução à notação XPath, usada para navegar pelos elementos de códigos HTML.

    Reproduzir Capítulo Agora
    Visão geral da raspagem da web
    50 xp
    A raspagem de dados da web não é bobagem!
    50 xp
    Linguagem de marcação de hipertexto
    50 xp
    Navegação complexa em uma árvore HTML
    50 xp
    Da árvore para o HTML
    100 xp
    Atributos
    50 xp
    Mantenha a classe
    100 xp
    Procurando href
    50 xp
    Curso intensivo de XPath
    50 xp
    Onde estou?
    100 xp
    Selecione os pês
    100 xp
    Um span com classe
    100 xp
  2. 3

    Localizadores CSS, encadeamento e respostas

    Aprenda a sintaxe de localizadores CSS e comece a brincar com a ideia de encadear localizadores CSS com o XPath. Também apresentamos os objetos Response, que se comportam como seletores, mas nos dão mais ferramentas para mobilizar nossos esforços de raspagem em vários sites.

    Reproduzir Capítulo Agora
  3. 4

    Spiders

    Aprenda a criar rastreadores da web com o scrapy. Esses spiders scrapy rastreiam a web por várias páginas, seguindo os links para raspar cada uma delas automaticamente, de acordo com os procedimentos que aprendemos nos capítulos anteriores.

    Reproduzir Capítulo Agora
Para Empresas

Treinar 2 ou mais pessoas?

Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.

Nas seguintes faixas

Desenvolvedor Python

Ir para a trilha

conjuntos de dados

DataCamp webpage HTML

colaboradores

Collaborator's avatar
Mari Nazary
Collaborator's avatar
David Campos
Collaborator's avatar
Shon Inouye

pré-requisitos

Intermediate Python
Thomas Laetsch HeadshotThomas Laetsch

Data Scientist at New York University

Ver Mais

O que os outros alunos têm a dizer?

Junte-se a mais de 15 milhões de alunos e comece Raspagem da Web em Python hoje mesmo!

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.