Pular para o conteúdo principal

Realize Hackathons de dados com o DataLab

Com o DataLab, executar hackathons de dados se torna fácil e divertido. Explore como o DataLab resolve as armadilhas comuns e as etapas para você organizar sua própria hackatona.
Actualizado 27 de dez. de 2024  · 9 min de leitura

Os Data Hackathons são ótimos, exceto quando não são. Problemas operacionais como a configuração do notebook, o acesso ao conjunto de dados e a colaboração podem transformar o que deveria ser uma experiência de aprendizado revigorante em um evento frustrante para os participantes. O DataLab, um notebook de dados colaborativo, resolve todas as armadilhas da realização de hackathons de dados, para que você possa realizar um ótimo evento de hackathon!

Assista novamente ao webinar que inclui uma demonstração da execução de um hackathon de dados.

O que é um Hackathon de dados?

Um hackathon de dados é um evento intensivo e focado em que entusiastas da área de ciência de dados se reúnem para resolver problemas desafiadores de dados. Durante várias horas ou até dias, os participantes manipulam, analisam e visualizam conjuntos de dados, extraindo percepções e criando soluções.

Esses eventos oferecem uma plataforma para aplicar e testar as habilidades de dados em um cenário do mundo real e proporcionam uma oportunidade de aprendizado, colaboração e inovação. Para aqueles que estão explorando o fascinante campo da ciência de dados, participar de um hackathon de dados pode ser uma experiência esclarecedora e envolvente.

O sonho e a realidade

Como organizador de uma hackathon de dados, você tem um cenário dos sonhos em mente: equipes de participantes colaboram e idealizam como resolver o problema de dados em questão, apresentando soluções inspiradoras em pouco tempo.

Enquanto algumas pessoas ainda trabalham com o código de ciência de dados para concluir o desafio, outras já começam a trabalhar no relatório final, que normalmente envolve um pouco de redação. Quando tudo estiver compilado, enviado e revisado, é hora de refletir sobre as soluções inspiradoras.

Infelizmente, a realidade costuma ser diferente.

Normalmente, os hackathons de dados vêm com uma pergunta de pesquisa ou um desafio e um conjunto de dados. O compartilhamento desse conjunto de dados pode ser o primeiro obstáculo. Como você pode compartilhar isso com as equipes?

Outro problema é a configuração do sistema: as pessoas têm diferentes versões do Python instaladas em seus computadores, com diferentes versões de pacotes. O que funciona em um computador não necessariamente funciona em outro.

Mesmo que a configuração do sistema seja a mesma, como você colabora com o código-fonte?

O Git é bastante técnico e não é em tempo real. O compartilhamento via Dropbox leva rapidamente a cópias conflitantes. Todos esses são obstáculos operacionais com os quais você não quer lidar como equipe, mas eles consomem um tempo valioso que você não pode gastar no desafio real em questão.

Mas há boas notícias! Os recentes avanços na tecnologia de nuvem deram origem a várias plataformas de colaboração de dados que contornam todas essas dores de cabeça.

Neste artigo, exploraremos como o DataLab pode ser um divisor de águas para você. Com este moderno caderno de ciência de dados da DataCamp, você organizará seu próximo hackathon com muita facilidade. Os participantes podem literalmente começar a trabalhar em menos de 5 segundos. E a melhor parte? É gratuito para os alunos do DataCamp Classrooms e Donates!

Por que usar o DataLab para potencializar sua próxima hackatona?

É gratuito!

Os professores que ensinam ciência de dados podem se inscrever para um Grupo de Sala de Aula DataCamp gratuito.

Todos os membros de um grupo de sala de aula terão acesso gratuito a toda a biblioteca de cursos do DataCamp e a uma licença do DataLab Premium. Isso permite que eles criem projetos de dados privados ilimitados (chamados de pastas de trabalho) que podem ser facilmente compartilhados com outros membros do grupo.

Também oferecemos essa versão superalimentada do DataLab para nossas organizações parceiras do DataCamp Donates, ONGs que nos ajudam a fornecer bolsas de estudo do DataCamp para pessoas carentes em todo o mundo.

image3.png

Configuração zero

Cada projeto de dados no DataLab é executado em um ambiente de notebook totalmente gerenciado e pré-configurado que é inicializado em segundos. Você pode criar pastas de trabalho em Python e R com todos os pacotes comuns de ciência de dados pré-instalados. Se quiser instalar mais pacotes ou outras versões, você ainda poderá fazer isso.

image4.png

Colaboração perfeita

A colaboração e os comentários em tempo real no estilo do Google Docs estão integrados. Todas as alterações são salvas automaticamente, com um histórico de versões para que você possa revisar e restaurar versões anteriores. Pense no DataLag como uma versão baseada em nuvem do JupyterLab com esteroides, otimizada para facilitar o uso, o acesso aos dados e a colaboração.

image1.png

Fácil distribuição de desafios

Como organizador, crie o desafio de amostra no DataLab e distribua-o facilmente como um link de cópia. Os participantes da hackathon começam clicando no link, é simples assim. Vamos examinar as etapas com mais detalhes para você ver como é feito!

Crie um link de cópia e compartilhe-o com os participantes da hackatona

Crie um link de cópia e compartilhe-o com os participantes da hackatona

Organize sua própria hackatona

Criar a pasta de trabalho do desafio

Use uma das pastas de trabalho de amostra do DataCamp

Para facilitar a realização da sua primeira hackatona, criamos três exemplos de cadernos de desafios que você pode usar para criar o seu próprio caderno de desafios. Dê uma olhada nelas abaixo:

Decida qual amostra de pasta de trabalho você deseja usar, clique em "File > Make a copy" (Arquivo > Fazer uma cópia) e, em "Account" (Conta), selecione sua sala de aula, empresa ou grupo de alunos. Depois de clicar em "Make a copy" (Fazer uma cópia), um novo woprkbook será criado em sua conta de grupo. A pasta de trabalho do desafio é privada para o grupo: somente os membros do seu grupo poderão acessar a pasta de trabalho do desafio.

Desenvolva sua própria apostila de desafios

Se você já tem uma ideia para o desafio da sua hackatona, ótimo! Crie uma nova pasta de trabalho na sua conta do grupo, carregue um conjunto de dados por meio do navegador de arquivos (Exibir > Arquivos) e adicione algumas instruções e critérios de envio ao arquivo do notebook (você pode consultar as pastas de trabalho de exemplo para se inspirar).

Criar e distribuir a pasta de trabalho do desafio

Agora você verá a distribuição do desafio. Você quer que isso seja o mais simples possível, para que as pessoas possam ignorar todo o incômodo da configuração e se concentrar no desafio em questão. O DataLab oferece suporte a isso por meio do chamado "link de cópia" que você pode criar da seguinte forma:

  • Vá para a pasta de trabalho do desafio na conta do grupo que você criou na etapa anterior.
  • Vá para "File > Create copy link" (Arquivo > Criar link de cópia)
  • No modal
    • Especifique o título. Quando os participantes usarem o link, esse título será definido como o título padrão da pasta de trabalho.
    • Especifique a conta. Certifique-se de que essa seja a conta do grupo, para que, quando os participantes usarem o link, a pasta de trabalho seja criada na conta do grupo e possa ser facilmente compartilhada com outros membros do grupo ou com todo o grupo em algum momento.
    • Clique em "Create copy link" (Criar link de cópia)
    • Um link será copiado para sua área de transferência.
  • Compartilhe esse "link de cópia" com os participantes da hackathon em um e-mail, uma mensagem direta no Slack, Whatsapp, Discord ou por meio do LMS da sua escola.

Se um participante clicar nesse link, uma nova pasta de trabalho será criada com todos os dados e o conteúdo do caderno da pasta de trabalho do desafio, pronta para que ele comece a trabalhar no problema que você apresentou a ele.

Para você ter uma ideia de como é isso, acesse o link de cópia de um dos exemplos de pastas de trabalho do hackathon. Você estará pronto e funcionando em menos de 5 segundos, com os arquivos de dados e o código padrão prontos para uso.

Se o seu hackathon exigir a colaboração de equipes de participantes, é importante que apenas um participante de cada equipe clique no link de cópia e compartilhe a pasta de trabalho recém-criada com os outros membros da equipe para que todos possam colaborar em uma única pasta de trabalho. Seja em equipe ou para competidores individuais, o DataLab é o ambiente ideal para o seu próximo hackathon.

Revisar os envios

Se a sua hackathon for competitiva e você precisar nomear um vencedor, será necessário analisar os diferentes envios. Estabeleça um prazo claro para o envio da pasta de trabalho e peça a todas as equipes que compartilhem a pasta de trabalho com você ou com o júri até o prazo final para que você possa analisar o trabalho delas.

Dependendo do tipo de desafio, esta análise será diferente. Os desafios com foco em análise provavelmente exigirão uma análise qualitativa, avaliando se a narrativa é clara, se os recursos visuais transmitem insights e se a conclusão é acionável.

Para desafios de aprendizado de máquina, você pode analisar a qualidade do modelo que eles treinaram e ver se seguiram todas as regras para avaliar o desempenho do modelo (por exemplo, separar o conjunto de teste e de treinamento).

Quando os vencedores forem anunciados, você poderá usar novamente a funcionalidade de compartilhamento do DataLab para compartilhar as pastas de trabalho vencedoras com todo o grupo, para que as pessoas possam saber o que torna um envio excelente.

Se a sua organização e os vencedores quiserem que as pastas de trabalho sejam compartilhadas para que o mundo todo as veja, as equipes vencedoras poderão usar a funcionalidade "Fazer uma cópia" para copiar a pasta de trabalho do grupo para o espaço da conta pessoal e torná-la pública. Dessa forma, o trabalho deles aparecerá em seu perfil do DataCamp, fazendo com que se tornem conhecidos no espaço de dados!

Temas
Relacionado

blog

Semana do Acesso Gratuito | 6 a 12 de novembro

Acesse gratuitamente toda a plataforma do DataCamp, incluindo todos os mais de 450 cursos, durante uma semana inteira. Sem pegadinhas, sem necessidade de cartão de crédito - apenas aprendizado ilimitado para qualquer pessoa com acesso à Internet.
Will Rix's photo

Will Rix

5 min

blog

As 10 principais ferramentas de ciência de dados a serem usadas em 2024

As ferramentas essenciais de ciência de dados para iniciantes e profissionais de dados, para que possam ingerir, processar, analisar, visualizar e modelar os dados com eficiência.
Abid Ali Awan's photo

Abid Ali Awan

9 min

blog

O que é o Kaggle?

Saiba o que é o Kaggle e por que ele é uma das plataformas mais populares para cientistas de dados. Obtenha respostas para as perguntas mais frequentes do Kaggle.
Çağlar Uslu's photo

Çağlar Uslu

12 min

blog

4 etapas para criar um programa de dados bem-sucedido

O diretor de design estratégico, dados, precificação e análise da AXA XL explica como fazer seu programa de dados decolar e implementar uma cultura orientada por dados bem-sucedida.
Joyce Chiu's photo

Joyce Chiu

8 min

Data Science Concept Vector Image

blog

Como se tornar um cientista de dados em 8 etapas

Descubra tudo o que você precisa saber sobre como se tornar um cientista de dados e se essa é a carreira certa para você!
Jose Jorge Rodriguez Salgado's photo

Jose Jorge Rodriguez Salgado

12 min

tutorial

Tutorial de introdução ao JupyterLab

Neste artigo, apresentaremos a você o JupyterLab, um dos IDEs mais populares para ciência de dados.
Javier Canales Luna's photo

Javier Canales Luna

7 min

See MoreSee More