Accéder au contenu principal

Organisez des hackathons de données avec DataLab

Avec DataLab, organiser des hackathons de données devient facile et amusant. Découvrez comment DataLab résout les écueils les plus courants et les étapes à suivre pour organiser votre propre hackathon.
Actualisé 27 déc. 2024  · 9 min de lecture

Les Data Hackathons sont formidables, sauf quand ils ne le sont pas. Des problèmes opérationnels tels que la configuration de l'ordinateur portable, l'accès aux données et la collaboration peuvent transformer ce qui devrait être une expérience d'apprentissage stimulante en un événement frustrant pour les participants. DataLab, un carnet de données collaboratif, résout tous les problèmes liés à l'organisation de hackathons sur les données, afin que vous puissiez organiser un excellent hackathon !

Regardez à nouveau le webinaire qui comprend une démonstration de l'organisation d'un hackathon sur les données.

Qu'est-ce qu'un hackathon de données ?

Un hackathon de données est un événement intensif et ciblé au cours duquel des passionnés de la science des données se réunissent pour s'attaquer à des problèmes de données difficiles. Pendant plusieurs heures, voire plusieurs jours, les participants manipulent, analysent et visualisent des ensembles de données, afin d'en extraire des informations et d'élaborer des solutions.

Ces événements offrent une plateforme pour appliquer et tester les compétences en matière de données dans un scénario réel et offrent une opportunité d'apprentissage, de collaboration et d'innovation. Pour ceux qui explorent le domaine fascinant de la science des données, la participation à un hackathon de données peut être une expérience instructive et engageante.

Le rêve et la réalité

En tant qu'organisateur d'un hackathon de données, vous avez un scénario de rêve en tête : des équipes de participants collaborent et réfléchissent à la manière de résoudre le problème de données qui se pose, en proposant des solutions inspirantes en peu de temps.

Alors que certains continuent à travailler sur le code de la science des données pour relever le défi, d'autres commencent déjà à travailler sur le rapport final, qui implique généralement un peu d'écriture. Lorsque tout est compilé, soumis et examiné, il est temps de réfléchir aux solutions inspirantes.

Malheureusement, la réalité est souvent différente.

Les hackathons de données sont généralement accompagnés d'une question de recherche ou d'un défi et d'un ensemble de données. Le partage de cet ensemble de données peut s'avérer être un premier obstacle. Comment pouvez-vous partager cela avec les équipes ?

Un autre problème est la configuration du système : les gens ont différentes versions de Python installées sur leurs ordinateurs, avec différentes versions de paquets. Ce qui fonctionne sur un ordinateur ne fonctionne pas nécessairement sur l'autre.

Même si la configuration du système est la même, comment collaborer sur le code source ?

Git est assez technique et n'est pas en temps réel. Le partage via Dropbox conduit rapidement à des copies contradictoires. Il s'agit là d'obstacles opérationnels auxquels vous ne voulez pas être confronté en tant qu'équipe, mais qui vous font perdre un temps précieux que vous ne pouvez pas consacrer au véritable défi à relever.

Mais il y a une bonne nouvelle ! Les progrès récents de la technologie cloud ont donné naissance à plusieurs plateformes de collaboration de données qui contournent tous ces maux de tête.

Dans cet article, nous allons voir comment DataLab peut changer la donne pour vous. Ce carnet de science des données moderne de DataCamp rendra l'organisation de votre prochain hackathon super fluide. Les participants peuvent littéralement démarrer en moins de 5 secondes. Et le meilleur ? C'est gratuit pour les apprenants de DataCamp Classrooms et Donates !

Pourquoi utiliser DataLab pour votre prochain hackathon ?

C'est gratuit !

Les enseignants et les professeurs qui enseignent la science des données peuvent demander un groupe de classe DataCamp Classrooms gratuit.

Tous les membres d'un groupe de classe auront un accès gratuit à l'ensemble de la bibliothèque de cours DataCamp et à une licence DataLab Premium. Cela leur permet de créer un nombre illimité de projets de données privés (appelés classeurs) qu'ils peuvent facilement partager avec les autres membres du groupe.

Nous offrons également cette version suralimentée de DataLab à nos organisations partenaires DataCamp Donates, des ONG qui nous aident à offrir des bourses d'études DataCamp à des personnes défavorisées dans le monde entier.

image3.png

Configuration zéro

Chaque projet de données dans DataLab s'exécute dans un environnement de notebook entièrement géré et préconfiguré qui démarre en quelques secondes. Vous pouvez créer des classeurs Python et R avec tous les packages courants de science des données préinstallés. Si vous souhaitez installer d'autres paquets ou d'autres versions, vous pouvez toujours le faire.

image4.png

Une collaboration sans faille

La collaboration et les commentaires en temps réel de type Google Docs sont intégrés. Toutes les modifications sont automatiquement enregistrées et un historique des versions permet de revoir et de restaurer les versions antérieures. Considérez DataLag comme une version cloud de JupyterLab sous stéroïdes, optimisée pour la facilité d'utilisation, la facilité d'accès aux données et la collaboration.

image1.png

Remise facile des défis

En tant qu'organisateur, créez l'exemple de défi dans DataLab et distribuez-le facilement sous forme de lien de copie. Les participants au hackathon peuvent commencer en cliquant sur le lien, c'est aussi simple que cela. Examinons les étapes plus en détail pour voir comment procéder !

Créez un lien de copie et partagez-le avec les participants au hackathon.

Créez un lien de copie et partagez-le avec les participants au hackathon.

Organisez votre propre hackathon

Construire le cahier d'exercices du défi

Utilisez l'un des exemples de classeurs de DataCamp

Pour vous aider à organiser votre premier hackathon, nous avons conçu trois exemples de cahiers d'exercices que vous pouvez utiliser tels quels pour créer votre propre cahier d'exercices. Découvrez-les ci-dessous :

Choisissez l'exemple de cahier d'exercices que vous souhaitez utiliser, cliquez sur "Fichier > Faire une copie" et, sous "Compte", sélectionnez votre classe, votre entreprise ou votre groupe d'étudiants. Après avoir cliqué sur "Faire une copie", un nouveau woprkbook sera créé dans votre compte de groupe. Le cahier d'exercices du défi est privé : seuls les membres de votre groupe pourront y accéder.

Élaborez votre propre cahier de défis

Si vous avez déjà une idée pour le défi de votre hackathon, c'est parfait ! Créez un nouveau classeur dans votre compte de groupe, téléchargez un ensemble de données via le navigateur de fichiers (View > Files) et ajoutez des instructions et des critères de soumission au fichier du classeur (vous pouvez vous inspirer des exemples de classeurs).

Créer et distribuer le cahier d'exercices du défi

Passons maintenant à la répartition du défi. Vous voulez que cela soit aussi simple que possible, afin que les gens puissent éviter tous les tracas de la configuration et se concentrer sur le défi à relever. DataLab prend en charge cette fonction par le biais d'un "lien de copie" que vous pouvez créer de la manière suivante :

  • Accédez au cahier de défis dans votre compte de groupe que vous avez créé à l'étape précédente.
  • Allez dans "Fichier > Créer un lien de copie"
  • Dans le modal
    • Spécifiez le titre. Lorsque les participants utilisent le lien, ce titre sera défini comme titre par défaut pour leur classeur.
    • Spécifiez le compte. Assurez-vous qu'il s'agit bien du compte du groupe, de sorte que lorsque les participants utilisent le lien, le cahier de travail est créé dans le compte du groupe et peut facilement être partagé avec d'autres membres du groupe ou avec l'ensemble du groupe à un moment donné.
    • Cliquez sur "Créer un lien de copie"
    • Un lien sera copié dans votre presse-papiers.
  • Partagez ce "lien de copie" avec les participants à votre hackathon dans un e-mail, un DM sur Slack, Whatsapp, Discord ou via le LMS de votre école.

Si un participant clique sur ce lien, un nouveau classeur sera créé avec toutes les données et le contenu du carnet de notes du classeur challenge, prêt à ce qu'il commence à travailler sur le problème que vous lui avez présenté.

Pour en faire l'expérience, consultez le lien de copie de l'un des exemples de cahiers d'exercices pour le hackathon. Vous êtes opérationnel en moins de 5 secondes, avec les fichiers de données et le code de base prêts à l'emploi.

Si votre hackathon nécessite la collaboration d'équipes de participants, il est important qu'un seul participant de chaque équipe clique sur le lien de copie, puis partage le classeur nouvellement créé avec les autres membres de l'équipe afin qu'ils puissent tous collaborer dans un seul et même classeur. Que ce soit en équipe ou pour des concurrents individuels, DataLab est l'environnement idéal pour votre prochain hackathon.

Examiner les soumissions

Si votre hackathon est compétitif et que vous devez désigner un gagnant, vous devrez examiner les différentes candidatures. Fixez une date limite claire pour la remise des cahiers de travail et demandez à toutes les équipes de vous remettre leur cahier de travail ou de le remettre à votre jury avant la date limite, afin que vous puissiez examiner leur travail.

Selon le type de défi, ce bilan sera différent. Les défis axés sur l'analyse nécessiteront probablement un examen qualitatif, afin d'évaluer si la narration est claire, si les images donnent une idée de la situation et si la conclusion est exploitable.

Pour les défis d'apprentissage automatique, vous pouvez vérifier la qualité du modèle qu'ils ont formé et voir s'ils ont respecté toutes les règles d'évaluation des performances du modèle (par exemple, en séparant l'ensemble de test et l'ensemble d'apprentissage).

Lorsque les gagnants sont annoncés, vous pouvez à nouveau utiliser la fonctionnalité de partage de DataLab pour partager les classeurs gagnants avec l'ensemble du groupe afin que les gens puissent apprendre ce qui fait une bonne soumission.

Si votre organisation et les gagnants souhaitent que leurs cahiers d'exercices soient partagés avec le monde entier, les équipes gagnantes peuvent utiliser la fonctionnalité "Faire une copie" pour copier le cahier d'exercices du groupe sur leur espace personnel et le rendre public. Ainsi, leur travail apparaîtra sur leur profil DataCamp, ce qui leur permettra de se faire un nom dans l'espace des données !

Sujets