Corso
Modelli multi-modali con Hugging Face
IntermedioLivello di competenza
Aggiornato 01/2026
PythonArtificial Intelligence4 h14 video45 Esercizi3,800 XPAttestato di conseguimento
Crea il tuo account gratuito
Continua con GoogleMostra più opzionio
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.
Preferito dagli studenti di migliaia di aziende
Formare un team?
Prova per il BusinessDescrizione del corso
Sfrutta la potenza dell'intelligenza artificiale multimodale
Entra nel mondo all'avanguardia dei modelli di IA multimodali, dove testo, immagini e voce si uniscono per creare app davvero potenti. Scopri come usare il grande archivio di modelli di Hugging Face che possono vedere, sentire e capire come mai prima d'ora. Che tu stia analizzando i contenuti dei social media, sviluppando assistenti vocali o creando app di intelligenza artificiale di nuova generazione, i modelli multimodali sono la chiave per gestire diversi tipi di dati senza problemi.Padroneggia le tecniche multimodali essenziali
Scopri modelli all'avanguardia come CLIP per capire immagini e testo, SpeechT5 per sintetizzare la voce e il modello Qwen2 Vision Language per l'analisi multimodale del sentiment. Grazie a esercizi pratici, imparerai le tecniche che usano le aziende leader nel campo dell'intelligenza artificiale per creare sistemi multimodali super sofisticati.Prepara le tue competenze nell'intelligenza artificiale per il futuro
Questo corso ti darà un kit di strumenti affidabile per gestire attività di intelligenza artificiale multimodali. Imparerai a gestire e mettere insieme diversi tipi di dati in modo efficace, a sistemare modelli già pronti per applicazioni personalizzate e a valutare e migliorare le prestazioni dei modelli in tutti i tipi di dati.Prerequisiti
Introduction to LLMs in Python1
Accesso a modelli e dataset di Hugging Face
Esplora l'hub dei modelli di Hugging Face e trasforma testo, audio e dati visivi grezzi in formati adatti all'AI. Scopri come trovare i modelli più recenti e popolari per attività come la generazione di testo e sfrutta la potenza delle pipeline predefinite.
2
Modelli unimodali per visione, audio e testo
Impara a padroneggiare le singole modalità con modelli all'avanguardia. Approfondisci la computer vision per classificazione e segmentazione di immagini, esplora il riconoscimento vocale e la sintesi text-to-speech, e scopri tecniche efficaci di fine-tuning. Sviluppa competenze pratiche con modelli pre-addestrati dalla libreria transformers di Hugging Face.
3
Modelli multi-modali per la classificazione
Impara a fondere informazioni visive, testuali e audio per applicazioni di AI più ricche. Padroneggia tecniche come CLIP per la classificazione zero-shot, crea analizzatori di sentiment che vedono e leggono e sviluppa rilevatori di emozioni che combinano espressioni facciali e voce. Porta i tuoi modelli di AI oltre il pensiero a singola modalità.
4
Generazione multi-modale
Trasforma le idee in realtà! Padroneggia tecniche di AI all'avanguardia per generare e manipolare contenuti visivi usando prompt testuali. Crea immagini sorprendenti, modifica le foto in modo intelligente e sviluppa potenti sistemi di domanda-risposta per immagini e documenti. Trasforma la tua visione creativa in realtà digitale con l'AI multi-modale.
Modelli multi-modali con Hugging Face
Corso completato
Ottieni Attestato di conseguimento
Aggiungi questa certificazione al tuo profilo LinkedIn, al curriculum o al CVCondividila sui social e nella valutazione delle tue performanceIscriviti ora
Unisciti a oltre 19 milioni di studenti e inizia Modelli multi-modali con Hugging Face oggi!
Crea il tuo account gratuito
Continua con GoogleMostra più opzionio
Continuando, accetti i nostri Termini di utilizzo, la nostra Informativa sulla privacy e che i tuoi dati siano conservati negli Stati Uniti.
Aumenta le tue competenze sui dati con l'app di DataCamp
Avanza ovunque ti trovi con i nostri corsi per dispositivi mobili e le nostre sfide di programmazione quotidiane da 5 minuti.