course
Introduction to Spark SQL in Python
- AvanceradFärdighetsnivå
- 4.4+
- 457
Learn how to manipulate data and create machine learning feature sets in Spark using SQL in Python.
Datamanipulation
Följ korta videor ledda av expertinstruktörer och öva sedan på det du lärt dig med interaktiva övningar i din webbläsare.
eller
Genom att fortsätta accepterar du våra Användarvillkor, vår Integritetspolicy och att dina uppgifter lagras i USA.course
Learn how to manipulate data and create machine learning feature sets in Spark using SQL in Python.
Datamanipulation
course
Learn the gritty details that data scientists are spending 70-80% of their time on; data wrangling and feature engineering.
Datamanipulation
course
Create more accurate and reliable RAG systems with Graph RAG and hybrid RAG.
Artificiell intelligens
course
Learn how to calculate meaningful measures of risk and performance, and how to compile an optimal portfolio for the desired risk and return trade-off.
Tillämpad ekonomi
course
Learn how to work with streaming data using serverless technologies on AWS.
Moln
course
Extend your regression toolbox with the logistic and Poisson models and learn to train, understand, and validate them, as well as to make predictions.
Sannolikhet och statistik
course
In this course you will learn to fit hierarchical models with random effects.
Sannolikhet och statistik
course
Learn how to make GenAI models truly reflect human values while gaining hands-on experience with advanced LLMs.
Artificiell intelligens
course
Master Databricks with Python: learn to authenticate, manage clusters, automate jobs, and query AI models programmatically.
Artificiell intelligens
course
Learn how to approach and win competitions on Kaggle.
Maskininlärning
course
This course covers everything you need to know to build a basic machine learning monitoring system in Python
Maskininlärning
course
Manage the complexity in your code using object-oriented programming with the S3 and R6 systems.
Programvaruutveckling
course
Learn to build pipelines that stand the test of time.
Maskininlärning
course
Learn how to use RNNs to classify text sentiment, generate sentences, and translate text between languages.
Artificiell intelligens
course
Learn how to write recursive queries and query hierarchical data structures.
Programvaruutveckling
course
Learn key techniques to optimize Java performance, from algorithm efficiency to JVM tuning and multithreading.
Programvaruutveckling
course
Learn how to load, transform, and transcribe speech from raw audio files in Python.
Datamanipulation
course
Build AI agentic workflows that can plan, search, remember, and collaborate, using LlamaIndex.
Artificiell intelligens
course
Connect Java to PostgreSQL with JDBC. Write secure queries, manage transactions, and handle large datasets efficiently.
Programvaruutveckling
course
In this course youll learn techniques for performing statistical inference on numerical data.
Sannolikhet och statistik
course
Sharpen your knowledge and prepare for your next interview by practicing Python machine learning interview questions.
Maskininlärning
course
In this course youll learn how to leverage statistical techniques for working with categorical data.
Sannolikhet och statistik
course
Learn to analyze Airbnb data using SQL in Databricks, create dashboards, and derive actionable insights.
Importera och rensa data
course
Build real-world applications with Python—practice using OOP and software engineering principles to write clean and maintainable code.
Programvaruutveckling
course
Explore latent variables, such as personality, using exploratory and confirmatory factor analyses.
Sannolikhet och statistik
course
Learn tools and techniques to leverage your own big data to facilitate positive experiences for your users.
Maskininlärning
course
Prepare for your next statistics interview by reviewing concepts like conditional probabilities, A/B testing, the bias-variance tradeoff, and more.
Sannolikhet och statistik
course
In this course youll learn how to perform inference using linear models.
Sannolikhet och statistik
course
Learn how to write effective tests in Java using JUnit and Mockito to build robust, reliable applications with confidence.
Programvaruutveckling
course
Develop a better intuition for advanced probability, risk assessment, and simulation techniques to make data-driven business decisions with confidence.
Sannolikhet och statistik
Datavetenskap är ett expertområde som fokuserar på att utvinna information från data. Med hjälp av programmeringsfärdigheter, vetenskapliga metoder, algoritmer och mer analyserar dataforskare data för att skapa användbara insikter.
Du behöver lära dig ett programmeringsspråk som Python eller R och behärska principerna för matematik och statistik. Kunskap om dataanalysmetoder och datavetenskapliga verktyg är också viktigt. Det finns många sätt att lära sig datavetenskap. Förutom formella utbildningsmetoder, som en examen eller universitetsstudier, finns det många andra resurser som hjälper dig att lära dig i din egen takt. Förutom onlinekurser och handledningar finns det böcker, videor och mer.
Förutom kunskaper i matematik och statistik behöver data scientists programmeringskunskaper i språk som Python, R och SQL. Dessutom kräver data science förmågan att arbeta med stora datamängder, kunskap om datavisualisering, datahantering och databashantering. Färdigheter inom maskininlärning och djupinlärning kan också vara användbara.
I en professionell kapacitet kan nästan alla branscher använda data science i viss mån. Hälso- och sjukvårdsorganisationer använder data science för att upptäcka och bota sjukdomar, medan finansbolag använder det för att upptäcka och förebygga bedrägerier. Alla typer av branscher använder data science för marknadsföring, till exempel för att bygga rekommendationssystem och analysera kundbortfall.
Ja, data science är bland de snabbast växande sektorerna i USA och världen över. Det är också en av de bäst betalda karriärerna som finns. Enligt data från Payscale tjänar erfarna data scientists i genomsnitt 97 609 dollar och har ett nöjdhetsbetyg på fyra av fem stjärnor i USA.
Det finns några saker att tänka på här. För det första kan det vara konkurrenskraftigt att komma in på en data science-examen, och den kräver ofta genomgående höga betyg. På samma sätt kräver många av de färdigheter som krävs för data science mycket studier och tålamod. Det kan ta flera månader att behärska alla nödvändiga grunder, såväl som mycket praktisk erfarenhet för att säkra en ingångsposition.
Ja, du behöver viss kodningserfarenhet i språk som Python, R, SQL, Java och C/C++. Men på grund av dess relativt enkla syntax är programmeringsspråket Python ofta det föredragna valet bland nybörjare.
För en person utan tidigare kodningserfarenhet och/eller matematisk bakgrund kan det vanligtvis ta 7 till 12 månader av intensiva studier för att nå nivån av en data scientist på ingångsnivå. Det är dock viktigt att komma ihåg att det inte nödvändigtvis gör dig till en riktig data scientist om du bara lär dig den teoretiska grunden inom data science.
När du väl behärskar grunderna i datavetenskap kan du specialisera dig inom en mängd olika områden, inklusive maskininlärning, artificiell intelligens, stordataanalys, affärsanalys och intelligens, datautvinning och mer.
Gör framsteg när du är på språng med våra mobila kurser och dagliga 5-minuters kodningsutmaningar.