Data Science II: Data Science en Machine Learning

Leer in 3 dagen alles over Data Science met Python. We nemen je mee in de essentiële en meest effectieve technieken die je direct kunt gaan toepassen in je eigen omgeving. Daarmee maak je een vliegende start in data science en machine learning!

Introductie

Machine Learning, dat is echt zo’n magisch woord! Jarenlang leek het iets wat alleen maar weggelegd was voor de echte diehards. Maar data science en machine learning is steeds dichterbij gekomen. En daarmee is het ook bereikbaar geworden voor jou! In deze driedaagse training leer je alles over de belangrijkste tools en toepassingen. Deze training is perfect voor mensen die al ervaring hebben in Python en een eerste kennismaking willen met data science en machine learning.

In deze training leer je de principes van hoe machine learning modellen leren. Je gaat data clusteren, leert regressie algoritmes toepassen, gaat aan de slag met classificatie algoritmes en leert een decision tree toepassen op datasets. Ofwel, je gaat zoveel mogelijk hands-on aan de slag zodat je de opgedane kennis direct kunt toepassen in de praktijk. Deze training sluit perfect aan op de cursus Python for Data Analysis en is een goede opstap naar de gespecialiseerde training Deep Learning.

In deze training van drie dagen leer je:

  1. Geavanceerde data-analyse
  2. Geavanceerde dataverwerking
  3. Machine learning modellen opzetten

Programma

Drie hele dagen praktisch aan de slag. Je ontdekt stap voor stap hoe data science werkt. We oefenen veel en gebruiken herkenbare voorbeelden. Zo weet je zeker dat je de stof direct kunt gebruiken.

  • Introductie in Data Science en Machine Learning
    We beginnen met een introductie in data science en machine learning om je vertrouwd te maken met de kaders, begrippen en toepassingen.

Fundamenten van machine learning

  • Supervised learning
    Dit is één van de meest gebruikte learning technieken van hedendaagse machine learning modellen. Je traint een model op basis van gelabelde data.
  • Unsupervised learning
    Je gaat een model trainen met een algoritme dat leert door patronen te herkennen. Je leert welke algoritmen er zijn en voor welke toepassingen je ze in kunt zetten.
  • Test set/train set
    Voor het goed opzetten van een machine learning model is het belangrijk om scheiding te maken tussen je test set en train set. Op deze manier kun je je hyperparameters optimaliseren op een unbiased manier. Klinkt nu misschien nog een beetje ingewikkeld maar we leggen je uiteraard precies uit hoe en waarom.
  • Bias en variance
    Een optimaal machine learning model heeft een goede balans in de complexiteit van het model. In deze model nemen we je mee in het optimaliseren van je model en wat de gevolgen zijn van overfitting en underfitting.

Regressie

  • Cost function en gradient descent
    In deze module leer je alles over hoe machine learning modellen leren. Je leert het concept van cost function, leert verschillende cost functions en leert wat Gradient Descent is. Ook leer je hoe je optimaal parameters kiest voor Gradient Descent
  • Lineaire en polynomial regressie in sci-it learn
    We leren je concepten voor het voorspellen van huizenprijzen. Je leert de resultaten analyseren en bekijkt hoe goed jouw model het doet met behulp van verschillende cost functions.

Clustering

  • K-means
    In deze module nemen we je mee in het K-means clustering algoritme. Je leert hoe je je dataset clustert op basis van een K aantal centrumpunten en hoe je een optimaal aantal centrumpunten kiest. Ook leer je het nut van data normaliseren of standaardiseren.
  • Clustering toepassen op de Iris dataset
    Je past de theorie van K-means clustering toe op de Iris dataset. Hier cluster je de data van de Iris flower data set en leer je clusters herkennen.
  • DBSCAN
    Naast K-Means leer je over DBSCAN. Dit is een clustering-algoritme dat punten in clusters groepeert op basis van hun nabijheid en dichtheid.

Classificatie

  • KNN
    In deze module leer je data classificeren op basis van het KNN algoritme. Dit algoritme leert door te kijken naar dichtbijgelegen datapunten. We leggen je uit voor welke data en vraagstukken je dit in kunt zetten. Ook leer je hoe je op een zorgvuldige manier je parameters kiest en wat de voor- en nadelen zijn van dit algoritme.
  • Classificatie met diabetes dataset
    We passen het algoritme toe op een dataset met mensen die wel of niet diabetes hebben. De uitdaging is hier om diabetes te voorspellen aan de hand van verschillende factoren.
  • Precision, recall en F1-score
    Wanneer we classificatie algoritmes gebruiken hebben we een goede graadmeter nodig om de kwaliteit van het algoritme te bepalen. In deze module leer je hoe je dat systematisch kunt doen.
  • SVM
    We leren je het Support Vector Machine algoritme gebruiken. Je leert de voor- en nadelen en hoe je systematisch parameters kiest om overfitting te voorkomen.

Decision Trees en Regression Trees

  • Information Gain
    Leer met de hand decision trees maken door de information gain per splitsing te berekenen. Je leert hiermee de theorie achter information gain en decision trees en begrijpt op een fundamentele manier hoe deze algoritmes werken.
  • Overfitting
    Ook decision trees kunnen last hebben van overfitting. We leren waarom ze overfitten en hoe je je parameters hierop aanpast.
  • Regression trees toepassen
    Je leert het concept decision trees uitbreiden naar regression trees. Hiermee leer je hoe beslisbomen in staat zijn om numerieke data te voorspellen.

En natuurlijk zit de training vol praktische tips en eyeopeners. Ook voor wie dacht: dit weet ik al wel. Na afloop ontvang je een certificaat en mag je trots zijn op wat je hebt geleerd!

Data en locaties

Deze cursus wordt aangeboden in samenwerking met onze collega’s van School of Datascience.

Staat er nog geen datum gepland op jouw voorkeurslocatie? Laat het gerust weten en we kijken samen naar de mogelijkheden. De cursus is ook incompany te boeken op jullie eigen locatie en op maat gemaakt voor het team. Neem daarvoor hier contact met ons op om de mogelijkheden te bespreken.

Ma 23 & Di 24 & Wo 25 februariDen Haag
Ma 18 & Di 19 & Wo 20 meiUtrecht

Kosten

Het inschrijfgeld bedraagt € 1665 per persoon (exclusief 21% BTW). Het inschrijfgeld is inclusief koffie/thee, een uitgebreide lunch en alle overige cursusmaterialen.

Voor wie

Deze cursus is ideaal voor mensen die data science en machine learning concepten willen begrijpen én effectief kunnen toepassen. Deze training gaat ervanuit dat je een beginner bent in het vakgebied datascience. Het is wel essentieel dat je Python onder de knie hebt op het niveau van de training Python for Data Analysis. Met die voorkennis kun je soepel instromen in deze training.

Beoordeeld met een 9,3

Onze cursisten vertellen

Daan Sloothaak - Binckbank

Ideale training om bekend te worden op het gebied van Data Science. De trainer weet een uitdagend programma met verschillende onderdelen op een leuke en luchtige manier over te brengen, helemaal afgestemd op het niveau van de cursisten. Door goed te coachen en altijd bereikbaar te zijn voor eventuele vragen stelt hij je in staat om in korte tijd veel te leren.

Mitchel Baes - TPS

Goede en informatieve training waarbij ook echt de tijd werd genomen voor ieder individu. De trainer neemt echt de tijd om alle concepten uit te leggen en daarbij ook voorbeelden te benoemen. De afwisseling van theorie en praktijk is ook ideaal om het zelf onder de knie te krijgen. Verder na de training staat de trainer altijd voor je klaar als je vragen hebt. De cursus is een aanrader voor iedereen die zich op het gebied van Data Science wil ontwikkelen.

Bart Vrancken - Volksbank

Een uitstekende cursus gevolgd over Data Science. Diverse varianten van supervised, unsupervised en reinforcement learning doorgeakkerd. De trainer legt rustig en duidelijk uit. Als hij merkt dat er meer tijd nodig is, dan wordt deze ingeruimd. De combinatie van theorie en praktijk, waarbij opdrachten gemaakt moeten worden, is een prima manier om wegwijs te worden in Python en de libraries van Python. Een aanrader!