Data Science met Python
In deze training leer je Data Science praktisch toepassen in een finance-toepassing. Je leert de krachtige programmeertaal Python vanaf de basics en maakt kennis met krachtige libraries en tools die jouw werk beter, sneller en leuker maken!
Data Science
Welkom bij de training Data Science met Python. Deze training gaat over het importeren, manipuleren en visualiseren van allerlei soorten data. We gaan dit allemaal doen met behulp van de programmeertaal Python.
Wat ga je leren
Data Science Fundamentals
Programmeren met Python
Libraries als Pandas en NumPy gebruiken
Datavisualisaties maken
Voor wie is deze training?
- Finance- en investeringsprofessionals die de grenzen van Excel hebben bereikt.
- Iedereen die interesse heeft in Data Science.
- Data Scientists die hun vaardigheden op het gebied van Data Handling/Manipulatie willen verbeteren.
Vereisten voor de training
- Een desktop computer (Windows, Mac, of Linux) waarop Anaconda kan draaien. De training leidt je door de installatie van de benodigde gratis software.
- Idealiter enige basiskennis van spreadsheets/programmeren. (niet verplicht, de training leert je de basisbeginselen)
Technology stack
Inhoud van de training
Introductie tot Data Science
- De vijf V's van Big Data
- Big Data instrumenten en technologieën
- Big Data bronnen
De Anaconda omgeving
- Anaconda download en installatie
- Aan de slag met Anaconda Navigator
- Jupyter Lab en de Notebook IDE
- Inleiding tot de Jupyter Notebook Interface
Python programmeren
- Comments
- Datatypes
- Operators
- String methodes en functies
- Variabelen
- Functies
- Je eigen functies schrijven
- Lists
- Index positions en slicing
- Dictionaries
- Tuples
- Sets
- Conditional Statements
- Iteraties - For Loops
- Iteraties - While loops en increments
- Iteratie over Dictionaries
- Oefening 1: Loops en Lists
- Oefening 2: Loop iteration en datatypes
- Oefening 3: Conditionals, Loops, Iteration
- Oefening 4: Conditionals, Loops
NumPy
- NumPy arrays maken
- NumPy Operations
- NumPy indexering
- NumPy Conditional Selection
Pandas en Series
- Series met pandas
- Series maken van CSV bestanden
- Series - Gebruik van de methoden tail() en head()
- Series - Gebruik van sort_index en sort_values
- Series - Het "in" keyword gebruiken
- Waarden uit Series halen per index position
- Waarden uit Series ophalen per index label
- Series - Wiskundige methoden
- Series - Unieke waarden tellen
- Series - De map() methode
- Praktijkoefeningen over pandas en Series
Pandas en dataframes
- Dataframes - Eén of meer kolommen selecteren
- Dataframes - Nieuwe kolommen toevoegen
- Dataframes - Broadcasting
- Dataframes - De methode value_counts() gebruiken
- Dataframes - De dropna() methode
- Dataframes - de fillna() methode
- Dataframes - de astype() methode
data-extractie
- Importeren van een nieuwe dataset
- set_index() en reset_index()
- - loc-accessor
- – iloc accessor
- 2e argument voor loc en iloc
- Quiz - Data Extractie pt.1
- Nieuwe waarden instellen in cellen
- Indexlabels of kolommen hernoemen
- Rijen en kolommen verwijderen
- Quiz - Data Extractie pt.2
- De Sample methode
- nsmallest en nlargest methods
- De where() methode
- De Query() methode
- De Apply() methode
- De Apply() methode met rij waarden
- De Copy() methode
- Quiz Data Extractie pt.3
Pandas text-data methodes
- De lower(), upper(), title() en len() functies
- De str.replace() methode
- Dataframe rijen filteren met string methoden
- De strip(), lstrip() en rstrip() methoden
- String methoden gebruiken op een data frame
- De str.split() methode
- De expand parameter met str.split()
Pandas Multi Index
- De set_index() methode
- De get_level_values() methode
- De set_names() methode
- De sort_index() methode
- Rijen uit een multi-Index Data Frame halen
- De transpose() methode
- Quiz - Pandas MultiIndex deel 1
- De swaplevel() methode
- De methoden stack() en unstack()
- De unstack() methode deel 1
- De unstack() methode deel 2
- De unstack() methode deel 3
- De methoden pivot() en pivot_table()
- De methode pivot_table()
- De pd.melt() methode
- Quiz - Pandas MultiIndex deel 2
Het pandas GroupBy object
- Werken met het GroupBy object
- De get_group() methode
- Aanvullende methoden voor het Groupby object
- Groeperen op meerdere kolommen
- De agg() methode
- Iteratie over groepen
- Quiz - Het Pandas Groupby object
Merging, Joining en Concatenating
- pd.concat methode
- inner joins deel 1
- Inner joins deel 2
- Outer joins
- left and right joins
- parameters left_on & right_on
- parameters left_index & right_index
- join methode
- pd.merge methode
- Quiz - Merging, Joining en Concatenating
Pandas - Date and Time Dataset
- datetime in Python
- Het pandas timestamp object
- DateTimeIndex object
- pd.to_datetime methode
- pd.date_range() methode deel 1
- pd.date_range() methode deel 2
- pd.date_range() methode deel 3
- .dt accessor
- Quiz - Pandas Date and Time Datasets 1
- pandas_datareader bibliotheek
- een financiële dataset importeren
- Rijen selecteren uit een DataFrame
- Attributen en methoden van het Timestamp object
- Quiz - Pandas Date and Time Datasets 2
- Het pd.DateOffset Object
- Timeseries Offsets
- Timedelta object
- Timeldeltas in een Dataset
- Quiz - Pandas Date and Time Datasets 3
Pandas - input en output
- importeren uit een URL
- Snelle Object Conversies
- CSV-bestand exporteren met de methode to_csv
- xlrd en openpyxl bibliotheken
- read_excel methode
- to_excel-methode
- Quiz - Pandas input en output
Datavisualisatie met matplotlib
- matplotlib plot methode
- matplotlib sjablonen
- staafdiagrammen in matplotlib
- taartdiagrammen in matplotlib
- NumPy met matplotlib
- matplotlib appearance opties
- Quiz - Datavisualisatie met matplotlib