Data Scientist
Wat is een data scientist?
Een data scientist is iemand die grote hoeveelheden data verwerkt uit verschillende (al dan niet gestructureerde) bronnen (oftewel ‘big data’) om deze om te zetten naar bruikbare informatie voor het management van een bedrijf. De functie lijkt op die van een data analist, met dit verschil dat laatstgenoemde zich met name bezighoudt met het verwerken van historische data tot informatie, waar de data scientist zich toelegt op het maken van voorspellingen door data te extrapoleren en modellen te bouwen. Hiervoor dient de data scientist te beschikken over een gedegen kennis van IT, inclusief de nodige programmeervaardigheden.
Wat doet een data scientist?
Data scientists genereren waardevolle inzichten uit een grote hoeveelheid gestructureerde of ongestructureerde data, ook wel ‘big data’ genoemd. Dit doet de data scientist door speciale tools en software te gebruiken en zogenaamde algoritmes te schrijven om data te ontsluiten, structuren en te analyseren. Binnen sommige functies kan een data scientist ook betrokken zijn bij het grondig analyseren van de bedrijfsvoering om de behoeftes van het bedrijf in kaart te brengen. De bezigheden van een data scientist kunnen onder meer het volgende omvatten:
- Zoeken naar kansen en mogelijkheden in een aanzienlijke hoeveelheid data
- Opschonen en verwerken van ruwe data tot bruikbare data
- Correleren van verschillende soorten data
- Detecteren van onregelmatigheden in data
- Identificeren van vragen vanuit de bedrijfsvoering
- Herkennen van patronen in ‘big data’, om hiervoor een voorspellend algoritme (zelflerend wiskundig model) te ontwikkelen – ook wel ‘machine learning’ genoemd
- Analyseren en selecteren van de beste statistische methodologie (bijvoorbeeld regressie, cluster analyse, decision trees) voor het oplossen van vragen vanuit de bedrijfsvoering
- Inzetten van voorspellende algoritmes ten behoeve van de besluitvorming
- Beschrijven en visualiseren van ontdekte inzichten en voorspellingen
- Rapporteren en delen van gegenereerde inzichten en kennis met het management en andere betrokkenen
- Onderzoeken en ontwikkelen van mogelijkheden om nog meer uit bestaande data te halen
- Beheren en optimaliseren van datastromen en data-analyses
- Opstellen, aansturen en/of trainen van een data science team
Waar werken data scientists?
Data scientists kunnen werkzaam zijn binnen alle (grotere) bedrijven die te maken hebben met big data en de behoefte hebben om deze grote hoeveelheid data te doorgronden en te gebruiken voor het maken van voorspellingen ten behoeve van de interne bedrijfsvoering. Dit kunnen bijvoorbeeld banken, uitgevers, IT-bedrijven of multinationals op het gebied van productie of retail zijn. Ook kan een data scientist als consultant werken bij dienstverlenende adviesorganisaties die externe klanten helpen met het creëren van inzichten en voorspellingen op basis van big data.
Doordat het werk van een data scientist veel raakvlakken heeft met de bedrijfsvoering, kunnen data scientists tijdens hun werk onder meer te maken krijgen met managers, projectleiders, econometristen, business intelligence consultants, developers, en data analisten.
Hoe word je data scientist?
Om data scientist te worden is – naast een ruime werkervaring in op het gebied van data(analyse) – vaak een achtergrond in exacte wetenschap vereist, bijvoorbeeld op basis van een van de volgende opleidingen:
- Informatica (hbo, wo)
- Econometrie (wo)
- Wiskunde (hbo, wo)
- Toegepaste wiskunde (hbo)
- Natuurkunde (hbo, wo)
Ook zijn kennis en vaardigheden vereist op het gebied van onder meer:
- Data science tools als R, SQL , SAS, MatLab
- Eén of meer programmeertalen (veelal Python)
- Grote databases en/of datamodellen (Hadoop, Spark, SQL)
- Simulaties, scenario-analyses en algoritmes (modellen)