De opkomst van datawetenschap volgen

Over de hele wereld wenden bedrijfsleiders zich tot datagestuurde besluitvorming in hun organisaties en accepteren ze gemakkelijk dat het vermogen om gegevens goed te beheren van vitaal belang is om hen te helpen de concurrentie voor te blijven. Deze ontwikkeling was echter jaren in de maak.

Volgens Juan M. Lavista Ferres, de chief data scientist en vice-president bij technologiegigant Microsoft, zijn de methoden die momenteel worden gebruikt nauwelijks nieuw, terwijl onze fascinatie voor data echt decennia geleden begon.

Met een master in machine learning en datamining van de John Hopkins University in 2005 – lang voordat datawetenschap als term werd bedacht, zou Lavista Ferres er het een en ander van moeten weten.

Het kantelpunt voor datawetenschap

In een interview met Fortuin Onderwijs, merkt Lavista Ferres op dat datawetenschap het hoogtepunt is van inspanningen op meerdere gebieden om met data te werken. Van economen, statistici en computerwetenschappers, experts binnen verschillende disciplines hadden in de loop der jaren verschillende datacentrische methoden ontwikkeld om met data te werken.

Datawetenschap is in wezen de samensmelting van deze technieken en strategieën.

En de methoden voor het manipuleren van gegevens zijn de afgelopen 100 jaar in wezen onveranderd gebleven, zegt Lavista Ferres. Zelfs „nieuwere“ algoritmen voor machine learning dateren nog steeds twee tot drie decennia.

De eenvoudige reden waarom veel van deze algoritmen in het verleden niet werden gebruikt, is te wijten aan een gebrek aan gegevens of onvoldoende verwerkingskracht, overwegingen die de alomtegenwoordige digitalisering en cloudcomputing hebben verminderd, zo niet volledig verwijderd.

“[A] veel van deze algoritmen werden niet gebruikt omdat er niet genoeg gegevens waren. Tegenwoordig hebben we aanzienlijk meer verwerkingskracht en aanzienlijk meer gegevens die we voorheen niet hadden”, aldus Lavista Ferres.

“[We are seeing an] exponentiële groei van data. De kosten voor het opslaan van gegevens zijn enorm gedaald en de verwerkingskracht is enorm toegenomen. Van al deze dingen wordt verwacht dat ze blijven groeien en geweldige kansen bieden die voorheen niet bestonden.”

Een uitzonderlijk data science-team bouwen

Deze databonanza kan helpen bij het oplossen van een groot aantal problemen, zegt Lavista Ferres, wat het tekort aan datawetenschappers verklaart terwijl bedrijven proberen ze in te huren.

De drempel om datawetenschapper te zijn is niet zo hoog als wordt beweerd. Hij legt uit: „[In general], je hoeft geen data science te hebben gestudeerd om een ​​data scientist te zijn… de meerderheid van de datawetenschappers die tegenwoordig bij Microsoft en in de tech-industrie werken, hebben niet specifiek datawetenschap gestudeerd, maar ze hebben wel een discipline gestudeerd die veel had [of] datawetenschapselementen.”

Hoewel Lavista Ferres zegt dat het grootste deel van de vaardigheden van een datawetenschapper tijdens het werk wordt geleerd, is een sterke basis rond belangrijke elementen zoals codering of gegevens van vitaal belang. Ten slotte zal een zeer sterke achtergrond in statistiek zeer nuttig zijn om te begrijpen wat men wel (of niet) met gegevens kan doen.

Maar hoe kunnen bedrijven een uitzonderlijk datawetenschapsteam bouwen? Het blijkt dat de beste teams die zijn met een diverse achtergrond, zegt Lavista Ferres: „Momenteel heb ik in mijn team economen, statistici, computerwetenschappers, natuurkundigen, mensen met een elektrotechnische achtergrond – en er zijn er die afkomstig zijn uit nieuwe disciplines die vooral gericht zijn op data science en daar werken we mee samen.”

Het is niet verwonderlijk dat het vermogen van een datawetenschapper om goed te communiceren door Lavista Ferres als een essentiële vaardigheid wordt beschouwd. Dit houdt in dat u uitlegt wat de gegevens zeggen en dat u dit op een manier plaatst die andere mensen kunnen begrijpen.

Datawetenschap is voor iedereen

Als er één afhaalmaaltijd is, zou het zeker de overtuiging van Lavista Ferres zijn dat datawetenschap voor iedereen is. Volgens hem vullen datawetenschappers momenteel de hiaten in veel disciplines – van artsen tot fysici – vanwege een gebrek aan datacentrische vaardigheden.

Maar naarmate de mogelijkheden van datawetenschap zich uiteindelijk verspreiden in organisaties en bedrijfstakken, verwachten wij dat datawetenschapsvaardigheden steeds meer gaan gelden.

En net zoals coderen nu wordt onderwezen in niet-IT-cursussen of zelfs als verrijkingslessen voor kinderen, is het niet zo moeilijk om je voor te stellen dat datawetenschap uiteindelijk overal te vinden zou zijn.

Paul Mah is de redacteur van DSAITrends. Als voormalig systeembeheerder, programmeur en IT-docent schrijft hij graag zowel code als proza. Je kunt hem bereiken op [email protected].​

Afbeelding tegoed: iStockphoto/lzf

.

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert