Uit de cursus: Data science in de vingers krijgen: De basis begrijpen

Krijg toegang tot deze cursus met een gratis proefabonnement

Word vandaag lid en krijg toegang tot meer dan 23.200 cursussen geleid door branchedeskundigen.

Statistieken en software gebruiken

Statistieken en software gebruiken

- Omdat data science nog steeds door de praktijk wordt gedefinieerd, ligt er een extra nadruk op het gebruik van gemeenschappelijke software en tools. Datawetenschappers zijn als vroege archeologen. Dus zie software als de borstels en pikhouwelen die je nodig hebt om ontdekkingen te doen. Probeer je niet te veel te concentreren op het leren van alle tools. De tools op zich maken van jou nog geen data scientist. Het is de wetenschappelijke methode, en niet de tools, die iemand tot een datawetenschapper maken. De tools vallen in principe in drie categorieën, opslaan, schrobben en analyseren. Om de gegevens op te slaan, kunt u spreadsheets, databases en belangrijke waardearchieven gebruiken. Enkele populaire zijn Hadoop, Cassandra en POST REST SQL. Scrubben is een gangbare praktijk om de gegevens gemakkelijker te maken om mee te werken. Hier gebruikt u teksteditors, scripttools en programmeertalen zoals Python en SCALLOP. Ten slotte zijn er de statistische pakketten om de gegevens te…

Inhoud