Uit de cursus: Data science in de vingers krijgen: De basis begrijpen

Krijg toegang tot deze cursus met een gratis proefabonnement

Word vandaag lid en krijg toegang tot meer dan 23.200 cursussen geleid door branchedeskundigen.

Ongestructureerde gegevens verzamelen

Ongestructureerde gegevens verzamelen

- We hebben veel meegemaakt, dus laten we een beetje samenvatten. Over het algemeen werken uw data science-teams met drie verschillende gegevenstypen. Daar zijn je gestructureerde gegevens. Dat zijn de gegevens die het meest lijken op de gegevens in uw spreadsheet. Het heeft een vaste volgorde en een consistent formaat. Het wordt meestal opgeslagen in een relationele database. Dan zijn er je semigestructureerde gegevens. Dat zijn de gegevens met enige structuur, maar er is extra flexibiliteit om sommige veldnamen te wijzigen. Ten slotte is er het meest populaire type gegevens, er is al het andere, het zijn de ongestructureerde gegevens. Sommige analisten schatten dat 80% van uw gegevens ongestructureerd is. Als je erover nadenkt is dit heel logisch. Denk na over de gegevens die u elke dag maakt. Elke keer dat u een voicemail achterlaat. Elke foto die je uploadt naar Facebook. De Microsoft Word-memo die u op het werk hebt gemaakt of de PowerPoint-presentatie. Zelfs als je op…

Inhoud