De eerste stap waar een data scientist bij kan helpen, is orde aanbrengen in ongestructureerde data. Voordat dat “telefoonboek” geanalyseerd kan worden, dient de data opgeschoond en gestructureerd te worden. Eerst wordt de grote poule met daarin zowel relevante als irrelevante data teruggebracht naar een relationele database met geordende, compacte tabellen. Dit kan gezien worden als een inhoudsopgave die de relatie tussen hoofdstukken en logisch ingedeelde paragrafen weergeeft. Informatie over de medische geschiedenis van patiënten komt in een andere paragraaf dan stafgegevens, maar is wel aan elkaar gelinkt vanwege een overeenkomstig ziekenhuis.
Na het analyseren worden er ook voorspellingen gemaakt over mogelijke uitkomsten. Tot slot worden alle uitkomsten grafisch weergeven (bijvoorbeeld in tabellen of grafieken) zodat de resultaten te begrijpen zijn voor andere partijen.
Het metaforische telefoonboek kan informatie bevatten die ons helpt vroegtijdige voorspellingen over kanker te maken, of een verborgen bedrijfsformule die uiterst winstgevend zou kunnen zijn. De uitdaging in data science is om die initieel onzichtbare parels op te vissen en te wassen opdat er iets bijzonder waardevols uitkomt.
Bringing data closer to you.
© 2022 Medicine for Business B.V.
Alle rechten voorbehouden