Gestructureerd versus ongestructureerd
Gestructureerd en ongestructureerd zijn twee soorten gegevens of informatie die verschillen vertonen als het gaat om hun concepten en betekenissen. De beschrijving van gegevens in velden is wat gestructureerde informatie wordt genoemd. Aan de andere kant worden alle binaire documenten met de naam ongestructureerde informatie of gegevens genoemd. Dit is het belangrijkste verschil tussen het gestructureerde en het ongestructureerde.
De gestructureerde informatie wordt zo genoemd, omdat de aard en functie worden geïdentificeerd door metadatatags. Aan de andere kant, enkele van de beste voorbeelden van de documenten die vallen onder de ongestructureerde soort gegevens of informatie zijn .pdf en .docx.
Het is belangrijk om te weten dat gestructureerde informatie veel met SharePoint te maken heeft. Er wordt gezegd dat alle inhoud die direct op of binnen SharePoint wordt geproduceerd of gemaakt, als gestructureerd van aard wordt beschouwd. Alle gebiedsvermeldingen en lijstitems die rechtstreeks binnen SharePoint worden gemaakt of geproduceerd, vallen bijvoorbeeld onder het gestructureerde type gegevens of informatie. Dit is een belangrijke observatie om te maken als het gaat om het definiëren van gestructureerde gegevens.
Er moet aan worden herinnerd dat alle binaire documenten die eigen toepassingen gebruiken, zoals Acrobat of Word, onder het ongestructureerde type gegevens of informatie vallen. In feite wordt ongestructureerde informatie automatisch geëxtraheerd door middel van de toepassing van IFilter of de overeenkomstige converter. Dit is een ander belangrijk verschil tussen gestructureerde en ongestructureerde gegevens.
Het moet natuurlijk worden onthouden dat SharePoint-verwijzingen hoofdzakelijk alleen worden gebruikt om de gestructureerde gegevens te indexeren. Het wordt niet voor andere doeleinden gebruikt. Een duidelijk begrip van het verschil tussen gestructureerde en ongestructureerde data of informatie is absoluut essentieel voor de software-expert in die zin dat hij in staat zal zijn om de bestanden en de data correct te categoriseren.