Momenteel wordt Europa geconfronteerd met industriële herstructurering, migratie, een vergrijzende bevolking en een financiële crisis in een wereld van versnelde verandering. Leren van (sociaal-economische) geschiedenis helpt om de onderlinge relatie tussen macro-economische verandering en individuele levensstijlen, beleidsregimes, arbeidsmarkten, gemeenschappen en nationale welvaart te begrijpen. Bronnen van historische informatie over het leven van individuen, gemeenschappen en naties zijn echter nog steeds verspreid.
Het Cedar Project
Dit project neemt Nederlandse volkstellingsgegevens als uitgangspunt om een semantisch dataweb van historische informatie te bouwen. Met zo’n web is het mogelijk om vragen te beantwoorden als:
- Wat voor soort patronen kunnen worden geïdentificeerd en geïnterpreteerd als uitingen van regionale identiteit?
- Hoe kunnen patronen van veranderingen in vaardigheden en arbeid worden gerelateerd aan technologische vooruitgang en patronen van geografische migratie?
- Hoe kunnen veranderingen van lokaal en nationaal beleid in de structuur van gemeenschappen en individuele levens worden getraceerd?
Resource Description Framework
Censusgegevens alleen zijn niet voldoende om deze vragen te beantwoorden. Dit project past een specifiek webgebaseerd datamodel toe – gebruikmakend van de Resource Description Framework (RDF)-technologie – om volkstellingsgegevens onderling koppelbaar te maken met andere knooppunten van historische sociaal-economische en demografische gegevens en daarbuiten. Patroonherkenning verschijnt op twee niveaus: ten eerste om de integratie van tot nu toe geïsoleerde datasets mogelijk te maken, en ten tweede om geïntegreerde bevraging en analyse toe te passen op deze nieuwe, verrijkte informatieruimte.
Data-analyse-interfaces, visuele inventarisaties van historische data en rapporten over open-linked datastrategieën voor digitale collecties zullen enkele van de resultaten van dit project zijn. Het project zal ook generieke methoden en hulpmiddelen produceren om historische en sociaaleconomische datasets te weven tot een onderling verbonden semantisch dataweb.