SPIDER

Deelnemers[bewerken]

Trekkers[bewerken]

Inleiding[bewerken]

SPIDER staat (voorlopig) voor Semantic Perspectives and Interlinked Data from E-humanities Research. In dit project willen we de meerwaarde van toepassing van de principes van Linked Data bij de publicatie van resultaten van wetenschappelijk onderzoek in de geesteswetenschappen aantonen.

Datasets die als Linked Data zijn gepubliceerd zijn:

Duurzaam. Data-elementen worden aangeduid met permanente HTTP-URIs. Onderzoeksresultaten kunnen altijd beschikbaar blijven.

Koppelbaar. Via HTTP-URIs kan een wereldwijd web van data worden gevormd. Gegevens kunnen worden gerelateerd aan tal van andere gegevens.

Zelfbeschrijvend. Onderzoeksresultaten kunnen zodanig worden gepubliceerd dat er geen externe documenten hoeven te worden geraadpleegd om ze te goed te kunnen interpreteren.

Goed automatisch te analyseren en te verrijken. Doordat gegevens goed gestructureerd zijn en van een universeel datamodel (RDF) gebruik maken kunnen er vele gegevens met zekerheid worden afgeleid uit bestaande gegevens. Ook kunnen gegevens worden afgeleid die niet zeker zijn, maar een zekere waarschijnlijkheid hebben. Die waarschijnlijkheid kan worden vastgelegd en worden gebruikt in verdere analyses.

We denken dat deze algemene eigenschappen zeer effectief kunnen zijn in de geesteswetenschappen, een terrein waarin traditioneel minder informatietechnologie wordt toegepast dan in de bètawetenschappen.

In dit project zouden deze theoretische voordelen via praktische toepassing aangetoond moeten worden, zodanig dat andere onderzoekers geïnspireerd en aangespoord worden om verder te bouwen het dataweb.

Voorziene resultaten[bewerken]

De gewenste resultaten van het project zijn:

1) Datasets beschikbaar als Linked Data, beschreven in één of meerdere datacatologi.

2) Ondersteuning van onderzoekers bij publicatie van data;

3) Slimme automatische methodes om relaties, vooral spatiotemporele relaties, tussen data te ontdekken, zowel binnen als tussen datasets.

4) Laagdrempelige interactie door eindgebruikers met oorspronkelijke data en dataverrijkingen, bijvoorbeeld door visualisatie via een kaart met een tijdbalk.

Datasets[bewerken]

Kerkgebouwen in Nederland[bewerken]

De eerste dataset die behandeld gaat worden is een dataset met gegevens over kerkgebouwen in Nederland. De dataset bevat gegevens over kerken waarbij het jaar van ingebruikname ligt tussen 1800 en 1970. De dataset wordt samengesteld in het kader van het promotieonderzoek van Herman Wesselink aan de VU. Het onderzoek draait met name om de vraag hoe kerken geclassificeerd/gerangschikt kunnen worden op cultuurhistorisch belang. Zie de detailpagina Dataset Kerken in Nederland voor meer informatie.

Thema's[bewerken]

In de loop van het project komen verschillende algemene vraagstukken aan de orde. Van deze vraagstukken wordt in dit hoofdstuk verslag gedaan.

  1. Versies van dingen in een dataset
  2. SKOS-concepten als temporele eigenschappen

Bijeenkomsten[bewerken]

Conceptual Monday 2015-02-24