Linked Open Data - een introductie

Gerrit Rietveld 1
Anonymous (photographer), Public domain, via Wikimedia Commons

Gerrit Thomas Rietveld (Utrecht, 24 juni 1888 – aldaar, 25 juni 1964) was een Nederlands architect en meubelontwerper. Hij was een van de leden van De Stijl en pionier in het nieuwe bouwen. Later maakte hij ook deel uit van de stroming van de nieuwe zakelijkheid (Wikipedia).

Gebouwen

Gerrit Rietveld heeft vele gebouwen onder zijn naam, een aantal ervan zijn ook geregistreerd als rijksmonument. Op deze pagina een weergave van de ontworpen gebouwen over tijd en naar locatie. Er zijn echter veel meer andere gebouwen die toegevoegd horen te worden, helaas zijn ze nog niet openlijk beschikbaar gemaakt. Voor een iets uitgebreider lijst zie: architectuur.org.

Meubels

Gerrit Th. Rietveld, een vernieuwende meubelontwerper, begon zijn carrière omstreeks 1918 met experimentele meubels, waaronder een vroege versie van de iconische Rood-blauwe stoel. Zijn ontwerpen waren modern, betaalbaar en gemakkelijk te produceren, zonder de intentie om de smaak van het grote publiek te veranderen. In de jaren 30 sloot hij zich aan bij het 'Nieuwe Bouwen' en ontwierp hij onder andere woningen in Wenen en Utrecht. Ondanks de oorlogsjaren bleef hij actief en creëerde hij zelfs in de illegaliteit. Na de oorlog kende De Stijl, waar hij een centrale figuur in was, een opleving. Rietveld ontving nieuwe opdrachten en richtte in 1961 zijn eigen architectenbureau op. Hij bleef zijn kennis uitbreiden en ontving in 1964 een eredoctoraat voor zijn bijdrage aan de moderne architectuur en design.

Gebouwen vervaardigd door Gerrit. Th. Rietveld. Een combinatie van data uit Het Nieuwe Instituut, Rijksmonumenten en Wikidata.

Objecten beschikbaar als Linked Open Data dat gemaakt of ontworpen is door Gerrit T.h. Rietveld.

Linked Open Data

Linked Open Data (LOD) is een methode om (gestructureerde) data op een manier te publiceren waardoor ze met elkaar kunnen worden verbonden en door computers begrepen kunnen worden als informatie.”

Linked Open Data Cloud

De LOD Cloud live

Web van documenten


Web van documenten

- Tim Berners-Lee
- Webpagina's die naar elkaar verwijzen met behulp van hyperlinks
- Door mensen, voor mensen

Drie "problemen"


Drie problemen

Dave en buurman Dave


Dave

Linked Open Data

Linked Open Data (LOD) is een manier om gegevens op het internet te delen en aan elkaar te knopen. Sir Tim Berners-Lee, de grondlegger van het World Wide Web, formuleerde vier ontwerpprincipes voor linked (open) data.

  • Allereerst moeten gegevens benoemd worden met behulp van URI's.
  • Deze URI's moeten vervolgens toegankelijk zijn via het HTTP-protocol, waardoor gebruikers de gegevens kunnen opzoeken.
  • Belangrijk is dat bij het opzoeken van een URI, bruikbare informatie wordt geboden volgens de standaarden RDF en SPARQL.
  • Tot slot moeten links naar andere URI's worden toegevoegd om gebruikers naar meer gerelateerde gegevens te leiden.

Deze principes, samen met FAIR-dataprincipes die de metadata en semantiek benadrukken, vormen de ruggengraat van LOD. Dit opent de deur naar een samenhangend web van data, waar zowel machines als mensen van kunnen profiteren, wat handig is voor onderzoek, innovatie en het ontdekken van nieuwe inzichten op allerlei gebieden, zoals wetenschap en cultuur waardoor innovatie en ontdekkingen op diverse terreinen worden gestimuleerd.

Papelooze kerk

De vier principes

Uri's en verwijzingen

  • Uri's zijn (gestandaardiseerde) tekenreeksen die unieke identificatie van bronnen of entiteiten op het web mogelijk maken. Ze worden gebruikt om verschillende soorten informatie te identificeren en te onderscheiden, waardoor ze essentieel zijn voor het Semantic Web en Linked Data-initiatieven. URI's kunnen verwijzen naar allerlei digitale bronnen, waaronder webpagina's, afbeeldingen, video's, documenten, en meer.

HTTP protocol

  • Het HTTP-protocol is een set regels voor communicatie op het internet. Binnen Linked Data wordt het HTTP-protocol gebruikt om informatie op te vragen en te versturen tussen servers en gebruikers. Dit stelt systemen in staat om gegevens op te halen vanaf specifieke URI's via HTTP-verzoeken, wat bijdraagt aan het verspreiden en delen van gestructureerde gegevens over het web.

Gebruik RDF en SPARQL

  • RDF (Resource Description Framework) is een standaardmodel voor het beschrijven en uitwisselen van gegevens op het web. Met RDF kunnen bronnen en hun relaties worden vastgelegd in de vorm van drievoudige statements, bestaande uit subjecten, predicaten en objecten. SPARQL (SPARQL Protocol and RDF Query Language) is een krachtige querytaal voor het ophalen en manipuleren van gegevens die zijn gemodelleerd in RDF-indeling. Door SPARQL te gebruiken, kunnen gebruikers complexe zoekopdrachten uitvoeren over RDF-gegevensbronnen, waardoor ze diepgaande inzichten kunnen verkrijgen en patronen kunnen ontdekken in verbonden gegevens.

Meer informatie over URI's, het HTTP-protocol, RDF en SPARQL:

Techniek

RDF en Triples

Een GRAPH in RDF bestaat uit TRIPLES.


1e triple
Een TRIPLE bestaat uit een SUBJECT, PREDICATE en OBJECT

Een SUBJECT en een PREDICATE hebben altijd een URI.

Het OBJECT in de TRIPLE.

Object
Een OBJECT heeft een URI.

of is een STRING, NUMMER, DATUM, etc.

Vraag

Afbeelding 1


Wat is een SUBJECT, wat is een EIGENSCHAP en wat is een OBJECT

De data in een tabel

Afbeelding 1


Een RIJ die een SUBJECT representeert.
Afbeelding 2


Een KOLOM die een EIGENSCHAP weergeeft.
Afbeelding 3


Een CEL die een OBJECT van een SUBJECT weergeeft.
Afbeelding 4


De Graph

Monument als graph
Een EIGENSCHAP van een MONUMENT als graph.

Afbeelding 2
Meerdere EIGENSCHAPPEN die een MONUMENT in een graph.

URI's

Subject

Een SUBJECT met een URI.

Predicate

Een EIGENSCHAP met een URI.

Object

Een OBJECT met URI.

Ontologie

Een cruciaal aspect van LOD is het gebruik van ontologieën om de betekenis van gegevens te beschrijven en de relaties ertussen te definiëren.

Drieeenheid

ontologie


Ontologie en vocabulaire


  • Web Ontology Language (OWL): Een krachtige ontologie-taal die is gebaseerd op RDF en RDFS en die uitgebreide expressieve mogelijkheden biedt voor het modelleren van complexe kennisstructuren.

  • RDF Schema (RDFS): Een eenvoudige ontologie-taal die wordt gebruikt om de semantiek van RDF-gegevens te beschrijven, inclusief het definiëren van klassen, eigenschappen en hun onderlinge relaties.

  • Dublin Core: Een standaardset metadata-elementen die vaak worden gebruikt om basisinformatie over resources op het web te beschrijven, zoals titels, auteurs, datums enzovoort.

  • Friend of a Friend (FOAF): Een ontologie die is ontworpen voor het beschrijven van sociale netwerken en het modelleren van sociale relaties tussen mensen en hun interesses.

  • Simple Knowledge Organization System (SKOS): Een gestandaardiseerde ontologie-taal die is gebaseerd op RDF en die wordt gebruikt voor het modelleren van conceptuele kennisstructuren zoals thesauri, classificatieschema's en taxonomieën.

  • Schema.org: Een gestructureerde gegevensstandaard die wordt ondersteund door grote zoekmachines zoals Google, Bing en Yahoo, en die wordt gebruikt om gegevens op webpagina's te markeren om de betekenis ervan te verbeteren voor zoekmachines.

  • EDM (Europeana Data Model): Een datamodel dat wordt gebruikt door Europeana voor het beschrijven van cultureel erfgoedobjecten en hun metadata.

  • CIDOC-CRM (Conceptual Reference Model van het Comité voor Documentatie van de International Council of Museums): Een model voor het beschrijven van culturele erfgoedobjecten en hun relaties, vaak gebruikt in de museumwereld.

  • Linked Art: Een ontologie die is ontwikkeld om de beschrijving en uitwisseling van kunstwerken en gerelateerde informatie in Linked Open Data-initiatieven te vergemakkelijken.

Ontologie RCE / ceo

ceo

De Cultureel Erfgoed Ontologie.

Linked Data Voorziening - Ontologie

Subject

Het toevoegen van URI en ONTOLOGIE.

Predicate

Een monument GEMODELLEERD.

Zelf Linked Open Data maken



De Rood-blauwe stoel, ook Rietveldstoel genoemd, is omstreeks 1918-1923 ontworpen door meubelmaker en architect Gerrit Rietveld.

Mogelijk antwoord

Twee classes.

  • Stoel, voorwerp, kunstvoorwerp
  • Ontwerper, actor

Enkele eigenschappen

  • naam
  • alternatieve naam
  • omschrijving
  • datum

enkele objecten

  • rood-blauwe stoel
  • rietveldstoel
  • meubelmaker
  • architect

De Rood-blauwe stoel, ook Rietveldstoel genoemd, is omstreeks 1918-1923 ontworpen door meubelmaker en architect Gerrit Rietveld.

Voorbeeld

@prefix schema: <http://schema.org/> .
@prefix edm: <http://www.europeana.eu/schemas/edm/> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .

<https://example.com/123456789> a schema:CreativeWork ;
   schema:name "De Rood-blauwe stoel"@nl ;
   schema:alternateName "Rietveldstoel"@nl ;
   schema:description "De Rood-blauwe stoel, ook Rietveldstoel genoemd, is omstreeks 1918-1923 ontworpen door meubelmaker en architect Gerrit Rietveld."@nl ;
   schema:creator [
       a schema:Person ;
       schema:name "Gerrit Rietveld"@nl ;
       schema:jobTitle "meubelmaker en architect"@nl
   ] ;
   foaf:depiction <https://linkeddata.cultureelerfgoed.nl/joop-van-der-heiden/gastcollege/assets/65f0b695212e2b22baec8902> .

Verbinden

@prefix schema: <http://schema.org/> .
@prefix edm: <http://www.europeana.eu/schemas/edm/> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix rkd: <https://rkd.nl/artists/> .

<https://example.com/123456789> a schema:CreativeWork ;
   schema:name "De Rood-blauwe stoel"@nl ;
   schema:alternateName "Rietveldstoel"@nl ;
   schema:description "De Rood-blauwe stoel, ook Rietveldstoel genoemd, is omstreeks 1918-1923 ontworpen door meubelmaker en architect Gerrit Rietveld."@nl ;
   schema:creator rkd:66880 ;
   foaf:depiction <https://linkeddata.cultureelerfgoed.nl/joop-van-der-heiden/gastcollege/assets/65f0b695212e2b22baec8902> .

rkd:66880 a schema:Person ;
   schema:name "Gerrit Rietveld"@nl ;
   schema:jobTitle "meubelmaker en architect"@nl .

SPARQL

  • SPARQL staat voor "SPARQL Protocol and RDF Query Language".
  • Het is een taal die gebruikt wordt voor het opvragen en manipuleren van gegevens die zijn opgeslagen in RDF (Resource Description Framework)-formaat.
  • SPARQL is specifiek ontworpen voor het werken met semantische gegevens en maakt daarbij gebruik van het RDF-model.
  • Het stelt gebruikers in staat om complexe queries te formuleren en betekenisvolle informatie uit RDF-datasets te halen.

Om in bovenstaande data te zoeken naar de rood-blauwe stoel zouden we de volgende SPARQL query kunnen schrijven.

PREFIX schema: <http://schema.org/>

SELECT ?work ?name ?description ?creator ?creator_name ?creator_jobTitle ?depiction
WHERE {
  ?work a schema:CreativeWork ;
        schema:name "De Rood-blauwe stoel"@nl ;
        schema:description ?description ;
        schema:creator ?creator ;
        foaf:depiction ?depiction .
        
  ?creator schema:name ?creator_name ;
           schema:jobTitle ?creator_jobTitle .
}

Wij willen zelf aan de slag

  1. Data Begin met het identificeren van de dataset waar je mee wilt werken. Dit kan een open dataset zijn die beschikbaar is op het web, zoals gegevens van een culturele instelling, een overheidsorganisatie of een wetenschappelijke database. Bijvoorbeeld, je kunt de dataset van de bibliotheek gebruiken. Download hier de dataset.

  2. ETL-proces

    • Extract: Haal de gegevens uit hun oorspronkelijke bron. Dit kan rechtstreeks van een website zijn, via een API, of door het downloaden van een bestand.
    • Transform: Gebruik tools zoals OpenRefine om de ruwe gegevens te transformeren naar een gestructureerd formaat dat geschikt is voor Linked Data. Dit omvat het standaardiseren van termen, het opschonen van gegevens en het toepassen van ontologieën.
    • Load: Laad de getransformeerde gegevens in een triple store of een RDF-bestand zodat ze kunnen worden gepubliceerd als Linked Data.
  3. OpenRefine OpenRefine is een krachtige tool voor het opschonen en transformeren van ruwe gegevens. Gebruik het om gegevens te standaardiseren, inconsistenties op te lossen en semantische annotaties toe te voegen aan je dataset. OpenRefine

  4. LDWizard LDWizard is een handige tool voor het genereren van Linked Data van gestructureerde gegevens. Het kan helpen bij het definiëren van ontologieën, het transformeren van gegevens naar RDF en het publiceren van Linked Data. NB LDWizard heeft geen mogelijkheid om te cleanen, maar kan wel aan het Termennetwerk koppelen.

Tot slot: Linked data voor (toekomstige) managers

Verrijking van collecties:

  • Het koppelen van erfgoed aan aanvullende informatiebronnen voegt waarde toe aan collecties.
  • Kunstwerken worden verbonden met biografieën, historische context en gerelateerde werken.

Bredere context en onderzoek:

  • Linked Data brengt erfgoedinformatie samen uit diverse bronnen.
  • Het combineren van archeologische opgravingen en historische kaarten biedt een bredere context voor onderzoek.

Samenwerking en kennisdeling:

  • Linked Data vergemakkelijkt het delen van erfgoedgegevens tussen instellingen en onderzoekers.
  • Het publiceren van gestandaardiseerde datasets stimuleert het gebruik en leidt tot nieuwe inzichten.

Verrijkte gebruikerservaring:

  • Dankzij Linked Data kunnen gebruikers interactief door erfgoed navigeren.
  • Gebruikers vinden gemakkelijk links naar aanvullende informatie en media.

Verder lezen:

RCE

Linked data bij RCE

NDE Linked Data

LDWizard

OpenRefine

Voor meer informatie over deze story neem contact met ons op

Met dank aan: Sablina Vis, Patrick Mout en Frans van der Zande.

Meer voorbeelden

Praalgraven in kerken

Deze query is gemaakt op basis van een inventarisatie van grafmonumenten als tombes, epitafen en wandmonumenten in kerken in de noordelijke Nederlanden vanaf 1572.

Grafstenen in kerken met foto's uit wikidata