Watch this: Probe the Semantic Web with SPARQL

The Semantic Web and linked open data

Berners-Lee's vision of the semantic Web describes Web content laden with semantic metadata. Web agents are envisioned interrogating the metadata and making decisions that, for example, might include linking the content from multiple records together to produce serendipitous benefits. The fulfillment of such a vision assumes, at a minimum, a commonly employed data architecture and a large amount of marked-up data in public Web space.

The impulse to share scientific data has been long standing. Since 2007 the sharing of data on the Web has been promoted by the Semantic Web Education and Outreach Interest Group, which organizes its activities at the Linking Open Data wiki. Rubrics such as linking open data, linked open data, LOD and the Web of data all describe structured data in open Web space that feature links from one data set to another. Metaphorically, one could find oneself in a local neighbourhood in one dataset and then ride a link to another dataset and, in this fashion, meander through the semantic Web. A listing of currently available datasets indicates there are more than seven billion records available (as of September 2009) for harvesting, linking and manipulation. Berners-Lee has declared the linked open data movement as the 'semantic Web done right', which suggests, at least rhetorically, that the semantic Web manifests itself as the linked open data.

SPARQL (pronounced sparkle) is the query language designed for interrogating the semantic Web.

Datasets typically provide a dedicated SPARQL endpoint for the handling of HTTP requests and, as well, an interactive Web page that permits one to test-fire SPARQL queries against the dataset. The following small selection of SPARQL endpoints indicates the wide variety of material available:

Forty two SPARQL endpoints to datasets such as GO: Gene Ontology, OMIM: Online Mendelian Inheritance in Man, PubMed, the National Center for Biotechnology Information bibliographic database, etc.
The DBLP (Digital Bibliography & Library Project) computer science bibliography
DBpedia, structured information available from Wikipedia
Jamendo, a music database
Linked Movie Data Base provides information about films, actors, etc.
Project Gutenberg Metadata provides information about the Project Gutenberg book library

The triple structure of linked open data

Linked open data are structured as RDF (Resource Description Framework) records. An insightful entrée to RDF is given by Allemang and Hendler who point to the similarities between a RDF structure and relational database structure. This sketch illustrates the structural similaries between a relational database structure and a RDF structure.

RDF is constructed as a tree structure or graph. Travelling along the branching structure of this graph, one comes upon a subject (the product with an id of "1"), then some branch predicates (both "model" and "quantity" are predicates), and finally objects ("ZX-6" and "62" are objects) embedded within the predicates.

Unsurprisingly, the basic pattern of a SPARQL query is a triple composed of a subject, predicate and object. Suppose we arm ourselves with the variable ?stuff that can assume values. Then the fragment of RDF graph above can answer the following queries structured in the triple pattern of Subject, Predicate, Object:

productID'1', model, ?stuff the variable ?stuff would take the value "ZX-6"
?stuff, model, "ZX-6" the variable ?stuff would take the value "productID'1'"

Probing linked open data

One thing that is immediately obvious from the triple pattern of SPARQL queries is that harvesting information from the semantic Web is more complex than firing query terms at a database. SPARQL queries are addresses to specific locations in the RDF graph structure, and furthermore, the elements of a SPARQL query are themselves addresses - URIs such as 'http://dbpedia.org/ontology/Place'. The only exception occurs at the end of a branch where string literals such as Montreal, Quebec reside.

To be successful firing queries at an RDF store requires one to know the URI addresses beforehand. The value of knowing the URI addresses beforehand is magnified by the challenge of setting links into other, unknown datasets or using a source built by the Web community such as DBpedia (the structured data from Wikipedia).

One might encounter all sort of inconsistencies and surprises.

Probing a linked dataset from the top down, or root to branch, as it were, is helpful to discover the graph structure and pave the way for subsequent queries.

Allemang's blog suggests the following strategy for probing linked datasets. The first query produces the top-level classes (i.e., subjects) used in a dataset.

SELECT DISTINCT ?Objects WHERE { []  a  ?Objects}

The triple pattern [] a ?Objects can be read as 'For all subjects ([] indicates an empty node), where the predicate is a type or class in the dataset (the keyword 'a' is a shortcut for the predicate rdf:type ), give me all the objects'. The objects produced would be the URIs of the highest level types or classes employed in structuring the dataset. In effect, these would be the one or more roots of the graph structure to follow for further discovery in the dataset.

As an example of the application of this high-level probe, the following query was submitted to the DBpedia SPARQL Web portal . (A limit of three results was used for brevity of the example.)
select distinct ?Concept where {[] a ?Concept} limit 3
The result is a table containing three URIs.

Concept

http://dbpedia.org/ontology/Place

http://dbpedia.org/ontology/Area

http://dbpedia.org/ontology/City

We learn from this probe that DBpedia contains information about places, areas and cities.

Concept
http://dbpedia.org/ontology/Place
http://dbpedia.org/ontology/Area
http://dbpedia.org/ontology/City

The next step would be to use these URIs as subjects and probe their predicates and objects. This can be accomplished by the following query

SELECT DISTINCT ?allPredicates ?allObjects WHERE {  <http://dbpedia.org/ontology/Place> ?allPredicates ?allObjects }

This query would return all the predicates and objects that have been branched under the subject "place."

I used a Greasemonkey script to perform the following queries. This means that my queries were aimed at the HTTP SPARQL address and not the Web portal for a given linked data resource. The 'rawQuery' in the following examples is the query variable used in the script.

Probing DBpedia

DBpedia collects the structure information from Wikipedia. SPARQL endpoint. The following SPARQL query asks for ten things that DBpedia has information about.

rawQuery = "select distinct ?concept where { [] a ?concept} limit 10";

concept
http://dbpedia.org/ontology/Place
http://dbpedia.org/ontology/Area
http://dbpedia.org/ontology/City
http://dbpedia.org/ontology/River
http://dbpedia.org/ontology/Road
http://dbpedia.org/ontology/Lake
http://dbpedia.org/ontology/LunarCrater
http://dbpedia.org/ontology/ShoppingMall
http://dbpedia.org/ontology/Park
http://dbpedia.org/ontology/SiteOfSpecialScientificInterest

We learn from this display that DBpedia has information about shopping malls. We can reveal the individual shopping malls by the following query. This query has a triple structure that can be read as "give me everything that has been classified as the type "http://dbpedia.org/ontology/ShoppingMall".

rawQuery = "select ?stuff where { ?stuff a <http://dbpedia.org/ontology/ShoppingMall>}";

stuff
http://dbpedia.org/resource/Westfield_West_Covina
http://dbpedia.org/resource/The_Forum_Shops_at_Caesars
http://dbpedia.org/resource/Dubai_Mall
http://dbpedia.org/resource/West_Edmonton_Mall
http://dbpedia.org/resource/Westfield_MainPlace
http://dbpedia.org/resource/Westfield_Fox_Hills
http://dbpedia.org/resource/Westfield_Santa_Anita
http://dbpedia.org/resource/Berjaya_Times_Square
http://dbpedia.org/resource/Agana_Shopping_Center
http://dbpedia.org/resource/Alamance_Crossing
http://dbpedia.org/resource/Alexandria_Mall
http://dbpedia.org/resource/Miracle_Mile_Shops
http://dbpedia.org/resource/Amarin_Plaza
http://dbpedia.org/resource/Ambi_Mall
http://dbpedia.org/resource/Americana_at_Brand
http://dbpedia.org/resource/Westfield_Solano
http://dbpedia.org/resource/Antara_Polanco
http://dbpedia.org/resource/Antioch_Center
http://dbpedia.org/resource/Arborland_Center
http://dbpedia.org/resource/Armadale_Shopping_City
http://dbpedia.org/resource/Westfield_Eastridge
http://dbpedia.org/resource/Westfield_Southcenter
http://dbpedia.org/resource/Westfield_Citrus_Park
http://dbpedia.org/resource/Westfield_Fox_Valley
http://dbpedia.org/resource/Ashley_Plaza_Mall
http://dbpedia.org/resource/Ashton_Arcades
http://dbpedia.org/resource/Augusta_Mall
http://dbpedia.org/resource/Australia_Fair_Shopping_Centre
http://dbpedia.org/resource/Bal_Harbour_Shops
http://dbpedia.org/resource/Kamppi_Center
http://dbpedia.org/resource/King_of_Prussia_Mall
http://dbpedia.org/resource/Forum_%28shopping_centre%29
http://dbpedia.org/resource/Iso_Omena
http://dbpedia.org/resource/Myyrmanni
http://dbpedia.org/resource/Batu_Pahat_Mall
http://dbpedia.org/resource/Bay_Centre
http://dbpedia.org/resource/Bay_Park_Square
http://dbpedia.org/resource/Bay_Street_Emeryville
http://dbpedia.org/resource/Bayshore_Shopping_Centre
http://dbpedia.org/resource/Bayview_Village_Shopping_Centre
http://dbpedia.org/resource/Meadowhall_Centre
http://dbpedia.org/resource/Birchwood_Mall
http://dbpedia.org/resource/Bluewater
http://dbpedia.org/resource/Bole_Dembel_Shopping_Center
http://dbpedia.org/resource/Bonnie_Doon_Shopping_Centre
http://dbpedia.org/resource/Boynton_Beach_Mall
http://dbpedia.org/resource/Bull_Ring%2C_Birmingham
http://dbpedia.org/resource/Brea_Mall
http://dbpedia.org/resource/Bridgeport_Village_%28Oregon%29
http://dbpedia.org/resource/Brighton_Mall
http://dbpedia.org/resource/Brunswick_shopping_centre
http://dbpedia.org/resource/Buchanan_Galleries
http://dbpedia.org/resource/Bucure%C5%9Fti_Mall
http://dbpedia.org/resource/Burlington_Mall_%28Massachusetts%29
http://dbpedia.org/resource/Roosevelt_Field_Mall
http://dbpedia.org/resource/SM_Megamall
http://dbpedia.org/resource/South_Coast_Plaza
http://dbpedia.org/resource/Suria_KLCC
http://dbpedia.org/resource/Cambridge_Centre
http://dbpedia.org/resource/Capalaba_Central_Shopping_Centre
http://dbpedia.org/resource/Toronto_Eaton_Centre
http://dbpedia.org/resource/Delta_City
http://dbpedia.org/resource/Cary_Towne_Center
http://dbpedia.org/resource/Causeway_Point
http://dbpedia.org/resource/Centerpointe_Mall
http://dbpedia.org/resource/Central_City_Shopping_Centre
http://dbpedia.org/resource/Central_Plaza_Pinklao
http://dbpedia.org/resource/Centre_Commercial_Bab_Ezzouar
http://dbpedia.org/resource/Centre_Mall_%28Hamilton%29
http://dbpedia.org/resource/Centro_Sunshine_Marketplace
http://dbpedia.org/resource/Hanes_Mall
http://dbpedia.org/resource/Cinderella_City
http://dbpedia.org/resource/CityPlace
http://dbpedia.org/resource/City_Mall
http://dbpedia.org/resource/Cityplaza
http://dbpedia.org/resource/Cobb_Center
http://dbpedia.org/resource/College_Mall
http://dbpedia.org/resource/Columbia_Center_Mall
http://dbpedia.org/resource/Columbia_Mall_%28Grand_Forks%29
http://dbpedia.org/resource/Columbia_Place_Mall
http://dbpedia.org/resource/Concord_Mall_%28Delaware%29
http://dbpedia.org/resource/Cordova_Mall
http://dbpedia.org/resource/Cotroceni_Park
http://dbpedia.org/resource/Les_Promenades_de_l%27Outaouais
http://dbpedia.org/resource/MBK_Center
http://dbpedia.org/resource/Craigmore_Village_Shopping_Centre
http://dbpedia.org/resource/Midway_Mall_%28Brazil%29
http://dbpedia.org/resource/Cwmbran_Shopping_Centre
http://dbpedia.org/resource/Dadeland_Mall
http://dbpedia.org/resource/Danbury_Fair_Mall
http://dbpedia.org/resource/Deerbrook_Mall
http://dbpedia.org/resource/Ontario_Mills
http://dbpedia.org/resource/Promenades_Saint-Bruno
http://dbpedia.org/resource/Deptford_Mall
http://dbpedia.org/resource/Dixie_Square_Mall
http://dbpedia.org/resource/Dover_Mall
http://dbpedia.org/resource/Downtown_at_the_Gardens
http://dbpedia.org/resource/Dream_Mall
http://dbpedia.org/resource/Dutchess_Mall
http://dbpedia.org/resource/Stonebriar_Centre
http://dbpedia.org/resource/Eastern_Plaza
http://dbpedia.org/resource/Eastgate_Quarters
http://dbpedia.org/resource/Eastland_Mall_%28Charlotte%2C_North_Carolina%29
http://dbpedia.org/resource/Eastview_Mall
http://dbpedia.org/resource/Eden%2C_High_Wycombe
http://dbpedia.org/resource/Edmonton_City_Centre
http://dbpedia.org/resource/Trafford_Centre
http://dbpedia.org/resource/Elizabeth_Shopping_Centre
http://dbpedia.org/resource/Era_Square
http://dbpedia.org/resource/Erina_Fair
http://dbpedia.org/resource/Euclid_Square_Mall
http://dbpedia.org/resource/Farmers_Plaza
http://dbpedia.org/resource/Flinders_Plaza_Shopping_Centre%2C_Townsville
http://dbpedia.org/resource/Florence_Mall
http://dbpedia.org/resource/Foothills_Mall_%28Tennessee%29
http://dbpedia.org/resource/Forest_Lake_Village_Shopping_Centre
http://dbpedia.org/resource/Forrestal_Village
http://dbpedia.org/resource/Forte_Shopping_Centre
http://dbpedia.org/resource/Forum_303_Mall
http://dbpedia.org/resource/Four_Seasons_Town_Centre
http://dbpedia.org/resource/Frenchgate_Centre
http://dbpedia.org/resource/Frenchtown_Square_Mall
http://dbpedia.org/resource/Palisades_Center
http://dbpedia.org/resource/Sapporo_Factory
http://dbpedia.org/resource/Siam_Center
http://dbpedia.org/resource/Galleria_at_Crystal_Run
http://dbpedia.org/resource/Gateway_Mall_%28Araneta_Center%29
http://dbpedia.org/resource/Gateway_Mall_%28Springfield%2C_Oregon%29
http://dbpedia.org/resource/The_Emporium_%28Bangkok%29
http://dbpedia.org/resource/The_Esplanade_%28Bangkok%29
http://dbpedia.org/resource/Glenbrook_Square

We learn from this display that DBpedia has information about a vast number of shopping malls including, for example, 'The Esplanade' in Bangkok. It is possible to keep branching down towards this particular shopping centre by using the following query, which uses the URI for 'The Esplanade' as the subject. This query returns all the predicates and corresponding objects branched under this shopping centre.

rawQuery = "select ?p ?o where { <http://dbpedia.org/resource/The_Esplanade_%28Bangkok%29> ?p ?o } ";

p	o
http://www.w3.org/1999/02/22-rdf-syntax-ns#type	http://dbpedia.org/ontology/Place
http://www.w3.org/1999/02/22-rdf-syntax-ns#type	http://dbpedia.org/ontology/ShoppingMall
http://www.w3.org/1999/02/22-rdf-syntax-ns#type	http://dbpedia.org/ontology/Building
http://www.w3.org/1999/02/22-rdf-syntax-ns#type	http://dbpedia.org/ontology/Resource
http://dbpedia.org/property/wikiPageUsesTemplate	http://dbpedia.org/resource/Template:infobox_shopping_mall
http://www.w3.org/2002/07/owl#sameAs	http://rdf.freebase.com/ns/guid.9202a8c04000641f800000000479074a
http://dbpedia.org/ontology/location	http://dbpedia.org/resource/Din_Daeng
http://dbpedia.org/ontology/location	http://dbpedia.org/resource/Nonthaburi
http://dbpedia.org/ontology/location	http://dbpedia.org/resource/Bangkok
http://dbpedia.org/ontology/location	http://dbpedia.org/resource/Thailand
http://dbpedia.org/property/reference	http://www.majorcineplex.com/esplanade/
http://dbpedia.org/property/reference	http://www.siamfuture.com/OurProperties/rachada/default.asp
http://dbpedia.org/property/openingDate	December 2006 and December 2009
http://dbpedia.org/property/owner	Siam Future Development Plc.
http://dbpedia.org/property/coordinates	http://dbpedia.org/resource/The_Esplanade_%2528Bangkok%2529/coordinates/coord
http://dbpedia.org/property/floorArea	105,000 square meters
http://www.w3.org/2000/01/rdf-schema#label	The Esplanade (Bangkok)
http://www.w3.org/2000/01/rdf-schema#label	??????? (????)
http://www.w3.org/2000/01/rdf-schema#label	????????
http://dbpedia.org/ontology/coordinates	{{coord\|13\|46\|0\|N\|100\|34\|11\|E \|region:TH-10_type:landmark \|display=inline,title}}
http://dbpedia.org/ontology/floorArea	105000
http://dbpedia.org/property/numberOfStores	120
http://dbpedia.org/property/floors	7
http://dbpedia.org/property/location	Ratchadapisek Road, Din Daeng, Bangkok and<Br>Rattanathibet Road, Nonthaburi, Thailand
http://dbpedia.org/property/abstract	The Esplanade is a shopping and entertainment complex on Ratchadapisek Road in Din Daeng district, Bangkok and the second branch is Rattanathibet Road in Nonthaburi.
http://dbpedia.org/property/abstract	???????(The Esplanade)????????????????????????·?????? (Ratchadapisek Road)???????? ????????????????100,000 m2????????????12????????????3000?????????????????????????????????????????????????????????????????????????
http://dbpedia.org/property/abstract	????????(??:??????????????????????????;??????:Esplanade Cineplex)????????????????????99????????????????
http://dbpedia.org/property/hasPhotoCollection	http://www4.wiwiss.fu-berlin.de/flickrwrappr/photos/The_Esplanade_%28Bangkok%29
http://www.w3.org/2004/02/skos/core#subject	http://dbpedia.org/resource/Category:Retailing_in_Bangkok
http://www.w3.org/2004/02/skos/core#subject	http://dbpedia.org/resource/Category:Shopping_malls_in_Thailand
http://www.w3.org/2004/02/skos/core#subject	http://dbpedia.org/resource/Category:Buildings_and_structures_in_Bangkok
http://www.w3.org/2004/02/skos/core#subject	http://dbpedia.org/resource/Category:Cinemas_in_Thailand
http://dbpedia.org/property/shoppingMallName	The Esplanade
http://dbpedia.org/property/manager	Siam Future Development Plc.
http://www.w3.org/2000/01/rdf-schema#comment	The Esplanade is a shopping and entertainment complex on Ratchadapisek Road in Din Daeng district, Bangkok and the second branch is Rattanathibet Road in Nonthaburi.
http://www.w3.org/2000/01/rdf-schema#comment	???????(The Esplanade)????????????????????????·?????? (Ratchadapisek Road)???????? ????????????????100,000 m2?????? ???????12??? ?????????3000????????? ????????????? ????????????????????????????????????????????????????
http://www.w3.org/2000/01/rdf-schema#comment	?? ???????(??:??????????????????????????;??????:Esplanade Cineplex)????????????????????99??????????????? ??
http://xmlns.com/foaf/0.1/page	http://en.wikipedia.org/wiki/The_Esplanade_%28Bangkok%29
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/Carrefour
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/Bangkok_Metro
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/Din_Daeng
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/Nonthaburi
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/List_of_cinemas_in_Thailand
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/Central_Group
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/JUSCO
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/Tesco_Lotus
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/Major_Cineplex
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/Thailand_Cultural_Centre
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/World_Film_Festival_of_Bangkok
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/Bangkok
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/Thailand
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/California_Fitness
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/B2S
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/List_of_shopping_malls_in_Thailand
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/Tops_Supermarkets_%28Thailand%29
http://dbpedia.org/property/wikilink	http://dbpedia.org/resource/skateboarding
http://dbpedia.org/property/wikilink
http://dbpedia.org/property/wikilink

We learn a number of things about this shopping centre, including the fact that it is linked to an entry in Freebase. Note that a number of objects are string literals, while others give us new URIs to pursue. A string literal represents the end of a branch, there is no further branching to be done. Note, as well, that some string literals are mysterious arrays of question marks and some feature escaped characters and some objects are missing. The prudent semantic Web promeneur might conclude that probing DBpedia before blindly firing queries might be a good thing to do.

This probe of DBpedia about 'The Esplanade' has armed me with sufficient URI information that I can now construct a query to force DBpedia to reveal its knowledge about the names of the shopping centers in Thailand.

    rawQuery = "select ?shoppingCenter where {  
         ?shoppingCenter  a <http://dbpedia.org/ontology/ShoppingMall> .   
                  # Find me everything that has been typed as a shopping mall
         ?shoppingCenter  <http://dbpedia.org/ontology/location> <http://dbpedia.org/resource/Thailand>  .} ";
                  # Confine the shopping malls to the location of Thailand

shoppingCenter
http://dbpedia.org/resource/MBK_Center
http://dbpedia.org/resource/Siam_Center
http://dbpedia.org/resource/The_Emporium_%28Bangkok%29
http://dbpedia.org/resource/The_Esplanade_%28Bangkok%29
http://dbpedia.org/resource/Pantip_Plaza
http://dbpedia.org/resource/Platinum_Fashion_Mall
http://dbpedia.org/resource/River_City_Shopping_Complex
http://dbpedia.org/resource/Siam_Paragon
http://dbpedia.org/resource/CentralWorld
http://dbpedia.org/resource/Interchange21
http://dbpedia.org/resource/L%26H_Sukhumvit

Probing the Linked Movie Database

The ambition of the LinkedMDB is to be the first open semantic Web database for movies. LinkedMDB SPARQL endpoint

The following probe finds ten major classes of the Linked Movie Database.

rawQuery = "select distinct ?concept where { [] a ?concept } limit 10";

<?xml version="1.0"?>
<sparql
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:xs="http://www.w3.org/2001/XMLSchema#"
    xmlns="http://www.w3.org/2005/sparql-results#" >
  <head>
    <variable name="concept"/>
  </head>
  <results>
    <result>
      <binding name="concept">
        <uri>http://data.linkedmdb.org/resource/movie/dubbing_performance</uri>
      </binding>
    </result>
    <result>
      <binding name="concept">
        <uri>http://data.linkedmdb.org/resource/movie/film_collection</uri>
      </binding>
    </result>
    <result>
      <binding name="concept">
        <uri>http://data.linkedmdb.org/resource/movie/special_film_performance_type</uri>
      </binding>
    </result>
    <result>
      <binding name="concept">
        <uri>http://data.linkedmdb.org/resource/movie/production_company</uri>
      </binding>
    </result>
    <result>
      <binding name="concept">
        <uri>http://data.linkedmdb.org/resource/movie/film_story_contributor</uri>
      </binding>
    </result>
    <result>
      <binding name="concept">
        <uri>http://data.linkedmdb.org/resource/oddlinker/linkage_run</uri>
      </binding>
    </result>
    <result>
      <binding name="concept">
        <uri>http://data.linkedmdb.org/resource/movie/film_crew_gig</uri>
      </binding>
    </result>
    <result>
      <binding name="concept">
        <uri>http://data.linkedmdb.org/resource/movie/film_location</uri>
      </binding>
    </result>
    <result>
      <binding name="concept">
        <uri>http://data.linkedmdb.org/resource/movie/film_cut</uri>
      </binding>
    </result>
    <result>
      <binding name="concept">
        <uri>http://data.linkedmdb.org/resource/movie/film_genre</uri>
      </binding>
    </result>
  </results>

</sparql>

We learn from this probe that film genre is a major branch in LMD. The following probe will reveal the various film genres.

rawQuery = "select ?stuff where {  ?stuff a <http://data.linkedmdb.org/resource/movie/film_genre> }";

<?xml version="1.0"?>
<sparql
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:xs="http://www.w3.org/2001/XMLSchema#"
    xmlns="http://www.w3.org/2005/sparql-results#" >
  <head>
    <variable name="stuff"/>
  </head>
  <results>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/1</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/2</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/3</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/4</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/5</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/6</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/7</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/8</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/9</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/10</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/11</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/12</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/13</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/14</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/15</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/16</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/17</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/18</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/19</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/20</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/21</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/22</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/23</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/24</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/25</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/26</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/27</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/28</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/29</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/30</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/31</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/32</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/33</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/34</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/35</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/36</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/37</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/38</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/39</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/40</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/41</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/42</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/43</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/44</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/45</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/46</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/47</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/48</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/49</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/50</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/51</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/52</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/53</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/54</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/55</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/56</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/57</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/58</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/59</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/60</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/61</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/62</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/63</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/64</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/65</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/66</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/67</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/68</uri>
      </binding>
    </result>
    <result>
      <binding name="stuff">
        <uri>http://data.linkedmdb.org/resource/film_genre/69</uri>
      </binding>
    </result>
    <result>
      <binding

This probe reveals that the Linked Movie Database has a vast number of genres and each is numbered. An arbitrary choice is film genre '1'. The following query will reveal the profile of this film genre.

rawQuery = " select ?p ?o where {  <http://data.linkedmdb.org/resource/film_genre/1> ?p ?o }  ";

<?xml version="1.0"?>
<sparql
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:xs="http://www.w3.org/2001/XMLSchema#"
    xmlns="http://www.w3.org/2005/sparql-results#" >
  <head>
    <variable name="p"/>
    <variable name="o"/>
  </head>
  <results>
    <result>
      <binding name="p">
        <uri>http://xmlns.com/foaf/0.1/page</uri>
      </binding>
      <binding name="o">
        <uri>http://www.freebase.com/view/guid/9202a8c04000641f800000000000d4ed</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/film_genre_film_genreid</uri>
      </binding>
      <binding name="o">
        <literal datatype="http://www.w3.org/2001/XMLSchema#int">1</literal>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/film_genre_name</uri>
      </binding>
      <binding name="o">
        <literal>Conspiracy theory</literal>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://www.w3.org/2000/01/rdf-schema#label</uri>
      </binding>
      <binding name="o">
        <literal>Conspiracy theory (Film Genre)</literal>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://www.w3.org/1999/02/22-rdf-syntax-ns#type</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/movie/film_genre</uri>
      </binding>
    </result>
  </results>

</sparql>

Conspiracy theory appears to be film genre '1'.

My ambition was to find information about at least one film, but it would appear that further branching down the genre branch will not lead me to any. Going back to my original query, I enlarged it to a limit of 50 main classes and stumbled upon the URI for films:

http://data.linkedmdb.org/resource/movie/film

As with genres, this produced a long list of numbered film branches. Arbitrarily I chose the second branch and found myself in Batman territory.

rawQuery = " select ?p ?o where {  <http://data.linkedmdb.org/resource/film/2> ?p ?o }  ";

<?xml version="1.0"?>

<sparql
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:xs="http://www.w3.org/2001/XMLSchema#"
    xmlns="http://www.w3.org/2005/sparql-results#" >
  <head>
    <variable name="p"/>
    <variable name="o"/>
  </head>
  <results>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/music_contributor</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/music_contributor/1764</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/music_contributor</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/music_contributor/2331</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://purl.org/dc/terms/date</uri>
      </binding>
      <binding name="o">
        <literal>1989-06-23</literal>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/initial_release_date</uri>
      </binding>
      <binding name="o">
        <literal>1989-06-23</literal>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://xmlns.com/foaf/0.1/page</uri>
      </binding>
      <binding name="o">
        <uri>http://www.rottentomatoes.com/alias?type=imdbid&s=0096895</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/sequel</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/film/26399</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/language</uri>
      </binding>
      <binding name="o">
        <uri>http://www.lingvoj.org/lingvo/en</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/film_collection</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/film_collection/7</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/director</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/director/7998</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/country</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/country/US</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/writer</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/writer/6418</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/writer</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/writer/7591</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/writer</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/writer/12013</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/runtime</uri>
      </binding>
      <binding name="o">
        <literal>126</literal>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/film_cut</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/film_cut/734</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/producer</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/producer/7979</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/producer</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/producer/8730</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://xmlns.com/foaf/0.1/page</uri>
      </binding>
      <binding name="o">
        <uri>http://www.freebase.com/view/guid/9202a8c04000641f800000000000bea5</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://xmlns.com/foaf/0.1/page</uri>
      </binding>
      <binding name="o">
        <uri>http://www.imdb.com/title/tt0096895</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/actor</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/actor/8856</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/actor</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/actor/13864</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/actor</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/actor/18866</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/actor</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/actor/18872</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/actor</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/actor/21277</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/actor</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/actor/23430</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/actor</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/actor/23455</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/actor</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/actor/24773</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/actor</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/actor/26094</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/actor</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/actor/28398</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://www.w3.org/2000/01/rdf-schema#label</uri>
      </binding>
      <binding name="o">
        <literal>Batman</literal>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://purl.org/dc/terms/title</uri>
      </binding>
      <binding name="o">
        <literal>Batman</literal>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/genre</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/film_genre/111</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://data.linkedmdb.org/resource/movie/filmid</uri>
      </binding>
      <binding name="o">
        <literal datatype="http://www.w3.org/2001/XMLSchema#int">2</literal>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://xmlns.com/foaf/0.1/based_near</uri>
      </binding>
      <binding name="o">
        <uri>http://sws.geonames.org/6252001/</uri>
      </binding>
    </result>
    <result>
      <binding name="p">
        <uri>http://www.w3.org/1999/02/22-rdf-syntax-ns#type</uri>
      </binding>
      <binding name="o">
        <uri>http://data.linkedmdb.org/resource/movie/film</uri>
      </binding>
    </result>
  </results>

</sparql>

These results help us with the URIs for film titles and movie actors. It appears to be a characteristic of the Linked Movie Database to number genres, films, actors and so on. An additional probe into one of the actors revealed the URI for an actor's name to be

"http://data.linkedmdb.org/resource/movie/actor_name"

I now have enough information to begin treating the Linked Movie Database like a database and create a query to find all the actors in this Batman movie:


rawQuery = " select ?name where {  
                ?movie  <http://purl.org/dc/terms/title>   'Batman'  .   
                      # My target movie is Batman
                ?movie  <http://data.linkedmdb.org/resource/movie/actor>  ?actor  .  
                      # My target individuals are typed as actors in the movie Batman 
                ?actor <http://data.linkedmdb.org/resource/movie/actor_name> ?name  . }    ";
                      # I would like the actors' names

<?xml version="1.0"?>
<sparql
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:xs="http://www.w3.org/2001/XMLSchema#"
    xmlns="http://www.w3.org/2005/sparql-results#" >
  <head>
    <variable name="name"/>
  </head>
  <results>
    <result>
      <binding name="name">
        <literal>J. Carrol Naish</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Lee Wallace</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Adam West</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Billy Dee Williams</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Burgess Meredith</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Burt Ward</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Cesar Romero</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Douglas Croft</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Frank Gorshin</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Jack Nicholson</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Jack Palance</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Kim Basinger</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Lee Meriwether</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Lewis Wilson</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Michael Gough</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Michael Keaton</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Pat Hingle</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Robert Wuhl</literal>
      </binding>
    </result>
    <result>
      <binding name="name">
        <literal>Tracey Walter</literal>
      </binding>
    </result>
  </results>

</sparql>

Probing MeSH: Medical Subject Headings

MeSH is the National Library of Medicine's controlled vocabulary thesaurus. I imagine that the manipulation of MeSH headings will become a basic technique of the semantic Web since its network of broader and narrower terms provides a conceptual laddering that could guide moving around the local neighbourhoods of topical resources. MeSH SPARQL endpoint

Fifty fundamental classes of MeSH are revealed by this query:

rawQuery = "select distinct ?concept where { [] a ?concept } limit 50";

<table class="sparql" border="1">
  <tr>
    <th>concept</th>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#QuadMapFormat</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#array-of-QuadMapFormat</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#QuadMap</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#QuadMapValue</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#array-of-QuadMapColumn</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#QuadMapColumn</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#array-of-QuadMapATable</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#QuadMapATable</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#QuadMapFText</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#array-of-string</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#QuadStorage</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#array-of-QuadMap</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#InverseFunctionalProperty</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#Ontology</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#Class</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#Restriction</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#FunctionalProperty</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#DatatypeProperty</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#ObjectProperty</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/xbrl/IFRS_GP_LabelLink</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/xbrl/IFRS_GP_PresentationLink</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/xbrl/IFRS_GP_CalculationLink</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#DataRange</td>
  </tr>
  <tr>
    <td>http://www.w3.org/1999/02/22-rdf-syntax-ns#Property</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/mesh:CompoundConcept</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/mesh:Qualifier</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/mesh#Concept</td>
  </tr>

</table>

It is very likely that the information describing concepts is located down the branch <http://bio2rdf.org/ns/mesh#Concept>. The following query returns the concepts of MeSH.

rawQuery = "select ?stuff where {  ?stuff a <http://bio2rdf.org/ns/mesh#Concept> }";

The results of this query indicated that MeSH has a vast number of concepts that are all structured in this fashion:


<table class="sparql" border="1">
  <tr>
    <th>stuff</th>
  </tr>
  <tr>
    <td>http://bio2rdf.org/mesh:D000001</td>
  </tr>
  <tr>
</table>

The following query delivered the structure of the concept mesh:D000001.

 rawQuery = " select ?p ?o where {  <http://bio2rdf.org/mesh:D000001> ?p ?o }  ";

  <table class="sparql" border="1">
  <tr>
    <th>p</th>
    <th>o</th>
  </tr>
  <tr>
    <td>http://www.w3.org/1999/02/22-rdf-syntax-ns#type</td>
    <td>http://bio2rdf.org/ns/mesh#Concept</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#sameAs</td>
    <td>http://bio2rdf.org/mesh:Calcimycin</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2000/01/rdf-schema#label</td>
    <td>Calcimycin [mesh:D000001]</td>
  </tr>
  <tr>
    <td>http://purl.org/dc/elements/1.1/title</td>
    <td>Calcimycin</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2004/02/skos/core#prefLabel</td>
    <td>Calcimycin</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/mesh#dateCreated</td>
    <td>1974-11-19</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/mesh#dateEstablished</td>
    <td>1984-01-01</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/mesh#dateRevised</td>
    <td>2003-07-30</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/mesh#onlineNote</td>
    <td>use CALCIMYCIN to search A 23187 1975-90   </td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/mesh#publicMeSHNote</td>
    <td>91; was A 23187 1975-90 (see under ANTIBIOTICS 1975-83)   </td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/mesh#recordAuthorizer</td>
    <td>NLM</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/mesh#recordMaintainer</td>
    <td>SYSTEM</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/mesh#recordOriginator</td>
    <td>NLM</td>
  </tr>
  <tr>
    <td>http://purl.org/dc/elements/1.1/identifier</td>
    <td>mesh:D000001</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/bio2rdf#html</td>
    <td>http://www.nlm.nih.gov/cgi/mesh/2009/MB_cgi?mode=&term=Calcimycin</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/mesh#activeMeSHYear</td>
    <td>2004</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/mesh#activeMeSHYear</td>
    <td>2005</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/mesh#activeMeSHYear</td>
    <td>2006</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2004/02/skos/core#altLabel</td>
    <td>A23187</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2004/02/skos/core#altLabel</td>
    <td>Antibiotic A23187</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2004/02/skos/core#hiddenLabel</td>
    <td>A 23187</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2004/02/skos/core#hiddenLabel</td>
    <td>A23187, Antibiotic</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2004/02/skos/core#historyNote</td>
    <td>Antibiotics (1973-1974)</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2004/02/skos/core#historyNote</td>
    <td>Carboxylic Acids (1973-1974)</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/mesh#historyNote</td>
    <td>91(75); was A 23187 1975-90 (see under ANTIBIOTICS 1975-83)</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2004/02/skos/core#scopeNote</td>
    <td>An ionophorous, polyether antibiotic from Streptomyces chartreusensis. It binds and transports cations across membranes and uncouples oxidative phosphorylation while inhibiting ATPase of rat liver mitochondria. The substance is used mostly as a biochemical tool to study the role of divalent cations in various biological systems.</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2004/02/skos/core#broader</td>
    <td>http://bio2rdf.org/mesh:D001583</td>
  </tr>

</table>

An examination of the structure of this concept gives me enough information to formulate my own query into MeSH that reveals the title of mesh:D000001, its scope note and the title of a broader term. Note that producing the title of the broader term, I am metaphorically travelling to more than one branch in the MeSH RDF dataset.


rawQuery = " select ?title ?scopeNote ?broaderTitle where {  
    ?meshConcept  <http://purl.org/dc/elements/1.1/identifier>   'mesh:D000001'  .  
         # Locate the concept mesh:D000001  
    ?meshConcept  <http://purl.org/dc/elements/1.1/title>  ?title  .  
         # Give me the title of this concept  
    ?meshConcept  <http://www.w3.org/2004/02/skos/core#scopeNote>  ?scopeNote  .  
         # Give me the scope note of this concept
    ?meshConcept  <http://www.w3.org/2004/02/skos/core#broader>  ?broaderConcept  .  
         # Target a broader concept
    ?broaderConcept   <http://purl.org/dc/elements/1.1/title>  ?broaderTitle  .}    ";
         # Travel down the branch of the broader concept to target its title

title	scopeNote	broaderTitle
Calcimycin	An ionophorous, polyether antibiotic from Streptomyces chartreusensis. It binds and transports cations across membranes and uncouples oxidative phosphorylation while inhibiting ATPase of rat liver mitochondria. The substance is used mostly as a biochemical tool to study the role of divalent cations in various biological systems.	Benzoxazoles

Probing NEWT

NEWT is the taxonomy database maintained by the UniProt group. It integrates taxonomy data compiled in the National Center for Biotechnology Information and data specific to the UniProt Knowledgebase. NEWT SPARQL endpoint

Fifty fundamental classes of NEWT are revealed by this query:

rawQuery = "select distinct ?concept where { [] a ?concept } limit 50";

<table class="sparql" border="1">
  <tr>
    <th>concept</th>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#QuadMapFormat</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#array-of-QuadMapFormat</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#QuadMap</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#QuadMapValue</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#array-of-QuadMapColumn</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#QuadMapColumn</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#array-of-QuadMapATable</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#QuadMapATable</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#QuadMapFText</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#array-of-string</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#QuadStorage</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/virtrdf#array-of-QuadMap</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#InverseFunctionalProperty</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#Ontology</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#Class</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#Restriction</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#FunctionalProperty</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#DatatypeProperty</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#ObjectProperty</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/xbrl/IFRS_GP_LabelLink</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/xbrl/IFRS_GP_PresentationLink</td>
  </tr>
  <tr>
    <td>http://www.openlinksw.com/schemas/xbrl/IFRS_GP_CalculationLink</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2002/07/owl#DataRange</td>
  </tr>
  <tr>
    <td>http://www.w3.org/1999/02/22-rdf-syntax-ns#Property</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/uniprot#Taxon</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/uniprot#Strain</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/uniprot#Image</td>
  </tr>

</table>

An enquiry about Taxon produces a long list of taxonomy items structured as follows:

stuff
http://bio2rdf.org/taxonomy:10239
http://bio2rdf.org/taxonomy:12333
http://bio2rdf.org/taxonomy:12335

Characteristics of a specific taxon can be revealed by this query:

rawQuery = " select ?p ?o where {  <http://bio2rdf.org/taxonomy:12352> ?p ?o }  ";

<table class="sparql" border="1">
  <tr>
    <th>p</th>
    <th>o</th>
  </tr>
  <tr>
    <td>http://www.w3.org/1999/02/22-rdf-syntax-ns#type</td>
    <td>http://bio2rdf.org/ns/uniprot#Taxon</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2000/01/rdf-schema#label</td>
    <td>Bacillus phage M2Y [taxonomy:12352]</td>
  </tr>
  <tr>
    <td>http://www.w3.org/2000/01/rdf-schema#subClassOf</td>
    <td>http://bio2rdf.org/taxonomy:12333</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/taxonomy#scientificName</td>
    <td>Bacillus phage M2Y</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/taxonomy#otherName</td>
    <td>Bacteriophage M2Y</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/taxonomy#partOfLineage</td>
    <td>false</td>
  </tr>
  <tr>
    <td>http://bio2rdf.org/ns/taxonomy#rank</td>
    <td>http://bio2rdf.org/ns/uniprotSpecies</td>
  </tr>

</table>

The results give me sufficient information that I can build my own query targeting the name and subclass of the Taxon 12352. Note that by producing the name of the subclass I am metaphorically travelling around the NEWT RDF dataset.

rawQuery = " select ?name  ?subName where {  
     <http://bio2rdf.org/taxonomy:12352>  <http://bio2rdf.org/ns/taxonomy#scientificName>  ?name .  
         # Give me the name of the Taxon 12352 
     <http://bio2rdf.org/taxonomy:12352> <http://www.w3.org/2000/01/rdf-schema#subClassOf>  ?subClass .  
         # Determine the subclass
     ?subClass <http://bio2rdf.org/ns/taxonomy#scientificName>  ?subName . }    ";
         # Go down the subclass branch to find its name

The result indicates that Bacillus phage M2Y is a subclass of unclassified phages.

name	subName
Bacillus phage M2Y	unclassified phages

Disembarking safely from our semantic Web travels

Like any traveller back home eager to share impressions of the trip, there is a struggle to find the right words. On the tip of the tongue are complex, difficult, lack of uniformity, probe before you fire queries and so on. There are extraordinary riches to be harvested, but the entry threshold is also fairly high.

Soon to be released is SPARQL 1.1. It will feature nested queries that will permit the results of one query to cascade into a subsequent query. This will facilitate the matching of data from one dataset against another dataset and, therefore, the metaphoric meandering through the semantic Web. My experience so far prompts me to carefully probe each step of the way before launching.

vol. 14 no. 4, December, 2009 Contents \| Author index \| Subject index \| Search \| Home