Jump to: navigation, search

Difference between revisions of "SPM1.28 - Semantic services and systems for Earth Observation products: an ESA/ESRIN initiative"

(Created page with "== Appunti sulla sessione == * presentazione (B. Valentin) ** intro su [http://wiki.services.eoportal.org/tiki-index.php?page=Prod-Trees+Project Prod-Trees] *** barriere tecn...")
 
m
 
(3 intermediate revisions by the same user not shown)
Line 1: Line 1:
 
== Appunti sulla sessione ==
 
== Appunti sulla sessione ==
  
* presentazione (B. Valentin)
+
* introduzione (B. Valentin)
 
** intro su [http://wiki.services.eoportal.org/tiki-index.php?page=Prod-Trees+Project Prod-Trees]
 
** intro su [http://wiki.services.eoportal.org/tiki-index.php?page=Prod-Trees+Project Prod-Trees]
 
*** barriere tecnologiche e teminologiche
 
*** barriere tecnologiche e teminologiche
*** il formato EO-netCDF introdotto dal CNR (Nativi)
+
*** il formato EO-netCDF (evoluzione di CF-netCDF) introdotto dal CNR (Nativi)
 
*** broker semantico
 
*** broker semantico
 
*** regole di reasoning per EO-netCDF
 
*** regole di reasoning per EO-netCDF
 
*** standardizzazione in atto da parte dell'OGC SWG
 
*** standardizzazione in atto da parte dell'OGC SWG
 +
** il progetto RARE (RApid Response support sErver)
 +
*** sistema di risoluzione per risorse eterogenee basato su ontologia
 +
*** sistema web-based distribuito basato su servizi REST/SOAP
 +
*** supporterà cataloghi CSW/OpenSearch catalogs e metadati EO-netCDF
 +
* live demo (M. Karpathiotaki)
 +
** query a testo libero per reperire prodotti Prod-Trees
 +
*** query ammettono date e toponimi (GeoNames)
 +
*** i termini (es. "flood") vengono sostituiti dalle interpretazioni fornite dall'ontologia
 +
*** le interprewtazioni vengono quindi ricercate nei metadati EO-netCDF
 +
** le interpretazioni possono essere direttamente navigate in modalità gerarchica nelle ontologie
 +
** altri criteri 8es. la BBox, il tipo di dato) si possono aggiungere
 +
* tecnologie abilitanti
 +
** architettura (B. Valentin)
 +
*** l'analizzatorre di query divide gli elementi nella stringa di query (parametro, data, toponimo, ...)
 +
*** la BBox viene derivata grazie a GeoNames e Google GeoCodin
 +
*** intervalli tempoirali sono supportati
 +
*** interfacce SOAP, OpenSearch e REST vengono utilizzate (singolarmente) nelle varie fasi
 +
*** verrà aggiunto supporto a WordNet per disambiguazione/espansione semantica
 +
*** Java Web Service
 +
*** termini adiacenti nella query vengono considerati per la disambiguazione
 +
** EO-netCDF convention (P. Mazzetti)
 +
*** CF-netCDF convention + metadata
 +
*** NcML utilizzato per i metadati netCDF
 +
*** la "convenzione" CF (climate and forecast) è la più utilizzata
 +
*** requisiti:
 +
**** definire una EO--netCDF più semplice che estendere CF--netCDF
 +
**** scope limitato ai dati osservativi
 +
**** metadati dal profilo EOP O&M
 +
**** compliance con CF-netCDF e netCDF-U
 +
**** EO conventions per il livello semantico inferiore
 +
**** conventions del dominio applicativo specifico (es. CF) per il livello semantico superiore
 +
*** implementato per netCDF v3 (con workaround per elementi non supportati) e v4
 +
*** versione finale in maggio 2014
 +
** semantic broker (M. Santoro)
 +
*** "how" si aggiunge ai parametri "what", "where", "who" e "when"
 +
*** il matching sintattico è quello tipicamente utilizzato nella disambiguazione delle cinque componenti
 +
*** estensione a OpenSearch in corso
 +
*** a parte il ricorso a thesauri esterni, l'espansione non pare molto dissimile da quella eseguita in AIP3
 +
*** anche l'insieme di thesauri utilizzati e quasi la stessa
 +
** cross-ontology browser and reasoner (K. Dogani)
 +
*** a quelli di AIP-3 pare che l'aggiunta sia il GSCDA multi-domain thesaurus (di cui ESA deve essere molto gelosa, perchè non si trova molto a riguardo)
 +
*** il mapping di thesauri indipendenti segue molteplici direttrici:
 +
**** string-based
 +
**** wordnet-based
 +
**** structure-level mapping
 +
**** alignment-reuse mapping (forse info su [http://eprints.biblio.unitn.it/1003/1/028.pdf questo] lavoro
 +
*** regole RIF vengono utilizzate
 +
* discussion
 +
** il matching è offline, come è ovvio che sia
 +
** i metodi di matching corrispondono a precise proprietà generate, es:
 +
*** proprietà skos:exactMatch sono prodotte esclusivamente da matching sintattico
 +
*** proprietà skos:relatedMatch sono prodotte esclusivamente da matching linguistico (WordNet-based)
  
* live demo
+
=== Commenti ===
  
- project presentation
+
Sessione molto interessante. Il matching tra terminologie è qualcosa che probabilmente, prima o poi, dovremo affrontare. Il fatto che l'espansione semantica sia applicata alla query (e non ai metadati) lascia un po' di margine per non invadere l'orticello altrui. Interessante il mapping structure-level, anche se non potrei giurare che non produca falsi positivi. L'applicazione di regole RIF (quindi a mondo chiuso) per il reasoning semplifica il lavoro (rispetto alla corretta semantica a mondo aperto) ma può darsi che il risultato sia indifferente.
  - B. Valentin
+
  - intro to Prod-Trees
+
    - variety, open-ness and demand for EO products increase lately
+
    - terminology and technology barriers
+
    - EO ontology through Product Trees
+
    - EO-netCDF introduced by CNR
+
    - Prod-Trees ESA wiki for details on EO-netCDF
+
    - GI-sem semantic broker
+
    - EO-netCDF Reasoning Rules
+
    - OGC SWG to pursue standardisation
+
  - RARE (rapid response support server) project
+
    - ontology-bases resolving server for heterogeneous EO resources
+
    - web-based and distributed, based on REST/SOAP services
+
    - add support for CSW/OpenSearch catalogs and EO-netCDF products metadata
+
- live demo
+
  - M. Karpathiotaki
+
  - free-text queries to search Prod-Trees products, dates and toponyms (GeoNames) can be added
+
  - term "flood" is replaced with interpretations from ontologies
+
  - mapping rules search the selected interpretation in EO-netCDF metadata
+
  - terms can be browsed directly in ontologies in hierarchical mode
+
  - EO-related search criteria (e.g., BB, datatype) can be specified
+
- enabling technologies
+
  - architecture
+
    - B. Valentin
+
    - the query analyzer divides the elements of the query string (parameter, date, toponym, ...)
+
    - BB seems of default size on the basis of the position from GeoNames
+
    - between xxx and yyy is supported
+
    - soap, opensearch and rest are the protocols used in the different steps
+
    - Google GeoCoding for BB
+
    - WordNet support to be added
+
    - Java web service
+
    - adjacent terms are considered
+
  - EO-netCDF conversion
+
    - P. Mazzetti
+
    - is a CF-netCDF + metadata
+
    - NcML typically used for netCDF metadata
+
    - CF (climate and forecast) convention the most widely used
+
    - requirement collection
+
      - decision to define EO-... rather than extending CF-...
+
      - scope limited to remote sensing data
+
      - metadata from EOP O&M profile
+
      - compliance with CF-netCDF and netCDF-U
+
      - EO conventions for lower semantic level addressed
+
      - application domain conventions (like CF) for higher semantic levels
+
      - full mapping of EOP, implemented in v3 (w. some workaround) and v4 of netCDF
+
      - final version in May 2014
+
    -> draft of EO enhancements
+
    -> validation supported by use cases
+
      - sentinel-1 data
+
      - EOP+SAR+SEN1 modules
+
  - semantic broker
+
    - M. Santoro
+
    - how added to what where who when
+
    - syntactic matching in the what constraint is the one typically considered in discovery
+
    - extension to the opensearch interface
+
    - automatic and manual semantic expansion does not seem to differ (except for external sources) from AIP3
+
    - still the variety of thesaury is almost the same
+
  - cross-ontology browser and reasoner
+
    - K. Dogani
+
    - GSCDA multi-domain thesaurus added
+
    - ontology mapping string-based, wordnet-based, structure-level and alignment-reuse techniques
+
    - RIF rules are used
+
    - structure-level matching is interesting
+
- discussion
+
  - alignment is offline
+
  - the way a matching is obtained is tracked, I mean that exacct matches are only produced by syntactic matching, linguistic matching produces relatedMatches etc.
+

Latest revision as of 17:04, 6 May 2014

Appunti sulla sessione

  • introduzione (B. Valentin)
    • intro su Prod-Trees
      • barriere tecnologiche e teminologiche
      • il formato EO-netCDF (evoluzione di CF-netCDF) introdotto dal CNR (Nativi)
      • broker semantico
      • regole di reasoning per EO-netCDF
      • standardizzazione in atto da parte dell'OGC SWG
    • il progetto RARE (RApid Response support sErver)
      • sistema di risoluzione per risorse eterogenee basato su ontologia
      • sistema web-based distribuito basato su servizi REST/SOAP
      • supporterà cataloghi CSW/OpenSearch catalogs e metadati EO-netCDF
  • live demo (M. Karpathiotaki)
    • query a testo libero per reperire prodotti Prod-Trees
      • query ammettono date e toponimi (GeoNames)
      • i termini (es. "flood") vengono sostituiti dalle interpretazioni fornite dall'ontologia
      • le interprewtazioni vengono quindi ricercate nei metadati EO-netCDF
    • le interpretazioni possono essere direttamente navigate in modalità gerarchica nelle ontologie
    • altri criteri 8es. la BBox, il tipo di dato) si possono aggiungere
  • tecnologie abilitanti
    • architettura (B. Valentin)
      • l'analizzatorre di query divide gli elementi nella stringa di query (parametro, data, toponimo, ...)
      • la BBox viene derivata grazie a GeoNames e Google GeoCodin
      • intervalli tempoirali sono supportati
      • interfacce SOAP, OpenSearch e REST vengono utilizzate (singolarmente) nelle varie fasi
      • verrà aggiunto supporto a WordNet per disambiguazione/espansione semantica
      • Java Web Service
      • termini adiacenti nella query vengono considerati per la disambiguazione
    • EO-netCDF convention (P. Mazzetti)
      • CF-netCDF convention + metadata
      • NcML utilizzato per i metadati netCDF
      • la "convenzione" CF (climate and forecast) è la più utilizzata
      • requisiti:
        • definire una EO--netCDF più semplice che estendere CF--netCDF
        • scope limitato ai dati osservativi
        • metadati dal profilo EOP O&M
        • compliance con CF-netCDF e netCDF-U
        • EO conventions per il livello semantico inferiore
        • conventions del dominio applicativo specifico (es. CF) per il livello semantico superiore
      • implementato per netCDF v3 (con workaround per elementi non supportati) e v4
      • versione finale in maggio 2014
    • semantic broker (M. Santoro)
      • "how" si aggiunge ai parametri "what", "where", "who" e "when"
      • il matching sintattico è quello tipicamente utilizzato nella disambiguazione delle cinque componenti
      • estensione a OpenSearch in corso
      • a parte il ricorso a thesauri esterni, l'espansione non pare molto dissimile da quella eseguita in AIP3
      • anche l'insieme di thesauri utilizzati e quasi la stessa
    • cross-ontology browser and reasoner (K. Dogani)
      • a quelli di AIP-3 pare che l'aggiunta sia il GSCDA multi-domain thesaurus (di cui ESA deve essere molto gelosa, perchè non si trova molto a riguardo)
      • il mapping di thesauri indipendenti segue molteplici direttrici:
        • string-based
        • wordnet-based
        • structure-level mapping
        • alignment-reuse mapping (forse info su questo lavoro
      • regole RIF vengono utilizzate
  • discussion
    • il matching è offline, come è ovvio che sia
    • i metodi di matching corrispondono a precise proprietà generate, es:
      • proprietà skos:exactMatch sono prodotte esclusivamente da matching sintattico
      • proprietà skos:relatedMatch sono prodotte esclusivamente da matching linguistico (WordNet-based)

Commenti

Sessione molto interessante. Il matching tra terminologie è qualcosa che probabilmente, prima o poi, dovremo affrontare. Il fatto che l'espansione semantica sia applicata alla query (e non ai metadati) lascia un po' di margine per non invadere l'orticello altrui. Interessante il mapping structure-level, anche se non potrei giurare che non produca falsi positivi. L'applicazione di regole RIF (quindi a mondo chiuso) per il reasoning semplifica il lavoro (rispetto alla corretta semantica a mondo aperto) ma può darsi che il risultato sia indifferente.