BC:xtalas:Ontologie

Z FI WIKI
Přejít na: navigace, hledání

Ontologie

Popis pro sdílení dat, popis nějaké domény. Reprezentuje množinu tříd v doméně a vztahy mezi těmi třídami. Používají se k vyvozování o objektech v dané doméně. Reprezentuje určitou znalost nebo její část.

Obsahuje definici pojmů a definici vztahů mezi nimi. Datový model ontologie obecně obsahuje čtyři typy prvků: jedince, třídy, atributy a vazby.

Jedinec (Individual) je základní stavební objekt datového modelu ontologie(živý, neživý, abstraktní objekt).

Třída (Class, Concept) je množina jedinců určitého typu. Podmnožinou třídy je podtřída. Třída může obsahovat zároveň jedince i podtřídy.

 * Molecule, the class of all molecules
 * Number, the class of all numbers
 * Vehicle, the class of all vehicles
 * Class, representing the class of all classes
 Mohou být extenzionální(právě když je charakterizovaná svým členstvím) nebo intenzionální. Mohou se navzájem zahrnovat (Třída Vehicle zahrnuje třídu Car). Typicky nahoře jedna nadtřída všech (Object, Thing...).


Atribut (Attribute) popisuje určitou vlastnost, charakteristiku či parametr jedince.

 Každý atribut určitého jedince obsahuje přinejmenším název a hodnotu a je určen pro uložení určité informace vztahující se k danému jednici.
 Každý má aspoň jméno a hodnotu. Ukládá informace o objektu ke kterému je přiřazen. Hodnota může být i komplexní datový typ

Vazba (Relation) jednosměrné, nebo obousměrné propojení dvou jedinců. Je možné říci, že vazba je určitým typem atributu, jehož hodnotou je jiný jedinec v ontologii.

 Vazba je typicky atribut, jehož hodnota je jiný objekt v ontologii (Objekt Dvořák může mít atribut Soused=Novák).
 Nejdůležitější typ vazeb je zařazení (is-superclass-of, is-a(jednoúrovnové podřazení), is-subtype-of or is-subclass-of). Definuje které objekty jsou členy kterých tříd objektů.
 Taxonomie (is-a) vytváří neúplné uspořádání. Strom.
 Meronymy relationships(part-of) vztahy ukazují jak je vytvořen kompletní celek pomocí jednotlivých objektů. Složitější než stromová, jde vyjádřit orientovaným acyklickým grafem.
 Další typy než is-a a part-of se moc nepoužívají(např. made-in).

+ Událost (Event) změna atributů nebo vazeb.



Ontology engineering

  • Ontologie reflektuje uspořádání skutečného světa
  • Definování domény a vztahů mezi jejími prvky
    • Definování tříd
    • Jejich hierarchie
    • Nastavit jaké vlastnosti můžou třídy mít a jejich povolené hodnoty
    • Vytvoření jedinců

1. Definice domény

2. Znovupoužití ontologie?

3. Vyjmenovat pojmy

  (wine, red wine, seafood, Bordeaux, grape, sugar content,...)

4. Definovat třídy, třída je kolekce elementů s podobnými atributy, mají své instance (toto víno na stole)

  Třída vín, třída vinic, třída červených vín,...
  Metody tvorby: top-down, bottom-up, kombinací
  Třída by měla mít dokumentaci - popis, synonyma, popis relevantní domény

5. Definovat atributy

  Tzv. sloty, popisují atributy instancí třídy a relace na ostatní instance
  Každé víno má barvu, zeměpisný původ, výrobce,...
  Typy atributů jsou vlastní(chuť, barva), nevlastní(jméno, cena),eng:parts(částečné? ingredients in a dish), relace na jiné objekty(výrobce)
  Podtřída dědí všechny sloty z nadtřídy.(Vše co má víno, má i bílé víno), případně všech nadtříd.
  Doména slotu: třídy které mají slot (resp. jejich instance které jej můžou mít)
  Rozsah slotu: třídy do kterých patří hodnoty slotu

6. Definovat facety - omezení

  Omezují povolené hodnoty pro sloty. (Výrobce vína je instance vinárny. Jméno vína je string.)
  Podtřída může překrývat facety.

7. Vytvořit instance

  Přímý typ - třída instance, typ - nadtřídy přímého typu
  Dát hodnoty slotům instancí.


Všechny třídy jsou instance rdfs:Class, hierarchie je definována pomocí rdfs:subClassOf. Instance třídy definována rdf:type. Vlastnosti stejného jména jsou stejné i v globálu (name tady = name někde jinde). Hierarchie vlastností: rdfs:subPropertyOf.



OWL:

  • Web Ontology Language - pro popis objektů a vztahů mezi nimi, usnadní sdílení dat
  • Používá RDF/XML syntaxi
  • Poskytuje hodně výrazových prostředků (rovnost, symetričnost, disjunktnost,...)
  • Definice individuí a vztahů mezi nimi. Dedukce nad třídami a individui. OWL Lite, DL, Full podle složitosti dedukcí.


Typy ontologií Ontologie se člení na 3 základní typy:

  • terminologickou - jsou nejčasteji používány v knihovnictví a slouží zejména k získávání informací a jsou velmi podobné slovníkům tezaurus
  • informační - je nadstavbou nad informačními databázemi (např. post-relační DB). Zajišťují kontrolu integrity celé databáze a také konceptuální abstrakci potřebnou k dotazování
  • znalostní - navazuje na reprezentaci znalostí v oblasti umělé inteligence a jsou chápány striktně jako logické teorie a jejich návaznost na reálný svět není podstatná.

--- Zajímavě vypadá projekt Twine: http://www.twine.com/about