Contact

Nieuws

Semantic types in i2 Analyst Notebook en iBase

Wat is een semantic type, ofwel een semantisch type in het Nederlands?

Een semantisch type is de brug tussen de echte wereld en de computerwereld, de vertaling als het ware. Het geeft aan tot welke categorie een entiteit, koppeling of veld behoort in de echte wereld en wordt daarmee omgezet naar een betekenis die het programma ook begrijpt. Zo heeft de entiteit ‘persoon’ de semantische betekenis ‘person’, het veld ‘voornaam’ ‘person first name’ en de koppeling ‘financiële transacties’ de semantische betekenis ‘transactions’.

Een semantisch type geeft een extra laag van betekenis aan de informatie. Hiermee begrijpen Analyst’s Notebook en iBase dat verschillende entiteiten, zoals ‘vliegtuig’, ‘trein’ en ‘boot’, karakteristieken uit de echte wereld delen, namelijk eigenschappen die horen bij transportmiddelen. Daarmee zijn ze te onderscheiden van ander entiteiten, zoals personen. Om deze semantische betekenissen goed bij te houden deelt het programma deze in categorieën en subcategorieën in. Zo valt de entiteit ‘verdachte’ onder de categorie persoon, net zoals de entiteit vrouw, politieagent of alias. De categorie persoon is weer een subcategorie van de categorie ‘legal entity’, hier vallen organisaties ook onder. Vliegtuig, trein en boot vallen onder de categorie ‘transport’ en daarmee weer onder de categorie ‘property’ en vervolgens onder de categorie ‘possession’. Er zijn bepaalde eigenschappen die gelden voor een gehele categorie en hoe specifieker de subcategorie is, hoe specifieker die eigenschappen kunnen zijn. Zo kan een persoon een leeftijd hebben en een ‘property’, eigendom, een (geschatte) waarde.

Dat ‘personen’ een subcategorie is onder de overkoepelende term ‘legal entity’ wordt ook wel verticale alignment genoemd. Dat categorieën subcategorieën hebben maakt dat er een hiërarchische indeling ontstaat van de semantische betekenissen. Dit houdt in dat als een record van het type politieagent wordt aangemaakt, dat deze automatisch ook de semantische betekenis ‘person’ krijgt en daardoor ook automatisch de semantische betekenis ‘legal entity’. Dit wordt ook wel het semantische pad genoemd. Zo gelden er eigenschappen voor alle ‘legal entities’, organisaties en personen, en verder gelden er daar bovenop nog eigenschappen voor organisaties die weer verschillen van de eigenschappen voor personen.

In de afbeelding hiernaast kunt u een aantal semantische types zien en hoe deze zijn ingedeeld in iBase/Analyst’s Notebook. Zo ziet u dat bijvoorbeeld onder de categorie ‘property’ verschillende subcategorieën staan, waaronder ‘account’, ‘animal’, ‘bank account’ en ‘bank card’. Onder de subcategorie ‘bank card’ staan vervolgens weer twee subcategorieën, namelijk een ‘credit card’ en een ‘debit card’. Deze subcategorieën die samen onder dezelfde categorie vallen zijn horizontaal aligned. Ze zijn niet ondergeschikt aan elkaar.

De verticale alignement houdt dus in dat er onder een categorie nog subcategorieën vallen die voldoen aan de eigenschappen van de bovenstaande categorie en horizontale alignement houdt in dat meerdere semantische types onder dezelfde categorie vallen en eigen individuele eigenschappen hebben bovenop de gedeelde eigenschappen van de bovenstaande categorie.

Afbeelding 1 Semantische types
Afbeelding 1 Semantische types

Semantische types gebruiken in Analyst’s Notebook:

In Analyst’s Notebook is het semantische pad en -type terug te vinden in de item properties van een entiteit of koppeling onder Analysis Attributes.

  • List Items: Het is mogelijk om te sorteren op zowel het semantische pad als semantisch type. Door te clusteren op semantisch pad worden alle soort gelijke entiteiten bij elkaar gezet en wordt gebruik gemaakt van verticale alignment. 
  • Visual Search: U kunt hier zoeken naar zowel losse entiteiten als gekoppelde entiteiten met bepaalde eigenschappen, dit kan ook op basis van hun semantische type. Hierdoor is het mogelijk om bijvoorbeeld op alle vervoersmiddelen (semantisch type ‘transport’) te zoeken zonder dat u weet of het gaat om een bus, fiets of vliegtuig. 
  • Search: Als zoekterm kunt u gebruiken maken van het semantische type, zoals bijvoorbeeld ‘person’. In de zoekresultaten komen alle entiteiten naar voren die daar onder vallen. Maar u kunt ook kiezen voor ‘legal entity’. U krijgt dan alle personen en bedrijven te zien.
  • Activity View: Als u deze functie wilt gebruiken aan de hand van iBase-gegevens dan is het wederom belangrijk dat bepaalde velden een semantisch type hebben. Het gaat daarbij om de velden datum, tijd en duur. Een start datum/tijd moet van het type ‘Event start Date/Time’ zijn en een eind datum/tijd moet van het type ‘Event End Date/Time’ zijn. Indien u gebruikt maakt van een duur dan moet deze van het type ‘Duration’ zijn en daarnaast ook een numeriek- of tekstveld zijn.
  • Find Matching Entities: Deze functionaliteit gebruikt u voor het zoeken naar dubbele records in uw schema en maakt volledig gebruik van semantische types. Er wordt niet letterlijk gekeken of de tekst precies overeenkomt maar er wordt in de context gezocht. Waarbij ook de verschillende velden die bij een entiteit horen een verschil kunnen maken. Zo heeft een persoon een BSN en dit veld heeft als semantisch type ‘social security number’. Dit nummer wordt niet vergeleken met een telefoonnummer omdat dit bij een ander semantische categorie hoort en daarom ook geen match kan zijn. Indien uw gegevens in een schema uit verschillende bronnen afkomstig zijn, is het van belang om na te gaan of voor overeenkomstige data ook eenzelfde semantisch type wordt gebruikt. Is dit niet het geval dan zal er geen match gevonden worden.

Semantische types gebruiken in iBase:

De belangrijkste functie binnen iBase waarbij u gebruik kunt maken van een semantisch type is het maken van een query. In een SQL-server database heeft u de mogelijkheid om te zoeken binnen een semantisch type in plaats van een specifieke entiteit. Het voordeel hiervan is dat u entiteit overstijgend kunt zoeken. Bijvoorbeeld, u heeft  in uw database entiteiten binnen een zelfde semantisch type zoals ‘personen’ en ‘verdachten’, dan kunt u een query maken waarbij u in beide entiteiten kunt zoeken. In de afbeelding hiernaast ziet u een query waarbij u zoekt naar een persoon (persoon of verdachte) die gekoppeld is aan een motor voertuig (bus, auto, motor, truck). Met de cirkeldiagramknop kunt u een semantisch type selecteren.

 

Afbeelding 2 Query
Afbeelding 2 Query

Het onderwerp semantisch type komt uitgebreid aan bod in de i2 iBase Designer training. Wilt u meer weten over i2 iBase en/of Analyst’s Notebook, neem dan contact op met info@dataexpert.nl. Voor informatie over de beschikbare data en kosten kunt u contact opnemen met training@dataexpert.nl

Deze website gebruikt cookies

We vinden het van groot belang dat u op de hoogte bent van welke cookies onze website inzet en voor welke doeleinden. Wij gebruiken Functional Cookies om onze website goed te laten functioneren. Daarnaast analyseren we d.m.v. Analytics Cookies het gebruik van onze website. Ook vragen we uw toestemming voor het plaatsen van cookies van derden (social media, advertising en analytics partners) waarmee we informatie delen. Door op ‘Accepteren’ te klikken, geeft u toestemming voor het plaatsen van de hiervoor genoemde cookies. Klikt u op ‘Instellingen’, dan wordt u geleid naar een pagina waar u kunt instellen welke cookies wel en niet geplaatst mogen worden. Klik hier voor onze privacyverklaring.