Copyright (c) Memodata 1998-2005

Web Memodata 

 
       

II.3] Die Satz-Funktionen des Sémiographe

Die Satz-Funktionen liefern Informationen ueber die Funktion von Woertern in einem syntaktischen Satz, oder den Sinn von Woertern in einem semantischen Satz.

II.3.1] Die morphologische Satz-Funktion

public Phrase createSentence ( String  stringSentence,
                               boolean avecAnalyseSyntaxique,
                               boolean avecAnalyseMorpho )
Bsp.: createSentence ("Essen wir jetzt den Kuchen?", false, true )

 

Gibt einen morphologisch analysierten Satz zurueck: fuer jedes Wort des Satzes werden saemtliche moegliche Kategorien zurueckgegeben. "Essen" ist beispielsweise ein Verb oder ein Nomen.

II.3.2] Die syntaktische Satz-Funktion

public Phrase createSentence ( String  stringSentence,
                               boolean avecAnalyseSyntaxique,
                               boolean avecAnalyseMorpho )
Bsp.: createSentence ("Essen wir jetzt den Kuchen?", true, true )

 

Gibt einen syntaktisch analysierten Satz zurueck: fuer jedes Wort des Satzes wird die syntaktische und grammatikalische Kategorie gemaeß dem Kontext zurueckgegeben. "Essen" ist hier also zum Beispiel ein Verb.

NB: Die syntaktische Analyse ist ein wesentliches Werkzeug fuer jeden, der aus einem Korpus Fakten extrahieren will (um eine Wissensbasis aufzubauen) und somit ein wesentlicher Bestandteil des "text mining".
Die Regeln (patterns) und Extrahierungs-Kriterien der Komponente des Sémiographe zur syntaktischen Analyse sind vollstaendig parametrierbar. Somit kann der Anwender (selbst aus der IT-Branche und mit entsprechenden Informatik-Kentnissen ausgestattet) die aus der Text-Basis zu extrahierenden Elemente definieren.

II.3.3]  Die semantischen Satz-Funktionen

Diese Funktionen setzen auf den semantischen Wort-Funktionen verbunden mit den Funktionen zur Aufloesung von semantischen Mehrdeutigkeiten auf: Aktivierung und Distanz.
Der Zweck von Aktivierung und Distanz besteht darin, einen "Abstand" zwischen einem Wort-Sinn-Paar und mehreren anderen in einem Satz vorkommenden Woertern angeben zu koennen.

  • Die Aufloesung von Mehrdeutigkeiten durch "Aktivierung"

public void activation( int scoreMax, int maxActives )

Bsp.: activation( -1, 10 )

Behaelt auf jeder Wortposition des Satzes die 10 Wort-Sinn-Paare mit den hoechsten Aktivierungs-Werten (unabhaengig vom absoluten Wert).

  • Die Aufloesung von Mehrdeutigkeiten durch "Distanz"

public void distance( int numMot, boolean filtrageLimites )

Bsp.: distance( -1, true )

Ermittelt fuer jedes Wort-Sinn-Paar jedes Wortes einen Distanz-Wert. Fuer eingeschraenkte Bedeutungen (zum Beispiel die Bedeutung "Schwanz des Hasen" fuer das Wort "Blume") gilt: sie werden nur erhalten, wenn Sie von mind. einem anderen Wort-Sinn-Paar des Satzes aktiviert werden.

  • Die N-Form

Die N-Form, oder das "inverse Woerterbuch", ermittelt den spezifischen Wert eines Oberbegriffs an erster Position der Funktion.
"Person, die Blumen verkauft" hat z.B. an erster Stelle das Wort "Person", das fuer jede beliebige spezielle Person stehen kann. Ein weiteres Beispiel fuer die N-Form ist "Waehrung von Japan".
Aus der Sicht der Informatik besteht die N-Form aus der Anwendung der Wortfunktion "Unterbegriffe", gefolgt von einer Berechnung des Aktivierungs-Wertes fuer jedes gefundene Wort und eventuell einer Distanz-Bestimmung.

public void extendActivated ( int     num,
                              String  langues,
                              boolean filtrageLimites,
                              int     scoreMax,
                              int     maxActives,
                              int     maxReponses,
                              char    origine,
                              boolean calculDistance )

Bsp.: extendActivated( 1, "F", true, -1, 50, 10, ‘P’, true )

In diesem Beispiel werden die Unterbegriffe zum ersten Wortes bestimmt, die eingeschraenkten Bedeutungen ausgefiltert und die Menge auf die 50 Woerter mit den hoechsten Aktivierungs-Werten eingeschraenkt. Anschließend wird der Distanz-Wert berechnet, um schließlich nur die "Top 10" zu behalten.

Bemerkung: wenn calculDistanc==false, dann ist der Parameter maxReponses gleich maxActives.

  • Aktivierte Unterbegriffe

Die Funktion "AktivierteUnterbegriffe" fuehrt die selben Berechnungen wie die N-Form aus, aber die Berechnung muss hier nicht zwingend das erste Wort des Satzes betreffen.

Diese Funktion ermoeglicht es, in einem Satz die moeglichen Bedeutungen eines Oberbegriffs auf alle seine Unterbegriffe "auszudehnen", wenn diese aktiviert werden.

Bsp.: extendActivated( 3, "F", true, -1, 50, 10, ‘P’, true )

Identisch zur N-Form, aber auf das 3. Wort des Satzes angewendet.

  • Uebersetzung

Die Funktion "Uebersetzen" gibt die Uebersetzung eines Wortes in einer Quellsprache in eine Zielsprache zurueck, fuer einen gewissen Wortkontext.

public Vector extendTranslation ( int    numMot,
                                  String LanguesAutorisees )
Bsp.: extendTranlation( 1, "EFSI")

 

Dieser Aufruf fuegt an erster Position die englischen, franzoesischen, spanischen und italienischen Uebersetzungen der Wort-Sinn-Paare an erster Stelle des Satzes hinzu.

Copyright (c) Memodata 1998-2004 English/deutsch : Sensagent.com