CREAM

In der Zeit von April 2008 bis Dezember 2008 war ich als freiberuflicher Entwickler am Projekt CREAM, einem Kooperations-Projekt der Universität Bielefeld und der Firma Novartis Pharma AG, Basel tätig.

 

Das Projekt Corpus Research for the Exploitation of Annotated Metadata (CREAM) befasst sich mit dem Problem der Zugänglichkeit von großen, reich strukturierten sprachlichen Ressourcen, die für wissenschaftliche Zwecke komplexe Annotationen erfahren. Das Projekt CREAM befasst sich mit einer Benutzerschnittstelle, die den Benutzer auf Grundlage der Daten in die Lage versetzen soll, die in den Daten vorhandenen Informationen zu erforschen, wozu die darin enthaltenden Metadaten verwendet werden.Dazu werden Methoden und Verfahren aus den Bereichen Computerlinguistik, Texttechnologie, semantische Netze und Sprachressourcenmanagement angewendet.

 

Meine Tätigkeit umfasste sowohl die technische Konzeption (Anforderungsanalyse und Design), als auch die folgende Implementierung eines ersten Software-Prototyps zur gerichteten Suche in hoch strukturierten Daten. Im Anschluss an die Implementierung entwickelte ich Testverfahren zur qualitativen Bewertung des ersten Implementationsansatzes und wendete diese auf den Prototyp an.

 

Der entwickelte Prototyp basierte auf der Programmiersprache PHP5. Als Datenbasis des Projekts diente eine ca. 440.000 Einträge umfassende Tamino XML-Datenbank der Firma Novartis Pharma AG, Basel. Tamino ist ein XML-basiertes Datenbanksystem, entwickelt von der Firma Software AG, Darmstadt. Als Abfragesprache für Tamino werden XPath und XQuery verwendet.