Teilprojekte

Smart Content Enrichment (FU Berlin)

Das Ziel dieses Teilvorhabens besteht darin, im Rahmen wissenschaftlicher Forschung neuartige Lösungsansätze zu drei Problemen zu entwickeln, die im Zusammenhang mit der oben erwähnten Prozesskette bestehen:

Entwicklung eines Ansatzes zur aspekt-orientierten Ontologiemodellierung: Die Erstellung von Ontologien ist eine aufwändige Aufgabe. Die Entwicklung sowie die Wiederverwendung von Ontologien, angefangen bei der Auswahl geeigneter Kandidaten, bis hin zur Anpassung und Verwendung, wird dadurch erschwert, dass Ontologien meistens in monolithischer Form vorliegen und viele querschnittliche Belange gleichzeitig repräsentieren. Somit sind sie oft zu groß und komplex für einen einfachen Zugang. Ansätze aus dem Bereich der Ontologiemodularisierung bieten hier keine allumfassende Lösung, da diese jeweils auf einen Aspekt spezialisiert sind, anhand dessen die Modularisierung vorgenommen wird. Wir schlagen einen Ansatz zur aspekt-orientierten Ontologiemodularisierung vor, der die verschiedenartigen Aspekte einer in einer Ontologie modellierten Domäne schon bei der Erstellung berücksichtigt. Somit können querschnittliche Belange getrennt modelliert und leichter wiederverwendet werden.

Semantische Erkennung und Annotation von komplexen Entitäten in Unternehmensdaten: Viele Ansätze unserer Partner entwickeln und benutzen Verfahren zur Erkennung von Named Entities. Die nach dem derzeitigen Stand der Wissenschaft und Technik existierenden Verfahren stoßen schnell an ihre Grenzen, wenn Hintergrundwissen mit einbezogen werden muss. Beispiele für solche Fälle sind Texte, in denen Entitäten nicht direkt benannt sind, über mehrere Dokumente verteilt sind oder sich durch die Kombination mehrerer einfacher Entitäten definieren. Wir werden Verfahren entwickeln, die durch Einbeziehung von Hintergrundwissen und durch die Analyse von Beziehungen zwischen einzelnen Entitäten auch solche komplexen Entitäten erkennen und annotieren können.

Semantisches Mining von Ereignisdaten im Unternehmen zur Wissensgewinnung: Heutzutage haben Unternehmen viele Ereignislogdaten über die Aktivitäten in ihren Geschäftsprozessen. Aus diesen enormen Mengen an Logdaten kann neues Hintergrundwissen über Ressourcen in Anwendungsszenarien gewonnen werden. Während die klassischen Prozess-Mining-Methoden nur die Logdaten für die Gewinnung von Modellen und Wissen nutzen, werden wir in diesem Forschungsvorhaben die Logdaten mit vorhandenem Hintergrundwissen anreichern und dann für die Wissensgewinnung nutzen.

Smart Content Management, Navigation und Empfehlungen (Condat AG)

Im Teilvorhaben Smart Content Management, Navigation und Empfehlungen entwickelt Condat einen Baustein des Gesamtvorhabens, der Redaktionen, Management, Marketing und Projektleitern in Unternehmen bei der Erstellung, Verwaltung, Navigation und Recherche von Inhalten unterstützt. In nahezu allen Unternehmen greifen Produkt- und Projektmanager, Presse und Public Relation, Web-Seiten Redaktion, sowie Management bei der täglichen Arbeit auf vielfältige Haus-interne und externe Materialien zu. Dabei hat der Umfang der täglich anfallenden Dokumente durch immer neue Distributionskanäle zwar immer mehr zugenommen, gleichzeitig ist jedoch ist der Anteil der relevanten Materialien ausreichender Qualität immer weiter gesunken. Insbesondere werden Mitarbeiter bisher kaum unterstützt, um die für ihr Arbeitsfeld wichtige, ergänzende, vertiefende Daten aus der Informationsflut zu extrahieren. Dabei wäre es zumindest sinnvoll, für ein Unternehmen die Themen zu selektieren, die für ihre Produkte, Dienste und Kundengruppen relevant sind; darüber hinaus könnte es für bestimmte Abteilungen oder Mitarbeiter auch interessant sein, neue Entwicklungen, Forschungsergebnisse oder Produkte in ausgewählte Bereiche zu observieren. Trotz der vielen neuen, ganz verschiedenen Informationsquellen wird bisher auch kaum zwischen vertrauenswürdigen und unsicheren sowie aktuellen und veralteten Materialien unterschieden.
 
Mit den innovativen Verfahren der semantischen Analyse wird es nun möglich, im CSC-SCM Projekt Funktionen zu entwickeln, die Mitarbeitern und Abteilungen besser bei der Informationssuche und Extraktion unterstützen. Dabei erlaubt die semantische Analyse, dass das implizite Wissen und Zusammenhänge in den verschiedenen Ressourcen explizit herausgearbeitet und automatisch verarbeitbar werden. Dies erfolgt auf Basis der Meta-Daten zu den Ressourcen, wie Titel, Verfasser und weitere beschreibende Daten, aber auch Wörter in Texten oder gesprochener Sprache in Videos. Alle erkannten Begriffe werden klassifiziert und Bezüge untereinander und zu anderen Quellen hergestellt.

Corporate Smart Wiki - Smart Wiki-Wizards für die Nutzung und Administration von Wiki-Systemen (EsPresto AG)

Smart Enrichment - Semantische Anreichung von Wiki-Seiten: Im Rahmen dieses Teilprojektes forscht EsPresto an Verfahren, die auf die existierenden Wiki-Seiten eine verbesserte bzw. optimierte Annotation und Verlinkung von Seiten ermöglichen, welche auf dem Kontext der jeweiligen Wiki-Seite beruht. Basierend auf diesen Verfahren sollen benutzerfreundliche Werkzeuge erstellt werden, die in der Lage sind, die Inhalte von Wiki-Seiten maschinell und durch Kollaboration der Mitarbeiter zu analysieren, um die richtigen Annotationen bzw. Verlinkungen zu anderen Seiten vorzuschlagen und die Nutzer so bei der Annotation und Typisierung zu unterstützen.

Smart Navigation - Semantische Navigation in Wikis: Das Ziel dieses Teilprojektes ist es, in Wiki-Seiten Navigationsvorschläge zu unterbreiten, die auf der Semantik der Mitarbeiterrolle und dem Kontext der aktuellen Seite sowie des Navigationspfades zu dieser Wiki-Seite basieren. Hierfür sollen Verfahren zur Analyse von Suchhistorien auf Wiki-Seiten, Mitarbeiterrollen und Seitenkontext erforscht werden und in Form von Widgets prototypisch umgesetzt werden.

Smart Administration - Semantische Archivierung von Wiki-Seiten: Die Archivierung von Wiki-Seiten ist eine zeitintensive und anspruchsvolle Aufgabe für die Wiki-Moderatoren. Die Archivierung von Wiki-Seiten ist notwendig, um beispielsweise die Wikis für die Nutzer übersichtlich zu halten und die Treffgenauigkeit bei der Suche zu optimieren. Im Rahmen dieses Teilprojektes forscht EsPresto an innovativen Methoden zur Erleichterung der Moderation und Archivierung von Wiki-Seiten, so dass die Wiki-Moderatoren bei ihrer Arbeit durch die maschinellen Vorarbeiten durch sinnvolle Archivierungsvorschläge, unterstützt werden.

Smart Content Creation and Annotation (Neofonie GmbH)

Im Teilvorhaben Smart Content Creation and Annotation entwickelt Neofonie ein selbstlernendes System zur Unterstützung von Redakteuren bei der Erstellung von Inhalten. Leichtgewichtige Technologien aus dem Web-2.0-Umfeld (Folksonomies, Collaborative Tagging) werden dabei weiterentwickelt und auf neuartige Weise mit semantischen Technologien verbunden. Das Vorhaben unterstützt Redakteure dabei, Dokumente kollaborativ mit semantischen Metadaten anzureichern, über welche dann gesucht werden kann. Bei der automatischen Informationsextraktion werden statistische Verfahren und linguistische Regelsysteme zur Relationsextraktion und erweiterten Eigennamenerkennung kombiniert. Neben domänenspezifischen Ontologien wird dabei auf vielfältige Linked-Open-Data-Quellen zurückgegriffen. Auf diese Weise sollen allgemeingültige Konzepte und firmeninternes Fachwissen verarbeitbar gemacht werden.

Corporate Smart Process Content (Semtation GmbH)

In  einer Organisation ist jeder Mitarbeiter in einer bestimmten Rolle in jeweils einem Prozess aktiv. Auf Basis eines Prozessmodells wird festgelegt, an welcher Stelle im Prozess er sich befindet. Das Prozessmodell ist semantisch angereichert und enthält auch bereits direkt dem Schritt zugeordnete Dokumente/Links bzw. zugeordnete Dokumentklassen, die auf Basis des aktuellen Kontextes instantiiert und damit konkretisiert werden können. Die Festlegung, an welcher Stelle im Prozess der Mitarbeiter sich befindet, wird über manuelle Auswahl oder über ein Workflow-System erzeugt. Damit wird die Suche nach Informationen im Prozesskontext über die Kontextinformationen (Rolle, vorgegebene Informationsart, betroffenes Business Objekt des Prozess-Schritts, Methode des Prozess-Schritts) eingeschränkt. Im Idealfall ist für den Benutzer gar kein aktiver Suchprozess mehr notwendig, sondern es wird ihm direkt das Ergebnis zur Verfügung gestellt, das er für den aktuellen Prozess-Schritt benötigt. Die Suche läuft dann im Hintergrund auf Basis der bereits durch den Kontext des Prozess-Schritts vorhandenen Informationen. Ziel dieses Vorhabens ist also die Ermittlung solcher Kontextdaten.