Corporate Smart Content

Das InnoProfile-Projekt Corporate Semantic Web an der FU Berlin hat eine umfassende Palette an Forschungsergebnissen im Bereich semantischer Technologien im Unternehmensumfeld hervorgebracht. Bei den Forschungsarbeiten wurden Technologien in drei Hauptbereichen Corporate Semantic Search, Corporate Semantic Collaboration und Corporate Ontology Engineering speziell für den Einsatz im Unternehmen entwickelt. Diese Forschungsarbeiten haben deutlich gemacht, dass der wirtschaftliche Erfolg wissensbasierter Systeme als produktives und wirtschaftliches System im Unternehmen stark von der Verfügbarkeit hochqualitativen Hintergrundwissens abhängig ist.

Durch die zunehmende IT-Unterstützung in allen Bereichen entstehen im operativen Geschäft in Unternehmen immer größere Mengen an Daten. Dies können unternehmensinterne Daten sein, wie zum Beispiel Dokumente, Emails, Berichte, Meetingprotokolle, Wikieinträge und Zugriffslogs oder das Produkt darstellen, das ein Unternehmen verkauft, beispielsweise in Form von Nachrichten, Marktanalysen oder multimedialen Unterhaltungsinhalten. Aktuellen Studien zufolge wurden allein im Jahr 2010 weltweit 7 Exabyte unternehmensinterner Daten erzeugt und darüber hinaus noch viel mehr öffentlich verfügbare Daten in Form von Webdokumenten, Blog-Einträgen, Twitter-Nachrichten, Bilder und Videos, von denen ein großer Teil wirtschaftlichen Nutzen birgt. Zusätzlich fällt in Unternehmen eine große Menge an implizitem Wissen an, zum Beispiel Wissen über Prozesse, welches sich der IT-mäßigen Verarbeitung und wirtschaftlichen Nutzung entzieht und dessen Bergung und Nutzbarmachung eine weitere große Herausforderung darstellt.

Allerdings stellt die Heterogenität sowohl der intern erzeugten, als auch der öffentlich verfügbaren Daten Unternehmen vor Probleme bei deren Integration und wirtschaftlicher Nutzung. Eine Abhilfe ist die Anreicherung mit Metadaten, die den Rohdaten einen Kontext zuordnen, in dem sie unter Umständen relevant sein können. Hier existiert ein “Big Data Gap”, denn 2012 waren nur 3 Prozent der Daten mit Metadaten angereichert; demzufolge wurden nicht mehr als 0,5 Prozent tatsächlich in einem betriebswirtschaftlichen oder wissenschaftlichen Kontext genutzt.

Semantische Technologien bieten hier eine Lösung in Form von Anreicherung heterogener Daten und Inhalte mit semantischem Hintergrundwissen in Form von Annotationen sowie der semantischen Beschreibung der annotierten Ressourcen mit Hilfe von domänenspezifischen Wissensmodellen in Form von Ontologien. Das Projekt CSW hat hier relevante Beiträge, beispielsweise in Form des Annotationssystems “Loomp”, mit dem “One Click Annotator” und dem Ontologie-Lebenszyklusmodell “COLM” sowie mit entsprechenden Tools wie der Ontologieversionsverwaltung “SVoNt”, hervorgebracht.

Auf der Basis dieser Ergebnisse forscht das InnoProfile-Transfer-Vorhaben “Corporate Smart Content” als Verbundprojekt mit der Freien Universität und vier regionalen Industriepartnern an Verfahren, die sich stärker auf die Prozesskette der Integration und wertschöpfenden Nutzung großer Bestände an heterogenen und sich über die Zeit ändernden Unternehmensdaten und -inhalten in Unternehmen konzentrieren. Die Prozesskette umfasst dabei die Entwicklung und Verwendung geeigneter Ontologien, die Anreicherung der Unternehmensinhalte mit ontologischem Unternehmenswissen sowie die Gewinnung weiteren Hintergrundwissens durch Analyse der Unternehmensinhalte.

Das Ziel dieses Teilvorhabens besteht darin, im Rahmen wissenschaftlicher Forschung neuartige Lösungsansätze zu entwickeln, die im Zusammenhang mit der oben erwähnten Prozesskette bestehen.

bmbf_logoUnternehmen Region - InnoProfile Transfer