Markus Spiske / Unsplash

BBC-DaaS

Building Blocks for Cloud Data as a Service

Kurzbeschreibung

Das Projekt wird wichtige Aspekte eines Data-as-a-Service (DaaS) Dienstes in der Cloud erforschen. Als Grundlage des DaaS-Dienstes fungiert ein Marktplatz für Informationen, der auf Basis neuer Technologien (GWT Cell Widgets for Large Data, NoSQL) effizienter gestaltet werden kann (Forschungsschwerpunkt an der Beuth Hochschule).

Projektinfos

Projektlaufzeit

01.07.2011 bis 30.06.2013

Förderlinie

Projektpartner

WebXells GmbH

Das Projekt hat wichtige Aspekte eines Data-as-a-Service (DaaS) Dienstes in der Cloud erforscht:

Projektteil A

Da auf dem Informationsmarktplatz Datenanbieter und Informationssuchende zusammenkommen sollen (Matching), ist eine entsprechende Technologie zum Suchen und Finden der passenden Anbieter notwendig.

Im Forschungsprojekt BBC-DaaS wurden zwei Ansätze für eine verbesserte Suche verschlagworteter Datensätze untersucht, Lösungen entwickelt und diese in Software implementiert:

1) Beim Nutzen der Schlagworte für die Suche tritt das Problem auf, dass gleiche Konzepte unterschiedlich benannt werden können, zum Beispiel sind „Bild“ und „Foto“ bedeutungsgleich (= synonym). Die Suche nach einem Schlagwort ergibt deshalb nur Begriffe, die mit dem Suchwort direkt bzw. in der linguistischen Grundform übereinstimmen. Zur Verbesserung der Suche werden daher häufig Synonym-Thesauri (Synonym-Lexika) eingesetzt. Ein manueller Aufbau und die Pflege dieser Thesauri ist allerdings mit hohem Aufwand verbunden. Im Rahmen des Projektes BBC-DaaS wurde eine Software geschaffen, mit der automatisch entsprechende Synonym-Thesauri aufgebaut werden können.

2) Außerdem wurde eine Lösung entwickelt, die es ermöglicht, mittels (freier) Wissensbasen die Terme semantisch einzuordnen, um neben dem Synonym-Problem das Homonym-Problem anzugehen. Ein Beispiel für ein Homonym ist das Wort “Hahn”. Es steht sowohl für das Konzept “Wasserhahn” als auch für den Vogel. So wird es möglich, die Suche auf die semantisch passenden Schlagworte einzugrenzen. Die entsprechende Software ist unter github.com/christianherta/BBC-DaaS verfügbar.

Projektteil B

Im Teilbereich B wurden die Grundlagen für offene Datenmarktplätze und Open Data Portale gelegt. Dazu gehörte initial die Definition aller Use Cases und die Entwicklung von GUIs, welche sowohl auf dem Desktop, als auch mobil mit html5 Daten manipulierbar und handelbar machen. Weiterhin wurden die Punkte Search und Security für Open Data Portale angegriffen und mit verschiedenen modularen Verfahren (OAuth, Single-Sign On) gelöst. Abschließend wurden diverse relationale und NoSQL Datenbanken angebunden und eine Deployment Pipeline aufgebaut, die durchgängig von Github auf PaaS Services wie Heroku, Cloud Foundry etc. deployt.

Diese Technologien sind daher Blueprint und Einsatzbeschleuniger und als erste dieser Art Open-Source verfügbar. Inzwischen hat der Marktführer Sokrata ebenfalls Teile als Open-Source verfügbar gemacht.

Neben vielen nationalen und internationalen Publikationen sind Teile des Projektes auf Github verfügbar:

  • https://github.com/edlich/BBC-DaaS
  • https://github.com/ipf/bbc-daas

Ein früher Prototyp (ohne Analyse Funktionalität), welcher für mobile Endgeräte optimiert ist, kann hier angezeigt werden. Kooperationen mit anderen erfolgreichen Großprojekten in diesem Bereich wie MIA und Nachfolgeprojekt laufen oder sind geplant. Teile der BBC-DaaS Technologie wurden erfolgreich in der Industrie für offene Portale eingesetzt.