TU Berlin: Community-Daten in den Griff bekommen

TU-Wissenschaftler forschen im neuen Projekt ROBUST

Forscher des Fachgebietes Datenbanksysteme und Informationsmanagement der TU Berlin entwickeln neuartige, skalierbare Methoden zur Analyse von Community-Daten aus Online-Netzwerken im Rahmen des EU-Projekts „Risk and Opportunity Management of Huge-scale Business Community Cooperation“ (ROBUST).

Professionelle Online-Communities erzeugen einen enormen wirtschaftlichen Mehrwert und sind ein zentrales Element im unternehmerischen Wissensmanagement, Marketing und der Innovationsfähigkeit. Solche Communities können leicht mehr als eine Millionen Nutzer umfassen und die zugrunde liegende Infrastruktur muss in der Lage sein, mehrere hundert Millionen Diskussionsverläufe mit Milliarden von Beiträgen zu verwalten. Die Wissenschaftlerinnen und Wissenschaftler des Projekts ROBUST arbeiten an Lösungen zum Risikomanagement, Datenmanagement, der Nutzermodellierung, der Simulation und der Datenanalyse für Online-Communities.

Für die Verarbeitung großer Mengen von Textdaten wie Forum-Posts sowie von Graph Daten, welche zum Beispiel die soziale Struktur eines Netzwerks repräsentieren, entwickeln die TU-Forscherinnen und -forscher skalierbare Methoden, die für großes Datenwachstum besonders geeignet sind. So können effizient auf „massiv parallelen“ Datenverarbeitungssystemen wie Apache Hadoop, Apache Giraph oder dem an der TU Berlin entwickelten System Stratosphere, also auf vielen Geräten gleichzeitig – in der Industrie sind es tausende -, ausgeführt werden. Skalierbarkeit ist ein wichtiger Bestandteil der ROBUST-Plattform, weil so enorm große Datenmengen („Big Data“) analysiert werden können.

Diese technischen Werkzeuge ermöglichen komplexere Algorithmen für die Analyse und Verbesserung von Online-Communities, wie beispielsweise das Empfehlen von Experten zu bestimmten Diskussionsthemen oder die automatische Ermittlung von Communities, die besonderer Aufmerksamkeit bedürfen.

Um die Skalierbarkeit der entwickelten Algorithmen zu überprüfen, haben TU-Forscher Experimente mit massiven Datensätzen durchgeführt, welche die Größe der Forschungsdaten im Projekt deutlich übersteigen. So konnten Sie zum Beispiel die Graphstruktur eines sozialen Netzwerkes mit über 40 Millionen Nutzerinnen und Nutzern sowie 3 Milliarden Verbindungen unter den Nutzern effizient analysieren und die lineare Skalierbarkeit der entwickelten Methoden verifizieren. Ausgewählte Algorithmen wurden bereits in die populären Open-Source-Bibliotheken Apache Mahout [1] und Apache Giraph [2] integriert. Sie stehen somit ab sofort für Entwickler, welche die Algorithmen in ihren eigenen Softwareprojekten einsetzen möchten, unter der Apache Software Lizenz zur Verfügung.

[1] http://mahout.apache.org
[2] http://giraph.apache.org

Das Projekt ROBUST wird mit 10,3 Millionen Euro im Rahmen des „Seventh Framework Programme“ der Europäischen Union für 3 Jahre gefördert. Die Projektleitung ist an der Universität Koblenz-Landau angesiedelt. Weitere Partner sind die SAP AG (Deutschland), IBM Israel – Science and Technology LTD (Israel), National University of Ireland, Galway (Irland), University of Southampton (Vereinigtes Königreich), TEMIS S.A. (Frankreich), Software Mind SA (Polen), The Open University (Vereinigtes Königreich) und MeaningMine Ltd. (Irland).

Website zum Projekt ROBUST: www.robust-project.eu

Weitere Informationen erteilt Ihnen gern: Prof. Dr. Volker Markl, TU Berlin, Fachgebiet Datenbanksysteme und Informationsmanagement, Tel.: 030/314-25553, E-Mail: volker.markl@tu-berlin.de

Die TU Berlin versteht sich als international renommierte Universität in der deutschen Hauptstadt, im Zentrum Europas. Eine scharfe Profilbildung, herausragende Leistungen in Forschung und Lehre, die Qualifikation von sehr guten Absolventinnen und Absolventen und eine moderne Verwaltung stehen im Mittelpunkt ihres Agierens. Ihr Streben nach Wissensvermehrung und technologischem Fortschritt orientiert sich an den Prinzipien von Exzellenz und Qualität.

Kontakt:
TU Berlin, Stabsstelle Presse, Öffentlichkeitsarbeit und Alumni
Stefanie Terp
Straße des 17. Juni 135
10623 Berlin
030/314-23922
pressestelle@tu-berlin.de
http://www.tu-berlin.de

Pressekontakt:
TU Berlin, Fachgebiet Datenbanksysteme und Informationsmanagement
Prof. Dr. Volker Markl
Straße des 17. Juni 135
10623 Berlin
030/314-25553
volker.markl@tu-berlin.de
http://www.pressestelle.tu-berlin.de/menue/service_fuer_journalisten/