Arbeiten ohne Umwege – Direkter Datenzugriff auf komprimierte Daten

Datenkompression – ein g?ngiges Verfahren – und ein zeitaufw?ndiges, wenn man mit den Daten arbeitet: komprimieren, entpacken, suchen, bearbeiten, wieder komprimieren – und beim n?chsten Mal das ganze wieder von vorn. ?berall genutzt, immer wieder Rechenaufwand. Nicht nur bei der effizienten Datenspeicherung, sondern besonders auch im mobilen Umfeld. Hier wird Datenkompression eingesetzt, um den Datenverkehr gering zu halten und die Speicherkapazit?ten zu schonen. Unaufh?rlich werden komprimierte Daten verwendet – direkt arbeiten kann man mit ihnen nicht.

Eine Standard-Datenkompression wie zum Beispiel ZIP erreicht eine Kompression auf circa 30 - 60%. Dabei erfordert die Verarbeitung komprimierter Daten immer den Dekompression-Editieren-Kompressionszyklus: zeitaufwendiges Entpacken vor der Modifikation und zeitaufwendiges Verpacken danach. Auch mobile Ger?te senden und empfangen st?ndig immer gr??ere Datenmengen. Ein Entpacken ist durch den begrenzten Arbeitsspeicher hier jedoch nur begrenzt m?glich.

Prof. Dr. B?ttcher, Fachgruppe ?Electronic Commerce und Datenbanken“ vom Institut für Informatik der Universit?t Paderborn, hat nun mit Indexed Reversible Transformation (IRT) ein Verfahren entwickelt, das nicht nur eine Verarbeitung von komprimierten Daten erm?glicht, sondern auch eine Volltextsuche speicher- und recheneffizient durchführen kann. Insbesondere k?nnen damit komprimierte Daten ohne vollst?ndige Dekompression ge?ndert werden.  Das Verfahren kann nicht nur auf reinen Textdateien angewendet werden, sondern kombiniert mit dem ebenfalls in der Fachgruppe entwickelten XML-Kompressionsverfahren XML Schema Definitions-Subtraktion (XSDS) auch auf die viel verwendeten XML-Daten.

Die Verfahren IRT und XSDS bieten sich an, um Ger?ten mit sonst stark beschr?nkten Ressourcen, zum Beispiel Smartphones, zu einem gr??eren Funktionsumfang auch bei geringen Datentransferraten zu verhelfen. IRT und XSDS bieten die M?glichkeit, den Datenverkehr und die Arbeitsbelastung für den Prozessor zu reduzieren – und damit auch Zeit und Energie: Die schnellere Verarbeitung von komprimierten Daten spart Zeit und Speicherplatz. Gleichzeitig erh?ht sich die Leistung der laufenden Anwendung sowie der mobilen Ger?te insgesamt.

Generell k?nnen verschiedenste Anwendungen, beispielsweise Web-Browser, Social Media, Office-Tools oder finanzielle Transaktionen, über SEPA (Single Euro Payments Area) verbessert werden. Es ist problemlos m?glich, die IRT- und XSDS-Technologie in bestehende L?sungen wie Applikationen für Smartphones und Computer zu integrieren. Dadurch wird das Datenvolumen in der Regel um 90% auf ca. 10% der Gesamtgr??e reduziert – ist also kleiner als bei einer Kompression mit gzip oder bzip2 und erlaubt zudem ein Durchsuchen und sogar ein ?ndern der Daten ohne vollst?ndige Dekompression.

Nicht nur im mobilen Bereich verspricht sich Prof. Dr. B?ttcher m?gliche Einsatzgebiete: Microsoft Word und Excel speichern ihre Daten in aktuellen Versionen ebenfalls als XML-Dokumente. Werden die Verfahren IRT und XSDS hier angewendet, sinkt nicht nur der Speicherbedarf, auch eine schnelle Volltextsuche kann so auf herk?mmlichen Rechnern durchgeführt werden. Eine attraktive M?glichkeit – besonders bei den Mengen an Dateien, die sich im Laufe der Zeit ansammeln.

Aktuell wird das IRT-Verfahren weltweit zum Patent angemeldet. Darüber hinaus bietet der Projektpartner PROvendis GmbH (Patentverwertungsgesellschaft der Hochschulen des Landes NRW) interessierten Unternehmen Lizenzen an.
 

Autorin: Jana Neuhaus
 

Kontakt:

Prof. Dr. Stefan B?ttcher
Electronic Commerce und Datenbanken
05251 60-6662
stb@uni-paderborn.de 

Foto: Komprimierte Daten ganz gro? – direkt sichtbar und sofort zu bearbeiten
Foto: Komprimierte Daten ganz gro? – direkt sichtbar und sofort zu bearbeiten