Komprimierungsverfahren

Das Ziel der Anwendung von Kompressionsalgorithmen ist grundsätzlich die Reduktion von Datenvolumen für eine effiziente Speicherung bzw Übertragung der Daten.

Grundsätzliches Verfahren ist die Eliminierung überflüssiger, also redundanter, Daten.

Aber: "Überflüssig ist relativ...

Unterscheidung zwischen zwei Ansätzen:

  1. Verfahren, bei denen das ursprüngliche Datenvolumen wieder vollständig verfügbar ist (verlustfrei)
  2. Verfahren, bei denen (vermeindlich) unbedeutende Daten herausgefiltert und gelöscht werden (verlustbehaftet)

Jeder Datenkomprimierung folgt ein Dekompressionsvorgang im Anwendungsfall. Nach diesem sind entweder alle Daten wieder vorhanden oder nur eine reduzierte Anzahl.

Was sind ZIP und RAR (Dateiformate)?

Generell zählen sowohl .zip als auch .rar zu den verlustfreien Kompressionsverfahren. Das heißt, dass die Datei nach dem Packen und anschließendem Entpacken zu 100% identisch mit dem Original wieder hergestellt wird. Die beiden Formate sind hauptsächlich zum Archivieren und Übertragen von Dateien (via Internet) gedacht.


Das ZIP-Dateiformat

Bei dem ZIP-Dateiformat handelt es sich um ein Kompressionsverfahren mit dem Texte und Grafiken komprimiert und archiviert werden können. Es zeichnet sich durch eine enorm hohe Kompressionsrate aus, arbeitet mit verlustfreier Kompression und wird bei der Übertragung großer Dateien zur vorherigen Datenreduktion benutzt.

Die Kompression der Dateien erfolgt mit Programmen wie WinZip, 7-Zip oder PKZIP, die mit dem LZW-Algorithmus arbeiten und je nach Dateistruktur Kompressionsraten von über 90% erreichen. Für die Dekompression ist wiederum eine Software erforderlich.

Mehrere zu komprimierende Dateien können in einer Datei zusammengefasst werden, wobei unterschiedlichste Dateiformate für Texte und Grafiken beliebig kombiniert werden können.

ZIP-Dateien haben die Extension *.zip.


Das RAR-Datenformat (Roshal archive)

Das RAR-Dateiformat ist ein Kompressionsformat mit dem beliebige Dateien verlustfrei mit einer sehr hohen Kompressionsrate komprimiert werden können. Das RAR-Format ist vergleichbar mit dem ZIP-Dateiformat und eignet sich für die Archivierung von Dateien.

RAR kann beliebige Dateien komprimieren. Vor der verlustfreien Kompression werden die Daten nach dem Dateityp sortiert. Wie andere Verfahren mit verlustfreier Kompression werden bei der RAR-Kompression Redundanzen entfernt, was zu der hohen Kompressionsrate führt. Im Gegensatz zu der ZIP-Kompression kann RAR Dateien in beliebiger Dateigröße komprimieren und große Dateien auch splitten. Komprimierte RAR-Dateien werden durch Entpacker-Software dekomprimiert.

Die Datei-Endung von RAR-Dateien ist *.rar.

Dieses Vorgehen besitzt jedoch zwei Nachteile:

Es können keine Einzeldateien aus einem Archiv extrahier werden, ohne den gesamten Datenstrom, der ggf. unerwünschte Dateien enthält, zu dekodieren. Außerdem führt ein beschädigtes Archiv zum Verlust aller archivierter Dateien (nicht nur der betreffenden Datei, da es in komprimiertem Zustand keine einzelnen Dateien mehr gibt).


Unterschiede

Kompression: ZIP hat eine wesentlich schnellere Kompressionsrate als RAR. Die Archive werden über ZIP etwa doppelt so schnell gepackt wie in RAR. RAR hingegen hat eine etwas höhere Kompressionsrate, sodass die Archiv-Datei (Größe) kleiner ist als das ZIP-Archiv.

ZIP: Die einzelnen Dateien werden erst komprimiert und dann als Archiv zusammengefügt. So ist die Kompressionsrate zwar geringer, jedoch können beschädigte Archive immer noch teilweise genutzt werden.

RAR: Die einzelnen Dateien werden erst zusammengefasst und dann komplett komprimiert. Das hat eine höhere Kompressionsrate zufolge, ist das Archiv jedoch beschädigt, ist das ganze Archiv unbrauchbar.


Fazit

Da ZIP sehr verbreitet und mit jedem Betriebssystem kompatibel ist, können (kleinere) Dateien oder Dateien, die nur zusammengefasst werden sollen, gut mit diesem Format gepackt werden, v. a., wenn es nicht auf den maximalen Kompressionsgrad ankommt.

RAR wird vorzugsweise für größere Dateiansammlungen genutzt. Da RAR-Dateien Archive sind und ein Programm zum Öffnen benötigen, muss dementsprechend eine Software angeschafft werden.