DOC(4) (Pilot Standard Textdocument) Dateiformat

ÜBERSICHT


struct doc_record0 { /* 16 bytes total */
Word version; /* 1 = Klartext, 2 = komprimierter Text */
Word reserved1; /* beim Erstellen auf Null setzen */
DWord doc_size; /* unkomprimierte Größe in Bytes */
Word num_recs; /* Anzahl der Text-Blöcke (nicht Header) */
Word rec_size; /* max. Blockgröße in Bytes: normal 4096 (4K) */
DWord position; /* aktuelle Leseposition im Text */
};

BESCHREIBUNG

Das Doc-Dateiformat ist das Standardformat für Textdokumente, das in allen Palm Pilots verwendet wird. Eine Doc-Datei ist eine pdb(4)-Datei, diese Manpage behandelt daher nur Teile, die speziell für Doc-Dateien zutreffen.

Eine Doc-Datei besteht aus 0 bis num_recs Blöcken; Block 0 ist der Kopf (Header) des Dokuments. (Dieser Header unterscheidet sich vom pdb(4)-Header.) Der Eintrag position wird nicht von allen Leseprogrammen benutzt. Die restlichen Blöcke enthalten Text, entweder Klartext oder komprimierten, das hängt ab vom Wert der version.

Wortgröße

In der ÜBERSICHT oben werden die Typen ``Word'' und ``DWord'' verwendet. Der Typ ``Word'' ist 16 Bit lang; der Typ ``DWord'' ist 32 Bit lang. Beide im Big-Endian-Format.

Kompressionsformat

Ein Zeichen ``c'' in einem komprimierten Block entspicht einer von vier Klassen:
01-08
Kopiere die folgenden ``c'' Bytes unverändert
00,09-7F
weiterreichen, so wie es ist
80-BF
kopiere eine Folge eines vorhergehenden Teils des Blockes
C0-FF
Ein Leerzeichen plus das ASCII-Zeichen ``c xor 0x80''

AUTOR

Paul J. Lucas <[email protected]>
Deutsche Übersetzung: Erik Schanze <[email protected]>