Scannen

In dieser Dialogbox kann man Einstellungen vornehmen, die das Verhalten von Kat-CeDe beim Scannen einer neuen CD beeinflussen

 

wpe4.png (26550 Byte)

In dieser Dialogbox kann man einstellen, in welchem Umfang Kat-CeDe eine CD analysiert. Viele Einstellungen haben auch einen großen Einfluß auf die Arbeitsgeschwindigkeit von Kat-CeDe. Je mehr Informationen Kat-CeDe sammelt, desto länger dauert es logischerweise. Ganz oben gibt es Checkboxen, die eher allgemeiner Natur sind:

·         Autoscan
bedeutet, daß Kat-CeDe jede CD automatisch scannt, wenn man diese in das CD-ROM-Laufwerk einlegt. Damit diese Option funktioniert, muß für das entsprechende Laufwerk die automatische Benachrichtigung beim Wechsel aktiviert sein. Windows9x hat die Benachrichtigung als Standard aktiviert.

·         Logfile
dient zur Fehlersuche und sollte eigentlich nur aktiviert werden, wenn ich zwecks Fehlersuche dazu auffordere.

·         CRC32
Wenn diese Option gewählt wird, so berechnet Kat-CeDe für jede Datei eine sogenannte CRC-Summe. Die CRC-Summen werden als erster Kommentar eingetragen. CRC-Summen können dazu dienen, Veränderungen an Dateien zu erkennen. Mit dem Menüpunkt „Ansicht“, „CRC anzeigen“ kann man bestimmen, ob die CRC-Summen als Teil des Kommentars angezeigt werden sollen oder nicht.

Der Rest der Dialogbox ist in durch einen Rahmen getrennte Bereiche aufgeteilt. Auf der linken Seite unter "Infodateien" kann man Einstellungen vornehmen, welche Dateien als Infodateien angesehen werden. Infodateien sind Dateien, die ihren Inhalt als Kommentar zugeordnet bekommen. Ab Version 3.1 werden diese Dateien nicht mehr ohne Überprüfung als Kommentar benutzt. Kommen in der Datei Zeichen mit einem Code <32 (außer 9,10,13) vor, so wird die Datei ignoriert. Kommt im Dateinamen „.HTM“ vor, so wird ein HTML->Text-Filter nachgeschaltet. HTML->Text-Filter versucht, den reinen Text aus einer Web-Seite zu extrahieren. Kommt im Dateinamen „.RTF“ vor, so wird ein RTF->Text-Filter nachgeschaltet. RTF->Text-Filter versucht, den reinen Text aus einer RTF-Datei zu extrahieren. HTML und RTF werden bei der Größe der Beschreibungen etwas besonders behandelt, da ja Informationen entfernt werden und die Länge der Beschreibungen dadurch abnehmen würde. Durch den Eintrag MaxHtml in der INI-Datei kann man bestimmen, wieviel KB bei HTML bzw. RTF geladen werden sollen, bevor der Filter aktiv wird. Bei allen Dateien werden mehrfach hintereinander vorhandene Leerzeichen durch ein einziges Leerzeichen ersetzt.

·         max. Größe
Da einige dieser Infodateien teilweise komplette Handbücher von mehreren hundert Kilobyte enthalten können, muß eine Grenze gesetzt werden, um die Datenbankgröße nicht ins Unermeßliche ausufern zu lassen. Die Angaben haben die Größe Kilobyte. Werte zwischen 1 und 10KB sind als sinnvoll zu erachten.

·         FILE_ID.DIZ
Dieser Dateiname stammt noch aus den Anfängen der Mailboxszene und hatte sich damals als Standard eingebürgert. Selbst heute gibt es noch viele nette Programmautoren, die freundlicherweise ihre Archive mit einer Datei dieses Namens ausstatten. Es spricht wenig dagegen, diese Option permanent aktiviert zu lassen.

·         *.ETX
Dateien mit der Endung ETX findet man praktisch nur auf den CDs der Zeitschrift Win. Da das Format wenig verbreitet ist und das Format der Dateien eigenwillig ist, lohnt es sich nicht unbedingt, diese Option aktiviert zu haben.

·         LSM/RPM (Linux)
Wie schon die Klammer verrät, lohnt sich diese Option hauptsächlich für Benutzer, die Linux nicht nur vom Hörensagen kennen. LSM ist ein älteres Format, das heute praktisch nicht mehr verbreitet wird. Bei RPM handelt es sich beinahe um den heutigen Standard und Kat-CeDe versucht, die Informationen möglichst komplett herauszufiltern.

·         INDEX (Linux)
Auch hier handelt es sich um den Versuch, eine Index-Datei von Linux-CDs auszuwerten. Ähnlich wie LSM, ist Index nicht mehr ganz so gebräuchlich, außer eventuell auf Abzügen von FTP-Servern.

·         5 freie Einträge
Unter den schon vordefinierten Dateitypen hat man hier die Möglichkeit, bis zu 5 Namensteile zu definieren. Enthält ein Dateiname auf einer CD die komplette Zeichenkette einer dieser 5 Einträge, so liest Kat-CeDe die Datei bis zur maximalen Länge ein und ordnet der Datei diesen Inhalt als Kommentar zu. Sinnvoll sind hier die Einträge LIESMICH bzw. README, die sehr verbreitet sind. Gibt man README an, so werden README.TXT, README.DOC usw. als Infodateien behandelt. Wenn es sich nicht um einfache Textdateien handelt, so ist der Eintrag nicht sehr hilfreich, aber ich denke darüber nach, eventuell weitere Filter einzubauen, die dann wichtige Informationen extrahieren.

Auf der rechten Seite geht es oben mit der Frage los, was mit gepackten Dateien passieren soll. In dem Abschnitt "gepackte Dateien" stehen folgende Optionen zur Verfügung:

·         nicht entpacken
Kat-CeDe entpackt keine Datei.

·         komplett entpacken
Kat-CeDe versucht, alle gepackten Dateien, soweit möglich, komplett zu entpacken. Diese Option ist sehr zeitintensiv, weil Kat-CeDe die Dateien im Gegensatz zu anderen Programmen dieser Art wirklich entpackt und nicht nur das Inhaltsverzeichnis liest. Vorteile dieser Vorgehensweise sind die Möglichkeit, auch rekursive Archive entpacken zu können, d. h. Archive in Archiven usw. können auch analysiert werden und die enthaltenen Dateien können weiter untersucht werden.

·         nur FILE_ID.DIZ entpacken
Ist diese Option aktiviert, so wird versucht, nur die Datei FILE_ID.DIZ aus einem Archiv zu entpacken und als Kommentar zu verwenden. Ist "komplett entpacken" aktiviert, ist diese Option zweckfrei.

Im nächsten Abschnitt kann man in Grenzen bestimmen, welche Dateien in den Katalog übernommen werden. Hier gibt es folgende Auswahlmöglichkeiten:

·         nur mit Kommentar
Ist diese Option aktiviert, so werden nur Dateien in den Katalog übernommen, die einen Kommentar (woher auch immer) zugeordnet bekommen haben.

·         ohne FILES.BBS
Ist diese Option aktiviert, so verzichtet Kat-CeDe auf die Analyse von Dateien, wie FILES.BBS, DESCRIPT.ION, WILDCAT.TXT und 00_INDEX.TXT. Sinn ist es, bei defekten FILES.BSS trotzdem die CD einlesen zu können oder mehr Informationen aus anderen Quellen zu sammeln.

Der letzte Abschnitt behandelt einige allgemeine Optionen. Über diese Punkte kann man sich den Kopf zerbrechen:

·         mehrzeilig
Ist dieser Punkt aktiviert, so versucht Kat-CeDe aus den Beschreibungsdateien FILES.BBS (und verwandte) auch mehrzeilige Informationen zu extrahieren. Da es keinen Standard gibt, wie diese Dateien auszusehen haben, klappt es leider nicht immer.

·         Zusatzinformationen
Ist dieser Punkt aktiviert, so analysiert Kat-CeDe jede einzelne Datei genauer, um eventuell erweiterte Informationen zu erhalten. Welche Informationen wie gefunden werden, wird auf einer anderen Seite eingestellt und auch erklärt.

·         Umlautwandlung
Ist dieser Punkt aktiviert, so erfährt jeder Kommentar einen Versuch einer Umlautwandlung. Eingebaut wurde dieser Punkt, um DOS-Kommentare richtig anzeigen zu können, aber es kommt dadurch leider auch manchmal zu Fehlern in der Darstellung.