Text
Processor

Zum Transformieren von Text gibt es bereits zahlreiche Werkzeuge. Leider sind viele dieser Werkzeuge sehr kompliziert in der Anwendung und erfordern das Beherrschen von Konzepten wie Regular Expressions. Das Ziel in dieser Projektarbeit war die Entwicklung einer einfacherer Möglichkeit. Der Anwender oder die Anwenderin definiert anhand mehrerer Beispiele, wie eine Transformation aussieht. Der TextProcessor erkennt dabei in vielen Fällen automatisch die Struktur des Textes und kann die gewünsche Transformation dann automatisch anwenden.

Beispiel

Die Ausgangslage in diesem Beispiel ist eine Liste von Emailadressen:

fritz@gmail.com

rene@hotmail.de

andrea@gmx.com

urs@bluewin.ch

Die Daten sollen so transformiert werden, dass nur alles vor dem “@“-Zeichen angezeigt werden soll. Die gewünschte Ausgabe ist also:

fritz

rene

andrea

urs

So wird diese Transformation im TextProcessor definiert:

Schritt 1: Daten in das Tool kopieren

Die Liste der Emailadressen wird im Tool erfasst

Schritt 2: Trenn-Zeichen für die Daten auswählen

Hier wird definiert, wie die einzelnen Datensätze voneinander getrennt sind. In diesem Beispiel handelt es sich um einen Zeilenumbruch (line break). In einigen Fällen kann das Tool das Trennzeichen selbstständig aus den Daten erkennen.

Schritt 3: Erfassen der Datenstruktur

Im nächsten Schritt wird definiert, welches Muster den Daten zugrunde liegt. In diesem Fall haben die einzelnen Einträge das Muster <name>@<domain>. In manchen Fällen kann das Tool das Muster in den Daten selbstständig erkennen.

Schritt 4: Beispieltransformation 1

Als nächstes wird dem Tool anhand von Beispielen beigebracht, wie der Text transformiert werden soll. In diesem Beispiel wird der Text “rene@hotmail.de” als Ausgangslage verwendet. Der gewünschte Output ist hier “rene

Schritt 5: Beispieltransformation 2

In der Regel müssen mehrere Beispiele erfasst werden, bis sich das Tool sicher ist, das Muster der Transformation richtig erkannt zu haben. In diesem Beispiel genügen zwei Beispieltransformationen.

Schritt 6: Resultat

Am Ende transformiert das Tool Zeile für Zeile und gibt das Resultat auf dem Bildschirm aus.