Dokumente und Belege mit paperless-ngx flexibel pflegen und handhaben

in  Verschiedenes , , ,

Dokumente und Belege mit paperless-ngx flexibel pflegen und handhaben

Das papierlose Büro war bislang ein Traum, den wir aus Gründen der revisionssicheren Archivierung noch nicht gelebt haben. Durch einen Artikel bin ich jedoch vor ein paar Wochen auf das Open Source Projekt paperless-ngx aufmerksam geworden und hatte mir vorgenommen: bei nächster Gelegenheit tauche ich dort einmal ein und schaue mir das näher an.

Was ist und kann das Tool?

Es handelt sich um eine Dokumentenverwaltung, die per Standard einfach via Docker Compose ausgeführt werden kann. Zur Speicherung der Daten können unterschiedliche Backends verwendet werden, empfohlen wird für normale Anwendungsfälle PostgreSQL.

Zu den Kernfunktionen zählen unter anderem folgende Features:

  • Dokumente über unterschiedliche Wege einstellen; zum Beispiel durch Kopieren in ein Verzeichnis, Upload über die Web-UI, Abruf von E-Mails oder eine REST API.
  • Dokumente anhand unterschiedlicher Kriterien (Dokumentarten, Tags, Korrespondenten) klassifizieren und in beliebigen Dateipfaden/-strukturen ablegen. Hierdurch sind auch Sicherungen der Daten einfach zu realisieren.
  • Dokumente anhand vielfältiger Such-/Filterkriterien selektieren und in unterschiedlichen Ansichten darstellen.
  • Möglichkeiten zur Bearbeitung und Massenänderung.
  • Extraktion und Indizierung der enthaltenen Inhalte (z. B. bei PDFs, Word, Excel, PowerPoint und LibreOffice).
  • Automatische Klassifikation neuer Dokumente anhand von Vorgaben oder automatischer Mustererkennung.

Erste Versuche und Erfolge

Der Start mit dem Werkzeug gestaltet sich schnell und einfach. Die ersten Testdokumente habe ich einfach per Drag n Drop in die Weboberfläche geschoben; im Nu waren sie eingespielt und konnten via Volltextsuche gefiltert werden. Nachdem ich ein paar erste Tags und Dokumentarten erstellt und zugeordnet hatte, konnten auch diese zum Filtern verwendet werden. Nett ist hier auch die Möglichkeit, eine eingestellte Reihe an Filtern als Ansicht zu speichern um sie jederzeit wieder öffnen zu können: entweder als Link im seitlichen Menü oder als Dashlet auf der Startseite, welches immer die passenden Dokumente direkt auflistet.

Ebenfalls testen wollte ich andere bzw. automatisierbare Möglichkeiten zum Einstellen der Dokumente. Also habe ich mit dem Drucker ein Dokument gescannt und es an meine Mailadresse senden lassen. In paperless-ngx lassen sich Mailkonten und darauf aufbauende Regeln definieren, welche vorgeben, unter welchen Umständen eine E-Mail in welcher Form verarbeitet werden soll. Alle 10 Minuten wird das enstprechende Postfach abgerufen und nach neuen Daten durchsucht. Auch das hat problemlos funktioniert. Das ist natürlich perfekt für Fälle, in denen man zum Beispiel regelmäßig Rechnungen per Mail zugesendet bekommt. Eine entsprechende Regel über Absender, Betreff und/oder Inhalt erstellen und schon landen diese Rechnungen fortan in der Dokumentenverwaltung.

Man kann alternativ auch den consume-Ordner im Netzwerk freigeben und den Drucker das gescannte Dokument dort ablegen lassen. Das habe ich noch nicht ausprobiert, ist aber für den Fall, dass Papier eingescannt werden soll, noch mehr straight forward, da der Umweg über das Postfach entfällt und die Daten somit das eigene Netzwerk gar nicht erst verlassen (auch wenn es in dem Fall mein eigener Mailserver ist).

Über die Einstellungen der Web-UI gelangt man auch in die dahinter stehende Administration. Gemeinsam mit der Dokumentation (am Ende dieses Beitrags verlinkt) festigt sich der Eindruck, dass das Projekt nicht nur gereift ist, sondern auch noch erheblich mehr in der Hinterhand hat, was über die via UI einstellbaren Möglichkeiten hinausgeht.

Workflow mit physischen Dokumenten

Ein für uns sehr wichtiger Bestandteil des Workflows ist die Möglichkeit, die Dokumente in paperless-ngx mit den zu Grunde liegenden Papieren zu verknüpfen (sofern das Papier aufgehoben werden sollte). Hierzu wird jeweils eine fortlaufende ASN (archive serial number) generiert, die dann vor dem Scanvorgang auf das Papier geschrieben wird. Die Papiere werden dann einfach sortiert nach ASN in einem Ordner abgeheftet; sobald der Ordner voll ist, landet er im Keller oder auf dem Speicher. Braucht man einmal den Originalbeleg, gibt die eingescannte Variante direkt Aufschluss über die benötigte ASN, die dann anhand der Sortierung in den abgelegten Papierdokumenten schnell gefunden werden kann. So kann das papierlose Büro bzw. die papierlose Wohnung mit einer Langzeitarchivierung optimal in Einklang gebracht werden.

Ausblick

Nachdem die ersten Tests sehr vielversprechend gelaufen sind, werden wir im nächsten Schritt die produktive Adaption des Tools planen. Hierzu wollen wir uns insbesondere darüber Gedanken machen, wie wir unsere Dokumente klassifizieren, wie unser Workflow konkret ausgestaltet werden soll usw. usf.

Für tiefgehende Integrationen ist sicherlich auch die erwähnte REST API interessant - erlaubt sie doch auch das programmatische Einstellen beliebiger Dokumente, zum Beispiel aus einem Webshop heraus. Solche Dinge werden wir aber erst on demand genauer anschauen.

Weitere Informationen

Die erste Anlaufstelle zu dem Projekt befindet sich unter https://docs.paperless-ngx.com/ - das dazugehörige GitHub-Projekt kann unter https://github.com/paperless-ngx/paperless-ngx erreicht werden.