scan_organizer

Kategorie: SW linux tools

vom 14. 04. 2026



Du kennst das Problem:

Rechnungen, Verträge und Notizen stapeln sich – digital oder auf Papier. Paperless ist zu komplex (Docker, PostgreSQL, Redis…), Paperwork ist veraltet und schwer zu installieren. Und kommerzielle Tools kosten ein Vermögen oder binden dich an eine Cloud. Dabei brauchst du doch nur:

✅ Scannen mit einem Klick – direkt vom Scanner oder per Datei.

✅ Automatische Texterkennung (OCR) – durchsuchbare PDFs, ohne manuelles Tagging.

✅ Labels für Ordnung – z. B. „Rechnung“, „Steuer 2024“, „Vertrag“.

✅ Volltextsuche – finde jedes Dokument in Sekunden.

✅ Läuft überall – auf Ubuntu 20.04, 22.04, 24.04 (und vielen anderen Distributionen).

✅ Keine Installation nötig – eine Datei, fertig.

📄 Scan-Organizer – Download

Einfache Dokumentenverwaltung mit OCR und Labels – ohne Docker, ohne Datenbank-Stress.

🚀 Installation

Option 1: Automatisch (empfohlen)

INSTALL.sh  runterladen (Download-Link kommt demnächst)
chmod +x INSTALL.sh
./INSTALL.sh

Option 2: Manuell

  1. Abhängigkeiten installieren: sudo apt install ocrmypdf tesseract-ocr tesseract-ocr-deu sane sane-utils imagemagick
  2. Scan-Organizer herunterladen und ausführbar machen:
    scan_organizer runterladen (Download-Link oben benutzen)
    chmod +x scan_organizer
  3. Ersten Scan testen:
    ./scan_organizer --scan "device" --label "Rechnung,2024"
            device kann ermittelt werden mit:
            scanimage -L
            oder für den ersten Test ohne scanner arbeiten und eine Datei (jpg, png) benutzen:
            ./scan_organizer --file "dateiname" --label "Rechnung,2024"
            

🔄 Vergleich mit Alternativen

Tool Scan-Organizer Paperless-ngx Paperwork Kommerzielle Tools
Einrichtung ✅ 5 Minuten ❌ Docker, PostgreSQL, Redis ❌ Veraltet, schwer zu installieren ❌ Cloud-Zwang, Abo
Abhängigkeiten ocrmypdf, tesseract-ocr Docker, PostgreSQL, Redis Python 2.7, GTK Proprietär
Größe ✅ 36 KB ❌ ~500 MB ❌ ~100 MB ❌ –
Preis ✅ Kostenlos (Kaffespende?) Kostenlos Kostenlos ❌ €€€
Datenhoheit ✅ 100% lokal Lokal Lokal ❌ Cloud-Zwang

Kurzbeschreibung

Befehl Beschreibung
./scan_organizer --scan 'escl:http://192.168.178.37:80' Scannt vom Scanner mit dieser IP und speichert
./scan_organizer --scan brother --source ADF Scannt vom Brother-Scanner mit ADF (Automatischer Dokumenteneinzug).
./scan_organizer --scan --pdf_dir "Rechnungen/2026" Scannt und speichert die PDF in ~/dokumente/Rechnungen/2026/.
./scan_organizer --file rechnung.jpg --label "Rechnung" Verarbeitet eine existierende Datei (JPG/PNG) mit Label.
./scan_organizer --file rechnung.jpg --pdf_dir "Verträge" Verarbeitet eine Datei und speichert die PDF in ~/dokumente/Verträge/.
./scan_organizer --search "Muster AG" Durchsucht alle Dokumente nach dem Begriff.
./scan_organizer --version Zeigt die Versionsinformationen an.
./scan_organizer --help Zeigt die Hilfeseite mit allen Optionen an.

📂 Ordnerstruktur


~/scans/               # Gescannte Bilder (JPG/PNG)
~/dokumente/           # Durchsuchbare PDFs
   ├── Rechnungen/
   │   └── 2026/       # Beispiel für --pdf_dir
   └── documents.db     # SQLite-Datenbank mit Metadaten

🔧 Problembehebung

Problem Lösung
Scanner wird nicht erkannt Prüfe mit scanimage -L. Installiere ggf. Treiber (z. B. sudo apt install brother-lpr-drivers für Brother).
OCR-Fehler Installiere ocrmypdf und tesseract-ocr: sudo apt install ocrmypdf tesseract-ocr tesseract-ocr-deu.
Datenbank-Fehler Prüfe Schreibrechte: touch ~/dokumente/documents.db.
Kein Text erkannt Prüfe die Bildqualität oder erhöhe die Auflösung: --resolution 600.
--pdf_dir funktioniert nicht Stelle sicher, dass der Zielordner existiert: mkdir -p ~/dokumente/Rechnungen/2026.

Geheimtip:

einmalig:

 sudo apt install newt-whiptail  
dann:
./scan_organizer
(ohne argumente)

💬 Feedback & Unterstützung

Falls du Fragen hast oder Feedback geben möchtest, schreib mir eine E-Mail an bernhard@bit-field.de.

🔓 Source-Code

Der Source-Code wird in Kürze veröffentlicht. Bis dahin kannst du die kompilierte Version (11 KB) nutzen. Falls du dringend den Code brauchst, schreib mir eine E-Mail an bernhard@bit-field.de.

Es gibt viele Erweiterungsmöglichkeiten: graphische Benutzeroberfläche, API, web-Oberfläche, Suchfunktionen,...
Wir werden diese Stück für Stück veröffentlichen.

Titelbildquelle: Yaru


Sende uns Deinen Kommentar

... because software matters