vom 14. 04. 2026
Rechnungen, Verträge und Notizen stapeln sich – digital oder auf Papier. Paperless ist zu komplex (Docker, PostgreSQL, Redis…), Paperwork ist veraltet und schwer zu installieren. Und kommerzielle Tools kosten ein Vermögen oder binden dich an eine Cloud. Dabei brauchst du doch nur:
✅ Scannen mit einem Klick – direkt vom Scanner oder per Datei.
✅ Automatische Texterkennung (OCR) – durchsuchbare PDFs, ohne manuelles Tagging.
✅ Labels für Ordnung – z. B. „Rechnung“, „Steuer 2024“, „Vertrag“.
✅ Volltextsuche – finde jedes Dokument in Sekunden.
✅ Läuft überall – auf Ubuntu 20.04, 22.04, 24.04 (und vielen anderen Distributionen).
✅ Keine Installation nötig – eine Datei, fertig.
Einfache Dokumentenverwaltung mit OCR und Labels – ohne Docker, ohne Datenbank-Stress.
INSTALL.sh runterladen (Download-Link kommt demnächst)
chmod +x INSTALL.sh
./INSTALL.sh
scan_organizer runterladen (Download-Link oben benutzen)
chmod +x scan_organizer
./scan_organizer --scan "device" --label "Rechnung,2024"
device kann ermittelt werden mit:
scanimage -L
oder für den ersten Test ohne scanner arbeiten und eine Datei (jpg, png) benutzen:
./scan_organizer --file "dateiname" --label "Rechnung,2024"
| Tool | Scan-Organizer | Paperless-ngx | Paperwork | Kommerzielle Tools |
|---|---|---|---|---|
| Einrichtung | ✅ 5 Minuten | ❌ Docker, PostgreSQL, Redis | ❌ Veraltet, schwer zu installieren | ❌ Cloud-Zwang, Abo |
| Abhängigkeiten | ocrmypdf, tesseract-ocr | Docker, PostgreSQL, Redis | Python 2.7, GTK | Proprietär |
| Größe | ✅ 36 KB | ❌ ~500 MB | ❌ ~100 MB | ❌ – |
| Preis | ✅ Kostenlos (Kaffespende?) | Kostenlos | Kostenlos | ❌ €€€ |
| Datenhoheit | ✅ 100% lokal | Lokal | Lokal | ❌ Cloud-Zwang |
| Befehl | Beschreibung |
|---|---|
| ./scan_organizer --scan 'escl:http://192.168.178.37:80' | Scannt vom Scanner mit dieser IP und speichert |
| ./scan_organizer --scan brother --source ADF | Scannt vom Brother-Scanner mit ADF (Automatischer Dokumenteneinzug). |
| ./scan_organizer --scan --pdf_dir "Rechnungen/2026" | Scannt und speichert die PDF in ~/dokumente/Rechnungen/2026/. |
| ./scan_organizer --file rechnung.jpg --label "Rechnung" | Verarbeitet eine existierende Datei (JPG/PNG) mit Label. |
| ./scan_organizer --file rechnung.jpg --pdf_dir "Verträge" | Verarbeitet eine Datei und speichert die PDF in ~/dokumente/Verträge/. |
| ./scan_organizer --search "Muster AG" | Durchsucht alle Dokumente nach dem Begriff. |
| ./scan_organizer --version | Zeigt die Versionsinformationen an. |
| ./scan_organizer --help | Zeigt die Hilfeseite mit allen Optionen an. |
~/scans/ # Gescannte Bilder (JPG/PNG)
~/dokumente/ # Durchsuchbare PDFs
├── Rechnungen/
│ └── 2026/ # Beispiel für --pdf_dir
└── documents.db # SQLite-Datenbank mit Metadaten
| Problem | Lösung |
|---|---|
| Scanner wird nicht erkannt | Prüfe mit scanimage -L. Installiere ggf. Treiber (z. B. sudo apt install brother-lpr-drivers für Brother). |
| OCR-Fehler | Installiere ocrmypdf und tesseract-ocr: sudo apt install ocrmypdf tesseract-ocr tesseract-ocr-deu. |
| Datenbank-Fehler | Prüfe Schreibrechte: touch ~/dokumente/documents.db. |
| Kein Text erkannt | Prüfe die Bildqualität oder erhöhe die Auflösung: --resolution 600. |
| --pdf_dir funktioniert nicht | Stelle sicher, dass der Zielordner existiert: mkdir -p ~/dokumente/Rechnungen/2026. |
einmalig:
sudo apt install newt-whiptail
dann: ./scan_organizer
(ohne argumente)
Falls du Fragen hast oder Feedback geben möchtest, schreib mir eine E-Mail an bernhard@bit-field.de.
Der Source-Code wird in Kürze veröffentlicht. Bis dahin kannst du die kompilierte Version (11 KB) nutzen. Falls du dringend den Code brauchst, schreib mir eine E-Mail an bernhard@bit-field.de.
Es gibt viele Erweiterungsmöglichkeiten: graphische Benutzeroberfläche, API, web-Oberfläche, Suchfunktionen,...Titelbildquelle: Yaru
... because software matters