Zum Hauptinhalt springenZur Hauptnavigation springen

Installation und Einrichtung von Gotenberg und Tika für paperless-ngx

Gotenberg und Tika für paperless-ngx
Veröffentlicht am 23.3.2025
Proxmox

Empfohlene Produkte

📦 Das könnte dir gefallen

Ausgewählte Empfehlungen für dein Smart Home Projekt

Lädt Produkte... (smartswitch → wifi)

In diesem Artikel möchten wir euch zeigen, wie ihr die PDF-Konvertierung (Gotenberg) und die Dokumentenanalyse (Apache Tika ) für paperless einrichten könnt.

Insbesondere für diejenigen, die paperless als Bare-Metal-Variante (ohne Docker) installiert haben.

Bei einer Installation mittels Docker, können hier die Pakete, falls nicht vorhanden, so nachträglich hinzugefügt werden.

Für alle anderen gilt dieser Weg:

Zuerst wird das System aktualisiert und die notwendigen Pakete installiert.

1 2 sudo apt update && sudo apt upgrade -y sudo apt install -y ca-certificates curl wget

Docker installieren

1 2 3 4 5 6 7 8 9 10 11 # GPG-Schlüssel für Docker hinzufügen sudo install -m 0755 -d /etc/apt/keyrings sudo curl -fsSL https://download.docker.com/linux/debian/gpg -o /etc/apt/keyrings/docker.asc sudo chmod a+r /etc/apt/keyrings/docker.asc # Docker-Repository einfügen echo "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.asc] https://download.docker.com/linux/debian $(. /etc/os-release && echo "$VERSION_CODENAME") stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null # Paketlisten aktualisieren und Docker installieren sudo apt update sudo apt install -y docker-ce docker-ce-cli containerd.io docker-compose-plugin docker-compose

Paperless Konfiguration anpassen

Damit Paperless Gotenberg und Tika nutzen kann, müssen die Konfigurationswerte in /opt/paperless/paperless.conf gesetzt werden.

Also mit nano die Tika und Gotenberg-Variablen anpassen:

1 <code>nano /opt/paperless/paperless.conf
1 2 3 PAPERLESS_TIKA_ENABLED=true PAPERLESS_TIKA_ENDPOINT=http://0.0.0.0:9998 PAPERLESS_TIKA_GOTENBERG_ENDPOINT=http://0.0.0.0:3000

Zusätzlich muss die paperless-consumer-Systemd-Unit angepasst werden:

1 <kbd>nano /etc/systemd/system/paperless-consumer.service</kbd>:
1 EnvironmentFile=/opt/paperless/paperless.conf

Bevor die systemd-Dienste eingerichtet werden, können die Container getestet werden:

1 docker run --restart=always -p 3000:3000 -d --name gotenberg gotenberg/gotenberg:latest gotenberg --chromium-disable-javascript=true --chromium-allow-list="file:///tmp/.*"
1 docker run --restart=always -p 9998:9998 -d --name tika apache/tika:latest

Falls alles läuft, können die Container gestoppt und die systemd-Dienste eingerichtet werden.

1 2 docker stop gotenberg tika docker rm gotenberg tika

Damit Gotenberg und Tika automatisch mit dem System starten, werden wir einen systemd-Dienst erstellen.

1 <kbd>nano /etc/systemd/system/gotenberg.service</kbd>:
1 2 3 4 5 6 7 8 9 10 11 [Unit] Description=Gotenberg PDF-Konvertierungsdienst After=network.target [Service] ExecStart=/usr/bin/docker run --rm --name gotenberg -p 3000:3000 gotenberg/gotenberg:latest gotenberg --chromium-disable-javascript=true --chromium-allow-list="file:///tmp/.*" Restart=always [Install] WantedBy=multi-user.target EOF
1 <kbd>nano /etc/systemd/system/tika.service</kbd>:
1 2 3 4 5 6 7 8 9 10 11 [Unit] Description=Tika Dokumentenanalyse-Dienst After=network.target [Service] ExecStart=/usr/bin/docker run --rm --name tika -p 9998:9998 apache/tika:latest Restart=always [Install] WantedBy=multi-user.target EOF

Dienste aktivieren und starten

1 2 3 sudo systemctl daemon-reload sudo systemctl enable gotenberg tika paperless-consumer sudo systemctl start gotenberg tika paperless-consumer

Den Status der Dienste prüfen

1 systemctl status gotenberg tika paperless-consumer --no-pager

Nach diesen Schritten sind Gotenberg und Tika als Docker-Container eingerichtet und werden automatisch von systemd verwaltet. Paperless kann nun neben PDFs auch andere Dateien (xlsx, docx, etc..) mit Gotenberg konvertieren und mit Tika analysieren.


Wer möchte, der kann sich auch diesen ganzen Weg als fertiges Script herunterladen und ausführen.

1 2 3 4 wget https://ktamazons3.s3.eu-central-1.amazonaws.com/shys/gotenberg_tika_paperless.sh chmod +x gotenberg_tika_paperless.sh ./gotenberg_tika_paperless.sh

Shopping-Empfehlungen

Passende smartswitch-Produkte

Weitere empfohlene Produkte für dein Smart Home

Lädt Produkte... (smartswitch → wifi)

Artikel teilen

Teilen: