linux|n00b Linux für Ein- und Umsteiger

3Jan/131

Wie viele Wörter hat mein PDF-File?

Diese Frage stellte ich mir soeben selbst, als ich den aktuellen Umfang meiner Bachelorarbeit überprüfen wollte.

Glücklicherweise gab es schon viele vor mir mit dieser Frage. So fand ich schnell eine Lösung:
http://superuser.com/questions/221359/count-words-in-pdf-file

Dort heißt es:

[arvid@c64 ~]$ pdftotext path/to/my/file.pdf - | wc -w

Ausgabe im Terminal ist schließlich die Anzahl der Wörter. Und das war's auch schon.

Wieder mal ein Hoch auf Linux, welches bereits alle Probleme gelöst hat, die ich erst noch bekommen muss. :-)

Kommentare (1) Trackbacks (0)
  1. Kleiner Nachtrag: Natürlich gibt die Zahl, die dabei herauskommt, nur einen groben Richtwert. Die genaue Anzahl Wörter ist sicherlich weitaus niedriger, weil…

    a) vieles mitgezählt wird, was eigentlich nicht zu zählen wäre.
    (Probe: echo „. . .“ | wc -w)
    b) Anhänge und dergleichen zuvor noch herausgenommen werden müssten.
    (In meinem Falle jedenfalls wäre der Anhang unerheblich.)
    c) pdftotext kein Wundermittel ist. Nicht alles ist perfekt am Ergebnis.

    Also bitte nicht einfach blind den beiden Tools „pdftotext“ und „wc“ trauen, wenn man nicht weiß, was da überhaupt rauskommt.

    Wie gesagt – für einen groben Richtwert jedoch reicht das vollkommen.


Leave a comment

Noch keine Trackbacks.