Ein bestimmtes Datum aus einem durchsuchbaren pdf zu extrahieren. Beispielsweise zur Umbenennung von Dateinamen ist leider gruselig. Hier reichen die Möglichkeiten mit neuestem, oder jüngstem Datum oder den anderen wenigen Möglichkeiten in den SmartRules kaum aus und die Ergebnisse sind z.T. sehr unbefriedigend.
Das ähnliche hier:
Wenn ich ein OCR pdf habe, wie könnte ich den höchsten Preis der Ware finden (bei mir in Euro), da ja durch die Angaben mit Nettopreisen und den Steuern meist doch einige unterschiedliche Beträge auf Rechnungen sind. Ich würde gerne automatisiert den Bruttopreis übernehmen und zum Beispiel in meine Metadaten automatisch übernehmen?
Ich habe verstanden, dass sich die Möglichkeiten zum Beispiel mit RegEx hier sehr stark potenzieren lassen, aber als Nicht-Programmierer werden die Fragezeichen bei der Lektüre hier und an anderen Stellen eher größer als kleiner werden, es scheint schon sehr speziell, Zumal man ja wahrscheinlich die meisten Sachen mit „Schlüsselwort xy“, oder "Phrase xy“ im Abstand oder Nähe zu meinem gesuchten Ausdruck von XX Wörtern oder Silben oder Zeilen irgendwie zu fassen sein müssten.
Gibt es nicht eine Art “universelle RegEx“ Suchzeile, welche man sich auch als Laie einfach umbauen kann oder könnte man die Probleme nicht auch in einfach verständliche Regeln packen?
Gerade komme ich mir wie Vettel vor… fahre ein Megaauto mit was weis für unglaublichen Möglichkeiten, aber ich finde den TURBO Knopf nicht…
Vieleicht waren es jetzt zu viele Sachen, aber da knabbere ich schon seit meinem Einstieg im Januar rum und es lähmt mich.
Ein Dank an alle die sich diese „Arie der Tränen“ angelesen hat (natürlich nicht so ganz ernst gemeint).
CU Alex
Übersetzt mit DeepL:
Extract a specific date from a searchable pdf. For example renaming file names is unfortunately scary. Here the possibilities with the newest, or most recent date or the other few possibilities in the SmartRules are hardly sufficient and the results are sometimes very unsatisfactory.
The similar one here:
If I have an OCR pdf, how could I find the highest price of the goods (in my case in Euro), since the information with net prices and the taxes usually result in some different amounts on invoices. I would like to automatically take over the gross price and for example automatically transfer it to my meta data?
I have understood that the possibilities can be potentiated very much, for example with RegEx, but as a non-programmer, the question marks will become bigger rather than smaller when reading here and in other places, it seems to be very special, especially since you probably would have to be able to somehow grasp most things with “keyword xy”, or “phrase xy” in the distance or proximity to my searched expression of XX words or syllables or lines.
Isn’t there some kind of “universal RegEx” search line, which even a layman can easily modify, or couldn’t I put the problems into easy to understand rules?
Right now I feel like Vettel… driving a mega car with what incredible possibilities, but I can’t find the TURBO button…
Maybe it was too many things now, but I’ve been nibbling since I started in January and it paralyzes me.
Thanks to everyone who read this “Aria of Tears” (of course not really meant that seriously).
CU Alex