lørdag, januar 23, 2021

PDF til Excel

Daily Rush Debat Off-topic PDF til Excel

  • Forfatter
    Emne
  • #0

    Muspelheim
    Bruger
    1.205 indlæg
    Offline

    Hey folks.

    I forbindelse medm it arbejde, har jeg fået trukket en masse rapporter ud i PDF-format.

    Problemet er, at jeg meget gerne skulle kunne arbejde videre med disse data i Excel.

    Findes der en eller anden smart, (helst gratis) måde at få konverteret disse PDF-filer til Excel, hvor selve formateringen af data i kolonner stadig består ?

    Jeg kan godt få kopieret data igennem PDF Creator, men så går formateringen i udu, og al data kommer i samme felt i Excel

    Har prøvet at google mig lidt frem, men enten skal man sende pdf-filerne hvorefter de bliver bearbejdet (hvilket jeg ikke tror er en god idé da det er rigtig mange firma-relaterede data) og ellers skal man betale for et mere eller mindre obskurt program…

    På forhånd tak for hjælpen

Viser 8 kommentarer - 1 til 8 (af 8 i alt)
  • Forfatter
    Kommentarer
  • #1

    Kolben
    Bruger
    18.939 indlæg
    Offline

    Hvis du har Adobe Acrobat (ikke Adobe Acrobat Reader), så er der vist et tabel-markeringsværktøj. Kan også være at der er i nogle andre tilsvarende.

    Ellers tror jeg ikke at der findes sådan en i generel forstand. Jeg er dog ikke sikker, men jeg har lidt kendskab til pdf-strukturen, og vil gerne melde ud at jeg ALDRIG ville give mig i kast med at kode sådan en sag. Den skal bruge et kæmpe framework.

    To tricks, der kunne hjælpe:
    1)
    Brug notepad eller lignende som mellemstation når du kopierer. Dvs. kopier fra pdf til clipboard (CTRL+C), og derefter fra clipboard til notepad. Kopier derefter fra notepad til clipboard og fra clipboard til excel. Det kan indimellem trylle dataen om til et format excel kan lide.

    Et cowboy-trick kan her være at søge og erstatte mellemrum med tabulatorer i notepad inden du kopierer videre. Hvis du ikke kan få en tab direkte ind i søgefeltet, så skriv den i dokumentet og kopier den derfra og indsæt den i søgefeltet.

    2)
    Når du indsætter i excel, så højreklik på den øverste venstre celle i det område du vil indsætte i og tryk “Indsæt speciel”. Der er der nogle muligheder for at fortolke dataen forskelligt. Det virker dog ganske sjældent efter hensigten

    To råd for de øvede: Lav en parser.
    1)
    Kopier al dataen ind i en celle og brug en kombination af funktionerne MID(), LÆNGDE(), RÆKKE(), KOLONNE(), FIND(), INDIREKTE() og ADRESSE() i de respektive celler. Det kræver lidt matematisk logisk sans. Det er tit det jeg ender med, fordi det det er hurtigere end at skrive et helt program, da det tester sig selv mens man laver det

    Kopier derefter VÆRDIERNE ind i et nyt ark. Og udskift dataen i cellen med dem fra næste dokument.

    2)
    Skriv en makro i VBA, der (skam-)bruger vba-funktionen Split() og skriver de rigtige værdier ned i de rigtige celler. Split() er en vidunderlig funktion.

    Et forslag jeg ikke har forsøgt i praksis:
    Brug en pdf2text ting. Det kan være at den fortolker dokumentet anderledes end din pdf-reader kopierer. Der er en milliard varianter. Og kombineret med nogle af ovenstående tricks kan du måske have held i sprøjten.

    Et andet forslag jeg ikke har forsøgt i praksis:
    Prøv noget OCR software. Der er nogle af dem der er blevet ret skrappe til at finde ud af hvad man faktisk gerne vil have ud af dem.

    Det var hvad jeg lige kunne finde på…nu mangler det bare at derkommer en gut om 2 minutter og linker dig til et program, der kan det hele

    Nu nu hvor du har brugt tid på at søge efter løsningen, prøvet ting af, bandet, grublet og læst mit lange indlæg kan det være at du ender med at konkludere at du ville kunne have tastet skidtet ind manuelt på den halve tid

    P=NP?

    #2

    Muspelheim
    Bruger
    1.205 indlæg
    Offline

    Jeg siger mange tak for de forskellige tips Det vil jeg så bruge dagen på

    Kan allerede nu love, at jeg ikke ender med at taste det ind manuelt Der er over 180 siders pdf med tætskrevet data som skal smides over i Excel… Alternativet er at jeg sender hele lortet til Bangkok, og så må de fixe det til en løn der gør det værdigt

    #3

    gnavpot
    Bruger
    2.494 indlæg
    Offline

    Måske var det nemmere bare at trække ud i et andet format først?

    Det er jo fordi at du kører det ud i PDF at det hele er fucked up.

    Kan man ikke eksportere direkte til csv (eller ligefrem excel?)

    Hellere komme galt afsted, end slet ikke komme afsted.

    #4

    Muspelheim
    Bruger
    1.205 indlæg
    Offline

    #3 Desværre ikke.

    Jeg prøvede at finde en virtuel printer som kunne gemme i xls, men måtte give fortabt. Derfor jeg har alle data i PDF nu.

    Normalt har programmet jeg arbejder i ingen problemer med at export til excel, men lige i det billede jeg har brug for, er der selvfølgelig kun en “print” option

    #5

    tommygj
    Bruger
    325 indlæg
    Offline

    google har en anstaendig PDF to HTML konverter indbygget i gmail

    Send dine PDF til en google gmail og brug saa vis som HTML, saa burde du kunne kopiere det ud.

    Udover det, saa er PDF det vaerste format at skulle hive data ud af.

    Held og lykke.

    #6

    Jeppe
    Bruger
    1.959 indlæg
    Offline

    Søg evt. efter et gratis OCR-program. Burde kunne klare tricket.

    #7

    gnavpot
    Bruger
    2.494 indlæg
    Offline

    #4 Selfølgelig kan du ikke finde en printer der gemmer i xls…. så skulle den jo kunne opfinde alt den information som er blevet smidt væk inden dokumentet rammer printeren.

    Men de data du ser på skærmen må jo komme et sted fra. Hvis der virkelig er tale om mange data så må det da være nemmere at fremskaffe dem rigtigt istedet for at fuske med cut’n’paste, OCR eller andre måder som jo alle giver dig en kæmpe risiko for at introducere fejl.

    Hellere komme galt afsted, end slet ikke komme afsted.

    #8

    Muspelheim
    Bruger
    1.205 indlæg
    Offline

    Update.

    Fandt et trial program som jeg har fået installeret.
    Det virkede 100% efter hensigten, men krævede en del udenomsarbejde da der selvfølgelig var begrænsninger.

    Næste step er at få kontaktet IT-afdelingen og få dem til at fixe en løsning inden jeg skal bruge det næste gang

    #7

    SAP (som er programmet jeg arbejder i) har normalt en eksporter-funktion som kan smide alle formateringer osv. videre til excel. Det kunne jeg bare ikke fra det billede hvorfra jeg trak mine info.

    Måden jeg i første omgang fik data ud på anden vis, end via print, var via en virtual printer som blev installeret i windows. På den måde kunne det info SAP sendte til printeren, blive omdirigeret til et PDF-dokument. Det var denne omdirigering jeg gerne ville have haft til xls eller lign.

    #5
    Jeg vil lige kigge videre på den der gmail-løsning. Tænkte selv om man ikke kunne få det ud som en form for html, så vil da sige tag for tippet

Viser 8 kommentarer - 1 til 8 (af 8 i alt)
  • Du skal være logget ind for at kommentere på dette indlæg.