lørdag, januar 23, 2021

finde antal a bogstav i text filer

Daily Rush Debat Off-topic finde antal a bogstav i text filer

  • Dette indlæg indeholder 24 kommentarer, har 15 deltagere og blev senest opdateret af  Sven_Bent for 6 år siden.
  • Forfatter
    Emne
  • #0

    Sven_Bent
    Bruger
    25.996 indlæg
    Offline

    jeg har en bunke text filer som jeg oensker at finde hvor magne gane characterne opholde sig total i alle filer

    dvs
    hvor mange gange “a” er i lidt over 200filer
    hvor mange gange “A” osv

    jeg har dog to problemmer
    1
    der skal findes forskelle paa bogstaver som er med skraaskrif dvs hvor de er omringe af og tags for ente bogstave eller hele linine text foregaar i
    2
    linier der inderholder “–>” skal helt ignorere da det er “meta data”

    nummer 1 kan ignorers men helst ikke problme 2

    Sven Bent - Dr. Diagnostic
    www.TechCenter.DK

Viser 9 kommentarer - 16 til 24 (af 24 i alt)
  • Forfatter
    Kommentarer
  • #16

    Atheist
    Bruger
    4.877 indlæg
    Offline

    Du kan lave en regex-søgning på hele mapper i sublime text.

    Jeg er ikke helt sikker på, hvad dit krav #1 er, men #2 kan rimelig nemt klares med
    noget regex.

    Growing old is mandatory, groving up is optional.

    #17

    Sven_Bent
    Bruger
    25.996 indlæg
    Offline

    jeg tager for alle forslag og giver mig igang her i weekende. desvarre blive min statis nu ligegyldig da sortering i OCR databassen kommer til at have en mindre betydning da der kom en bedre ide paa banen med brug an en lille mini cache databaseer sidst (mest?) bruge tegn

    reelt se skulle jeg se hvilke bogstaver det optraeds flest gange sa de kunne ligges forest i databasen og derved findes hurtigst. men med cachen bliver der naesten ligegyldig da cachen vil indeholde storset alle opslag der bruges per fil

    Sven Bent - Dr. Diagnostic
    www.TechCenter.DK

    #18

    Uranos
    Bruger
    2.240 indlæg
    Offline

    hmm men nu blev jeg jo lige færdig

    https://dl.dropboxusercontent.com/u/13797033/CharCount.jar

    burde virke, hvis ellers java læser de linjeskift der ikke blev vist i notepad

    Alle har deres særheder,,

    #19

    Lump
    Bruger
    240 indlæg
    Offline

    Hvis bogstaverne hælder, så er det ofte betegnet som “Italic”, hvor “skråskrift” er en hel skriftype familie.

    #20

    Sven_Bent
    Bruger
    25.996 indlæg
    Offline

    #19 men hvad er den danske udgave af italic da italic jo er hvad det kaldes paa engelsk

    #18 takker alligevel og prover det lige.
    kan altid vare det hjalper pa millimeter performance. cache skal jeg ogsaa fyldes op

    — edit —
    GDAMN det gik sgu smart og staerkt

    hmm punktum optraeder ca 4 gange sa ofte som komma i undertecter
    – og / forkommer stor set ens.

    og ser ud til at ignore metatags lininer

    Sven Bent - Dr. Diagnostic
    www.TechCenter.DK

    #21

    PBT
    Admin
    3.900 indlæg
    Offline

    #20 Kursiv

    Startede Daily Rush og Quake3.dk sammen med Webster i et andet årtusind

    #22

    Uranos
    Bruger
    2.240 indlæg
    Offline

    hmm har ikke taget højde for kursiv, og ved heller ikke lige hvordan jeg skulle gribe det an.

    men linjer med –> ignoreres samt linjen før en pil.

    hvis det har interesse så sker optællingen det i countIt()
    https://dl.dropboxusercontent.com/u/13797033/ThePanel.java

    Alle har deres særheder,,

    #23

    PBT
    Admin
    3.900 indlæg
    Offline

    Altså hvis det er rene tekstfiler, er der jo ikke noget kursiv Var det ikke bare noget SB satte ind, for at fremhæve hvilke linjer, han er interesseret i?

    Startede Daily Rush og Quake3.dk sammen med Webster i et andet årtusind

    #24

    Sven_Bent
    Bruger
    25.996 indlæg
    Offline

    #21
    DOH… jeg takker for info

    #22 det er heller ikke saa vigtig igen
    hovedsagen var bogstaver og tal. dvs de tegn som optrader mest

    #23 helt orrekt er det srt filer. men det er storset bare en text fil med de og html tags og lidt timecode meta data

    Sven Bent - Dr. Diagnostic
    www.TechCenter.DK

Viser 9 kommentarer - 16 til 24 (af 24 i alt)
  • Du skal være logget ind for at kommentere på dette indlæg.