lørdag, januar 23, 2021

finde antal a bogstav i text filer

Daily Rush Debat Off-topic finde antal a bogstav i text filer

  • Dette indlæg indeholder 24 kommentarer, har 15 deltagere og blev senest opdateret af  Sven_Bent for 6 år siden.
  • Forfatter
    Emne
  • #0

    Sven_Bent
    Bruger
    25.996 indlæg
    Offline

    jeg har en bunke text filer som jeg oensker at finde hvor magne gane characterne opholde sig total i alle filer

    dvs
    hvor mange gange “a” er i lidt over 200filer
    hvor mange gange “A” osv

    jeg har dog to problemmer
    1
    der skal findes forskelle paa bogstaver som er med skraaskrif dvs hvor de er omringe af og tags for ente bogstave eller hele linine text foregaar i
    2
    linier der inderholder “–>” skal helt ignorere da det er “meta data”

    nummer 1 kan ignorers men helst ikke problme 2

    Sven Bent - Dr. Diagnostic
    www.TechCenter.DK

Viser 15 kommentarer - 1 til 15 (af 24 i alt)
  • Forfatter
    Kommentarer
  • #1

    ice_boy
    Moderator
    13.723 indlæg
    Offline

    Vidste det var en SB tråd inden jeg klikkede på den!

    #2

    photon
    Bruger
    943 indlæg
    Offline

    Prøv at kigge på regular expressions, der kan du sætte præcise søgekriterier op.

    #3

    Human
    Bruger
    4.993 indlæg
    Offline

    HVROFR ER DETTE IKKR I HARDWSRE???

    LÆG LÆgf mig

    #4

    Betjenten
    Bruger
    632 indlæg
    Offline

    Matlab vil kunne gøre det meget let. Men det er nok lige dyrt nok. Eller gratis programmeringssprog vil også sagtens kunne gør det. Python f.eks..

    Hest styres med bidsel, kone med kæp.

    #5

    sYnCHAoZ
    Bruger
    12.058 indlæg
    Offline

    Alt på nettet er gratis.

    #6

    Uranos
    Bruger
    2.240 indlæg
    Offline

    Lyder som noget der kunne laves nemt i java.

    Hvis du uddyber/renskriver “1” og linker til 1 eksempler på de filer, kan jeg se om der kommer et hul i min ellers stramme tidsplan hvor jeg kan lave det.
    (læs: det ville blive en bedre oversprings handling end at gøre rent)

    Alle har deres særheder,,

    #7

    VampiricEye
    Bruger
    26.865 indlæg
    Offline

    #5 Hvorfor kan jeg så ikke længere besøge page3.com?

    Nintendo Influencer

    På dansk: https://www.youtube.com/channel/UC-6I6HgrpYjimEpvayLu3Vg

    På engelsk: https://www.youtube.com/channel/UCNNzj5gu0Iolj4vcNIp1IUA

    #8

    Kasper Kål
    Bruger
    3.340 indlæg
    Offline

    Kan man ikke ikke bare lave en regex søgning i et tekst-program som notepad++ eller et tekstsøgningsværktøj som Agent Ransack?

    http://www.mythicsoft.com/agentransack

    The Profile Formerly Known As kring17a

    #9

    ice_boy
    Moderator
    13.723 indlæg
    Offline

    #3 Tråden passer vel bedre under programmering hvis det endelig skulle være

    #10

    Bearish
    Bruger
    525 indlæg
    Offline

    Python og http://www.nltk.org/ det brugte vi på studie til at arbejde med tekster, mener det kan det du søger.

    PSN: Bearishdk

    #11

    PBT
    Admin
    3.900 indlæg
    Offline

    Hvilken type løsning leder du efter? Uden programmering kan det givetvis løses i bash (Unix/Linux), men ellers kan det nemt klares i et hvilket som helst programmeringssprog man måtte have lyst til/mulighed for at bruge.

    Startede Daily Rush og Quake3.dk sammen med Webster i et andet årtusind

    #12

    brwnx
    Bruger
    3.609 indlæg
    Offline

    #12 batch fil selvfølgelig…

    spøg til side…det er rimelig simpelt at løse i et givent sprog..hvilken platform skal du køre det på?

    Læs det med småt

    #13

    Sven_Bent
    Bruger
    25.996 indlæg
    Offline

    #11

    Doh jeg skall kunne finde det under win7 64bit platform

    #6

    eksempel:

    29
    00:03:21,248 –> 00:03:22,840
    To keep that whiskey cold

    30
    00:03:22,916 –> 00:03:25,316
    That’s how they showed
    their respect for…

    31
    00:03:26,753 –> 00:03:28,311
    They took the white
    kid to the hospital.

    linine med –> oenskes at ingored samt linie lige over ( index tallet)

    2 2-3 liner efter et –> skal der taelles bogstaver i

    a-z A-z og tall
    andre character og special tegn behoeves ikke men skader heller ikke at blive talt

    Filerne er i unicode format.

    jeg har dog opdater at der ikke er korrekt windoswes CR/BR haandtering da aabning i notepad ikke viser linie skift. det goeres der dog under wordpad

    den bruger byte 0Ah (ASCII Linefeed) some lineskift isteader for 0Ch (ASCII carriage return

    Sven Bent - Dr. Diagnostic
    www.TechCenter.DK

    #14

    Kolben
    Bruger
    18.939 indlæg
    Offline

    Jeg forstår ikke halvdelen af hvad du skriver, men følgende bash-kommndo tæller antallet af små a’er i alle filerne i et bibliotek på linjer der ikke indeholder ->:

    cat * | grep -v “\->” | grep -o a | wc -l

    …antaget at filerne slutter med en newline.

    P=NP?

    #15

    PBT
    Admin
    3.900 indlæg
    Offline

    Du kan sikkert også lave noget á la bash-løsningen i PowerShell, som du med din interesse for batch på Windows under alle omstændigheder bør sætte dig ind i

    Startede Daily Rush og Quake3.dk sammen med Webster i et andet årtusind

Viser 15 kommentarer - 1 til 15 (af 24 i alt)
  • Du skal være logget ind for at kommentere på dette indlæg.