mandag, oktober 14, 2019

DeepMind AI + StarCraft 2

Daily Rush Debat Off-topic DeepMind AI + StarCraft 2

  • Forfatter
    Emne
  • #0

    3nickma
    Bruger
    4.316 indlæg
    Offline

    Googles DeepMind AI projekt prøver at takle StarCraft 2 i morgen kl. 18 GMT.

    TeamLiquid annoncering

    DeepMind og Blizzard annoncerer samarbejde

    DeepMind research paper

    DeepMind Neural Network AI’en har tidligere lært sig selv at spille Go, og har slået verdens bedste Go spillere. Samt det har lært sig selv at spille skak, og slå den regerende mester StockFish. Selvom en del skakspillere “protesterer” lidt mod vilkårene.

    Jeg har set Netflix dokumentaren omkring DeepMind og deres Go udfordring, og det var skræmmende spændende

    Er sku pænt spændt på hvad de vil demonsterer i morgen, for kunne ikke forestille mig de ville fremvise noget negativt om dem selv! Bliver spændende at se hvor showmatch agtigt det er, eller om det er nogle reelle kampe.

    • Dette indlæg blev ændret for 8 måneder, 3 uger siden af  3nickma.
Viser 15 kommentarer - 31 til 45 (af 47 i alt)
  • Forfatter
    Kommentarer
  • #31

    klingest
    Bruger
    816 indlæg
    Offline

    #28 De har netop bygget noget insane!! Det er fanme sindsygt, at man kan lave en AI der overlegent kan vinde over nogle af verdens bedste starcraft 2 spillere, og så kan det godt være, at han vandt i den sidste kamp, men han havde også haft mulighed for at lære af den (han brugte selv nogle af de strategier den tidligere havde brugt imod ham selv), og det kunne let være gået galt for ham.

    Du lyder som om, at du tror det er nemt at lave en bot der kender en masse strategier, og som kan lære at lave “insane” micro. Måden Deepmind er programmeret på er fundamentalt anderledes end almindelig kunstig intelligens.
    Almindelige AI’er er “hard coded”. Dvs, de følger nogle faste regler som programmøren har skrevet i programmet. Denne (Deep mind, /red.) her form for AI er revolutionerende ved, at den selv lærer hvordan man spiller på bedst mulige måde. Den vil være dårlig til at starte med, men efter kort tid vil den have lært hvordan man spiller perfekt, og vil dermed være uovervindelig. Forskellen er, at den lærer langt hurtigere end mennesker. Folkene bag siger selv, at den på få uger har lært hvordan man spiller starcraft på et niveau der svarer til 200 års erfaring. Det skal man nok tage med et gran salt, men det er samtidig ikke helt urealistisk.

    Yoda - "Beware of the dark side... The dark side leads to fear. Fear leads to anger. Anger leads to hate. Hate leads to suufferiiing!!"

    #32

    Ixnatifual
    Bruger
    2.128 indlæg
    Offline

    #31 Jeg vil tro de 200 år er hvad det nogenlunde vil svare til, hvis en menneskelig spiller skulle spille et tilsvarende antal spil som det, AIen kan nå at spille på en uge. Til gengæld tror jeg et menneske vil være i stand til at få et betydeligt større læringsmæssigt udbytte fra de enkelte spil end AIen kan.

    #33

    FIRESTORM
    Bruger
    5.070 indlæg
    Offline

    #31 jeg ved rimelig meget om feltet uden at være ekspert, har selv skrevet neurale netværk på uni. Nej jeg er ikke imponeret, de har ikke opfundet noget banebrydende inden for deeplearning de har fået Blizzard til at lave en version af spillet der kan styres af en AI også har de ellers trænet på samme facon som med Alpha go, more or less, de har sikkert lavet en masse tweaks, men igen ikke noget banebrydende (de nævner også at de anvender LSTM hvilket er standard inden for feltet). Jeg vil tro et hvilket som helst AI team ved en af de store techgiganter kunne have udført det samme, hvis de havde fået tid og penge til det (de fleste andre er dog mere optaget af at løse rigtige problemer). Jeg glæder mig mest til at se om de tager dette som en sejr eller de træner videre og laver en bot der kan klare alle maps og alle racer, hvis de gør det med succes er jeg mere imponeret, plus de skal gøre det med den version mana slog, at de har fuld view og intet camera management er en kæmpe fordel imo.

    Derudover vil jeg se en en agent der overbevisende gentagne gange kan slå en pro. Jeg er overbevist om at hvis mana kunne spille eller se replays med de forskellige bots så kan han sagtens finde svagheder som vi så i sidste kamp han kan udnytte. Jeg tror f.eks. ikke botten havde styr på hvis mana havde expanded til en ukonventiel base, det virkede heller ikke som om botten var god til tech switch. Tilgengæld var den klart bedre til Micro hvilket igen måske ikke er så underligt når den laver alt input digital og den rigtige spiller har en mus og et keyboard. Derfor er deres argumentation med APM også lidt wierd, fordi det er fint nok at have 300+ APM men ingen pro player sætter alle 300 actions perfekt det er noget problem for botten at lave de syge micro moves, igen og igen.

    Når det så er sagt er det god underholdning og jeg takker deepmind for at have brændt nogle millioner USD af på projektet – det var meget seværdigt – så håber de laver en bot der kan spille med i en rigtig pro turneringen

    #34

    Krael
    Bruger
    2.361 indlæg
    Offline

    #29

    Deepmind vandt over TLO 5-0 i ganske overbevisende stil. De viste kun 3 ud af 5 replays, men her var det tydeligt, det forskellige “agents”, kunne formulere forskellige strategier baseret på de kampe, de allerede havde erfaring med at spil.

    Deepmind vandt over MaNa 5-0 igen i overbevisende stil. Her var det især Oracle harass og en fuldstændig vanvittig blink-stalker micro i flere af kampene, der gjorde forskellen.

    Herefter var der en livematch hvor MaNa vandt efter at have været en lille smule bagud. Han identificerer at AIen bruger “f2” til at flytte mange af sine units med og begynder herefter at harasse Deepminds mineral-line i hans main. Deepmind rykker sine stalkers frem og tilbage hele tiden, hvilket giver MaNa frit spil til at harasse et par gange. I mellemtiden bygger Deepmind Oracles og sender disse ud for at “holde øje” med hans harass Warp Prism. Bagved har MaNa bygget masser af stalker/Immortals/chargelots han bruger til at pushe ind og vinde med.

    Det var et godt eksempel på, hvordan du kan exploite en AI.

    En anden vigtig ting at nævne i den sidste kamp er, at da MaNa begynder at ødelægge Deepminds base “tør” Deepmind ikke engage med sin hær, hvilket betyder, MaNa har et langt frit spil til virkelig at gøre megen skade.

    Der var et andet eksempel i en af de andre kampe på, hvor AIen har udviklet en grad af “forsigtighed” der virkelig sætter den i en dårlig position efter ellers at have været længere foran. (Den vandt nu alligevel).

    Det var faktisk et virkeligt spændende program og jeg glæder mig personligt til at se noget mere.

    Jeg savnede at se Deepmind spillede mod andre races dog.

    #35

    Kwanza
    Bruger
    5.396 indlæg
    Offline

    Jeg forstår ikke, hvad forskellen er, på om AI’en skal styre sit fokus eller har zoomet ud og styrer hele mappet derfra.

    Selv hvis AI’en ikke er zoomet ud, ved den så ikke med det samme, hvor den skal tage forskellige handlinger og hvor på kortet den skal gøre det? og kan gå fra sted til sted instantly via minimappet? Dens præcision med en musemarkør er vel perfekt, så hvad er forskellen?

    #36

    SapowiTz
    Bruger
    1.875 indlæg
    Offline

    #35 jeg går ud fra at AI’en i de første 10 games kunne “overskue” hele mappet på samme tid og tage beslutninger derfra.

    Hvor i den 11 match live kan den kun træffe beslutninger ud fra hvad der ville være på “skærmen” og hvis der så evt. Skete flere events på mini-mappet må den priotere hvilken event/attack den vil observere/handle på næste gang… tror de nævnte at den brugte i omegn af 300ms om at perceive/think/act … og hvis den kun kan gøre det på en normal screensize og må priotere hvad den vil observere/act på næste gang, kan den ikke ligeså hurtigt feks omringe fjenden ligesom man så imod mana i replays

    Jeg vil hellere spise her!

    #37

    klingest
    Bruger
    816 indlæg
    Offline

    #33 Det gør jeg også.

    Deep learning er i sig selv banebrydende. Teorien har eksisteret i mange år, men det er først nu at folk begynder at udnytte det aktivt. Primært fordi computerkraften har nået et niveau, hvor det ikke tager alt for lang tid at træne algoritmen. Så det banebrydende i det her er altså at man rent faktisk prøver at implementere en deep learning algoritme, der skal fungere som kunstig intelligens i et spil. Det er ikke set før. De fleste spil har en forholdsvis forudsigelig AI fordi den bygger på faste regler som programmøren har givet den.
    Denne AI laver sine egne regler og taktikker, og bygger videre på dem som holder bedst. Det vil potentielt kunne revolutionere AI i spil generelt. Dvs. Det kan potentielt blive meget sjovere at spille singleplayer spil, som fx. Total War serien.

    Med tiden vil vi se Deep Learning algoritmer implementeret mange flere steder.
    Hvad vil der fx. ske den dag at din tandbørste bliver mere intelligent end dig selv?
    Det er den slags spørgsmål fremtidsforskere i dag stiller.

    Yoda - "Beware of the dark side... The dark side leads to fear. Fear leads to anger. Anger leads to hate. Hate leads to suufferiiing!!"

    #38

    Mart33N
    Bruger
    3.112 indlæg
    Offline

    #37

    Når min tandbørste bliver mere intelligent end mig, bruger jeg den til at rengøre lokummet med. Så kan den fandme lære det!

    Google

    • Denne kommentar blev ændret for 8 måneder, 3 uger siden af  Mart33N.
    #39

    klingest
    Bruger
    816 indlæg
    Offline

    #38 Hvorefter den analyserer lokumsbakterierne og sladrer til din tandlæge. Du vil herefter bliver spammet med sms beskeder der fraråder dig at børste tænder, med tandbørsten. Du vil desuden modtage reklamer omkring, hvor du kan købe en ny smart-tandbørste.

    Yoda - "Beware of the dark side... The dark side leads to fear. Fear leads to anger. Anger leads to hate. Hate leads to suufferiiing!!"

    #40

    FIRESTORM
    Bruger
    5.070 indlæg
    Offline

    Deep learning er da ikke banebrydende længere? Eller det kan godt være det bare er mig der er for hurtigt til at rykke videre efter vi så alpha-go og OpenAI’s dota bot. Vi har set hvad det kan og ja med en helvedes masse GPUer og en masse data kan man træne en computer til at kunne en helt masse også bedre end mennesker. Men problemet er jo bare at det i min optik ikke har noget med at være selvtænkende AI at gøre, den kan ikke deducere noget ud fra lignende handlinger den har gjort før. Du kan f.eks. ikke sætte en alpha star agent til at spille et andet RTS uden at den ville gå helt i smadder, men jeg er ret sikker på at mana og TLO kunne slå dig og mig i ca. hvilket som helst RTS no problemo, selvom de stort set intet kender til spillet, fordi de har forståelse for genren og har tilegnet sig nogle generelle skills.

    • Denne kommentar blev ændret for 8 måneder, 3 uger siden af  FIRESTORM.
    #41

    klingest
    Bruger
    816 indlæg
    Offline

    #40 Deep learning er da banebrydende. Vi har kun lige skrabet overfladen af hvad det kan bruges til. Teorien har været kendt i mange år, men det bliver ikke brugt særlig mange steder, fordi erfaringen med det ikke er der endnu, og det er stadig for svært for de fleste, at programmere en deep learning algoritme. Derudover er computerkraften først nu ved at nå niveau, hvor det for alvor kan bruges til noget, og det er kun fantasien der sætter grænser. Det vil desuden blive nemmere med tiden at udvikle, når det går op for udviklerne, at det skal være nemt at lave. Det som er skræmme scenariet er, at det pludselig bliver så nemt, at det er alle steder, og med udviklingen af kvantecomputeren, som nu er blevet en realitet, så bliver der ovenikøbet pludselig mulighed for, at indsamle og behandle ekstremt store mængder data, på ingen tid. Forestil jer hvad der vil ske, hvis man træner en kvantecomputer med en deep learning algoritme, eller måske en endnu mere effektiv algoritme. Det bliver som sagt ikke i morgen at skynet overtager, det er stadig på baby stadiet, men det vil blive mere og mere, og det fortsætter eksponentielt.

    Mht. til dit eksempelt så er det bestemt muligt at træne en algoritme, på et overordnet plan, til at spille strategispil. Det handler kun om hvilke, samt hvor mange kriterier og målsætninger, du træner den ud fra. Det er svært og tidskrævende, men som sagt, så vil det blive nemmere med tiden.

    For at være konservativ og på den sikre side, så giver jeg det 20-40 år før AI styrer alt i vores liv. Men vi har set før hvad der kan ske med udviklingen på 10 år. Der kan ske MEGET!. I virkeligheden så tror jeg, at vi vil opleve, at nogle radikale og nye teknologier, baseret på kunstig intelligens, invaderer vores liv inden for de næste 5-10 år, men det er blot min personlige tro.

    Er der nogen der har hørt om Internet of Things, og industry 4.0.
    Hvis ikke, så brug evt. google’s fremragende Deep learning algoritme til at søge efter det.

    Yoda - "Beware of the dark side... The dark side leads to fear. Fear leads to anger. Anger leads to hate. Hate leads to suufferiiing!!"

    • Denne kommentar blev ændret for 8 måneder, 3 uger siden af  klingest.
    • Denne kommentar blev ændret for 8 måneder, 3 uger siden af  klingest.
    #42

    Bams
    Bruger
    1.988 indlæg
    Offline

    Jeg synes det er alt for vildt. Og helt sikkert en milepæl for Deepmind-projektet. Det er også sådan de selv ser det (og nej, det tror jeg ikke bare de siger, fordi de synes de er nødt til det)

    Det er slet ikke overraskende, at vi er nået hertil. Vi ved jo godt, at det sker. Men det er alligevel fascinererende at konstatere det ske – lige der i det øjeblik i går, hvor den spiller imod MANA.

    Jeg har også fuldt en del med I AlphaZero (skak) som jo trak overskrifter hele efteråret, men at man i et spil som Starcraft, hvor du skal kombinere så mange strategiske overvejelser både i forhold til macro og micro – det er helt exceptionelt

    Jeg hoster når jeg kysser

    #43

    Ixnatifual
    Bruger
    2.128 indlæg
    Offline

    Plus StarCraft er i realtid.

    #44

    klingest
    Bruger
    816 indlæg
    Offline

    Det kan bruges alle steder hvor det er en fordel at automatisere. Forretninger kan få optimeret deres økonomiske strategier så de bliver helt perfekte og så pengeindbringende som mulig, priser vil blive justeret så de altid passer perfekt med udbud og efterspørgsel, og transportsektoren vil blive fuld automatisk og 100% effektiv. Det er sat lidt på spidsen, men det er i den retning vi bevæger os.

    https://www.youtube.com/watch?v=MuWWZ91-G6w

    Yoda - "Beware of the dark side... The dark side leads to fear. Fear leads to anger. Anger leads to hate. Hate leads to suufferiiing!!"

    • Denne kommentar blev ændret for 8 måneder, 3 uger siden af  klingest.
    • Denne kommentar blev ændret for 8 måneder, 3 uger siden af  klingest.
    #45

    klingest
    Bruger
    816 indlæg
    Offline

    https://www.youtube.com/watch?v=MuWWZ91-G6w

    Yoda - "Beware of the dark side... The dark side leads to fear. Fear leads to anger. Anger leads to hate. Hate leads to suufferiiing!!"

Viser 15 kommentarer - 31 til 45 (af 47 i alt)
  • Du skal være logget ind for at kommentere på dette indlæg.