De AI's winnen 5 keer wanneer computers mensen verslaan
Kunstmatige intelligentie is de grens van de informatica. De wetenschap is zo ver gevorderd dat AI ons in ons eigen spel slaat - of moeten we zeggen, games. Sommige mensen vrezen de opkomst van Skynet. Hier is waarom wetenschappers denken dat je je zorgen moet maken over kunstmatige intelligentie. Hier is waarom wetenschappers denken dat je je zorgen moet maken over kunstmatige intelligentie. Denk je dat kunstmatige intelligentie gevaarlijk is? Kan AI een ernstig risico vormen voor de mensheid. Dit zijn enkele redenen waarom u zich misschien zorgen wilt maken. Meer lezen met elke AI-evolutie, maar we zijn een beetje optimistischer.
AlphaGo is de nieuwste AI om een mens te verslaan in een bordspel, maar het komt uit een lange stamboom. Hoewel deze vijf machines begonnen als speciaal gebouwde programma's, hebben sommigen een tweede leven gevonden dat verder gaat dan hun oorspronkelijke roeping.
In dit artikel zullen we elke keer dat een briljant mens verloren gaat aan een computer doornemen en onderzoeken wat elk van die computers zijn beslissende voordeel gaf.
1. Deep Blue, de schaakmeester
IBM's Deep Blue en Garry Kasparov hadden een van de eerste spraakmakende gevechten tussen mens en machine. Kasparov verloor natuurlijk, maar ze hadden een beetje een gecompliceerde geschiedenis.
Nadat Kasparov voor het eerst Deep Blue's kleine broer Deep Thought versloeg, keerde IBM in 1989 terug met zijn nieuwe en verbeterde Deep Blue in 1996. Kasparov verloor een openingswedstrijd, sloeg een seconde, maar won toen drie opeenvolgende wedstrijden om de wedstrijd te nemen.
Pas in een tweede herkansing in 1997 won Deep Blue Kasparov en won een game van zes wedstrijden bij één wedstrijd.
Kasparov zei dat hij intelligentie zag in het spel van Deep Blue en beschuldigde IBM ervan te interveniëren. De “intelligentie-” was eigenlijk een fout waardoor Deep Blue uit zijn karakter reageerde. Kort gezegd, de AI was nogal primitief, bruut dwong zich een weg door mogelijke bewegingen en resultaten ...
... en als het geen optimale keuze kon vinden, koos het willekeurig.
Voor elk van zijn zetten modelleerde Deep Blue alle mogelijke zetten en de antwoorden van Kasparov. Hij kon tot twintig stappen vooruit modelleren en daarbij miljoenen mogelijke posities per seconde evalueren. Die modellering vereiste hardware die in staat is tot krachtige parallelle verwerking.
Parallelverwerking is het opsplitsen van taken in kleinere computertaken en het tegelijkertijd voltooien van die taken. De resulterende gegevens worden vervolgens opnieuw samengevoegd voor het resultaat.
Tussen de twee wedstrijden kreeg Deep Blue een aanzienlijke hardware-upgrade. De winnende hardware was een systeem met 30 nodes dat op het Power PC-platform van IBM draaide. Elk knooppunt had secundaire processoren gewijd aan schaakinstructies 10 Creatieve manieren om uw schaaktraining te stimuleren 10 Creatieve manieren om uw schaaktraining te verbeteren Schaaktraining is normaal gesproken over opzettelijke oefening over veel ontmoedigende spelletjes, dus laten we eens kijken naar enkele manieren waarop u kunt brengen plezier en creativiteit in je schaaktraining. Lees verder .
Alle gecombineerde, Deep Blue hadden 256 processors parallel aan elkaar.
Er zijn afstammelingen van deze hardware die in datacenters werken, maar Deep Blue's echte nalatenschap is Watson, de Jeopardy-kampioen. Uiteindelijk heeft IBM Deep Blue ingezet voor financiële modellering, datamining en geneesmiddelenontdekking, allemaal gebieden waar grootschalige simulaties nodig zijn.
2. Polaris, de pokerkampioen
De University of Alberta heeft Polaris gemaakt, de eerste AI die pokerprofessionals versloeg in een toernooi. De onderzoekers kozen een Texas Hold 'Em-variant voor hun AI omdat deze het minst afhankelijk is van geluk.
Polaris stond twee keer tegenover pokerspelers. De eerste was in 2007 tegen twee spelers. De handen werden vooraf gedeeld - Polaris had een set kaarten als hij tegenover een speler stond en de omgekeerde hand bij het spelen van de andere speler (om geluk te beheersen).
Polaris werd later herwerkt voor een toernooi van 2008 tegen zes spelers. Dit was ook een vooraf afgehandelde reeks games. Polaris kreeg een gelijkspel in de eerste game en verloor de tweede, maar won uiteindelijk het toernooi, kwam van achteren en won twee straight-games.
In tegenstelling tot schaken, kan poker niet bruut worden gedwongen door modellering, omdat de AI een beperkt beeld van het spel heeft - het heeft geen idee over de handen van zijn tegenstanders.
Kaartdeals zijn bijna oneindig uniek, waardoor het modelleren nog minder effectief is. Dezelfde kaarten kunnen een goede of waardeloze hand zijn, afhankelijk van de gedeelde kaarten. Bluffen biedt nog een ander probleem voor AI, omdat gokken op zich geen goede indicator is voor handkracht.
Polaris is een combinatie van verschillende programma's, die agents worden genoemd. Elk van deze programma's had zijn eigen strategie en er was nog een agent die zou kiezen welke van deze het beste was voor een bepaalde hand.
De strategieën die worden gebruikt om het pokerspel te doorbreken, zijn gevarieerd en vereisen speltheorie. Het basisidee is om erachter te komen wat de beste strategie van elke speler is op basis van alle beschikbare gegevens, en Polaris heeft dit bereikt via een techniek genaamd bucketing.
Bucketing wordt gebruikt om kaarthanden te classificeren op basis van sterkte. Hierdoor kon Polaris het aantal datapunten dat nodig is om het spel bij te houden, verminderen. Vervolgens gebruikte het de waarschijnlijkheid van alle andere mogelijke emmers die beschikbaar waren, deze afleidend van de zichtbare kaarten.
Polaris heeft een unieke hardware-installatie: een cluster van 8 computers met elk 4 CPU's en 8 GB RAM. Deze machines hebben de simulaties uitgevoerd die nodig zijn om de emmers en strategieën voor elke agent te maken.
Sindsdien is Polaris geëvolueerd naar een ander programma genaamd Cepheus, dat zo geavanceerd is geworden dat onderzoekers Texas Hold'em hebben verklaard als zijnde “zwak opgelost”.
Games zijn “opgelost” wanneer algoritmen de uitkomst van een game vanaf elke positie kunnen bepalen. Een spel is “zwak opgelost” wanneer het algoritme geen imperfect spel kan verklaren. Je kunt hier je geluk beproeven tegen Cepheus.
3. Watson, de Jeopardy Genius
AI overwinningen tot dit moment in de geschiedenis waren low-key games, daarom is Watson's overwinning zo'n mijlpaal voor reguliere mensen: Watson bracht de strijd van AI rechtstreeks in de huiskamers van Amerika.
Jeopardy is een geliefde spelshow bekend om zijn uitdagende trivia, en het heeft een unieke gril: de aanwijzingen zijn de antwoorden en de deelnemers moeten komen met de vragen. Een echte test voor Watson, die bekende Jeopardy-kampioenen Brad Rutter en Ken Jennings op zich nam.
Rutter was de all-time geld-kampioen en Ken Jennings had de langste winning streak. Een derde partij koos een willekeurig assortiment vragen uit oudere afleveringen om te verzekeren dat vragen niet werden geschreven om Watson te helpen of te exploiteren.
Watson won drie straight-games - een training en twee op de televisie - maar er waren een aantal rare eigenaardigheden aan sommige antwoorden van Watson. Bijvoorbeeld, nadat Jennings een vraag verkeerd had beantwoord, reageerde Watson met hetzelfde verkeerde antwoord.
Wat Watson echter uniek maakte, was het vermogen om natuurlijke taal te gebruiken. IBM noemde deze diepe QA, die stond voor “vraag beantwoorden”. De belangrijkste prestatie was dat Watson antwoorden kon zoeken met context, niet alleen met trefwoordrelevantie.
De software is een combinatie van gedistribueerde systemen. Hadoop en Apache UIMA werken samen om de gegevens te indexeren en de verschillende knooppunten van Watson te laten samenwerken.
Net als Deep Blue werd Watson gebouwd op het Power PC-platform van IBM. Watson was een 90-core cluster met 16 TB RAM. Voor de Jeopardy-spellen werden alle relevante gegevens geladen en opgeslagen in RAM.
Welke relevante gegevens? Welnu, Watson had toegang tot de volledige tekst van Wikipedia. Het had een reeks woordenboeken, thesaurussen, encyclopedieën en andere referentiematerialen. Watson had tijdens het spel geen toegang tot internet, maar alle lokale gegevens waren ongeveer 4 TB.
Meer recentelijk is Watson gebruikt om behandelingsopties voor kankerpatiënten te analyseren en te suggereren. Watson's nieuwste onderneming helpt bij het creëren van gepersonaliseerde leer-apps voor kinderen. Er zijn zelfs pogingen om Watson te trainen in het koken van IBM's Watson gemaakt van mijn Thanksgiving-maaltijd - Hier is wat er is gebeurd IBM's Watson heeft mijn Thanksgiving-maaltijd gecreëerd - IBM's kunstmatige intelligentie, gekend als Watson, kan veel slimme dingen doen, maar kan het een complete en complete unieke Thanksgiving maaltijd? Ik probeer het. Kijken wat er gebeurt! Lees verder !
4. Deepmind, de autodidact
Google's Deepmind kan nerds eindelijk iets geven om zich zorgen over te maken omdat het mensen verslaat bij klassieke Atari-spellen. Internet Archive brengt 900 klassieke arcadegames naar je browser. Hier zijn 7 van de beste Internet Archive brengt 900 Classic Arcade Games naar uw browser. Hier zijn 7 van de beste De arcade van je stad is mogelijk halverwege de jaren 90 afgesloten, maar dat zou je er niet van moeten weerhouden om je klassieke spellen te laten repareren. Lees meer - wel, bepaalde spellen tenminste. De mensheid houdt nog steeds zijn voorsprong in games als Asteroid en Gravitar.
Deepmind is een neuraal netwerk-AI. Neurale netwerken zijn AI's die zijn gemaakt om de manier waarop de menselijke geest werkt na te bootsen, wat het doet door virtueel te creëren “neuronen” computergeheugen gebruiken.
Deepmind kon elke pixel van het scherm analyseren, beslissen welke actie het beste kon worden ondernomen in de winomstandigheden en vervolgens reageren met de invoer van de controller.
De AI heeft games geleerd met behulp van een variant van Q-Learning die Deep Learning wordt genoemd. Dit is een leermethode waarbij de AI de beste beslissing behoudt die in een bepaalde situatie is gemaakt, en deze vervolgens herhaalt wanneer deze dezelfde situatie tegenkomt.
Deepmind's variant is echter uniek, omdat het externe geheugenbronnen toevoegt.
Dankzij dit systeem van vastgehouden informatie kon Deepmind de patronen van sommige Atari-games onder de knie krijgen en zelfs de ideale strategie van Breakout helemaal zelf proberen te vinden.
Waarom presteerde Deepmind slecht in bepaalde games? Vanwege de manier waarop het situaties beoordeelde. Het bleek dat Deepmind slechts vier frames per keer kon analyseren, waardoor het onmogelijk werd om door doolhoven te navigeren of snel te reageren.
Ook moest Deepmind elk spel van de grond af aan leren en kon het geen vaardigheden van het ene spel naar het andere toepassen.
5. Alpha Go, the Incredible
AlphaGo is een ander DeepMind-project en het is opmerkelijk omdat het erin slaagde om twee professionele Go-kampioenen te verslaan. Google's AI Doorbraak: wat het betekent en hoe het u beïnvloedt Google's AI Doorbraak: wat het betekent en hoe het u beïnvloedt Lees meer - Fan Hui en Lee Sedol - door de wedstrijden 5-0 en 4-1 te winnen, respectievelijk.
Volgens de spelers en matchcommentatoren zeiden ze allemaal dat de AI conservatief speelde, wat niet verrassend is omdat het is geprogrammeerd om veilige bewegingen te bevorderen die de overwinning op riskante bewegingen zouden garanderen die voor meer punten zouden zorgen.
Go werd ooit gedacht buiten bereik te zijn voor AI, maar Alpha Go is nu de eerste AI die professioneel in het spel is gerangschikt.
De game heeft een eenvoudige opzet: twee spelers proberen het bord te veroveren met witte en zwarte stenen. Het bord is een 19 x 19 raster met 361 kruispunten en de plaatsing van stenen bepalen het territorium van elke speler. Het doel is om te eindigen met meer territorium dan het andere.
Het aantal mogelijke bewegingen en spelstatussen is op zijn zachtst gezegd enorm. Ja, veel groter dan schaken, als je je dat afvroeg.
Alpha Go maakt gebruik van het eerder genoemde Deep Learning AI-systeem, wat betekent dat Alpha Go de games die het heeft gespeeld, onthoudt en ze als ervaring bestudeert. Vervolgens doorzoekt het hen en selecteert de keuze die het grootste aantal positieve potentiële uitkomsten heeft.
Alpha Go heeft veel computervermogen nodig om zijn rekenalgoritme uit te voeren. De versie die de wedstrijden speelde, draaide op een gedistribueerde set servers met in totaal 1.920 CPU's en 280 GPU's - een enorme hoeveelheid kracht die 64 gelijktijdige zoekdraden toeliet tijdens het spelen.
Net als Watson gaat DeepMind naar de medische school. Deepmind heeft een samenwerking aangekondigd met de Britse NHS om gezondheidsrapporten te analyseren. Het project, Streams, zal helpen bij het identificeren van patiënten met een risico op nierbeschadiging.
Kunstmatige intelligentie wordt serieus
Er is momenteel veel onderzoek gaande naar AI.
Google hoopt dat AI hun zoekactiviteiten kan ondersteunen. Een project genaamd Rankbrain is op zoek naar AI om de effectiviteit van Page Rank te verbeteren. Microsoft en Facebook hebben beide chatbots uitgegeven. Tesla leidt de laatste hand met zijn automatische rijmodus, en Google zit er meteen achter met zijn zelfrijdende auto's.
Het is misschien moeilijk om de samenhang tussen deze projecten en de training van een AI te zien om games te winnen, maar elk van deze AI's heeft het machine-leren op de een of andere manier gevormd.
Naarmate het veld zich ontwikkelde, heeft het AI's kunnen werken met complexere gegevenssets. Dit bijna oneindige aantal bewegingen in Go kan worden vertaald naar het bijna oneindige aantal variabelen op de openbare weg. Dus echt, deze games zijn nog maar het begin - een oefenfase, als je wilt.
Het echt interessante spul is net om de hoek, en het is heel goed mogelijk dat we het allemaal uit de eerste hand kunnen ervaren.
Wat vind je leuk aan AI? Is er een spel waarvan je denkt dat AI het uiteindelijk niet kan winnen? Laat het ons weten in de comments.
Image Credit: David Pacey via Flickr, Debbie Miesel via IBM, CPRG via University of Alberta, Play Among Friends Paf via Flickr, Mr Seb via Flickr, Matt Brown via Flickr, Jiuguang Wang via Flickr
Meer informatie over: kunstmatige intelligentie.