Nieuws

Robot leert zichzelf lopen


Robots programmeren voor taken in huishoudens of in de zorg is tijdrovend en lastig. Een efficiëntere aanpak zou kunnen zijn om de robots het in de praktijk zelf te laten leren. Promovendus Erik Schuitema van TU Delft ontwikkelde een robot (en noemde ‘hem’ Leo) die zichzelf kan leren lopen.

Met zogenoemde reinforcement learning kan een systeem (lees robot) leren om taken uit te voeren op basis van terugkoppeling op zijn gedrag: goed gedrag wordt versterkt door positieve beloningen, slecht gedrag wordt bestraft door negatieve beloningen.

Robot Leo is in staat om twee motorische basistaken te leren: het plaatsen van een voet op een traptrede en lopen. Om te leren lopen, ontvangt Leo een positieve beloning voor het vooruit bewegen van zijn voet, en negatieve beloningen voor het gebruik van tijd en energie. Die beloning is simpelweg een getalletje in de computer dat hoger of lager kan worden.

Het plaatsen van een voet op de trede, een relatief simpele taak, leerde Leo op deze manier uit zichzelf binnen vijftien minuten. Het leren lopen duurt ongeveer vijf uur in een simulatie, waarbij de robot duizenden keren valt. Omdat de hardware niet helemaal bestand was tegen zoveel keren vallen, werd besloten om Leo in de beginfase een handje te helpen. Hij kon nog een beetje ‘afkijken’ van de manier waarop lopende robots nu handmatig worden geprogrammeerd. Leo kon deze loopwijze al snel evenaren en zelfs iets verbeteren.

Follow Faqtman on Twitter