<div dir="ltr">Ezra,<div>    Very interesting insights! I suspect it is used when the machine makes an obvious error. </div><div><br></div><div>Regards,</div><div>Doug P.</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Fri, Feb 23, 2018 at 6:17 PM, Ezra Christensen <span dir="ltr"><<a href="mailto:ezracc@gmail.com" target="_blank">ezracc@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div>Interesting. <br><br>I wonder whether human's watching Google's latest DeepMind go through iterations to test and train itself in Go would have been able to know whether the bot was doing a good or bad job. It reportedly came up with new strategies that even expert players hadn't used, which allowed it to beat its predecessor. As that emerged, a human watching that may not have been able to recognize what the bot was doing and not rewarded such behavior. </div><div><br></div><div>For human training, sometimes it's good to let a person do a bad job for a period of time so they learn how to differentiate between what good and bad is and why. For learning algo's, if you don't give it enough iterations it may not have a complete data set to figure out what to pay attention to and what to ignore, assuming it has access to relevant data. <br><br><div id="m_-5540078469682110431xc9ff96a4060f4e4c88a6e104ccd54843"><div><div>Does TAMER reach a point it starts ignoring the human feedback as it determines they don't really know what they're talking about. ;)</div></div></div></div><div><br></div><div>Still cool. </div><div><br></div><div><br></div>
<div><br></div>
<div>------ Original Message ------</div>
<div>From: "Doug Paradis" <<a href="mailto:paradug@gmail.com" target="_blank">paradug@gmail.com</a>></div>
<div>To: "DPRG" <<a href="mailto:dprglist@lists.dprg.org" target="_blank">dprglist@lists.dprg.org</a>></div>
<div>Sent: 2/23/2018 1:34:44 PM</div>
<div>Subject: [Dprglist] Method for humans to teach robots for deep learning</div><div><br></div>
<div id="m_-5540078469682110431xb64ed125fde045c"><blockquote cite="http://CAOdUW+awc98YP5wF5UdkVKPGaXJ-V+GwmFdq0YNzfEgy8T1cOg@mail.gmail.com" type="cite" class="m_-5540078469682110431cite2">
<div dir="ltr">Interesting article:<div><a href="http://www.machinedesign.com/motion-control/good-robot-bad-robot-future-robotic-feedback-deep-learning?NL=MACD-001&Issue=MACD-001_20180223_MACD-001_551&sfvc4enews=42&cl=article_2_b&utm_rid=CPG05000003813138&utm_campaign=15533&utm_medium=email&elq2=ced390a9de014072adc478258295d454" target="_blank">http://www.machinedesign.com/<wbr>motion-control/good-robot-bad-<wbr>robot-future-robotic-feedback-<wbr>deep-learning?NL=MACD-001&<wbr>Issue=MACD-001_20180223_MACD-<wbr>001_551&sfvc4enews=42&cl=<wbr>article_2_b&utm_rid=<wbr>CPG05000003813138&utm_<wbr>campaign=15533&utm_medium=<wbr>email&elq2=<wbr>ced390a9de014072adc478258295d4<wbr>54</a><br></div></div>
</blockquote></div>
</div></blockquote></div><br></div>