Du er ikke logget ind
Beskrivelse
Glubokoe obuchenie s podkrepleniem bystro stalo odnim iz samyh gorqchih naprawlenij issledowanij w äkosisteme glubokogo obucheniq. Uwlechenie obucheniem s podkrepleniem swqzano s tem, chto iz wseh metodow glubokogo obucheniq imenno ätot bol'she wsego pohozh na to, kak uchitsq chelowek. Za poslednie neskol'ko let ni odna kompaniq w mire ne sdelala bol'she dlq razwitiq glubokogo obucheniq s podkrepleniem, chem dochernqq kompaniq Alphabet - DeepMind. S momenta zapuska swoego znamenitogo agenta AlphaGo, DeepMind nahoditsq na perednem krae issledowanij w oblasti obucheniq s podkrepleniem. Neskol'ko dnej nazad oni opublikowali nowoe issledowanie, w kotorom popytalis' reshit' odin iz samyh slozhnyh aspektow reshenij w oblasti obucheniq s podkrepleniem: mnogozadachnost'. Sposobnost' k odnowremennomu wypolneniü i izucheniü shozhih zadach imeet bol'shoe znachenie dlq razwitiq chelowecheskogo razuma. S tochki zreniq nejronauki, mnogozadachnost' ostaetsq w znachitel'noj stepeni zagadkoj, i neudiwitel'no, chto nam bylo chertowski trudno realizowat' agentow iskusstwennogo intellekta (II), kotorye mogut äffektiwno obuchat'sq w neskol'kih oblastqh, ne trebuq neproporcional'no bol'shogo kolichestwa resursow. Dannaq monografiq predstawlqet soboj dohodchiwoe wwedenie w DeepMind Learning Machine s prostoj teoriej.