Патрік MacAlpine і Пітер Стоун . Використання динамічних нагороди, щоб дізнатися Повністю голономні Двоногих Walk . У AAMAS адаптивних агентів навчання (АЛК) семінар , червень 2012 року.
Відео доступно http://www.cs.utexas.edu/~AustinVilla/sim/3dsimulation/AustinVilla3DSimulationFiles/2012/html/holonomicwalk.html
Завантажити
[PDF] 525.6kB [PostScript] 2.2MB
Абстрактний
У даній роботі представлені розробки та вивчення архітектури повністю голономні всеспрямований ходьби використовується UT Austin Villa робота-гуманоїда футбольного агента, що діє в середовищі моделювання RoboCup 3D. За « повністю голономні» ми маємо на увазі ходьби дозволяє рух у всіх напрямках з однаковою швидкістю.Прогулянка на основі подвійних лінійних перевернута модель маятника і був спочатку розроблений для реального фізичного робота Nao. Параметри для ходьби оптимізовані для максимальної швидкості і стабільності і в той же час новий підхід до перезважування нагороди для прогулянок швидкості в кардинальних напрямах вперед, назад, вбік і використовується з метою створення рівних ходьбі швидкості у всіх напрямках. Варіант цій прогулянці, яка використовує той же двигун прогулянку, але не в повній мірі голономні, як він використовує три різних набору параметрів дізнався ходьби упередженим по відношенню до максимально вперед, швидкість ходьби, була важливим компонентом в команді UT Austin Villa перемоги в 2011 році RoboCup 3D-моделювання конкуренція. Детальні експерименти показують, що адаптивно змінюється вага нагороди протягом довгого часу є ефективним методом для навчання повністю голономні прогулянку. Додаткові дані показують, що команда агентів за допомогою цієї дізнався повністю голономні прогулянка може бити інших команд, у тому числі в 2011 році RoboCup 3D моделювання чемпіоном UT Austin Villa команди, які використовують не повністю голономні прогулянки.
Добавить комментарий
Вы должны войти, чтобы оставить комментарий.