日本語
 
Help Privacy Policy ポリシー/免責事項
  詳細検索ブラウズ

アイテム詳細

登録内容を編集ファイル形式で保存
 
 
ダウンロード電子メール
  Apprenticeship learning via soft local homomorphisms

Boularias, A., & Chaib-draa, B. (2010). Apprenticeship learning via soft local homomorphisms. In 2010 IEEE International Conference on Robotics and Automation (ICRA 2010) (pp. 2971-2976). Piscataway, NJ, USA: IEEE.

Item is

基本情報

表示: 非表示:
資料種別: 会議論文

ファイル

表示: ファイル

関連URL

表示:

作成者

表示:
非表示:
 作成者:
Boularias, A1, 著者           
Chaib-draa, B, 著者
所属:
1Laval University, Quebec, ou_persistent22              

内容説明

表示:
非表示:
キーワード: -
 要旨: We consider the problem of apprenticeship learning when the expert's demonstration covers only a small part of a large state space. Inverse Reinforcement Learning (IRL) provides an efficient solution to this problem based on the assumption that the expert is optimally acting in a Markov Decision Process (MDP). However, past work on IRL requires an accurate estimate of the frequency of encountering each feature of the states when the robot follows the expert‘s policy. Given that the complete policy of the expert is unknown, the features frequencies can only be empirically estimated from the demonstrated trajectories. In this paper, we propose to use a transfer method, known as soft homomorphism, in order to generalize the expert‘s policy to unvisited regions of the state space. The generalized policy can be used either as the robot‘s final policy, or to calculate the features frequencies within an IRL algorithm. Empirical results show that our approach is able to learn good policies from a small number of demonstrations.

資料詳細

表示:
非表示:
言語:
 日付: 2010-05
 出版の状態: 出版
 ページ: -
 出版情報: -
 目次: -
 査読: -
 識別子(DOI, ISBNなど): DOI: 10.1109/ROBOT.2010.5509717
BibTex参照ID: 6825
 学位: -

関連イベント

表示:
非表示:
イベント名: 2010 IEEE International Conference on Robotics and Automation (ICRA 2010)
開催地: Anchorage, AK, USA
開始日・終了日: 2010-05-03 - 2010-05-07

訴訟

表示:

Project information

表示:

出版物 1

表示:
非表示:
出版物名: 2010 IEEE International Conference on Robotics and Automation (ICRA 2010)
種別: 会議論文集
 著者・編者:
所属:
出版社, 出版地: Piscataway, NJ, USA : IEEE
ページ: - 巻号: - 通巻号: - 開始・終了ページ: 2971 - 2976 識別子(ISBN, ISSN, DOIなど): ISBN: 978-1-424-45038-1