Jun
20
第9回自然言語処理企画:分散型強化学習手法の最近の動向と分散計算フレームワークRayによる実装の試み
講演者:太田 晋
Organizing : AI&機械学習しよう!勉強会
Registration info |
学生参加枠 Free
FCFS
既発表者/発表予定者 Free
FCFS
有料参加枠 ¥200 (Pre-pay)
FCFS
|
---|---|
About Prepayment |
About Prepayment Contact Info: (Only shown to attendees.) |
Cancel/Refund Policy: キャンセルの際は参加費用の払い戻しはできませんので、ご了解ください。 |
|
Print receipt data: 発行する (詳しくはこちら) |
Description
この勉強会は、Zoomでのオンライン勉強会です。
・有料参加枠 200円 30名 先着順
参加費はZoom環境などの勉強会用の費用、今後シンポジウム開催時の講師謝金などに、充当させていただきたいと思います。
AI&機械学習しよう!(Do2dle)は、プログラム、システム開発の現場の人を中心にしたソース&論文輪読会を進めて、AIを作れる人を増やすことを目的とするグループです。 AIに関するホットな話題を取り入れながら情報交換できる場を作っていきます。定期的にミートアップを開催していきます。
概要
(1) ビデオゲームAtariにおいて, State-of-the-Art(SotA)を実現した分散型強化学習手法について紹介します.
Ape-X(2018)[1], R2D2(2019)[2], MuZero(2019)[3], Agent57(2020)[4] を予定しています.
(2) 2018年にAtariのSotAを達成したApe-X[1]のサブセットを, Pythonを使った分散計算フレームワークRay[6]によって実装し, Amazon EC2上にクラスタを構築して分散計算を行う方法を解説します.
【参考資料】
[1] Horgan et al., "Distributed Prioritized Experience Replay", ICLR2018, 2018.
[2] Kapturowski et al., "Recurrent Experience Replay in Distributed Reinforcement Learning", ICLR2019, 2019.
[3] Schrittwieser et al., "Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model", arXiv preprint arXiv:1911.08265, 2019.
[4] Badia et al., "Agent57: Outperforming the Atari Human Benchmark", arXiv preprint arXiv:2003.13350, 2020.
[5] Sutton et al., "Reinforcement Learning: An Introduction second edition", MIT Press, 2018.
[6] The Ray Team, "Ray - Fast and Simple Distributed Computing", 2020.
タイムスケジュール
- 14:55 ~ 開場
- 15:00 ~ 16:30 説明(途中10分ほど休憩あり)
- 16:30 ~ 17:00 質疑応答、自由討論
- 17:00 終了
会場
開催日前にアクセス方法など注意事項はご連絡いたします。 また、Zoomパーフェクトマニュアルがあります。 今後色々なところでオンラインイベントが行われるようになると思います。 参考にしていただければ幸いです。 https://zoomy.info/zoom_perfect_manual/
参加費
- 一部有料200円
発表者
Media View all Media
Feed
2020/06/22 15:29
勉強会後に若干更新した資料をSlideShareにアップロードしました。また勉強会当日に紹介したソースコードと設定ファイルをgithubにアップロードしました。どちらも「資料」のセクションからアクセス可能です。