管理人

管理人

このサイトの管理人です。 人工知能や脳科学、ロボットなど幅広い領域に興味をもっています。 将来の目標は、人間のような高度な身体と知能をもったパーソナルロボットを開発することです。 最近は、ロボット開発と強化学習の勉強に力を入れています(NOW)。

探索と活用のトレードオフ

2023/12/30  

この記事では、探索と活用のトレードオフ(exploration-exploitation trade-off)と呼ばれる、強化学習において重要な考え方を説明します。 多腕バンディット問題 多腕バンディ ...

方策勾配法と方策勾配定理の導出

2023/11/30  

本記事では、強化学習において重要な最適化方法の1つである方策反復法の具体的な手法の方策勾配法について解説するとともに、そこで使用する方策勾配定理について導出も示していきます。 はじめに 強化学習で使用 ...

CPG基礎|神経振動子モデルの理論と実装(執筆中)

2022/3/27  

この記事では、ロボットの適応的な歩行を実現するときに必要となる中枢パターン生成器(Central Pattern Generator: CPG)について解説します。 こんな方におすすめ 動物の歩行メカ ...

Hodgkin-Huxleyモデルの理論とPythonによる実装

2022/3/27  

Hodgkin-Huxleyモデルについて紹介していきます。 こんな方におすすめ 連続時間ニューロンに興味がある スパイキングニューラルネットワークに入門したい などの方々にとって有益なものとなるはず ...

フィッツヒュー-南雲モデルの理論とPythonによる実装

2022/3/27  

本記事では、連続時間ニューロンの一種であるフィッツヒュー-南雲モデルについて実装コードも含めて紹介していきます。 フィッツヒュー-南雲モデル フィッツヒュー-南雲モデル(FitzHugh-Nagumo ...

マルコフ過程・マルコフ報酬過程・マルコフ決定過程・部分観測マルコフ決定過程

2022/8/15  

この記事では、強化学習の根幹部分を理解することを目標に、マルコフ過程・マルコフ報酬過程・マルコフ決定過程・部分観測マルコフ決定過程、そして関連する理論について分かりやすく解説していきたいと思います。 ...

Generative Adversarial Networks(GANs)基礎

2022/3/27  

この記事ではGenerative Adversarial Networks(GANs)について解説していきます。 こんな方におすすめ GANについて詳しく知りたい GANのコードを動かしてみたい では ...

OpenAI Gym入門

2023/10/23  

この記事ではOpenAI Gymについて解説していきます。 こんな方におすすめ 強化学習のプログラミングに興味がある OpenAI Gymについて詳しく知りたい などの方々にとって有益なものとなるはず ...

OpenAI Gym用ラッパーの自作方法

2023/10/23  

この記事ではOpenAI Gym用のラッパーを自作する方法を紹介していきます。 内容は、OpenAI Gymのインターフェースを活用した強化学習環境の自作方法の記事(以下)で紹介した内容の延長になりま ...

OpenAI Gym用の環境自作方法と自作例を紹介!

2023/10/23  

この記事では前半にOpenAI Gym用の強化学習環境を自作する方法を紹介し、後半で実際に環境作成の具体例を紹介していきます。 こんな方におすすめ 強化学習環境の作成方法について知りたい 強化学習環境 ...

PAGE TOP