将棋でディープラーニングを実験するためのプロジェクトです。
基本的にAlphaGoの手法を参考に実装していく予定です。
検討経緯、実験結果などは、随時こちらのブログに掲載していきます。
http://tadaoyamaoka.hatenablog.com/
※モンテカルロ木探索の実装は囲碁プログラムのRay+Rnの実装を参考にしています。
フォルダ | 説明 |
---|---|
cppshogi | Aperyを流用した将棋ライブラリ(盤面管理、指し手生成)、入力特徴量作成 |
dlshogi | ニューラルネットワークの学習(Python) |
make_hcp_by_self_play | Policyネットワークによる自己対局 |
make_hcpe_by_self_play | MCTSによる自己対局 |
test | テストコード |
usi | 対局用USIエンジン |
utils | ツール類 |
- Windows 10 64bit
- Visual Studio 2019
- Ubuntu 18.04 LTS
- g++
- CUDA 10.2
- cuDNN 7.6
- TensorRT 7
上記USIエンジンのビルド環境に加えて以下が必要
ライセンスはGPLライセンスとします。