diff --git a/.DS_Store b/.DS_Store index bbfe686..f3c8517 100644 Binary files a/.DS_Store and b/.DS_Store differ diff --git a/README.md b/README.md new file mode 100644 index 0000000..54a4c74 --- /dev/null +++ b/README.md @@ -0,0 +1,22 @@ +# SFighterAI 街头霸王游戏智能代理 + +本项目基于深度强化学习训练了一个用于通关《街头霸王·二:冠军特别版》(Street Fighter II Special Champion Edition)关地 BOSS 的智能 AI 代理。该智能代理完全基于游戏画面(RGB 像素值)进行决策,在该项目给定存档中最后一关的第一轮对局可以取得 100% 胜率(实际上出现了“过拟合”现象,详见[结果]部分的讨论)。 + +### 文件结构 + +```bash +├───main +│ ├───logs +│ ├───trained_models +│ └───scripts +├───utils +│ └───scripts +``` + +项目的主要文件夹为 `main/`。其中,`logs/` 中包含了记录训练过程的终端文本和数据曲线(使用 Tensorboard 查看);`trained_models/` 中包含了不同阶段的模型权重文件,可以用于在 `test.py` 中运行测试,观看智能代理在不同训练阶段学习到的对战策略的效果。 + +## 运行指南 + +本项目基于 Python 编程语言,主要使用了 [OpenAI Gym Retro](https://retro.readthedocs.io/en/latest/getting_started.html)、[Stable-Baselines3](https://stable-baselines3.readthedocs.io/en/master/) 等标准代码库。程序运行使用的 Python 版本为 + +,建议使用 [Anaconda](https://www.anaconda.com) 配置 Python 环境。 diff --git a/README_CN.md b/README_CN.md deleted file mode 100644 index 16ae806..0000000 --- a/README_CN.md +++ /dev/null @@ -1,18 +0,0 @@ -# SFighterAI 街头霸王游戏智能代理 - -该项目基于深度强化学习训练了一个用于通关《街头霸王·二:冠军特别版》(Street Fighter II Special Champion Edition)关地 BOSS 的智能 AI 代理。该智能代理完全基于游戏画面(RGB 像素值)进行决策,在该项目给定存档中最后一关的第一轮对局可以取得 100% 胜率(实际上出现了“过拟合”现象,详见[结果]部分的讨论)。 - -### 文件结构 - -```bash -├───android -│ ├───app -│ │ └───src -│ └───gradle -├───doc_images -├───main -│ └───pose_data -│ └───train -│ ├───forwardhead -│ └───standard -``` diff --git a/main/.DS_Store b/main/.DS_Store new file mode 100644 index 0000000..28c3d26 Binary files /dev/null and b/main/.DS_Store differ