复现工作主要包括3分实验,gmm采样,softmax采样以及交互式强化学的指导探索,对于的实验代码都在对应的文件夹中,而功能函数是一些基础功能函数用于调用,每个部分的都有一个实验结果文件夹用于存储实验结果。数据集是主目录下的data_dorest.csv。而提出的新的框架是主目录下的a2c mask.py
要运行这个项目,您需要安装以下依赖:
- numpy
- pandas
- torch
- scikit-learn
您可以通过以下命令安装这些依赖:
pip install numpy pandas torch scikit-learn