在本次作业中,需要阅读程序,理解其中使用的强化学习算法,并尝试修改程序提高学习性能。阐述强化学习的方法和过程;尝试修改特征提取方法,得到更好的学习性能;尝试修改强化学习参数,得到更好的学习性能;并报告修改的尝试和得到的结果。