Reinforcement_Learning_AI_Video_Games

Code for each week's short video of Siraj Raval Course on Reinforcement Learning "AI for Video Games"

Week 1 - Value iteration algorithm

Value iteration algorithm built for the Taxi-v1 environment by OpenAI Gym library.

Week 2 - Monte Carlo Prediction algorithm

Monte Carlo Prediction algorithm built for the Blackjack-v0 environment by OpenAI Gym library.

Week 3 - Q-Learning algorithm

Q-Learning algorithm built for the MountainCarContinuous-v0 environment by OpenAI Gym library.

Week 4 - Policy Gradients algorithm

Policy Gradients algorithm built for the Pong-v0 environment by OpenAI Gym library.

Week 5 - Actor-Critic model

Actor-Critic model built for the Pendulum-v0 environment by OpenAI Gym library.

Week 6 - Proximal Policy Optimization

Proximal Policy Optimization algorithm built for the Pendulum-v0 environment by OpenAI Gym library.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Reinforcement_Learning_AI_Video_Games

Week 1 - Value iteration algorithm

Week 2 - Monte Carlo Prediction algorithm

Week 3 - Q-Learning algorithm

Week 4 - Policy Gradients algorithm

Week 5 - Actor-Critic model

Week 6 - Proximal Policy Optimization

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
Week 1		Week 1
Week 2		Week 2
Week 3		Week 3
Week 4		Week 4
Week 5		Week 5
Week 6		Week 6
README.md		README.md

wangshenfeng/Reinforcement_Learning_AI_Video_Games

Folders and files

Latest commit

History

Repository files navigation

Reinforcement_Learning_AI_Video_Games

Week 1 - Value iteration algorithm

Week 2 - Monte Carlo Prediction algorithm

Week 3 - Q-Learning algorithm

Week 4 - Policy Gradients algorithm

Week 5 - Actor-Critic model

Week 6 - Proximal Policy Optimization

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages