Fill your skill gaps in AI and Data Science

External Tag: reinforcement-learning

Introducing n-Step Temporal-Difference Methods

External Tags hands-on-tutorials, machine-learning, openai-gym, python, reinforcement-learning

Understanding the Mathematics of PPO in Reinforcement Learning

External Tags artificial-intelligence, machine-learning, mathematics, ppo, reinforcement-learning

Jointly learning rewards and policies: an iterative Inverse Reinforcement Learning framework with…

External Tags applied-mathematics, deep-dives, imitation-learning, machine-learning, reinforcement-learning

Preference Alignment for Everyone!

External Tags deep-dives, fine tuning, LLM, reinforcement-learning, RLHF

Using Offline Reinforcement Learning To Trial Online Platform Interventions

External Tags data-science, hands-on-tutorials, machine-learning, online-engagement, reinforcement-learning

Automatic Differentiation (AutoDiff): A Brief Intro with Examples

External Tags computer-science, deep learning, getting-started, machine-learning, reinforcement-learning

Top 5 AI Agent Projects to Try

External Tags Agent Pilot: An Autonomous Flight Simulation Agent, AI Agent for Game Development, AI Agent Projects, AI Agents, Autonomous HR Agent, chatbot, Content Recommendation Agent, generative-ai, machine-learning, nlp, ReAct Search Agent, Recommendation, reinforcement-learning

Exploring the AI Alignment Problem with GridWorlds

External Tags ai-safety, alignment, artificial-intelligence, deep-dives, reinforcement-learning

Optimizing Inventory Management with Reinforcement Learning: A Hands-on Python Guide

External Tags data-science, inventory-management, optimization, python, reinforcement-learning

Reinforcement Learning for Physical Dynamical Systems: An Alternative Approach

External Tags machine-learning, physics, python, reinforcement-learning, sagemaker