Reinforcement learning
# RL
强化学习(Reinforcement Learning, RL)是机器学习的一个重要分支,主要研究智能体(Agent)如何在一个环境中通过与环境交互来学习策略,以最大化某种累积奖励。强化学习的核心思想是通过试错(Trial and Error)来学习,智能体通过执行动作(Action)来影响环境,并从环境中获得反馈(Reward),进而调整其策略(Policy)以优化长期奖励。
# Math
x$$ 代表观测值,$$X $$代表随机变量
#### 概率密度函数
是描述连续型随机变量概率分布,随机变量 X 落在某一点附近的可能性密度有多大
单点概率...
more...









