O que é: Policy Optimization (Otimização de Políticas)
O que é: Posterior Sampling (Amostragem Posterior)