rl-fin / todo_next.txt
bonadio's picture
qlearning_v1-6 using PRB reward
7cf1db5
raw
history blame contribute delete
69 Bytes
- Testar PPO com TI de hoje e ontem
- Testar log return como reward