Skip to content

想请教一下您的dqn+MAML为什么只有一次replay()? #1

@Niyx52094

Description

@Niyx52094

我看到run_dqn_meta.py里面代码只有一次replay()。但是maml的标准算法不是需要先更新模型然后再用更新的模型与环境交互生成新的transition,最后用这些新生成的在更新一次,那么应该有两次replay()把?另外您的dqn+MAML看上去像是给每一个环境都分配了一个agent,每个agent各自在各自的环境进行更新,这不是maml把?

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions