Skip to content

Network 类中 Attention Mechanism 的定义在 forward 中,这不会导致每次 forward 的 Attention Mechanism 的 Linear 层 重新初始化吗,这还会有效训练吗? #1

@ljw-struggle

Description

@ljw-struggle

很棒的工作,我在自习学习您的代码,但有一些疑问

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions