Hard Module 관련 이슈

일단 일차적으로 구현한 hard-module은 아래 사진과 같은 구조를 가지고 있습니다.
특히
 - One-hot task id 는 f.c. embedding layer(10->400->256)를 거친 뒤,
 
각 레이어마다 아래
 - select_fc (256->4) 를 통과하여 4개 module중 어떤 것을 선택할지 gumbel-softmax를 통해 선택합니다.
 - select_cond_fc(4->256)을 통과하여, task embedding과 elementwise곱을 통해 다음 레이어의 select_fc 인풋으로 사용됩니다.
 
![image](https://github.com/AliceOfSNU/Soft-Module_fork/assets/86138312/bb21fcfd-a608-48db-81e7-141fe4010c63)

의도한 건 아닌데
https://arxiv.org/abs/1711.01239
이 페이퍼와도 접점이 있는 것 같습니다.

![image](https://github.com/AliceOfSNU/Soft-Module_fork/assets/86138312/f8eef25c-7f1f-47d7-81fe-30471e9ef2bd)

저 논문에서는 아래처럼 각 Task (Ti)에 대해 트레이닝 진행도에 따라 어떤 module들이 선택되는지
![image](https://github.com/AliceOfSNU/Soft-Module_fork/assets/86138312/8ca08ca4-d757-49ba-b829-75733ea4e4d7)

그려놓은게 있었는데 training과정에서 저런거 그려보면 도움 될 것 같아 log를 남겨놓고 분석해보겠습니다~~

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Hard Module 관련 이슈 #1

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Hard Module 관련 이슈 #1

Description

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions