想请教一下为什么`model/llama.py`内构建的LLaMa模型只有Transformer-encoder?后面直接linear输出,这样符合原始llama模型的结构吗?会影响效果吗?谢谢~
想请教一下为什么
model/llama.py内构建的LLaMa模型只有Transformer-encoder?后面直接linear输出,这样符合原始llama模型的结构吗?会影响效果吗?谢谢~