看了一下您提供的数据集文件,发现SFT的数据context非常大(几十万),请问这么大的上下文长度训练模型不会出现问题么
看了一下您提供的数据集文件,发现SFT的数据context非常大(几十万),请问这么大的上下文长度训练模型不会出现问题么