cc77

lora不同任务类型的区别

SEQ_CLS (Sequence Classification): 定义:序列分类任务。 用途:将整个输入序列分类为一个类别标签。例如,情感分析(将一段文本分类为“正面”或“负面”)、垃圾邮件检测(将邮件分类为“垃圾邮件”或“非垃圾邮件”)。 SEQ_2_SEQ_LM (Sequence-to-S

Administrator Administrator 发布于 2024-08-08

cosin,为什么学习率,在逐渐增大

如果选择了cosine学习率调度策略但发现学习率在逐渐增大,而不是逐渐减小,可能存在以下几个原因: 热身期设置:在使用余弦学习率调度器时,通常会有一个热身期(warmup period),在热身期内学习率会从较小值逐渐增加到初始学习率值。热身期结束后,学习率才会开始按照余弦曲线逐渐减小。 调度器的错

Administrator Administrator 发布于 2024-08-07

lora 微调,instruction和response位置

如果将 response 的结果放在向量的前半部分,而不是后半部分,将会对模型的训练和推理产生显著的影响。以下是具体变化的分析: 原始代码 input_ids = instruction["input_ids"] + response["input_ids"] + [tokenizer.pad_to

Administrator Administrator 发布于 2024-08-07