1. 使用lora,给internlm模型做训练
  2. 训练的时候,如何让模型知道自己的身份,并且对相关问题进行拒绝回答。这里给到相关解决方案。

模型效果

这里给大家看一下,使用我这个方法训练的模型效果:

可以看得出来:

  1. 模型有非常明显的自我认知能力;
  2. 模型懂得拒绝回答;
  3. 模型对于别的问题,回答的也还可以;

训练脚本介绍

GitHub训练代码:https://github.com/yuanzhoulvpi2017/zero_nlp/tree/main/internlm-sft

Downloads last month
24
Safetensors
Model size
7.32B params
Tensor type
F32
·
FP16
·
Inference Examples
Inference API (serverless) does not yet support model repos that contain custom code.

Dataset used to train yuanzhoulvpi/intermlm-7b-lml_001