本章节中,我们将为您介绍D-Robotics-LLM的基本使用流程,便于您实现快速上手。
我们为您提供了Qwen2.5的Base和Instruct双版本模型,满足您不同的开发与应用需求,二者区别如下:
Base版本是基础的文本生成模型,适用于后续的模型训练任务,模型名称中不包含Instruct字样。
Instruct版本是在Base版本基础上经指令微调得到的模型,更适合用于对话场景,模型名称中包含Instruct字样。
这里我们以Qwen2.5-1.5B-Instruct模型为例,为您进行使用说明。
下载我们提供的D-Robotics_LLM_{version}.tar.gz部署包并解压。
下载我们提供的Qwen2.5_1.5B_Instruct_1024.hbm模型。
关于hbm模型的下载链接,请参见oellm_runtime中model文件夹的resolve_model.txt文件。
当部署包以及模型准备完毕后,我们将模型(*.hbm)和部署包中的oellm_runtime SDK整合到一起,参考目录结构如下:
在板端创建工作目录,参考命令如下:
将开发机中整合的文件夹拷贝至此板端目录下,参考命令如下:
最后,在/home/root/llm/D-Robotics_LLM_{version}/oellm_runtime路径下,对LD_LIBRARY_PATH进行配置,参考命令如下:
模型板端运行参考指令如下:
程序的输入参数如下:
| 参数 | 参数说明 | 是否可选 |
|---|---|---|
-h, --help | 显示帮助信息。 | / |
--hbm_path | 用于指定量化后的模型文件(*.hbm)路径。 | 必填 |
--tokenizer_dir | 用于指定分词器配置路径。 | 必填 |
--template_path | 用于指定Instruct模型的对话模板路径,加载Base模型时缺省。 | 可选 |
--model_type | 用于指定运行的模型类型,当前Qwen2.5模型类型为7。 | 必填 |
运行完成后,即可进行简单对话测试,参考如下: