本章节中,我们将为您介绍D-Robotics-LLM的基本使用流程,便于您实现快速上手。这里我们以InternLM2-1.8B模型为例,为您进行使用说明。
下载我们提供的D-Robotics_LLM_{version}.tar.gz部署包并解压。
下载我们提供的InternLM2_1.8B_1024.hbm模型。
关于hbm模型的下载链接,请参见oellm_runtime中model文件夹的resolve_model.txt文件。
当部署包以及模型准备完毕后,我们将模型(*.hbm)和部署包中的oellm_runtime SDK整合到一起,参考目录结构如下:
在板端创建工作目录,参考命令如下:
将开发机中整合的文件夹拷贝至此板端目录下,参考命令如下:
最后,在/home/root/llm/D-Robotics_LLM_{version}/oellm_runtime路径下,对LD_LIBRARY_PATH进行配置,参考命令如下:
模型板端运行参考指令如下:
其中,运行参数如下:
| 参数 | 参数说明 | 是否可选 |
|---|---|---|
-h, --help | 显示帮助信息。 | / |
--hbm_path | 用于指定量化后的模型文件(*.hbm)路径。 | 必填 |
--tokenizer_dir | 用于指定分词器配置路径。 | 必填 |
--model_type | 用于指定运行的模型类型,当前InternLM模型类型为4。 | 必填 |
运行完成后,即可进行简单对话测试,参考如下: