本章节中,我们将为您介绍D-Robotics-LLM的基本使用流程,便于您实现快速上手。这里我们以Qwen2.5-Omni-3B模型为例,为您进行使用说明。
下载我们提供的D-Robotics_LLM_{version}.tar.gz部署包并解压。
下载我们提供的Qwen2.5_Omni_3B_Audio.hbm,Qwen2.5_Omni_3B_Visual.hbm,Qwen2.5_Omni_3B_Text.hbm模型,以及模型的输入嵌入权重embed_tokens.bin文件。
关于hbm模型的下载链接,请参见oellm_runtime中model文件夹的resolve_model.txt文件。
准备完毕后,我们将模型(*.hbm),embed_tokens.bin文件,以及部署包中的oellm_runtime SDK整合到一起,参考目录结构如下:
在板端创建工作目录,参考命令如下:
将开发机中整合的文件夹拷贝至此板端目录下,参考命令如下:
最后,在/home/root/llm/D-Robotics_LLM_{version}/oellm_runtime路径下,对LD_LIBRARY_PATH进行配置,参考命令如下:
Qwen2.5_Omni_3B模型有online和offline两种运行模式。这里以offline模式为例,模型板端运行参考指令如下:
在offline模式中,可执行文件的参数如下:
| 参数 | 参数说明 | 是否可选 |
|---|---|---|
-h, --help | 显示帮助信息。 | / |
-c, --config | 用于指定运行时的json配置文件路径。 | 必填 |
json配置文件示例如下:
json配置文件参数说明如下:
| 参数 | 参数说明 | 是否可选 |
|---|---|---|
visual_hbm_path | 用于指定量化后的视频图像特征提取模型文件(*.hbm)路径。 | 必填 |
audio_hbm_path | 用于指定量化后的音频特征提取模型文件(*.hbm)路径。 | 必填 |
text_hbm_path | 用于指定量化后的文本模型文件(*.hbm)路径。 | 必填 |
embed_tokens | 用于指定模型的输入嵌入权重(embed_tokens.bin)路径。 | 必填 |
tokenizer_dir | 用于指定分词器和部分初始化数据的配置路径。 | 必填 |
model_type | 用于指定运行的模型类型,当前Omni模型类型为5。 | 必填 |
online_mode | 用于指定模型以在线或者离线方式运行。 取值范围: 'true'、'false'。 | 必填 |
运行后,即可进行测试,参考如下:
Qwen2.5_Omni_3B模型运行时需传入json文件的路径,您需在该json文件中配置音频、视频、图像、文本等输入内容。程序运行过程中,会将json文件中的输入信息同步打印至终端。
在该示例中,omni_offline_prompt.json文件内容如下:
关于多模态输入的完整支持范围、在线运行模式的具体说明,以及json文件的详细填写规范等内容,请参考 进阶开发 章节。