这篇文章记录在 Windows 环境下配置 OPi AI Studio 的完整流程,包括测试模式设置、驱动安装、CANN 环境变量配置,以及用 llama-cli.exe 进行大模型推理。
一、环境与准备
开始前建议先确认以下信息:
- 系统为 Windows。
- 驱动安装包、CANN 压缩包、
llama-cli.exe与模型文件均可从以下地址下载:https://pan.baidu.com/s/1Gik8ghnBnZBlUUkAlaM8Tg?pwd=psjb - 使用产品附带 USB4 线缆连接设备。
系统信息参考:

二、将系统切换到测试模式
- 右键开始菜单,打开
终端(管理员)或Windows PowerShell(管理员)。 - 输入命令:
bcdedit /set testsigning on
- 出现“操作成功”后,重启系统。
- 重启后桌面右下角应出现“测试模式”水印。
命令执行示意:

测试模式水印示意:

三、安装驱动并验证设备识别
- 安装驱动
Ascend310P_1.1.0.3.exe。 - 重启系统。
- 启动 OPi AI Studio,并使用 USB4 线缆连接电脑。
注意事项:
先启动 OPi AI Studio 并连接到主机,再启动主机。若顺序错误,可能出现设备无法识别。
驱动安装界面示意:

- 打开管理员终端,执行:
npu-smi info
- 若终端能正确打印 OPi AI Studio 相关信息,则驱动安装成功。
识别成功示意:

若安装成功后依旧报错如下,可以尝试重启整套环境:

四、安装 CANN 包
- 解压
CANN8.0.0.zip。 - 将解压后的目录放到:
C:\Program Files\CANN8.0.0
- 手动创建目录:
C:\Program Files\Huawei\Ascend
五、配置环境变量
- 在开始菜单搜索“环境变量”,打开“编辑系统环境变量”。
- 在“系统变量”中新建以下变量:
ASCEND_HOME_PATH = C:\Program Files\CANN8.0.0
ASCEND_OPP_PATH = C:\Program Files\CANN8.0.0
- 编辑系统变量
Path,新增:
C:\Program Files\CANN8.0.0
环境变量配置示意:


六、配置 llama.cpp 并运行模型
1) 添加 llama.cpp 相关环境变量
在系统环境变量中新增:
GGML_CANN_WEIGHT_NZ = 1
配置示意:

2) 启动推理
打开管理员终端,执行:
{llama-cli.exe 文件路径} -m {模型文件路径}
命令行调用示意:

当终端出现 > 且光标闪烁时,表示模型已成功启动:

3) 提问与结束
- 在
>后输入提问内容并回车。 - 等待模型输出完成。
- 当再次出现
>且光标闪烁时,按Ctrl + C结束推理。
推理输出示意:

已知日志说明:
在我的推理输出中可以看到类似以下日志:
[ERROR](9836)D:\cann\0605_release\abl\slog\liblog\slog\plog\plog_file_mgr.c:218: fsync fail, ret=-1, strerr=Input/output error.
这个报错大概率来自 CANN 的 slog 日志模块。该模块主要按 Linux 服务器环境设计,Windows 文件系统对 fsync 语义支持与 Linux 存在差异,在特定条件下会触发 fsync fail。当前看属于日志写盘路径的兼容性问题,通常表现为持续报错日志,但推理进程本身并不崩溃。
结束后会看到性能统计信息(包含平均 tps):

七、常见问题
1) 设备无法识别
优先检查启动顺序与 USB4 连接状态:
- 先启动 OPi AI Studio 并连接主机。
- 再启动主机。
- 重新执行
npu-smi info验证。
2) fsync fail 日志反复出现
典型日志如下:
[ERROR](9836)D:\cann\0605_release\abl\slog\liblog\slog\plog\plog_file_mgr.c:218: fsync fail, ret=-1, strerr=Input/output error.
可能原因:
- CANN 的
slog在 Linux 场景设计较完善。 - Windows 文件系统对
fsync语义支持不完全一致。 - CANN 在 Windows 路径上未完全做容错,导致该日志持续出现。
八、总结
目前在 Windows 环境下,OPi AI Studio 整体上已经完成适配,可以正常完成推理任务:
- 驱动识别正常(
npu-smi info可读)。 - CANN 环境变量可用。
llama-cli可以成功加载模型并启动推理。
但由于前面提到的 fsync fail 报错问题,推理输出的可视性会受到影响,结果显示常常断断续续,不够稳定直观。
因此,后续将改用 Ubuntu 环境重新配置,并继续验证推理链路的稳定性与输出效果。