OPi AI Studio 配置记录 - Windows（驱动+CANN+llama.cpp）

这篇文章记录在 Windows 环境下配置 OPi AI Studio 的完整流程，包括测试模式设置、驱动安装、CANN 环境变量配置，以及用 llama-cli.exe 进行大模型推理。

一、环境与准备

开始前建议先确认以下信息：

系统为 Windows。
驱动安装包、CANN 压缩包、llama-cli.exe 与模型文件均可从以下地址下载：https://pan.baidu.com/s/1Gik8ghnBnZBlUUkAlaM8Tg?pwd=psjb
使用产品附带 USB4 线缆连接设备。

系统信息参考：

系统信息

二、将系统切换到测试模式

右键开始菜单，打开 终端（管理员） 或 Windows PowerShell（管理员）。
输入命令：

bcdedit /set testsigning on

出现“操作成功”后，重启系统。
重启后桌面右下角应出现“测试模式”水印。

命令执行示意：

将系统设置为测试模式

测试模式水印示意：

测试模式显示

三、安装驱动并验证设备识别

安装驱动 Ascend310P_1.1.0.3.exe。
重启系统。
启动 OPi AI Studio，并使用 USB4 线缆连接电脑。

注意事项：

先启动 OPi AI Studio 并连接到主机，再启动主机。若顺序错误，可能出现设备无法识别。

驱动安装界面示意：

安装驱动

打开管理员终端，执行：

npu-smi info

若终端能正确打印 OPi AI Studio 相关信息，则驱动安装成功。

识别成功示意：

npu-smi info显示

若安装成功后依旧报错如下，可以尝试重启整套环境：

四、安装 CANN 包

解压 CANN8.0.0.zip。
将解压后的目录放到：

C:\Program Files\CANN8.0.0

C:\Program Files\Huawei\Ascend

五、配置环境变量

在开始菜单搜索“环境变量”，打开“编辑系统环境变量”。
在“系统变量”中新建以下变量：

ASCEND_HOME_PATH = C:\Program Files\CANN8.0.0
ASCEND_OPP_PATH  = C:\Program Files\CANN8.0.0

编辑系统变量 Path，新增：

C:\Program Files\CANN8.0.0

环境变量配置示意：

环境变量CANN

环境变量CANN2

六、配置 llama.cpp 并运行模型

1) 添加 llama.cpp 相关环境变量

在系统环境变量中新增：

GGML_CANN_WEIGHT_NZ = 1

配置示意：

环境变量llama

2) 启动推理

打开管理员终端，执行：

{llama-cli.exe 文件路径} -m {模型文件路径}

命令行调用示意：

llama调用qwen2.5-0.5b

当终端出现 > 且光标闪烁时，表示模型已成功启动：

运行成功等待输入

3) 提问与结束

在 > 后输入提问内容并回车。
等待模型输出完成。
当再次出现 > 且光标闪烁时，按 Ctrl + C 结束推理。

推理输出示意：

推理输出(包含报错)

已知日志说明：

在我的推理输出中可以看到类似以下日志：

[ERROR](9836)D:\cann\0605_release\abl\slog\liblog\slog\plog\plog_file_mgr.c:218: fsync fail, ret=-1, strerr=Input/output error.

这个报错大概率来自 CANN 的 slog 日志模块。该模块主要按 Linux 服务器环境设计，Windows 文件系统对 fsync 语义支持与 Linux 存在差异，在特定条件下会触发 fsync fail。当前看属于日志写盘路径的兼容性问题，通常表现为持续报错日志，但推理进程本身并不崩溃。

结束后会看到性能统计信息（包含平均 tps）：

结束后tps显示

七、常见问题

1) 设备无法识别

优先检查启动顺序与 USB4 连接状态：

先启动 OPi AI Studio 并连接主机。
再启动主机。
重新执行 npu-smi info 验证。

2) `fsync fail` 日志反复出现

典型日志如下：

[ERROR](9836)D:\cann\0605_release\abl\slog\liblog\slog\plog\plog_file_mgr.c:218: fsync fail, ret=-1, strerr=Input/output error.

可能原因：

CANN 的 slog 在 Linux 场景设计较完善。
Windows 文件系统对 fsync 语义支持不完全一致。
CANN 在 Windows 路径上未完全做容错，导致该日志持续出现。

八、总结

目前在 Windows 环境下，OPi AI Studio 整体上已经完成适配，可以正常完成推理任务：

驱动识别正常（npu-smi info 可读）。
CANN 环境变量可用。
llama-cli 可以成功加载模型并启动推理。

但由于前面提到的 fsync fail 报错问题，推理输出的可视性会受到影响，结果显示常常断断续续，不够稳定直观。

因此，后续将改用 Ubuntu 环境重新配置，并继续验证推理链路的稳定性与输出效果。