作者trfmk1 (TRF小兵)
看板PC_Shopping
标题[心得] 9070XT RCOm7 纯Win环境AI跑图心得後续-1
时间Mon Nov 10 03:11:27 2025
之前写了两篇文章
但SD.Netx更新实在太快...
目前直接帮你导入
ROCm/TheRock团队架构的PyTorch安装包
整个安装方式
我又重新更新一次
目前9070XT在MI Open上有BUG
还在排队等修复中
总之就是找不到最佳化算法
GPU核心一直疯狂满载
最终崩溃掉驱动
ComfyUI跟SD.Netx最新版本
都已经自动针对9070XT关闭MI Open
等於下面的参数自动帮你加上了
torch.backends.cudnn.enabled = False
所以目前不用在手动追加这个参数
我花了一点时间测试
如何在纯Win11系统环境下
让9070XT跑最新的ROCm7
提供的构筑环境方式我觉得已经是最简单的了
而且是纯WIN环境下去跑
不用额外搞甚麽linux子系统
纯WIN环境下目前能跑的是
Radeon RX 7000 系列
Radeon RX 9000 系列
Ryzen AI 300 与 AI Max 系列 APU(部分型号)
主要参考SD.Next网站上的说明
https://vladmandic.github.io/sdnext-docs/AMD-ROCm/
使用ROCm/TheRock团队架构的PyTorch安装包
安装方式参考
https://github.com/ROCm/TheRock
ComfyUI架构ROCm7可以参考下面网址教学
https://xoghfwdske.feishu.cn/docx/J2TmdPNOpoXWwBxOU57cSUjJnRU
架构ROCm7 Stable Diffusion WebUI SD.Next 简易流程
安装AMD PyTorch on Windows 测试驱动
https://www.amd.com/en/resources/support-articles/release-notes/RN-AMDGPU-WINDOWS-PYTORCH-PREVIEW.html
安装AMD HIP SDK 目前最新6.4.2
https://www.amd.com/zh-tw/developer/resources/rocm-hub/hip-sdk.html
Git安装
https://github.com/git-for-windows/git/releases/download/v2.47.1.windows.1/Git-2.47.1-64-bit.exe
Python 3.12.10 安装
https://www.python.org/ftp/python/3.12.10/python-3.12.10-amd64.exe
https://i.imgur.com/hr83AwA.png
把Python加入PATH 环境变数记得打勾
MSVC装上X64版本
https://learn.microsoft.com/zh-tw/cpp/windows/latest-supported-vc-redist?view=msvc-170
接着开启Windows PowerShell可以用脚本执行
桌面工作列上的视窗图标按右键
选择以系统管理员身分执行 PowerShell
https://i.imgur.com/yw6VzHz.png
输入
Set-ExecutionPolicy RemoteSigned
让PowerShell支援长路径
输入
New-ItemProperty -Path "HKLM:\SYSTEM\CurrentControlSet\Control\FileSystem"
-Name "LongPathsEnabled" -Value 1 -PropertyType DWORD -Force
完成後关闭PowerShell
前置作业到这边告一段落
接着准备开始安装 Stable Diffusion WebUI SD.Next
记得挑容量大一点的硬碟位置
AI大模型基本6G起跳
在准备要安装的位置新增一个资料夹
我是取名为SD.Next
点进资料夹按右键 选择在终端开启
呼叫命令提示字元
https://i.imgur.com/JzO58wf.png
依序一段一段输入
1. git clone
https://github.com/vladmandic/sdnext
2. cd sdnext
3. git switch dev
4. git pull
关闭PowerShell
在sdnext根目录下新增一个文字文件
档名我是用webui-user
里面文字内容如下
@echo off
set COMMANDLINE_ARGS=--use-rocm --autolaunch
call webui.bat
https://i.imgur.com/D1SPYcq.png
接着存档把文字文件.txt的副档名改成.bat即可
这个webui-user.bat以後就是执行档
set COMMANDLINE_ARGS =
这里可以直接填上想用CLI Arguments参数
https://vladmandic.github.io/sdnext-docs/CLI-Arguments/
不想每次自动打开浏览器
把--autolaunch移除就好
想要自己安装
ROCm/TheRock团队架构的PyTorch安装包
从头开始安装指令如下
打开PowerShell 终端机输入下面指令
1. git clone
https://github.com/vladmandic/sdnext
2. cd sdnext
3. git switch dev
4. git pull
下面开始不一样
5. pip install uv
安装uv 套件安装器
这个套件会加速套件安装的速度至10倍~100倍
6. python -m venv venv
7. venv\Scripts\Activate
使用虚拟环境
8. uv pip install --index-url
https://rocm.nightlies.amd.com/v2-staging/gfx120X-all/ torch torchvision
torchaudio
针对9070XT後续要跟更新ROCm
或者从其他版本直接升级
1. venv\Scripts\Activate
2. uv pip install --upgrade --index-url
https://rocm.nightlies.amd.com/v2-staging/gfx120X-all/ torch torchvision
torchaudio
我重复安装测试好几次应该没问题
有问题请自己DEBUG
有时候发生问题或是想要重新安装ROCm时
可以直接把venv资料夹整个删掉
重新做一个虚拟环境
只需要下面两个指令
python -m venv venv
venv\Scripts\Activate
如果想要使用不同版本独立的python去部属
可以改成
uv venv venv --python 3.11 --seed
venv\Scripts\Activate
python版号可自由选择 3.11、3.12、3.13
成功的人恭喜你
正式踏入修练AI炼金术的其中一员
主要模型会放在\sdnext\models\Stable-diffusion下面
建议一开始使用wai-nsfw-illustrious-sdxl动漫模型来测试
https://civitai.com/models/827184/wai-nsfw-illustrious-sdxl
动漫类提示词我都抄这里的
https://seesaawiki.jp/nai_ch/
提供一个动漫脚色查询程式
https://github.com/mirabarukaso/character_select_stand_alone_app
也有提供提示词的辅助
但不支援SD.Netx 直接用API调用
我是拿来当简易辞典使用
词库是简体中文
我自己把改文件成繁中
然後输入关键字会自动跑出脚色
https://i.imgur.com/Z4WlyrP.png
提示词也是
https://i.imgur.com/WxQoXA1.png
输入好後按生成
提示词用滑鼠反白 Ctrl+C复制贴到SD.Netx即可
https://i.imgur.com/glchyEU.png
我不提供自行修改过的档案
有兴趣请自行研究= =
再来是追加针对9070XT後续调效优化
由於MI Open被强制关闭
9070XT犹如脱缰的野马
在显存控制上不受控制
有时候会爆显存oom错误
发生破图的时候
请马上关掉PowerShell
不然高机率系统死当= =
由於SD.Netx已经内建许多功能
一些外挂套件装上可能会出问题
网路上一些教学都可能已经过时
我建议使用SD.Netx内建功能就足够
建议可以装上sd-webui-prompt-all-in-one
但是用在SD.Netx上还是有点BUG
想装的人自行去搜寻
我介面是改成标准介面
https://i.imgur.com/X5iYmBj.png
我的使用界面目前是这样
https://i.imgur.com/n08CYCQ.png
上面教的webui-user.bat用记事本打开
追加一条打开aotriton的环境参数
set TORCH_ROCM_AOTRITON_ENABLE_EXPERIMENTAL=1
如下面这样
@echo off
set COMMANDLINE_ARGS=--use-rocm --autolaunch
set TORCH_ROCM_AOTRITON_ENABLE_EXPERIMENTAL=1
call webui.bat
建议追加下面两条参数
--experimental
允许使用不支援的libraries
--debug
出问题会跑比较详细的资讯
可以贴到网路上去查询问题
接着是设定方面
计算设置基本上用FB16或BF16
https://i.imgur.com/KcxOyQ6.png
我测试用起来BF16是快一些
但用FB16稳一点
下面那些注意力模式
目前A卡Rocm7 Windows下都不能用
除非你有自己有能在Win环境下
编译Flash attention的能力
VAE设置 基本上就分块减少GPU记忆体的开销
https://i.imgur.com/hIbCXS6.png
瓦片大小选择512或256
管道修改器
https://i.imgur.com/4M42IcU.png
HyperTile下
Hypertile UNet Enabled 打勾
这设定会影响精度
但我其实没什麽感觉
能提高跑图性能就好
模型量化可以减少GPU记忆体的开销
https://i.imgur.com/RvSV8oU.png
这是里面最重要的优化调整
内建的SDNQ: SD.Next Quantization基本上就很好用
我这边是针对9070XT目前能用的设定调整
量化模式使用post
量化类型可以用:int8或float8_e4m3fn
要进一步节省GPU记忆体
可以选择int4 但是精度会下降
基本上选择模型、te、LLM去做量化
VAE基本上不用...打开也没用...会报错
9070XT量化用int8或float8_e4m3fn速度最快
目前FSR4模型标准版就是用float8去跑
附带一题9070XT int8算力达779Tops
接近RTX4080 int8 780Tops
也是目前RDNA架构唯一支持float8(FP8)
上代RDNA3 7900XTX int8也只有122.83Tops
模型卸载的选择会影响显存释放并影响效能
https://i.imgur.com/Y7Cfz36.png
最快当然是无,不自动对模型卸载动作
平衡 我用起来很无感我不是很推...对於现在的9070XT来说
模型 跑完流程自动卸载
最省显存是选择顺序...但就是很慢
如果模型有经过进一步量化调整
可以选择无处理跑看看
再来就是选择模型
其他设定不懂就不要碰了
乱开会导致错误
到时候打不开只能重新跑一次安装
调整後测试
生成一位天之罩杯(光),在中世纪旅馆躺在床上
使用模型:waiNSFWIllustrious_v150
解析度1024X768 20步 引导尺度6 VAE类型选择Tiny 高扩散打勾
https://i.imgur.com/RI5oamJ.png
20步算完3s 流程跑完3.85s
量化类型float8_e4m3fn
GPU 7790 MB 48% | RAM 23.15 GB 36%
想换换口味跑真人模型
我是推荐找一些Pony模型或SDXL、Illustrious XL
FLUX我是不推啦...虽然跑起来很真实
但实在消耗巨大...我还在死守AM4平台
基本上跑FLUX我系统记忆体64G直接吃满
不好瑟瑟...还要找LoRA...
基本上跑真人细节增强器必开
自动修脸、修手、修眼睛之类的
会增加显存的消耗
所以模型量化很重要
真人模型尺度没有动漫模型那麽自由
提示词AI不理解有时跑出一些奇奇怪怪的
多出手臂跟脚还是跑出好几个头
虽然习惯就好...但还是请做好心理准备
一开始接触正常人出现恐怖谷效应很正常
我这边改用beretMixReal_v100模型测试
解析度改成1280X960
https://i.imgur.com/JLefOsC.png
单纯用提示词效果结果还行
优化後提高解析度跑图效率还是不错的
https://i.imgur.com/fVvJQ3J.png
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 125.229.59.186 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/PC_Shopping/M.1762715494.A.58F.html
1F:推 chugliang: 推125.228.238.102 11/10 04:34
2F:推 labbat: 纯推 不过Linux下的相容性还是比Win好多了 180.177.204.60 11/10 05:10
3F:→ eva19452002: 建议你先把跑图的结果秀出来,如果跑 118.232.62.188 11/10 06:01
4F:→ eva19452002: 图效果好,大家才有动力去看你的设定 118.232.62.188 11/10 06:02
我是比较低调啦
虽然瑟瑟是一种驱动力没错
稍微贴几张意思一下
https://i.imgur.com/xtoImNq.png
https://i.imgur.com/mahSVUJ.png
https://i.imgur.com/QmmKHtx.jpeg
https://i.imgur.com/7pUpNSB.jpeg
https://i.imgur.com/j6gGkeH.jpeg
https://i.imgur.com/4Ew8Wo0.jpeg
只能说懂得就懂
跑本地AI图生成
建议还是低调点
只要AI能懂你打的提示词
那根冰棒也能是香蕉
能放在任何你想放的地方
5F:推 abc21086999: 为啥要用Python 3.12?有什麽原因吗153.246.176.240 11/10 06:33
因为AMD PyTorch on Windows预览驱动里面说明写
Python 3.12 support
其实目前Python3.12稳定性不错、第三方函式库也都相容
6F:推 a2492409g: 推36.236.229.114 11/10 07:49
※ 编辑: trfmk1 (125.229.59.186 台湾), 11/10/2025 07:56:42
7F:推 elvis222: 有遇到过windows用rocm7出图会变杂讯图45.144.227.6 11/10 09:18
8F:→ elvis222: 然後驱动弹错误吗? 用6.4.4版本却能正45.144.227.6 11/10 09:18
9F:→ elvis222: 常出图45.144.227.6 11/10 09:18
ROCm7 Win环境还没正式推出
等於是抢先预览不稳定很正常
会破图就不明原因爆显存
※ 编辑: trfmk1 (39.12.112.53 台湾), 11/10/2025 10:25:08
10F:→ yangwen5301: 杂图是已知错误59.132.15.69 11/10 10:44
11F:推 gwofeng: 可以试一下Euler a 25步 832*1216 同时算 111.82.155.237 11/10 11:13
12F:→ gwofeng: 四张图的时间吗 111.82.155.237 11/10 11:14
13F:推 d030b: 感谢分享 36.229.38.196 11/10 11:20
14F:→ NanaMizuki: 要看图,去推特转一圈就一堆了 125.230.22.150 11/10 11:21
15F:→ NanaMizuki: 现在产图时间都花在後处理上,5090生 125.230.22.150 11/10 11:23
16F:→ NanaMizuki: 图只花5秒,但後面跑2次hires + 125.230.22.150 11/10 11:25
17F:→ NanaMizuki: detailer修脸就花掉2~4分钟 125.230.22.150 11/10 11:26
18F:推 chchwy: 推 36.225.138.4 11/10 18:50
19F:推 gameguy: 你迟早换5080的,怎麽不现在就换 223.137.73.46 11/10 19:40
※ 编辑: trfmk1 (125.229.59.186 台湾), 11/11/2025 02:52:02
※ 编辑: trfmk1 (125.229.59.186 台湾), 11/11/2025 02:57:28
20F:推 kawa0710: 推个 123.241.243.11 11/11 08:06
21F:推 gundamdx: 请问你有试过产生短影片吗?不知道效果 80.187.113.255 11/13 16:16
22F:→ gundamdx: 和效能如何,最近也想买9070 80.187.113.255 11/13 16:16
23F:推 zhandy35: 猛哥 111.82.44.101 11/13 23:37
24F:→ Adven: 请问powershell一开始设定remotesigned 182.155.3.201 12/09 18:22
25F:→ Adven: 之後要选yes吗? 182.155.3.201 12/09 18:22
26F:推 a951l753vin: 是说 新的红石对影片有差吗 114.34.169.60 12/20 01:13