作者erspicu (.)
看板Soft_Job
标题Re: [讨论] GPU加速Transistor层的模拟器
时间Sat May 30 22:54:41 2026
※ 引述《erspicu (.)》之铭言:
: 标题: [讨论] GPU加速Transistor层的模拟器
: 推 SkyFluid: 想这麽做也可以, 但有件很关键的事你没有注意到. 01/03 01:39
: → SkyFluid: 硬体在跑的时候,并不是所有的电晶体都有作用. 但你用gpu 01/03 01:40
: → SkyFluid: 模拟(emu)时,会在编译期先决定哪些电晶体需要跑.除非能 01/03 01:41
: → SkyFluid: 事先拿到testbench,不然就是全部电晶体都要emu,这是巨大 01/03 01:41
: → SkyFluid: 的负担. 同时,某条signal有上百个load是很正常的事,不过 01/03 01:42
: → SkyFluid: 这会造成在emulation时的同步问题. 01/03 01:44
: 推 SkyFluid: 有兴趣的话, 你可以看一下去年CAD-contest, NV出的题目 01/03 03:20
这东西是有弄出一些小成果 有兴趣可以看看
https://erspicu.github.io/AprVisual/index.html
不过很偏晶片设计那块领域的东西
倒不是说真的有原创性贡献 而是很多现有文献做法拿去实际测试和叠加
把真的有效益性的方法给叠上去 然後实务工程上的优化程式 极尽可能加速
当然结果还是可以预期 用netlist层去跑模拟 花了很多时间跨过一座山又一座山
找了很多办法下去试 虽然效能改善明显可见 搞到目前开源纪录第一名
https://erspicu.github.io/AprVisual/comparison.html
实际上离实机realtime模拟的效能还是差几百倍
简单来说真实任天堂红白机fps大概是60.x , 我现在一秒还算不到一张
平均算一张大概要10秒左右 但说真的一些大神相比结果已经强上不少
主要是有ai 叠加文献纪录中的方法
https://erspicu.github.io/AprVisual/design.html
再说一次 我没有什麽演算法上独创的贡献 我做的事情是极尽可能从现有方法中
用ai当辅助 克服工程阻力 不断测试验证 然後把有效的方式拼凑在一起
ps.其实很多学术的方法纸上谈兵很漂亮
实际上你用cpu跑就是有很多你没想到的问题 很多东西都是这边cost低了
结果cost拿去做另外的评估 或是需要额外的纪录 结果额外评估的cost
或是额外的纪录资讯反来造成d-cache崩溃 诸如此类
然後thread也是 要处理资源lock问题 搞到最後也是崩溃
不过这是专案初期 我还是很想冲透过netlist层
直接把一张frame rendering的时间压缩到几秒内完成
後续可能再想想 说不定有机会灵光一现
反正就满有趣的东西 另外也可以当成电脑效能测试的banchmark
在我电脑上的数据最高曾经到达 71k hc/s 1张不用10秒
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 182.233.248.16 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1780152885.A.686.html
1F:→ saladim: 不是这领域的 考古一下是2020年底开头的 现在GPU跟ML/AI 05/31 03:13
2F:→ saladim: 跟当年又有天壤之别 或许有新的可能? 05/31 03:15
有兴趣玩看看
https://baxermux.org/myemu/AprVisual/
今天更新算法後 一下子又突破很多
结果AMD Ryzen 7 3700X 8-Core Processor 加新版算法後
还是惨输 AMD Ryzen 7 7800X3D 8-Core Processor
天下武功唯快不破... 感觉有生之年可能可以看到NETLIST达成实机速度
※ 编辑: erspicu (182.233.248.16 台湾), 05/31/2026 21:21:21