作者kanonehilber (隐居处)
看板VideoCard
标题[请益] MATLAB计算用显示卡的选择
时间Thu Oct 12 18:41:38 2017
(更新)
刚刚在QUADRO GP100的页面发现有一款旧的 QUADRO K6000 双精度计算能力很强
有1 TFLOPS,是1080 TI的大约三倍
https://goo.gl/U9UsQ8
而且好像三万多就能买到二手的,请问各位推荐这个吗?
(更新二)
刚刚又发现有一款 GTX TITAN Black 双精度也有1 TFLOPS以上,好像很不错
=======================================================
最近有意购买专门为MATLAB做GPU运算的显示卡,上网查一些资料发现不同显示卡在计算
单浮点与双浮点的能力上似乎有很大的区别
https://read01.com/zh-tw/OyyjQB.html#.Wd8Ba1uCzIU
比方说从这篇文章看起来MAXWELL架构下双浮点的计算能力似乎很低,是单浮点的1/32,
而PASCAL则是1/2。我印象中MATLAB里变数都是预设用双精度浮点数来处理,所以要使
显示卡在MATLAB最佳化应该要使用PASCAL而不是MAXWELL架构的显示卡这样想对吗?
http://www.nvidia.com.tw/object/gpu-architecture-tw.html
官网也特别强调了PASCAL双浮点计算性能的提升
======
目前实验室有一台的电脑显卡是QUADRO K2200 (GM107GL) Maxwell架构
我找不到像第一个连结里那样直接秀出FP64核心数的网页,不过这个网页给出的单双浮点
数FLOPs也是差32倍
http://www.digitaleng.news/de/impressive-new-gpus/
如果我把它换成PASCAL的GTX 1080 Ti是不是理论上就能大幅提升MATLAB的运算速度? 感恩
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.114.253.36
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/VideoCard/M.1507804904.A.3FF.html
阿 才发完文不久就有找到网站说要算双精度不适合用1080 Ti,然後wiki上面有
10系列FLOPs资料
https://en.wikipedia.org/wiki/GeForce_10_series
1080 Ti只有上面K2200网站中的约8倍,单双浮点还是差32倍,怎麽会这样啊?不是也
是PASCAL吗..
目前大概没有钱买TESLA P100 或V100这种顶级规格的
※ 编辑: kanonehilber (140.114.253.36), 10/12/2017 19:42:48
1F:推 vobor: 就 故意阉割游戏卡 不给你便宜 10/12 20:42
2F:→ kanonehilber: Q_Q 10/12 21:05
3F:推 Jokering5566: 用intel xeon phi加速卡会不会不会比较好 10/13 01:02
4F:推 Jokering5566: 二手的31s1p 双精度1tflops 只是功耗270w 挺高耗的 10/13 01:06
5F:推 Jokering5566: google了一下matlab不支援xeon phi的样子 那只能选n 10/13 01:12
6F:→ Jokering5566: vidia 10/13 01:12
7F:→ kanonehilber: 原来还有这种东西,我来研究一下 10/13 10:59
※ 编辑: kanonehilber (140.114.253.94), 10/13/2017 16:00:20
※ 编辑: kanonehilber (140.114.253.94), 10/13/2017 16:01:24
※ 编辑: kanonehilber (140.114.253.94), 10/13/2017 16:30:25
※ 编辑: kanonehilber (140.114.253.94), 10/13/2017 16:42:15
8F:推 moonlca: Mathworks 有gpubench啊 而且980ti出乎意料的强 大概1080 10/14 00:30
9F:→ moonlca: 八折 1080ti的一半 10/14 00:30
10F:推 moonlca: 然後Nvidia 的tflops其实是理论的有些根本是颗数乘上频率 10/14 00:38
11F:→ moonlca: 同架构还可以比 而且要注意软体支援 10/14 00:38
12F:推 moonlca: 另外bandwith也很重要 不过真的要运算卡才有hbm2 10/14 00:43
13F:→ moonlca: Bandwidth才对... 10/14 00:58
刚刚查一下,看起来矩阵相乘时的结果最接近理论值~
※ 编辑: kanonehilber (140.114.253.31), 10/14/2017 01:49:16