作者JefferyTseng (世界越快,心则乱)
看板Statistics
标题[问题] 使用 R 或 Python 做 big data 电脑推荐
时间Thu Oct 19 18:04:39 2017
虽然是硬体问题,
但在电脑相关的板和 mobile01 搜寻和发问,
都没有好的解答,也许在统计板或许反而可以有解,
故来板上发问看看。
预定着手硕士论文的写作,
没意外会是用 Big Data 的资料处理法做金融方面的主题,
因为资料量将会很庞大,故须购置一台笔电(学校没有配给我电脑),
於是选择电脑型号出现问题。
据老师表示,以期货来说,一个月就有 70~80 万笔资料,
所以我用来做论文的资料量或许会有几百万笔
(资料结构会是如何我还不清楚),
私心想要轻薄型电脑,毕竟频繁往来图书馆或研究室,
甚至跨校作业时便携性很重要。
然而时下轻薄型电脑(姑且粗略定义为 14" 萤幕机体大小及 1.7kgs 以下),
接配备 U 系列的CPU,
配备 HQ 系列的CPU大概是没有小於 15.6" 萤幕机体大小且小於 2kgs 的,
想请教板上先进,使用U系列的CPU做 Big Data 的分析是否堪用?
(愚见关键是在CPU的样子,所以作为先决要件;
记忆体会在预算考量及机种支援下尽量最大化。)
谢谢!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.127.120.81
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1508407483.A.615.html
1F:→ andrew43: ram 不够会比 CPU 不够更严重。先估你要多少 ram10/19 18:09
2F:→ andrew43: cpu 主要看运算有多复杂,但老实说coding影响更大。10/19 18:10
不巧的是当下记忆体报价高档,所以在「跑得动」的情况下,
我会配至少16GB的DDR4记忆体。
CPU如果U系列的运算足堪应付的话,
我会考虑捏一下上八代(真四核)的U。
※ 编辑: JefferyTseng (140.127.120.81), 10/19/2017 18:14:45
3F:→ Wush978: 先估计你需要的RAM个数。直接跟老师要个一万笔资料,读到10/19 20:25
4F:→ Wush978: R/python之中利用API (R 用 object.size, python 我不知)10/19 20:26
5F:→ Wush978: 查记忆体用量。然後乘以1000就是千万笔资料需要的记忆体 10/19 20:26
6F:→ Wush978: 然後再乘以2,就差不多是你要稳稳整理资料需要的记忆体10/19 20:26
7F:→ Wush978: 如果你的记忆体低於我上面讲的方法算出来的数字,整理资 10/19 20:27
8F:→ Wush978: 料会比较辛苦一点。10/19 20:28
9F:→ Wush978: 另外资料分析我比较推桌机,比笔电便宜,长时间跑也可以10/19 20:29
10F:→ Wush978: 放着10/19 20:29
11F:推 pelicanper: U基本上就掰了10/20 08:01
12F:推 DIDIMIN: 几百万笔资料用一般 ultra book 就好,样本没有很大10/20 09:00
13F:→ jupit: 期货资料也就只是OHLC四个数字,一天不超过10万个tick,所以10/20 19:10
14F:→ jupit: 相当於一天资料量顶多2M,我看用P4+8g ram就够了吧10/20 19:12
15F:→ luenchang: big data为何不在server里分析? local的电脑就当成一10/22 10:32
16F:→ luenchang: 个access server的介面。能动就好了。10/22 10:32
抱歉我对资讯的部分不是很懂,
请问该如何在 server 内分析呢?
这样我选购 U 系列的 CPU 机种(Ultrabook)就可以了吗?
谢谢。
※ 编辑: JefferyTseng (42.77.201.87), 10/23/2017 22:24:18
17F:→ andrew43: 首先要有一台server,通常是几十万的工作站。 10/24 03:16
18F:→ andrew43: 你可以先按Wush的建议测试,不然只是空谈了。 10/24 03:18
19F:→ andrew43: 如果不知道怎麽估需求,急的话就买你想买的吧。反正如果 10/24 03:25
20F:→ andrew43: 不够用的时候自然就会去找台高效桌机了。 10/24 03:26
21F:推 errard: Big data 笔电随便ultra book就可以了,然後google cloud 10/24 12:28
22F:→ errard: computing或组一台桌机。 10/24 12:28
23F:推 errard: 要笔电硬跑big data 很难,你创个10k*10k大小的矩阵,算一 10/24 12:30
24F:→ errard: 下inverse看要多久。 10/24 12:30
25F:推 cd12631: 认真要固定跑当然用server跑就好 笔电买顺眼的就好 10/24 16:07
26F:→ cd12631: 就算你笔电可以跑 难道你就整天瞪着你的笔电等他跑不做其 10/24 16:08
27F:→ cd12631: 他事吗? 10/24 16:09
28F:→ cd12631: 其实我觉得这种配备应该要求实验室配给你 10/24 16:09
29F:推 goshfju: 好惨 10/25 01:47
30F:→ goshfju: 要马儿好 又要马儿不吃草的感觉 10/25 01:47
感谢大家的建议,因为可能做完一次论文,
就不会再用到需要效能的电脑,
所以
1.如果笔电,甚至桌电达不到这样的需求,其实想省下这笔钱,
昨天研究了 Google Cloud Computing,但能找到的中文资料不多,还在摸索。
2.如果高效能的笔电可以符合需求,就买台 Intel 七代 HQ CPU 搭
16GB RAM 以上的 Notebook,出掉手边的 Intel 3 代 I5 CPU 的 Notebook
(暂定 Acer A715-71G-54UE,CPU:I5-7300HQ)。
3.如果 Ultrabook 能办到,就卖掉现有的平板电脑(Surface pro 3,I5,4GB RAM),
以及 Intel 3 代 I5 CPU 的 Notebook。
购入搭七代或八代 I5 CPU 的 ASUS UX410、UX430、S410、S510、T304
或 Acer Swift 5、Swift 3,可扩充的机型记忆体就扩充至 16GB 或 20GB。
4.如果桌电可以满足需求,不得已就也只能组一台,但是不能在老家、租屋处、
学校间带来带去真是乱不方便的。
另外网路上有人建议组 GPU。(现在才知道还有这种用法,但不知道怎麽组就是了。)
※ 编辑: JefferyTseng (140.127.120.81), 10/26/2017 15:22:15
31F:→ celestialgod: GPU就免了吧... 10/26 18:48
32F:推 bearching: 可以去PC_Shopping板问问,如果在硬体限制的情况下, 10/27 16:22
33F:→ bearching: 是否要试试用Stata处理资料? 我处理一百多万笔的资料 10/27 16:22
34F:→ bearching: 约20个变数以上,用AsusTA205的小笔电都跑得动,不 10/27 16:23
35F:→ bearching: 过比较慢就是了XD 可以同时读一些paper 看你要怎麽跑 10/27 16:23
36F:→ bearching: 资料,方法跟变数先选个大概就可以决定硬体了 10/27 16:24
请问大大说的是这台(Asus X205TA)吗?
https://www.asus.com/us/Laptops/ASUS_EeeBook_X205TA/specifications/
※ 编辑: JefferyTseng (140.127.120.81), 10/28/2017 14:36:30
37F:→ f496328mm: 认真说 笔电U系列蛮弱的 CPU 常常操到挂掉 10/28 15:18
38F:→ f496328mm: 笔电不用到 I7 RAM还比较重要 10/28 15:20
39F:→ f496328mm: 要是真的没办法 就分批处理 DATA 吧 10/28 15:22
40F:→ f496328mm: 会比较麻烦就是了 10/28 15:22