作者SangoDragon (SANGO)
看板R_Language
标题[问题] R语言在Data mining 的应用
时间Fri Mar 4 10:02:03 2016
本人之前都是用 SQL + Mining tools (例如MS-SQL Analysis service , SPSS Modeler)
之前大部分是用 SQL 整理资料
之後再用 mining Tools run mining (包含调参数等等)
例如我们做一个罗吉斯回归,去预测信用卡客户是否会变呆卡
或用 CART 去做回应率分析
现在关於 R 我有一些问题:
1. R的mining 函数支援到那些演算法?
例如:分群,类神经网路,CART 等等?
2. R有办法调参数吗?
例如分群时分几群,CART的切点,等等 (这部分在mining tools 都有很强的支援)
3. R怎样做Mining前的资料处理?
SQL 强的地方在於下语法可以做很多资料预处理
例如:资料中只有生日要转换成年龄,还有一些更复杂要套公式转换的部份等等
SQL 的资料可以存很多资料
R 在预处理部分的强度如何?
总不能一直读EXCEL的资料吧?
我要表达的是,在资料面SQL 资料库有很强大的SQL语法,跟储存面
R 的方式?
4. 这张图
http://i.imgur.com/iMTOAoG.jpg
是否过誉?
以MS-SQL mining 而言,建构好一个预测模型,可以利用MDX等等
去对这个Model 做一些处理,例如输入资料做预测等等
而且也有很多图形介面的输出
以上几点问题
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 49.214.99.52
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1457056925.A.0B5.html
※ 编辑: SangoDragon (49.214.99.52), 03/04/2016 10:03:16
1F:推 JackBaska: R绝对可以,但前提是有coding 的 sense 03/04 15:02
2F:→ JackBaska: R是很强物件导向的weak type语言 03/04 15:06
3F:→ obarisk: r的物件导向真心不推... 03/04 18:59
4F:推 JX660: 个人用过R SAS SPSS 比较图中六项 R毫无疑问是完胜 03/04 23:34
5F:→ JX660: 阿不是六项 是八项 不过SAS SPSS有其他方面的好处就是了 03/04 23:39
6F:推 JackBaska: o大 虽然R写物件很麻烦,但他基础型态是以物件式管理的 03/04 23:51
7F:→ JackBaska: 所以相对很多问题变很好解 03/04 23:52
8F:→ celestialgod: 我觉得R6用物件导向就还可以 03/05 00:34
9F:→ clickhere: 2/29 R 刚刚满 8000 个 packages...这图要更新了 03/05 09:43
10F:→ clickhere: 这还不含 BioC 和 archived 的 packages. 03/05 09:44
11F:→ clickhere: R的基础型态不是以物件式管理的... 03/05 09:47
12F:推 JackBaska: ???我之前看原文网站有强调所有资料都是一个物件 ??? 03/05 09:52
13F:→ JackBaska: 我一开始用的时候觉得他资料有些部分默认的方式很像 03/05 09:52
14F:→ JackBaska: 物件 , 後来看到网站写那段 03/05 09:52
15F:推 JackBaska: 原网站我要再找一下,不过当时是主要查询class用法,然後 03/05 09:55
16F:→ JackBaska: 系列文章有从物件切入,然後有一段直接写,实质上所有 03/05 09:55
17F:→ JackBaska: 元素都是物件,然後再开始介绍怎麽去自己另外写一个物件 03/05 09:56
18F:推 JackBaska: 会需要另外写主要是我有需求开发特殊物件 03/05 09:58
19F:→ andrew43: 物件式管理和它是不是物件应该不是同义的。 03/05 18:31
20F:推 JackBaska: 感谢A大,能否多分享一点相关资讯?我最近还在研究,想问 03/05 21:50
21F:→ JackBaska: 有经验的人的人一些比较详细的知识 03/05 21:51
22F:→ andrew43: 我不是专家。R确实让所有的型态都是物件,但它和主流的 03/05 22:45
23F:→ andrew43: 物件导向语言的特色还是差距不少。 03/05 22:47
24F:→ andrew43: 在主流的S3和S4,继承、多型、封装都有点半调子。 03/05 22:48
25F:→ celestialgod: reference也是,可以考虑R6吧 03/05 22:50
26F:→ andrew43: 前面c大提到的R6有很大的进展,它至少把最基本物件导向 03/05 22:50
27F:→ andrew43: 该有的特徵都有了。很物件导向的朋友可以研究R6下去。 03/05 22:52
28F:→ andrew43: 又例如S3或S4连私有成员都没有,实在很不「物件导向」。 03/05 22:55
29F:→ clickhere: 继承、多型、封装都是在S3/S4之後才逐渐成形的. 03/06 09:17
30F:→ clickhere: 光能用在函数和变数中用"."就够C++和java使用者头痛了 03/06 09:19
31F:→ clickhere: 就甭说管理或导向了...S3/4当年可是很先进的咧. 03/06 09:21
32F:→ andrew43: 谢谢补充这段历史先後顺序。 03/06 12:05
33F:→ obarisk: 学完s4,换rc,现在是r6 03/07 19:21