作者elegantnight (elegantnight)
看板R_Language
标题[问题] 投影寻踪相关问题
时间Sun Nov 15 23:00:52 2015
[问题类型]:
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
不好意思打扰,我有个台湾去北京大学念书的朋友,遇到一份需要使用R的作业,希望可以
请大家帮忙 >"< 他是第一次写R的新手,完全不知道该怎麽处理,
所以希望可以得到一点建议或是方向,谢谢大家!
问题如下:
4. 探索性数据分析部分
在loan data中,自选合适的定量变量,通过投影寻踪来研究影响grade的因素。要求:
(1)指出你所选择的投影指标,并说明理由;
(2)给出投影向量,你是否能通过投影向量说明哪些变量对grade的影响比较大?
(3)在投影结果中,对不同grade的样本点进行染色,说明投影结果是否能够反应grade变量的分组情况
(4)数据中是否存在特异点?如果有,请指出来。
会需要用到REPPlab中的函数
3. 统计制图部分
在loan data中,自选合适的变量,绘制以下图形:
(1)分面的风玫瑰图,玫瑰叶片的颜色至少三种;
(2)某一个连续型变量的分布直方图,并加入拟合分布线,直方图的组距和组数自己设定
(不要使用默认的),并且每个柱子里面填上相应的组的频数,整个图片加上一个蓝色的
外框,并且图的底色为深色,柱子为浅色;
(3)某两个连续型变量的密度图,并且在图中找出一个部分加上一个方框与其他部分区
别开来(比如说,密度最高或者最低的区域,用一个矩形的方框加以标示);
(4)挑选多个连续型变量,进行聚类,并且绘制相应的热图(可以不用全部样本)。
要求:以上所有图表都要求有图表名称、图例、行标题、列标题等要素。
data 如下:
https://www.dropbox.com/s/t7madvx8dmj4ai6/LoanStats3d.csv.zip?dl=0
因为我也完全不会R,但是朋友希望我可以帮他问问看,如果有不洽当的地方,
再麻烦跟我说,我会自己删文,拜托大家了,谢谢! >"<
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.227.174.122
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1447599655.A.E98.html
1F:→ Wush978: 请建议你朋友把R 学起来之後再尝试看看。可以参考置底 11/15 23:22
2F:→ Wush978: 也欢迎试试看我最近写的教材: 11/15 23:22
4F:→ elegantnight: 谢谢W大,但是因为她明天就得交,所以还是希望得到 11/15 23:49
5F:→ elegantnight: 一些方向的建议 >"< 11/15 23:49
6F:→ Wush978: 对於完全不懂R 的新手,我觉得除了学R 以外的建议都多余 11/16 01:13