作者Su22 (装配匠)
看板R_Language
标题[问题] data frame的index
时间Mon Mar 20 22:53:05 2017
[问题类型]:
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
[软体熟悉度]:
请把以下不需要的部份删除
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
请简略描述你所要做的事情,或是这个程式的目的
假设我捞了0050的股票资料存到data frame
这样data frame最前面是日期(但不是data frame的栏位)
但该日期栏并不是data frame的栏位
如果我又捞了0056的股票资料存到另一个data frame
data frame最前面也是日期(但不是data frame的栏位)
那要如何用日期来join两个data frame ?
[程式范例]:
#install.packages("quantmod")
library(quantmod)
STK0050=get(getSymbols("0050.tw"))
View(STK0050)
STK0050DF=data.frame(STK0050)
str(STK0050DF)#查出来日期并非data frame的栏位
STK0056=get(getSymbols("0056.tw"))
View(STK0056)
STK0056DF=data.frame(STK0056)
str(STK0056DF)#查出来日期并非data frame的栏位
#若我要用index:日期来join STK0050与STK0056
该怎麽做?
[环境叙述]:
> library(quantmod)
Loading required package: xts
Loading required package: zoo
Attaching package: ‘zoo’
The following objects are masked from ‘package:base’:
as.Date, as.Date.numeric
Loading required package: TTR
Version 0.4-0 included new data defaults. See ?getSymbols.
Warning messages:
1: package ‘quantmod’ was built under R version 3.3.3
2: package ‘xts’ was built under R version 3.3.3
3: package ‘zoo’ was built under R version 3.3.3
4: package ‘TTR’ was built under R version 3.3.3
> STK0050=get(getSymbols("0050.tw"))
As of 0.4-0, ‘getSymbols’ uses env=parent.frame() and
auto.assign=TRUE by default.
This behavior will be phased out in 0.5-0 when the call will
default to use auto.assign=FALSE. getOption("getSymbols.env") and
getOptions("getSymbols.auto.assign") are now checked for alternate defaults
This message is shown once per session and may be disabled by setting
options("getSymbols.warning4.0"=FALSE). See ?getSymbols for more details.
> View(STK0050)
> STK0050DF=data.frame(STK0050)
> str(STK0050DF)#查出来日期并非data frame的栏位
'data.frame': 2235 obs. of 6 variables:
$ X0050.TW.Open : num 61.5 60.1 59.1 59.1 56.4 ...
$ X0050.TW.High : num 61.7 61.3 59.4 59.4 57.6 ...
$ X0050.TW.Low : num 61 60 58.6 58 56.3 ...
$ X0050.TW.Close : num 61.5 60.1 59.1 59.1 56.4 ...
$ X0050.TW.Volume : num 2870000 4975000 7413000 7686000 20041000 ...
$ X0050.TW.Adjusted: num 52.2 51 50.2 50.2 47.9 ...
>
> STK0056=get(getSymbols("0056.tw"))
> View(STK0056)
> STK0056DF=data.frame(STK0056)
> str(STK0056DF)#查出来日期并非data frame的栏位
'data.frame': 2235 obs. of 6 variables:
$ X0056.TW.Open : num 26 25.8 25.4 25.4 25.1 ...
$ X0056.TW.High : num 26.1 26.1 25.4 25.4 25.4 ...
$ X0056.TW.Low : num 25.7 25.7 25.2 25.1 25 ...
$ X0056.TW.Close : num 26 25.8 25.4 25.4 25.1 ...
$ X0056.TW.Volume : num 3440000 3806000 3145000 1543000 5381000 ...
$ X0056.TW.Adjusted: num 19.9 19.7 19.4 19.4 19.1 ...
[关键字]:
#data frame
#index
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.161.47.220
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1490021589.A.DA1.html
※ 编辑: Su22 (118.161.47.220), 03/20/2017 22:53:38
※ 编辑: Su22 (118.161.47.220), 03/20/2017 22:54:40
1F:推 bluecadence: merge(STK0050,STK0056,all=True) 这是你要的吗? 03/20 23:59
概念上是用merge没错
但直接这样写好像出来的结果不是我要的
我是要依照日期当index值去join这两个data frame
所以join後一个日期应该只会有一笔row
2F:→ bluecadence: 另外getSymbols()吐出来的资料是xts格式,如果你想要 03/21 00:00
3F:→ bluecadence: 把日期抓出来,要用index() 03/21 00:01
4F:→ bluecadence: 例如index(STK0050) 03/21 00:02
谢谢~试了index()的确可以把日期抓出来
我後来是用index把日期变成data frame的一个正式栏位
取名为DATE
STK0050DF=cbind(STK0050DF,index(STK0050))
colnames(STK0050DF)[ncol(STK0050DF)]='DATE'
0056也用同样的方法新增出一栏DATE
再用merge(STK0050DF,STK0056DF,by="DATE")
是可以达到我原本期望的效果
虽然要经过一次加工...
※ 编辑: Su22 (118.161.49.73), 03/22/2017 21:43:14