作者jklkj (诚实可靠小郎君)
看板R_Language
标题[问题] 在R中有类似Excel的资料剖析的语法或工具
时间Fri Jun 9 17:02:58 2017
[问题类型]:
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
[软体熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
目前我有A、B两个table
我想做一件事是把两个table先join成C,这部分没问题我用merge
之後我想当item栏位是空值时把text的资料撷取出部分
text的资料是url类似
utm_source=apple&utm_campaign=PRO&utm_medium=banner&text_id=12228473&date=
970101&loc=65173194cbfdbb89e06742a196ec150f
我想把各别的字串丢进资料库的栏位中
例如:
apple 丢进source栏位
PRO丢进campaign栏位
banner丢进medium栏位
65173194cbfdbb89e06742a196ec150f丢进loc栏位
但是text_id我没有设栏位,所以不需要解析
[程式范例]:
if(C$item == "") {C$apple <- C$text}
我本来是想说先丢进去再拆解,可是我连这个最基础的都ERROR
the condition has length > 1 and only the first element will be used
想问一下这怎麽处理
[环境叙述]:
R version 3.3.3 (2017-03-06)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 7 x64 (build 7601) Service Pack 1
locale:
[1] LC_COLLATE=Chinese (Traditional)_Taiwan.950 LC_CTYPE=Chinese (Traditional)_Taiwan.950
[3] LC_MONETARY=Chinese (Traditional)_Taiwan.950 LC_NUMERIC=C
[5] LC_TIME=Chinese (Traditional)_Taiwan.950
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] RPostgreSQL_0.4-1 DBI_0.6
loaded via a namespace (and not attached):
[1] tools_3.3.3
[关键字]:
ETL
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 211.23.167.43
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1496998981.A.87C.html
1F:→ andrew43: 你会用regular expression吗?不会的话趁机会学起来 06/09 18:00
2F:→ andrew43: 另外,URL的参数一定是这6项不会有缺有例外吗? 06/09 18:01
3F:→ tses89214: error是因为C$item有很多项,土法炼钢一点可以用for或 06/09 18:19
4F:→ tses89214: lapply之类的function来处理 06/09 18:20
5F:推 Goldexp: stringr的str_split_fixed 试试看 然後再整理一下应该可 06/13 12:44
6F:推 celestialgod: 善用urltools::url_parse就好了 06/13 18:37
7F:→ celestialgod: 推错了QQ 我还是回个文 06/13 18:44