R_Language 板


LINE

做完才看到这份,我写写我的作法好了 S1 <- regexpr("\\?", XXX$text) S1[S1 < 0] = NA End <- 1000 XXX$text <- substr(XXX$text, S1+1, End) --上面把?後面的取出来 XXX <- na.omit(XXX) code_1 <- strsplit(XXX$text, "&") names(code_1) <- XXX$id --为了可以识别url来自哪个id code_2 <- do.call(rbind, lapply(code_1, data.frame, stringsAsFactors = F)) do.call(rbind, ......)跟rbind不是一样的吗?可是我只用rbind解不出来 S2 <- regexpr("\\=", code_2$X..i..) 跟&的一样 ^^^^^^我懒得改了 code_2$Name <- substr(code_12$X..i.., 1, S2-1) code_2$Value <- substr(code_12$X..i.., S2+1, 50) 把=前後的值设为对应的值 S3 <- regexpr("\\.", rownames(code_2)) 因为列名不能重复,所以id会出现.1、.2、.3、......我只要.之前的id code_2$line_id <- substr(rownames(code_2), 1, S3-1) result <- code_12[,c("line_id", "Name", "Value")] rownames(result) <- NULL 这我自己龟毛,rowname看起来很阿砸 cast <- dcast(result, formula = id ~ Name, value.var = "Value") 这是大神的套件,我之前的动作就是为了产生这个cast 有其他更好的方法吗? 求教了 ※ 引述《celestialgod (天)》之铭言: : 前面先随便给他一个protocle跟host 加个?表示是query string : 然後用httr::parse_url就可以轻松处理完了 : 剩下就是看你要什麽栏位mapping到table中,改个名字,然後as.data.frame即可 : library(httr) : x <- parse_url(paste0("http://1?", "utm_source=apple&utm_campaign=PRO&", : "utm_medium=banner&text_id=12228473&date=970101&", : "loc=65173194cbfdbb89e06742a196ec150f")) : x$query : # $utm_source : # [1] "apple" : # : # $utm_campaign : # [1] "PRO" : # : # $utm_medium : # [1] "banner" : # : # $text_id : # [1] "12228473" : # : # $date : # [1] "970101" : # : # $loc : # [1] "65173194cbfdbb89e06742a196ec150f" : ※ 引述《jklkj (诚实可靠小郎君)》之铭言: : : [问题类型]: : : 程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来) : : [软体熟悉度]: : : 入门(写过其他程式,只是对语法不熟悉) : : [问题叙述]: : : 目前我有A、B两个table : : 我想做一件事是把两个table先join成C,这部分没问题我用merge : : 之後我想当item栏位是空值时把text的资料撷取出部分 : : text的资料是url类似 : : utm_source=apple&utm_campaign=PRO&utm_medium=banner&text_id=12228473&date= : : 970101&loc=65173194cbfdbb89e06742a196ec150f : : 我想把各别的字串丢进资料库的栏位中 : : 例如: : : apple 丢进source栏位 : : PRO丢进campaign栏位 : : banner丢进medium栏位 : : 65173194cbfdbb89e06742a196ec150f丢进loc栏位 : : 但是text_id我没有设栏位,所以不需要解析 : : [程式范例]: : : if(C$item == "") {C$apple <- C$text} : : 我本来是想说先丢进去再拆解,可是我连这个最基础的都ERROR : : the condition has length > 1 and only the first element will be used : : 想问一下这怎麽处理 : : [环境叙述]: : : R version 3.3.3 (2017-03-06) : : Platform: x86_64-w64-mingw32/x64 (64-bit) : : Running under: Windows 7 x64 (build 7601) Service Pack 1 : : locale: : : [1] LC_COLLATE=Chinese (Traditional)_Taiwan.950 LC_CTYPE=Chinese (Traditional)_Taiwan.950 : : [3] LC_MONETARY=Chinese (Traditional)_Taiwan.950 LC_NUMERIC=C : : [5] LC_TIME=Chinese (Traditional)_Taiwan.950 : : attached base packages: : : [1] stats graphics grDevices utils datasets methods base : : other attached packages: : : [1] RPostgreSQL_0.4-1 DBI_0.6 : : loaded via a namespace (and not attached): : : [1] tools_3.3.3 : : [关键字]: : : ETL --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 211.23.167.43
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1497503939.A.81C.html







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:BabyMother站内搜寻

TOP