作者e181280 (Enya)
看板R_Language
标题[问题] 筛选含特定文字的资料
时间Tue Jun 5 16:51:16 2018
- 心得: 当你自己想要分享经验时,请使用这个类别。
- 讨论: 当你自己已经有答案,但是也想听听版友意见时。
[问题类型]:
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
[软体熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
目前在自学写PTT爬虫,暂以Stock版为例,由於是抓所有资料,
想要筛选出[请益]的那一行的资料,但用filter等一些网路查到的方法去处理
却一直无法处理完成,所以想请问如何解决,谢谢
做出来的:
datetime title month day
<dttm> <chr> <chr> <chr>
1 2018-06-02 21:22:17 Re: [请益] 台湾程式交易工具现况 06 02
2 2018-06-02 21:55:47 Re: [新闻] 加入MSCI首日 沪指跌0.66% 创业板 06 02
3 2018-06-02 22:06:30 Re: [心得] 第一季寿险到底亏多少? 06 02
4 2018-06-02 22:44:21 [请益] 最近生技股在涨什麽呢? 06 02
5 2018-06-02 22:46:47 [请益] 是不是没人价值派转技术派? 06 02
6 2018-06-02 23:00:09 "[标的] 3029 零壹 多 " 06 02
7 2018-06-02 23:01:49 [请益] 国泰科技ETF 06 02
8 2018-06-03 01:06:21 Re: [心得] 如果能生存,交易是不是最棒的 06 03
9 2018-06-03 02:27:24 Re: [请益] 台湾程式交易工具现况 06 03
10 2018-06-03 04:16:50 "Re: [请益] 请问 \"量缩到极尽\" 怎麽看? 06 03
希望做到:
datetime title month day
<dttm> <chr> <chr> <chr>
1 2018-06-02 22:44:21 [请益] 最近生技股在涨什麽呢? 06 02
2 2018-06-02 22:46:47 [请益] 是不是没人价值派转技术派? 06 02
[程式范例]:
filter(article.table,title %in% '请益')
[环境叙述]:
# A tibble: 0 x 4
#.. with 4 variables: datetime <dttm>, title <chr>, month <chr>, day <chr>
[关键字]:
filter
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 27.52.74.87
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1528188678.A.DB2.html
1F:推 eri820503: 可以看看regular expression 06/05 16:58
2F:→ cywhale: wl <- regexpr("^[0-9](.*?)\\s(\\[|[a-zA-Z])",x) 06/05 17:02
3F:→ cywhale: substr(x,wl,attributes(wl)$match.length-2) 抓时间 06/05 17:02
4F:→ cywhale: substr(x,wl,attributes(wl)$match.length, nchar(x)) 06/05 17:03
5F:→ cywhale: 抓title 06/05 17:03