作者nesiron (Nes)
看板Python
标题[问题] 用pandas计算推文的速度
时间Tue Sep 3 01:50:16 2019
大家好
我想用PTT推文的时间资料,计算文章被推爆或嘘爆的时间
以下是我一部分的资料:
文章ID 推文时间
1R9wmgLL → alfonsosoria 盖 2019-06-18 20:57
1R9wmgLL → alfonsosoria 干 2019-06-18 20:57
1R9wmgLL → meowchen 谢三楼 2019-06-18 20:57
1R9wmgLL → hitsukix 新闻很故意 2019-06-18 20:58
1R9wmgLL 推 borissun 新新相连比较好记 2019-06-18 20:58
1R9wmgLL 推 lovekangin 明眼人都知道母鸡是谁 呵呵 2019-06-18 20:58
1R9wmgLL 推 Workforme 其他几个没连到是....不会做事? 2019-06-18 20:58
1R9wmgLL → ga652206 可怜 2019-06-18 20:58
1R9wmgLL 嘘 minimax76715 绿,台湾精神,笑话连线。 2019-06-19 08:04
1RAtj_Ns → LAKobeBryant 新竹人出来说 2019-06-21 18:19
1RAtj_Ns 推 kid33 国民党不派实力坚强的 2019-06-21 18:19
1RAtj_Ns 嘘 modachen 恶不恶心 2019-06-21 18:19
1RAtj_Ns 推 venomsoul 光复路来一下谢谢 2019-06-21 18:20
我想groupby文章ID,然後在推文时间後添加一栏为净推数(=推-嘘)
这样在净推数为100时,就可以知道被推爆的时间和速度
下面是我的程式码:
import pandas as pd
#读取资料来源
csvfile = pd.read_csv("推文.csv")
group = csvfile.groupby("文章ID")
csvfile["推文时间"] = pd.to_datetime(csvfile["推文时间"])
到这里就卡住不知道怎麽写了QQ
请板友提点一下接下来该怎麽写
感谢
--
Sent from my Windows
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.141.67.58 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1567446618.A.B80.html
※ 编辑: nesiron (220.141.67.58 台湾), 09/03/2019 01:55:57
1F:→ djshen: 式子列出来就会写了吧 09/03 02:16
2F:推 karco: 纪录发文时间跟推文时间 09/03 03:23
3F:→ karco: 不就能得知推爆速度了吗? 09/03 03:23
4F:→ karco: 搭配time应该可以算 09/03 03:23
5F:推 gmoz: 先用头脑去想 再用程式码去实现 09/03 10:32
6F:→ gmoz: 依时序往下读 同文章嘘-1 推+1 看什麽时候达到就好啦 09/03 10:32
7F:→ nesiron: 好的,谢谢各位,比较有头绪了 09/03 10:41
8F:→ CodingMan: 加油 09/03 13:01
9F:→ Kazimir: df.rolling().sum() ? 09/04 20:06