作者nchunerdy120 (batman)
看板Python
标题[问题] 从评论提取特徵并做成分类器
时间Fri May 8 23:01:48 2020
小弟目前是学生,有个专案是要从几万笔的评论中提取出几个重要的特徵,并且将这些特
徵拿来制造筛选器。
例如从餐厅的评论中得出「食物种类」、「食物价钱」、「食物口味」非常重要,就用这
三个当作分类器的attribute。然後在给定这些attribute值的时候,就能够导向对应的餐
厅。
自己思考一下作法後,归类出两个问题:
首先是该如何提取特徵?我目前的想法是使用tf-idf向量化,找出tf-idf最高的前几个字
当作晒选器的attribute(X)。请问还有其他更适合的方式吗?
第二个问题是该如何把餐厅(Y)跟选定的attribute(X)做连结?毕竟无法连结的话就
无法训练分类器,所以该怎麽把这些attribute(X)跟餐厅(Y)是个大问题... 目前怎
麽解决这件事情小弟完全没有头绪,不知道有没有大神可以解答Orz [编辑]:选定att
ribute之後该怎麽将评论中对应attribute的文字量化,例如评论中提到「食物很好吃」
,那该如何将「好吃」量化放入食物口味的attribute中
麻烦各位乡民们替小弟解惑,如果有上述方法以外的作法也麻烦各位不吝提出,感谢!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.231.28.197 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1588950110.A.4FF.html
1F:推 TuCH: 第二个问题是?? 评论就能产生X吧05/08 23:40
小弟的意思是,选定attribute之後该怎麽将其量化,例如评论中提到「食物很好吃」,
那该如何将「好吃」量化放入食物口味的attribute中,感谢您的提问
※ 编辑: nchunerdy120 (36.231.28.197 台湾), 05/08/2020 23:54:27
2F:推 jigfopsda: 给Y一个具体的定义,然後看一下 supervised learning05/08 23:51
3F:→ jigfopsda: 看看?05/08 23:51
4F:→ nchunerdy120: y就是餐厅唷,例如「争鲜」「必胜客」05/09 00:12
5F:→ s860134: 你想要的应该是推荐系统,把评论关键字转换成加权分数05/09 00:16
6F:→ s860134: 根据加权分数算出排名推荐出来吧? 05/09 00:16
没错,看起来就是这个东西!原谅小弟才疏学浅不知道有推荐系统这个东西orz 请问有什
麽关键字可以上网找实作范例吗?
7F:→ s860134: 关键字 -> 分数 想是没什麽客观标准拉...05/09 00:17
那请问 关键字 -> 分数 有什麽方式可以做转换吗?
※ 编辑: nchunerdy120 (36.231.28.197 台湾), 05/09/2020 00:31:26
8F:推 ddavid: 讲推荐系统很笼统,同样是推荐系统,其外表的目的性跟内部 05/09 00:53
9F:→ ddavid: 的实际方法都可能天差地远05/09 00:53
10F:→ ddavid: 你在用的导航系统也是推荐系统(推荐你路线),Google广告05/09 00:54
11F:→ ddavid: 也是推荐系统(尝试推荐你更可能有兴趣的广告),Facebook 05/09 00:55
12F:→ ddavid: 推荐你可能认识的好友也是推荐系统,推荐系统其实是一个太05/09 00:55
13F:→ ddavid: 大的类别,只讲推荐系统其实没有解答到到实作方向的答案05/09 00:56
了解,感谢您~ 小弟刚拜读完您的文章,有在回文下面提问,再麻烦您解惑了
14F:推 silverair: RNN语意分类?tensorflow官方教学有输入IMDB评论,然後05/09 01:35
15F:→ silverair: 判断这个评论是属於正面或负面05/09 01:35
不只是要做情绪分析唷,主要是希望产出一个筛选器,透过填写筛选器的attribute最终
导向符合理想的店家~
※ 编辑: nchunerdy120 (36.231.28.197 台湾), 05/09/2020 09:41:53
16F:推 ouryouth: 大部分的评论都有这三种attributes吗 没有的话感觉data 05/13 19:32
17F:→ ouryouth: 很难处理 05/13 19:32
18F:推 ddavid: 楼上,当然不一定有啊,没有的你就是要给个missing值之类 05/21 15:21
19F:→ ddavid: 的来标记 05/21 15:21