Re: [问题] 不同主题的情绪分析的资料库

时间Wed Jun 10 14:24:16 2020

※ 引述《nchunerdy120 (batman)》之铭言： : 推 ddavid: 因为例如价格这个就比一般的情绪分析麻烦，所以就算做出一 06/09 20:59 : → ddavid: 套来也很难通用，难通用就相对比较不会有学术公开发表，一 06/09 21:00 : → ddavid: 般会是商业上自己独门建一套出来只适用他经营项目这样，自 06/09 21:01 : → ddavid: 然也不会开放出来（因为是他吃饭的家伙） 06/09 21:01 : 推 ddavid: 你还是可以针对题目很类似的情绪或语意分析研究找看看有没 06/09 21:11 : → ddavid: 有，不一定能找到就是 06/09 21:11 : 了解，所以要做好得自己定义一套的准备咯XDD 真的非常感谢您多次帮忙！！！对了，我讲一下完整弄一套这个时可以考虑的一个招数。相信各位在网路上常玩过有种小游戏是一直出现两个选项叫你选比较喜欢的那个，选了很多次以後他就可以帮你弄出一个所有东西对你个人而言的排序结果。跟上面那个很相似，写个可以一直随机丢出两个词（或两个句子）的网页或app 让使用者简单点选「哪个词让你觉得比较贵？」最後就可以列出每个使用者对於每个词的「价格」概念由贵到便宜排列，例如：天价 > 千金难买 > 买不起 > 昂贵 > 高价 > 高级 > 平价 > 实惠 > 便宜 > 廉价你想办法让更多人玩这个东西，把这些结果存起来，之後就可以建立Model直接从这些资讯去自动学每个词的分数，到最後再测试并手动微调。这样会比从头到尾手动自己想一套分数来得合理。当然要建立这个程式并让多一些人来测试也是有其麻烦之处啦，所以这只是一种可能性，你可以自己想想有什麽其他方法可以不要只靠自己观点来从头建立一套分数。至於学习的Model，比如最简单就是把每个人最後排列出来的ranking normalize 到0到1之间，然後再对所有使用者同一个词的normalized ranking加总平均作为分数。更进阶当然会有更多适用不同情况的方法。例如前述例子就可以：天价 > 千金难买 > 买不起 > 昂贵 > 高价 > 高级 > 平价 > 实惠 > 便宜 > 廉价 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 每个人排列出来的结果当然不会一样，因此每个人的结果加总平均，某种程度就解释了受测者对於各个词的平均昂贵程度语感。收集的受测资料越多，我们就可以期待应该可以更接近社会平均对词汇的认知语感。最後说句老实话，包括以前那次回答，这些文章似乎发在DataScience版会更好，内容已经不太Python了XD。而且那边有经验的高手应该更集中，也许会得到更多不同的好答案。 -- 「去质疑亲眼所见的事是最愚昧的行为。这又分为两种－－质疑自己所见是不是真的，或是用见到的事去质疑没见到的事。呵。」－－芙莉雅，谎言事务所实现使者 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.169.66.177 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1591770260.A.030.html ※ 编辑: ddavid (1.169.66.177 台湾), 06/10/2020 14:25:55

1^F：推 nchunerdy120: 呜呜真的太感谢您了！！！会在python问一方面是想 06/10 23:18

2^F：→ nchunerdy120: 问情绪分析的package，然後也是因为不知道有datasci 06/10 23:18

3^F：→ nchunerdy120: ence版XDDD 谢谢您多次提点，万分感谢！！！ 06/10 23:18

对了，其实忘了补充一句，明眼人可以很明显看出上面那举例中排列给出的分数是有问题的。至於怎麽修正？那就是手法各有巧妙不同，看自己的需求而定了。 ※ 编辑: ddavid (1.169.72.51 台湾), 06/16/2020 10:13:36

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Python 板

Re: [问题] 不同主题的情绪分析的资料库

热门看板

赞助商连结