作者CaptPlanet (ep)
看板DataScience
标题[问题] Word2Vec LSTM sentiment classification
时间Tue Apr 10 13:11:53 2018
ctrl + y 可以删除一整行,请将不需要的内容删除
文章分类提示:
- 问题: 当你想要问问题时,请使用这个类别。
- 讨论: 当你自己已经有答案,但是也想听听版友意见时。
- 情报: 当你看到消息时,请使用这个类别。
根据板规规定,做适当的转换,以及摘录重要文意。
- 心得: 当你自己想要分享经验时,请使用这个类别。
(回答并非义务,所以当有人回答时,哪怕句谢谢也好,多多回应,大E可编辑文章)
(如果用不到以下框架,如观念问题请自行视情况删除作业系统,使用工具等项目)
作业系统:(win10)
问题类别:(DL, RNN, NLP)
使用工具:(python,keras,gensim word2vec)
问题内容:
最近尝试对文本进行正负面评价分类
先自己训练了word2vec模型(一个词256维)
然後参考网路上的code
https://blog.keras.io/using-pre-trained-word-embeddings-in-a-keras-model.html
利用tokenizer和sequence padding把文章转成对应的编码(400维向量)
再利用embedding 层设置权重让汇入的文章变成400*256的矩阵
Embedding层後接着三层LSTM然後Flatten和Dense输出2维向量用softmax和crossentropy
预测正负面
目前已经都训练完成,但是现在想要实际丢入一些新资料进去预测,新的文章该如何转换
成这个model的输入呢?
直接参考上面的code用一样的方法将文章编码就可以输入了吗?
感谢各位
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 110.26.70.117
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1523337118.A.C01.html
※ 编辑: CaptPlanet (110.26.70.117), 04/10/2018 13:12:49
※ 编辑: CaptPlanet (110.26.70.117), 04/10/2018 13:51:04
2F:推 lucien0410: 这个研讨会的task 3 是推特的语意分析 04/11 00:03
3F:→ lucien0410: 没有回答到你的问题 但你可以看看state of the art 04/11 00:10
4F:→ lucien0410: 用什麽方法 04/11 00:10
5F:推 lucien0410: 我说错了 语意分析是task 4 不是3 04/11 00:22