作者stayfool (fool)
看板DataScience
标题[问题] 自然语言处理 如何找资料?
时间Wed Oct 19 17:34:22 2022
问题类别:NLP
使用工具:tensorflow
问题内容:
需求如下,给定句子,风景真美丽,断词後并打乱,可能变成
「美丽,风景,真」或「真,风景,美丽」或其它组合
目标是机器训练後,
当输入「美丽,风景,真」或「真,风景,美丽」或其它组合
输出会得到 风景真美丽
给定句子,我要买玩具,断词後并打乱会得到随机的文字序列
当输入随机的文字序列,
输出会得到 我要买玩具
想知道 该下什麽关键字 才能找到这方面的资料?
一直找不到,故上站发问,谢谢能解答的各位
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.160.218.107 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1666172064.A.FC0.html
1F:→ chang1248w: 自己断词之後打乱不行吗 10/19 22:57
2F:→ chang1248w: 你是要找refer还是资料集....? 10/19 22:58
3F:→ chang1248w: 我记得bert的其中一个是抽换语句顺序的 10/19 22:59
4F:→ chang1248w: ^训练任务 10/19 23:00
5F:→ chang1248w: 不是bert就是albert 10/19 23:06
7F:→ chang1248w: 你有先土炮硬上过吗 10/19 23:16
8F:→ imvic999: 参考这个概念看看"以功能词及知网为基础之软体搜寻系统" 10/20 13:39
9F:→ imvic999: 18年前写的硕论 10/20 13:41
10F:→ stayfool: 如果这个题目从来没有人研究,那我只好独自钻研 10/20 14:38
11F:→ stayfool: 否则,我希望有范例能参考,就不用重新打造轮子 10/20 14:40
12F:→ stayfool: 我看了硕论,找不到能解决我的需求的概念 10/20 14:41
14F:→ chang1248w: 稍微爬了一下,跟恢复句意相比,研究模型怎麽理解句意 10/20 16:55
15F:→ chang1248w: 才是主流 10/20 16:56
17F:→ chang1248w: 研究多半只抽换一两个词的顺序,不会完全破坏整体的 10/20 18:24
18F:→ chang1248w: 句法结构 10/20 18:24
19F:→ chang1248w: 所以不如从词袋造句开始找 10/20 18:25
20F:→ chang1248w: 噢... 你是之前那个google坏掉的天兵 10/20 18:30
21F:→ stayfool: ch大!强!给出的连结就是我想查询的资料 10/20 19:20
22F:→ stayfool: 你说的词袋造句,该如何查呢?google"词袋 造句"或 10/20 19:23
23F:→ stayfool: "bag of words sentence" "机器学习 造句"都找不到 10/20 19:24
24F:→ stayfool: 适合的资料 10/20 19:24
25F:→ lycantrope: 原来是google坏掉的部分,建议google如何使用google 10/21 10:48