作者stayfool (fool)
看板DataScience
標題[問題] 自然語言處理 如何找資料?
時間Wed Oct 19 17:34:22 2022
問題類別:NLP
使用工具:tensorflow
問題內容:
需求如下,給定句子,風景真美麗,斷詞後並打亂,可能變成
「美麗,風景,真」或「真,風景,美麗」或其它組合
目標是機器訓練後,
當輸入「美麗,風景,真」或「真,風景,美麗」或其它組合
輸出會得到 風景真美麗
給定句子,我要買玩具,斷詞後並打亂會得到隨機的文字序列
當輸入隨機的文字序列,
輸出會得到 我要買玩具
想知道 該下什麼關鍵字 才能找到這方面的資料?
一直找不到,故上站發問,謝謝能解答的各位
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.160.218.107 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1666172064.A.FC0.html
1F:→ chang1248w: 自己斷詞之後打亂不行嗎 10/19 22:57
2F:→ chang1248w: 你是要找refer還是資料集....? 10/19 22:58
3F:→ chang1248w: 我記得bert的其中一個是抽換語句順序的 10/19 22:59
4F:→ chang1248w: ^訓練任務 10/19 23:00
5F:→ chang1248w: 不是bert就是albert 10/19 23:06
7F:→ chang1248w: 你有先土炮硬上過嗎 10/19 23:16
8F:→ imvic999: 參考這個概念看看"以功能詞及知網為基礎之軟體搜尋系統" 10/20 13:39
9F:→ imvic999: 18年前寫的碩論 10/20 13:41
10F:→ stayfool: 如果這個題目從來沒有人研究,那我只好獨自鑽研 10/20 14:38
11F:→ stayfool: 否則,我希望有範例能參考,就不用重新打造輪子 10/20 14:40
12F:→ stayfool: 我看了碩論,找不到能解決我的需求的概念 10/20 14:41
14F:→ chang1248w: 稍微爬了一下,跟恢復句意相比,研究模型怎麼理解句意 10/20 16:55
15F:→ chang1248w: 才是主流 10/20 16:56
17F:→ chang1248w: 研究多半只抽換一兩個詞的順序,不會完全破壞整體的 10/20 18:24
18F:→ chang1248w: 句法結構 10/20 18:24
19F:→ chang1248w: 所以不如從詞袋造句開始找 10/20 18:25
20F:→ chang1248w: 噢... 你是之前那個google壞掉的天兵 10/20 18:30
21F:→ stayfool: ch大!強!給出的連結就是我想查詢的資料 10/20 19:20
22F:→ stayfool: 你說的詞袋造句,該如何查呢?google"詞袋 造句"或 10/20 19:23
23F:→ stayfool: "bag of words sentence" "機器學習 造句"都找不到 10/20 19:24
24F:→ stayfool: 適合的資料 10/20 19:24
25F:→ lycantrope: 原來是google壞掉的部分,建議google如何使用google 10/21 10:48