作者sunbysea (忠言逆耳良药苦口)
看板Tech_Job
标题[新闻] DeepSeek涉不当获取OpenAI数据?微软调查
时间Wed Jan 29 17:41:12 2025
DeepSeek涉不当获取OpenAI数据?微软调查
https://i.imgur.com/xLJQAYe.jpeg
2025年1月28日,在巴黎的一部手机上显示的中国应用程式DeepSeek(左)和美国应用程
式ChatGPT的标志。 (Joel Saget/AFP)
【大纪元2025年01月29日讯】(大纪元记者夏雨综合报导)彭博社周二(1月28日)报导
,知情人士透露,微软和OpenAI正在调查OpenAI技术输出的数据,是否被一个与中国
人工智能初创公司DeepSeek有关团体以未经授权方式获取。
知情人士表示,微软的安全研究人员在去年秋季发现,他们认为可能与DeepSeek有关的个
人使用OpenAI应用程序编程接口(API)窃取了大量数据。由於此事属於机密,这些知情
人士要求不具名。
软件开发人员可以付费获得使用API的许可,将OpenAI专有人工智能模型集成到他们自己
的应用程序中。
知情人士表示,作为OpenAI技术合作夥伴和最大投资者的微软,已将这一行为通知了
OpenAI。知情人士表示,此类活动可能违反OpenAI的服务条款,也可能表明该组织采取行
动取消了OpenAI对其可获取数据量的限制。
周一,低成本的DeepSeek应用在美国苹果应用商店中超越了OpenAI的ChatGPT,引发科技
股抛售。
周二早些时候,白宫人工智能和加密特使大卫‧萨克斯(David Sacks)在福克斯新闻受
访时,被问及DeepSeek的进展是否涉及知识产权盗窃。他表示,有「大量证据」表明
DeepSeek依靠OpenAI模型的输出,来帮助开发自己的技术。
「这是可能的。人工智能中有一种叫做蒸馏(知识蒸馏,Knowledge Distillation)的技
术,你会听到很多关於它的信息,它是指一个模型从另一个模型中学习。」萨克斯在采访
中说。
路透社报导,OpenAI一位发言人在一份声明中附和了萨克斯的说法,指出中国公司和其它
公司一直在试图复制美国领先人工智能公司的模型,但没有具体点名DeepSeek或任何其它
公司。
「我们采取反制措施来保护我们的知识产权,包括谨慎确定哪些前沿能力应该纳入已发布
的模型中,并相信在我们前进的过程中,与美国政府密切合作至关重要,以最好地保护最
强大的模型,防止对手和竞争对手窃取美国技术。」声明说。
责任编辑:叶紫微#
https://www.epochtimes.com/b5/25/1/29/n14424578.htm
----
该查就查,但结果是明显的,是说同一个行业赛道大家努力的方式不会差太远,任何不能
够踏踏实实努力、想走捷径弯道超车的都不会长久,除非你真的是那个万中选一的AI奇才
、天才中的天才
补充下,模型开源跟用什麽资料做训练是两回事,完全可以是开源的模型,然後在没有得
到ChatGPT允许的前提下,用ChatGPT的输出输入资料做模型训练,也就知识蒸馏
Knowledge Distillation,以此走捷径得到一个建立在ChatGPT高品质输出输入前提下又
进一步的结果
至於这个模型到底有没有能力在不透过ChatGPT资料前提下把那些raw data转化内敛为同
ChatGPT等级的输出结果,这个不得而知
同时这种模式的缺点也是易见的,暂时瞥除未经允许拿ChatGPT资料训练的智慧财产权、
授权等法律问题,如果没有ChatGPT或者ChatGPT也答不出来的问题,那基於此基础的延伸
AI同样很难答出这类问题的答案,也就是很难超越其资料宿主ChatGPT
--
於贵州省平塘县掌布乡发现的「藏字石」,藏於距今 2.7亿年左右的二叠统栖霞组
深灰色岩中,石上六个大字「中国共产党亡」,可谓是「天灭中共」、天意使然,
中国共产党就是古今中外各种预言中的末世魔鬼,迷惑欺骗全人类的赤龙撒旦,望
百姓明鉴,
曾入中共党团队者,记得退党、退团、退队,三退抹去兽印,与恶党划
清界线,善恶报应之时才不至於随恶党一起遭报,给自己选择一个光明美好的未来!
https://i.imgur.com/MGxr2Ng.jpg https://youtu.be/OSqNGxXB1tg
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 61.227.17.50 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Tech_Job/M.1738143676.A.35F.html
1F:推 KanzakiHAria: 哈哈哈openai干多少别人的资料 36.231.98.6 01/29 17:51
2F:推 sunnyhung : 禁吧,美国能用ai 中国只有ci 111.81.62.140 01/29 17:53
3F:推 cplusplus426: ccc 223.141.144.87 01/29 17:55
4F:嘘 oldchang1205: 说个笑话 大纪元 111.82.181.143 01/29 17:56
5F:推 boards : 中国拉一根暗管 112.78.81.247 01/29 18:09
6F:→ boards : 偷接OpenAI 、Gemini ! 112.78.81.247 01/29 18:09
7F:→ boards : 资料还会回传中国! 112.78.81.247 01/29 18:09
8F:→ solid1109 : dv失败的话,就不会查了 39.14.33.152 01/29 18:17
9F:推 mryf : 连techjob也被中国网军罢占了… 118.170.202.14 01/29 18:21
10F:→ henrk : 程式里有用到abc就是美国技术了吧! 114.36.41.134 01/29 18:25
11F:→ vsbrm : 一个整理课文变成考卷,一个整理考 223.139.92.248 01/29 18:28
12F:→ vsbrm : 卷变参考书 223.139.92.248 01/29 18:28
13F:→ oldchang1205: 确实 我觉得大纪元=中国网军无误 111.82.181.143 01/29 18:33
14F:推 tanby : 这个可能性很大 用来标注数据的 111.250.8.222 01/29 18:45
15F:→ now99 : 偷资料管子223.136.101.159 01/29 19:08
16F:推 deolinwind : openai自己用爬虫爬了多少数据,之 218.173.136.10 01/29 19:08
17F:→ deolinwind : 前美国艺术家的联合诉讼摆平了? 218.173.136.10 01/29 19:08
18F:→ deolinwind : 不过api应该是真的有用到,干嘛重新 218.173.136.10 01/29 19:08
19F:→ deolinwind : 发明轮子呢 218.173.136.10 01/29 19:08
20F:推 straggler7 : 如果我看得比别人远,那是因为我站在 36.229.59.188 01/29 19:19
21F:→ straggler7 : 巨人的肩膀上 ~牛顿~ 36.229.59.188 01/29 19:20
22F:推 ggyaining : 推文笑死223.140.195.252 01/29 19:27
23F:嘘 bloody089 : openai拿全世界的数据来喂了~大纪元 27.53.154.18 01/29 19:31
24F:推 zombiechen : 前天狂吹DS的帐号都躲起来了 125.227.119.60 01/29 19:36
25F:推 ben1013 : 暗管大师 133.32.51.57 01/29 20:15
26F:推 zaiter : 美国偷了世界多少资料 无耻的 做贼 49.215.154.172 01/29 20:48
27F:→ zaiter : 喊抓贼 49.215.154.172 01/29 20:48
28F:推 dakkk : 训练资料根本没什权利 什麽不当 神182.233.179.121 01/29 21:09
29F:→ dakkk : 经182.233.179.121 01/29 21:09
30F:推 godog : 大纪元 110.28.64.5 01/29 21:45
31F:→ lmc66 : 中国本来就爱偷 民族性吧 偷专利出 101.10.92.90 01/29 21:59
32F:→ lmc66 : 名的 101.10.92.90 01/29 21:59
33F:→ milandi : 中国猪不偷窃就做不出个屁了111.251.134.154 01/29 22:47
34F:推 bimmers0 : 简单说就是黑吃黑。 72.194.73.24 01/29 23:53
35F:→ rodion : 笑死 大纪元=五毛病毒快筛再度验证 219.70.163.13 01/30 00:10
36F:→ rodion : 竟然还有五毛想反向宣传大纪元=中 219.70.163.13 01/30 00:10
37F:→ rodion : 共网军 真的笑死 219.70.163.13 01/30 00:10
38F:嘘 cmcmisgod : 大纪元有固定在帐号一直在PTT散播 36.227.130.210 01/30 01:10
39F:→ cmcmisgod : 啊 36.227.130.210 01/30 01:10
40F:→ cmcmisgod : 他们的报导都是三分真七分模糊来报 36.227.130.210 01/30 01:11
41F:推 Wishmaster : 爬虫跟利用别的AI是两码子事吧 = = 125.229.77.61 01/30 03:22
42F:嘘 jatj : 大纪元引用彭博社,不会自己去看原 73.239.47.111 01/30 05:20
43F:→ jatj : 文?还是吹看不懂英文? 73.239.47.111 01/30 05:20
44F:嘘 tgyhuj01 : 不管大纪元引用什麽 看到大纪元就是 114.24.32.24 01/30 09:11
45F:→ tgyhuj01 : 嘘 114.24.32.24 01/30 09:11
46F:嘘 soufon : id 223.140.181.60 01/30 10:11
47F:推 michael4210 : 比较好奇closeai闭源怎麽偷 111.82.240.70 01/30 10:21
48F:推 ku399999 : 他给你关键字了 蒸馏 125.228.117.5 01/30 10:28
49F:→ ku399999 : 这家公司2023年才成立 算合理怀疑吧 125.228.117.5 01/30 10:29
50F:→ ku399999 : 不管真假 话说太早都不好 吃瓜看戏 125.228.117.5 01/30 10:31
51F:推 rodion : 快筛还是有用的 阳姓的建议去看个病111.240.133.239 01/30 10:40
52F:→ rodion : 中了中共宣传毒的 早点治疗还有得救111.240.133.239 01/30 10:40
53F:推 straggler7 : 微软Asure已上架 DS R1 请多多利用 36.229.59.188 01/30 10:44
54F:推 cphe : 这个版的资讯真的慢很多… 科技版 42.79.160.68 01/30 11:27
55F:→ cphe : 只剩嘴炮了 42.79.160.68 01/30 11:27
56F:→ cphe : 看看微软的发文吧 42.79.160.68 01/30 11:28
57F:→ zxp9505007 : 台湾科技版 几乎都是硬体仔 不要那 24.7.63.0 01/30 12:41
58F:→ zxp9505007 : 麽严格 24.7.63.0 01/30 12:41
59F:→ ctw01 : distill有没有开源都没关系 223.137.203.11 01/30 15:03
60F:推 nalthax : X上的画师们表示: 39.15.25.249 01/30 17:53
61F:推 michael4210 : 学到了,谢谢解释 111.82.240.70 01/30 22:18
62F:→ physicsdk : 说啥了 openAI干的是民主的资料 其 114.34.77.14 01/31 12:44
63F:→ physicsdk : 它非我族类才叫该死 114.34.77.14 01/31 12:44
64F:→ physicsdk : 会信大纪元的比较像是中了中共大内 114.34.77.14 01/31 12:45
65F:→ physicsdk : 宣的毒吧 显已丧失独立思考问题的 114.34.77.14 01/31 12:45
66F:→ physicsdk : 能力 114.34.77.14 01/31 12:45