作者CardLin (卡林)
看板MobileComm
標題Re: [新聞] 蘋果將偵測兒童色情影像 用戶上傳iCloud
時間Sun Aug 8 02:15:34 2021
AI可以將圖片分類,找出有問題的圖片
具體做法有很多種,我們先簡介目前效果最好的神經網路
首先會用數學模擬神經元的運算
簡化來說每一層的網路輸出(Output)就是輸入(Input)乘上權重(Weight)再加上偏移(Bias)
Output = Input * Weight + Bias
而每個 Input 可以是一維、二維或三維的矩陣,Weight, Bias也是特定大小的矩陣
所以 Output 就會很像是腦袋裡面神經網路的連結
https://imgur.com/fBbB0HA
所以當我有很多層的時候,就會像是小型腦袋
https://imgur.com/4QEmiLF
而這個小型的腦袋就可以透過已標註資料進行訓練
假設 Apple 已經人工標定好 1000 張照片,其中 800 張正常,另 200 張異常
我們就可以透過訓練這個小型腦袋,讓他逐漸地學會如何分辨正常與異常
學習過程會計算最終的輸出(FinalOutput)與真正的答案(GroundTruth)的差異(Loss)
透過這個 Loss 就可以透過數學的運算來微調需要修改的權重(Weight)與偏移(Bias)
最後訓練完的神經網路的最終輸出(FinalOutput)就會是以下例子:
一般照片:正常:0.99 (99%) 異常:0.01 (1%)
異常照片:正常:0.22 (22%) 異常:0.78 (78%)
通常類神經網路並不會用原始解析度進行訓練
需要降維,例如先縮小到 224*224 的大小再進行訓練
而經過訓練後的神經網路就能很好地將圖片進行分類
其實這種類似的做法已經有在手機相機軟體上應用: 場景智慧辨識、眨眼偵測...等
如果有足夠多的人工標註資料進行訓練,已經可以輕鬆達到 99% 以上的成功率
如果設計夠好,一台伺服器一秒要處理 100 張照片應該也沒問題
畢竟在手機端的運算能力也都可以即時辨識場景
不在手機端分析照片的原因可能是避免增加耗電
Apple會對照片進行分析,主要當然是希望降低虐童犯罪
我剛剛 Google 了一下查到 "美國一年有高達76萬5000名兒童失蹤"
我不知道數據是否準確,但這些失蹤兒童可能有大部分都跟虐童犯罪有關
希望 Google 也能跟進,讓兒童更安全!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.44.67.182 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/MobileComm/M.1628360136.A.6E6.html
1F:→ kkcity59 : 聽起來好像很厲害...可是我看到的版本只是取Hash值 08/08 02:17
2F:→ kkcity59 : 去跟已知違法圖檔做對照 08/08 02:17
3F:推 s25g5d4 : 你看到的版本不夠詳細 08/08 02:18
4F:→ kkcity59 : 如果要這樣分析的話大概得多放幾個核心跟電池囉 08/08 02:18
5F:推 ZnOnZ : 希望 Google 不會跟進,這樣很不安心 08/08 02:19
6F:→ s25g5d4 : 那是蘋果要擔心的事情,為什麼你要幫他們擔心 XD 08/08 02:19
7F:→ kkcity59 : 一般人不開心的點是我明明不是性犯罪者 08/08 02:20
8F:→ kkcity59 : 你要花我手機電力跟運算力來檢查我自己手機上的資料 08/08 02:20
9F:→ kkcity59 : 來跟你證明說我是清白的。 08/08 02:21
10F:推 s25g5d4 : 好,不爽不要用 08/08 02:25
11F:推 destiny3952 : 我覺得應該比較像是用autoencoder這類的方法 08/08 02:26
12F:→ CardLin : 原文只有上傳iCloud才審查吧,不會用你手機的電量 08/08 02:26
13F:→ CardLin : Autoencoder的特性是不在資料集內的照片就會警報喔 08/08 02:28
14F:推 s25g5d4 : 會喔,比對是在裝置端運作的 08/08 02:42
15F:推 abadjoke : 不是希望估狗跟進 是估狗早就有了 08/08 02:45
16F:推 benedict76 : 模型建立好手機餵圖進去用aie運算沒多久就有結果, 08/08 03:03
17F:→ benedict76 : 又不是要在手機上訓練模型。 08/08 03:03
18F:推 puffycat : google早就這樣做了!最近沒看新聞嗎? 08/08 04:09
19F:→ Benetnasch : 不要放照片在海水上不是基本共識嗎? 08/08 18:39
20F:推 RonanXidi : 上傳圖片前,愛瘋有說會檢查嗎? 08/08 18:40
21F:→ awerte : google早就做了,apple是最近才有消息 08/08 18:45
22F:→ spath : 一年有76.5萬兒童失蹤是怎麼來的?逛賣場時亂跑之 08/08 18:51
23F:→ spath : 後找回來這樣有算嗎? 08/08 18:51
24F:→ evanade : 那是累積報案數,一年少10%兒童人口數你會信? 08/08 19:00
25F:噓 smallcar801 : 一秒100張… 沒概念就不要誤導人家了 08/08 19:54
https://imgur.com/50OIHT5
NVIDIA Tesla V100 使用 FP16 精度可達 28.26 TFLOPS
EfficientNet 的推論效能甚至每秒可以破 1000 張
我估計 100 張確實有點太少了,誤導大家了,抱歉
26F:推 yahappy4u : 希望不要被獨裁政府拿來打壓異議者就好 08/08 21:54
27F:→ trywish : 其實在手機上做也沒啥問題,每次增加一張照片比對一 08/08 22:27
28F:→ trywish : 個數字是能吃你多少電,當然從雲端上比對也可以,像 08/08 22:27
29F:→ trywish : google就有新聞是"巡查"到照片才抓的,也都幾年前的 08/08 22:28
30F:→ trywish : 事情了,當然排除這些,光侵犯隱私就是不可取。 08/08 22:29
※ 編輯: CardLin (114.44.83.81 臺灣), 08/08/2021 22:50:15