如果要用一句話概括AI的訓練和推理的不同之處,我覺得用「臺上一分鐘,臺下十年功」最為貼切。
話說小明已經和心目中的女神交往數年,在邀約女神出門這件事上積累了大量的經驗資料,但卻依然捉摸不透其中的玄機。
藉助AI技術,能否實現精準預測呢?
小明思考再三,總結出了可能影響女神是否接受邀請的變數:是否節假日,天氣不好,太熱/太冷了,心情不好,生病了,另有他約,家裡來親戚了……等等。
將這些變數加權求和,如果大於某個閾值,女神必定接受邀約。那麼,這些變數的都佔多少權重,閾值又是多少呢?
這個問題相當複雜,難以精確求解。於是小明設計了一個深度神經網路,準備基於多年來積累的存量資料對AI模型進行大量的訓練,讓AI自己學習其中的規律。
豐富的資料積累是小明最大的優勢。於是他經過整理,把上述所有變數都準確列了出來,並和是否邀約成功也做了精確的對應。這就叫做「資料標註」。
有了資料,就把它們投餵給AI。AI讀取每一組資料,採用初始的默認權值進行評估,然後得出自己分析的結果,這個過程叫做「正向傳播」。
然後,就是檢驗AI的結果是否正確了。
這裡需要引入一個「損失函數」來計算結果和正確答案之間的差距。如果結果不甚理想,會返回去最佳化調整權值,再次得出結果進行評估,這個過程叫做「反向傳播」。
經檢驗,發現評估結果和正確答案近了一步。後面再經過多輪循環往復的迭代,不斷通過調整參數權重逐步逼近正確答案,這個過程就叫做「梯度下降」。
經過多輪已知資料的深度洗禮,AI評估的準確度已經相當高了。於是小明結束訓練,固定參數權值,修剪掉權值未激活的多餘參數,宣告進入下一階段。
是時候檢驗下前段時間艱苦卓絕的工作的成果了!
於是,小明挑選良辰吉日,把各項全新的參數都準備齊全並輸到AI裡。AI迅速地給出了自己的評估結論:女神將接受邀約!
上面的過程就叫做「推理」。
小明沐浴更衣,精心收拾,預定好電影票,小心翼翼地徵求女神意見。果然,女神答應了!
此後,每次邀約之前,小明都要虔誠地讓AI預測一下是否成功。事實證明,AI絕大多數時候都能說對。我們可以AI的說「泛化」效果很好。
綜上,所謂AI訓練,就是讓神經網路從已有的資料中學習新能力的過程。
這個過程非常複雜,就像從小接受九年義務教育一樣,涉及到學校、書本、老師等因素的緊密配合,資料吞吐量大,屬於密集計算,花費時間訓練是非常必要的。
所謂AI推理,就是給訓練好的AI輸入新資料,讓它解決同類的新問題。
這個就好比學生大學畢業,離開學校、書本、老師,採用所學的知識獨立處理新問題,資料吞吐量相對較小,但需要隨叫隨到,又快又好地給出答案。
我們一般接觸到的AI應用,都是服務提供商訓練好的APP。我們在上面提出各種各樣的任務,後臺以秒為單位快速響應並給出答案,這些都屬於AI推理。
駕馭好AI,就能讓我們在工作中游刃有餘,事半功倍。
延伸閱讀:
人工智慧來了,小心你的飯碗不保
AI訓練,為什麼需要GPU?