
(圖片來源:youtube)
2021的第一則MLOps post,整理3點來自倫敦的Luke Marsden在2020年3月的MLOps.community 的分享。
- 組成MLOps的元素:
– 可重現的:要能夠可以重現9個月前的模型,並且誤差落在一定範圍內。
– 可問責的:從訓練模型到發佈上線都要能夠追溯到是誰做的。
– 可非同步合作的:在事情做到某一個階段之後,其他人能夠過了一陣子再接起來繼續完成。
– 可持續性的:能夠自動化部署且在部署之後能夠監測模型的狀況。 - ML所需要的開發跟一般的軟體開發有什麼不同?

(圖片來源:youtube)
一般的軟體開發,大部分是專注在程式碼、測試、部署、以及之後的活動監測。而機器學習相關的開發則是除了程式碼之外,還必須要專注在資料流(包含彙整資料、整理資料格式)、透過版本控制記錄每一次模型訓練的資料、參數跟評測指標(metrics)的結果,以及部署跟之後的活動監測。也因此這會讓一般的DevOps無法馬上跨越門檻來當MLOps。
3. 導入MLOps的典型障礙:
– Jupyter notebooks
– 資料版本控制、資料分享
– 追蹤參數跟評測指標(metrics)
– 使用本地/雲端開發的執行一致性
如果看到這些典型障礙但是腦中沒有畫面的話,記得找身邊的資料科學家聊聊,請對方跟你分享他的日常開發生活。
這場演講很適合對於MLOps還沒有太多概念的朋友觀看,影片說明的部分大約每3分鐘左右都會加上時間軸說明,讓觀眾在看影片的過程當中可以保持專注,知道這個時間主要想傳達的概念是什麼。[點這裡看影片]
如果對於聽英文演講沒有問題的話,可以直接點開連結觀看。如果需要中文字幕的朋友,可以先開啟cc字幕,接著在齒輪裡面的字幕選擇繁體中文為翻譯語言,這樣就可以了。
歡迎提出看法一起討論,祝大家學習愉快 🙂