收藏本站

電腦請使用 Ctrl + D 加入最愛
手機請使用 收藏
關閉

小編的世界 優質文選 主機

無服務器框架CodeFlare,把AI 模型訓練從4 小時縮短為15 分鐘!


字體大小:
2021年7月18日 -
:     
 

四川人在香港

IT主管,科技領域創作者

IBM 於近期推出了全新無服務器的開源框架CodeFlare,幫助開發人員減少在混合雲環境中部署AI 模型所花費的時間,此框架目前已在 GitHub 上開源。

使用CodeFlare 後,減少94% 機器學習模型Pipeline 執行時長對於企業而言,訓練出一個機器學習模型從來不是主要的瓶頸— 那什麼才是呢?

在生產環境中的持續營運、構建完整的人工智能系統,達成規模化落地,而且中間沒有任何重大的斷層,這才是真正的挑戰。然而,企業為了隨時因應新需求來部署機器學習解決方案,經常只能不斷重寫實驗代碼來迭代,但這種方法是模棱兩可的,在不具備MLOps 的概念之下,成功幾率更低。

據IBM表示,用戶使用CodeFlare框架分析和優化大約100,000個用於訓練機器學習模型的pipeline時,可將 執行時長從原本的4小時大幅縮減到短短15分鐘 。

資料科學和機器學習分析,在各個垂直領域的需求正在激增,任務也變得越來越複雜。隨著數據集越來越大,涉及的系統也變多,使得AI 研究人員和開發人員得花更多時間配置在模型設定上,要創建一個機器學習模型,必須還得進行數據清洗、特征標准化、特征提取等耗時、耗力、多重的前置作業,才能進行訓練優化。

而CodeFlare 存在的目的,就是要簡化AI 迭代過程,讓數據工作流程更容易規模化進行。

CodeFlare 框架主要是建立在Ray 之上— Ray 是加州大學柏克萊分校RISE 實驗室為AI 應用程序開發的開源分布式計算系統,也是源自IBM 集團的一個項目,通過該項目也創建出了世界上第一個原型2 納米芯片。

IBM 框架CodeFlare 介面基於Python,具三大特點

IBM Research混合雲平台總監Priya Nagpurkar透露:「CodeFlare采用了簡化機器學習的概念…更進一步把每個孤立的步驟串聯起,將端到端pipeline與資料科學家熟悉的介面無縫整合—比如Python,而不是容器(container)。CodeFlare使用了統一的runtime和程序接口,有助於簡化pipeline整合和擴展的過程,展現與眾不同的效能。」

具體來說,CodeFlare 擁有以下三大特點:

1. 基於Python 的介面,可用於管理跨平台的pipeline,且pipeline 可以在大多數計算環境中共享資源、進行平行化運算。通過轉接器與其他雲原生生態系統整合和銜接,形成橫向分布式工作流程,開發人員也不必為了維護管理而去學新的語言。

2. 觸發器功能,使CodeFlare pipeline 能夠在發生某些特定事件(例如有新文件抵達)時被啟動,同時,可從任何來源載入和分割數據,讓pipeline 能夠有效去運用一系列數據源,包括文件系統、物件存儲、數據湖和分布式文件系統。

3. 可以部署在任何雲基礎架構上,通過和Red Hat OpenShift 和IBM Cloud Code Engine 的整合,實現了無服務器的體驗,並供用戶在任意平台建立工作流程,具備拓展無服務器服務的好處。

從廣泛角度來看,CodeFlare的概念類似於Amazon SageMaker Pipelines,聚焦在從雲儀表板自動化、組織機器學習pipeline的流程,而Google、微軟和Hybernet Labs則是分別在Cloud AI Platform Pipelines、Azure Machine Learning Pipelines和Galileo中提供了相似的服務。

但IBM強調,CodeFlare結合了本地和雲端基礎架構,是從本地端開始構建來支持混合雲的 。

「該框架背後的動機,是為了收攏工作流程,還有為了完美結合人工智能、機器學習、數據分析和建模」,Nagpurkar 表示,「我們看到了在runtime 之下能大幅優化管道的機會,可以有效管理和改善數據依賴性(data dependencies)、執行控制性(execution control)。」

CodeFlare 已開源,降低企業AI 部署混合雲難度

目前CodeFlare 已在 GitHub開源,IBM也提供了一系列有關其工作原理,以及開發人員入門所需的技術部落格文章。展望未來,IBM計劃繼續發展CodeFlare,來支持更複雜的pipeline和功能,例如容錯和一致性、外部資源的整合和數據管理,以及強化對視覺化管道的支持。

就目前的性能來看,CodeFlare 已經可以將執行100,000 個訓練管道的分析和優化時間,從4 小時縮短到15 分鐘。此外,IBM 正在與客戶合作,將CodeFlare 整合到他們的軟件流程中,也在IBM 自家的AI 研究中使用此框架。

「實現一致性的體驗,以將pipeline 從筆記本電腦擴展到小型集群(cluster)、再到雲,是CodeFlare 的一大關注點」,Nagpurkar 補充,「我們將CodeFlare 視為我們混合雲平台發展的關鍵下一步,對用戶的價值方面,我們必須強調,通過顯著提高效率,CodeFlare 不僅可以節省成本和時間,而且還創造了機會來解決以前由於規模或複雜度等原因、而根本不切實際的新使用情境。」

有了像CodeFlare 這種具備MLOps 優勢的框架,開發人員就不必一直重複相同的工作,也不需要徹底理解pipeline 的配置,用統一界面就可使用豐富的工具和API 一致的進行操作,把更多寶貴的時間放在研究和實際應用上,簡化配置和部署的複雜工作流程,更快速部署到混合雲,開發和部署AI 模型的過程,又會變得輕巧許多。

#機器學習#

想了解更多精彩內容,快來關注四川人在香港

  大家在看    
《MIR4(傳奇4)》免費開放 服務器登陸問題遭

《MIR4(傳奇4)》免費開放 服務器登陸問題遭

1U GPU Server 服務器 新一代 GP

1U GPU Server 服務器 新一代 GP

我國網絡受美國“根服務器”限制,一旦對方關閉,會

我國網絡受美國“根服務器”限制,一旦對方關閉,會

11.11什麼值得買?有顏又能打的PowerEd

11.11什麼值得買?有顏又能打的PowerEd

數據庫存儲服務器怎樣購買?看完以下五點再做決定

數據庫存儲服務器怎樣購買?看完以下五點再做決定

聯想 戴爾 華為 浪潮全系列 服務器 存儲 工作

聯想 戴爾 華為 浪潮全系列 服務器 存儲 工作

永劫無間服務器炸了,玩家大罵rnm退錢

永劫無間服務器炸了,玩家大罵rnm退錢

非常鑒定室|《你是我的榮耀》更新讓服務器崩了!這

非常鑒定室|《你是我的榮耀》更新讓服務器崩了!這

美國心虛啥?對服務器發動攻擊,企圖破壞調查德堡實

美國心虛啥?對服務器發動攻擊,企圖破壞調查德堡實

Tyan Transport SX 2U AMD

Tyan Transport SX 2U AMD