<menuitem id="lewcz"></menuitem>
      <menuitem id="lewcz"><acronym id="lewcz"></acronym></menuitem>
      <sup id="lewcz"><small id="lewcz"></small></sup>
      <tr id="lewcz"></tr>
      <code id="lewcz"></code>
      <ins id="lewcz"></ins>

        阿里巴巴開源深度學習訓練框架EPL 可支持10萬億參數超大模型

        2022-03-07 13:43 來源:科創網

          3月4日消息,阿里巴巴宣布完全開源支持10萬億模型的自研分布式深度學習訓練框架EPL(Easy Parallel Library,原名whale),進一步完善深度學習生態。

          EPL由阿里云機器學習平臺PAI團隊自主研發,PAI是面向開發者和企業的機器學習/深度學習工程平臺,提供包含數據標注、模型構建、模型訓練、編譯優化、推理部署在內的AI開發全鏈路服務,內置140多種優化算法,具備豐富的行業場景插件,為用戶提供低門檻、高性能的云原生AI工程化能力。

          EPL是PAI團隊一次面向大規模深度學習分布式自動化訓練的探索,EPL希望能夠簡化深度學習模型從單機訓練到分布式開發調試的流程。EPL通過對不同并行化策略進行統一抽象、封裝,在一套分布式訓練框架中支持多種并行策略,并進行顯存、計算、通信等全方位優化來提供易用、高效的分布式訓練框架。

          EPL適合不同場景的模型,在阿里巴巴內部已經支持圖像、推薦、語音、視頻、自然語言、多模態等多樣性的業務場景。同時,EPL也支持不同規模的模型,最大完成了10萬億規模的M6模型訓練,相比之前發布的大模型GPT-3,M6實現同等參數規模能耗僅為其1%。最新測試結果顯示,使用EPL的流水+數據并行對Bert Large模型進行優化,相比于數據并行,訓練速度提升了66%。

          阿里云資深技術專家九豐表示,“近些年,隨著深度學習的火爆,模型的參數規模飛速增長,同時為訓練框架帶來更大挑戰。為應對這個問題,我們研發了EPL,EPL功能也隨著業務需求的迭代逐漸完善。未來,我們將在軟硬件一體優化、全自動策略探索等幾個探索性方向上持續投入精力。今天,我們將EPL完全開源,希望和深度學習訓練框架的開發者或深度學習從業者之間有更多更好的交流和共建,持續完善深度學習生態。”

        標簽:

        熱門文章

        熱點圖文

        中文字幕无码日韩专区

            <menuitem id="lewcz"></menuitem>
            <menuitem id="lewcz"><acronym id="lewcz"></acronym></menuitem>
            <sup id="lewcz"><small id="lewcz"></small></sup>
            <tr id="lewcz"></tr>
            <code id="lewcz"></code>
            <ins id="lewcz"></ins>