百度集團副總裁吳甜釋出文心大模型最新升級,AI應用步入新階段

語言: CN / TW / HK

在去年11月30日的WAVE SUMMIT峰會上,百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜帶來了文心大模型的最新升級,包括新增11個大模型,大模型總量增至36個,構建起業界規模最大的產業大模型體系,並通過大模型工具與平臺的升級和文心一格、文心百中等基於大模型技術的產品應用,進一步降低大模型產業化門檻,讓更多企業和開發者步入AI應用的新階段。

圖片百度集團副總裁、深度學習技術及應用國家工程研究中心副主任 吳甜**

文心大模型全景圖重新整理, **構建產業大模型體系****

近年來,大模型的出現,為人工智慧進一步發展帶來新機遇。百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰在峰會上表示,深度學習平臺加大模型,貫通AI全產業鏈,夯實產業智慧化基座,將進一步加速智慧化升級。

百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜表示,產業級深度學習平臺飛槳和產業級知識增強大模型文心,相互促進、共同發展,已然成為產業智慧化的基礎性平臺。文心大模型持續圍繞“產業級”、“知識增強”兩大特性,延續“降低應用門檻”的發展路線,進行創新突破。在此次峰會上,文心大模型全景圖再一次迎來全面升級。

圖片文心大模型全景圖

在模型層,文心大模型一次性發布11個大模型,涵蓋基礎大模型、任務大模型、行業大模型的三級體系,全面滿足產業應用需求;在工具與平臺層,全面升級大模型開發套件、文心API和提供全流程開箱即用大模型能力的EasyDL和BML開發平臺,全方位降低應用門檻;新增產品與社群層,包括AI藝術與輔助創作平臺“文心一格”、產業級搜尋系統“文心百中”和暘谷社群,讓更多人零距離感受到最先進的AI大模型技術帶來的新體驗。

作為推進大模型在行業深度應用的關鍵舉措,本次峰會上,百度聯合深圳燃氣、吉利、泰康保險、TCL、上海辭書出版社重磅新發5個行業大模型:深燃-百度·文心、吉利-百度·文心、泰康-百度·文心、TCL-百度·文心和辭海-百度·文心。吳甜表示,文心行業大模型是百度與行業頭部企業、機構聯合探索出的行之有效的大模型產業落地方式,讓大模型在實際應用場景中“不但能用還便捷好用”。截至目前,文心已累計釋出11個行業大模型,涵蓋電力、燃氣、金融、航天、傳媒、城市、影視、製造、社科等領域,加速推動行業的智慧化轉型升級。

圖片文心行業大模型家族

除行業大模型外,此次還發布了5個基礎大模型和1個任務大模型,包括:知識增強輕量級大模型ERNIE 3.0 Tiny、跨模態理解大模型ERNIE ViL 2.0、跨模態生成大模型ERNIE ViLG 2.0、文件智慧大模型 ERNIE-Layout、單序列蛋白質結構預測大模型HelixFold-Single和程式碼大模型 ERNIE-Code。

其中,知識增強輕量級大模型ERNIE 3.0 Tiny是以ERNIE 3.0千億引數大模型為師,通過多工知識蒸餾手段將千億多工大模型的所學遷移至輕量級模型中,訓練了10億級、億級、千萬級不同體量大小的輕量級大模型。ERNIE 3.0 Tiny具備非常優秀的泛化能力,同時相對於超大引數模型,推理速度提升數十倍到百倍,能夠顯著降低超大引數模型落地的成本。ERNIE 3.0 Tiny和ERNIE ViLG大模型將上線“鵬城雲腦”,在雲腦上精調訓練、部署服務,進一步降低大模型開發和應用的門檻。

文心大模型工具平臺全面升級, **全流程支撐大模型開箱即用****

為了讓開發者更加方便、快速地使用大模型的最新能力,文心大模型工具與平臺進行了全面更新。吳甜介紹到,在工具方面,文心大模型開發套件全面升級,釋出行業大模型定製工具,同時提供更加完備的場景化建模工具、更為豐富的模型精調工具,以及大模型可信學習工具,讓大模型開發訓練更加靈活高效;文心API服務支援多種模型尺寸的精調,體驗專區提供更多可體驗能力,同時基於大規模叢集算力分散式推理加速能力,可滿足大規模高效能產業級呼叫。

大模型的開發、訓練、推理部署的門檻是非常高的。為了更好地支援大模型應用落地,飛槳釋出了端到端大模型開發套件PaddleFleetX。針對大模型的訓練挑戰,PaddleFleetX基於框架自適應分散式訓練能力,根據模型和硬體平臺的特點,自動感知硬體特性,支援在異構硬體上進行自適應並行訓練。同時,充分發揮飛槳動轉靜能力優勢,進行訓練加速,實現端到端的極致效能優化。訓練過程還支援彈性容錯訓練,大幅提升訓練過程的魯棒性。針對大模型推理部署的挑戰,PaddleFleetX提供了大小模型無縫聯動的能力,以滿足大模型推理對效能的極致要求。同時,PaddleFleetX支援自適應分散式推理技術,真正做到分散式策略的訓推一體,大可支援超大模型的服務化部署,小可協同極致小型化策略,支援端側輕量化部署。

飛槳企業版AI開發平臺EasyDL和BML也圍繞大模型的技術應用進行了全新升級,釋出了提供全流程開箱即用的大模型平臺能力,加速大模型的產業化落地。

圖片飛槳企業版全面升級

據百度AI平臺部總監忻舟介紹,在EasyDL零門檻AI開發平臺預置了各種通用任務場景大模型,可以讓AI應用開發者獲得更好的模型訓練效果。在BML全功能AI開發平臺上,端到端的並行訓練優化方案大幅提升了大模型訓練效能;預置的基於大模型的場景模型生產線,讓開發者在主流的場景開箱即用,快速構建大模型場景應用;新增的自動化推理服務監控能力,及時感知變化和問題,驅動反饋和迭代,讓AI應用的高效迭代閉環。

AI作畫產品“文心一格”推出三大新功能,產業級搜尋系統“文心百中”首次亮相

為了進一步降低應用門檻,讓廣泛的使用者可以使用文心大模型,百度釋出和升級2個由大模型為核心驅動的應用產品。

首先是AI藝術與輔助創作平臺“文心一格”。在文心一格上,使用者僅需輸入文字創想,即可完成別具一格的畫作,受到使用者廣泛好評。值得一提的是,文心一格深諳中國文化精髓,所創畫作盡現中國風骨。本次峰會上,吳甜釋出了文心一格的三大全新功能:支援以圖生圖、支援可控的增刪改等圖片二次編輯和一鍵生成視訊,進一步激發創造力,降低內容生產成本。

繼文心一格之後,以文心大模型為核心驅動的第二個產品——產業級搜尋系統“文心百中”在峰會上釋出,該產品由百度搜索與文心大模型聯合研製,命名寓意搜尋結果精準,百發百中。

圖片產業級搜尋系統

文心百中文心百中具有三大特性:極簡、強大、高效。文心百中採用純神經搜尋架構加資料驅動搜尋效果優化策略設計而成,應用起來極其簡便,僅需三步即可線上完成搜尋引擎的構建;文心百中擁有強大的語義理解能力,相比傳統模型實現了質的提升,已在多個場景展現驚豔的搜尋效果;文心百中具備搜尋系統從0到1的高效建設能力,相比傳統搜尋系統可減少人力成本90%以上;同時,基於小樣本學習能力極強的文心大模型,文心百中僅需少量的資料,即可實現不同行業的搜尋效果優化,十分高效。

文心大模型與飛槳共享生態,圍繞“產業級”和“知識增強”兩大特色,持續構建適合產業應用的模型體系。未來,將有越來越多的企業和開發者通過大模型加深度學習平臺的模式,步入AI應用的新階段,進一步加速產業智慧化升級。