3
發(fā)布日期:2024-09-14 15:26 瀏覽次數(shù):
本文摘自《云棲戰(zhàn)略參考》,這本刊物由阿里云與鈦媒體聯(lián)合策劃。目的是為了把各個行業(yè)先行者的技術探索、業(yè)務實踐呈現(xiàn)出來,與思考同樣問題的“數(shù)字先行者”共同探討、碰撞,希望這些內容能讓你有所啟發(fā)。
2023年底,百模大戰(zhàn)基本宣告結束,中國市場真正有實力留存下來做基礎模型的廠商或許不超過10家。2024年,迎接下一輪AI發(fā)展,大模型應用接棒。大家都開始思考如何在這一輪新的排位賽中率先突出重圍,以及到底怎么用并用好大模型。
基于這些考量,阿里云圍繞離線訓練、在線工具以及安全等功能,在2023年10月推出了“阿里云百煉”平臺,并在2024年3月在功能上實現(xiàn)了一輪大規(guī)模的迭代升級。
該平臺集成了國內外主流優(yōu)質大模型,提供模型選型、微調訓練、安全套件、模型部署等服務和全鏈路的應用開發(fā)工具,為用戶簡化了底層算力部署、模型預訓練、工具開發(fā)等復雜工作。開發(fā)者可在5分鐘內開發(fā)一款大模型應用,幾小時即可“煉”出一個企業(yè)專屬模型,開發(fā)者可把更多精力專注于應用創(chuàng)新。
從發(fā)布至今,阿里云百煉已經(jīng)在多個行業(yè)中展現(xiàn)出強大的賦能能力。本文將系統(tǒng)介紹百煉的能力升級和實踐應用,幫助用戶了解如何具體通過阿里云百煉開展專屬模型構建和應用優(yōu)化;以及對于初學者來說,存在哪些路徑可以快速理解和掌握使用阿里云百煉,從而更輕松構建高效、強大的大模型應用。
阿里云百煉發(fā)布之初,主要是面向不具備深厚“代碼能力”的企業(yè)和開發(fā)者這類初級用戶,提供一站式的模型服務能力。
2024年3月,阿里云百煉進行了全新升級,以一站式的大模型開發(fā)及應用構建能力,成為各類企業(yè)和開發(fā)者鏈接云與AI的重要云服務平臺,提供從基礎模型推理服務到復雜模型定制化訓練的全方位服務,實現(xiàn)AI能力的快速接入與應用。
升級迭代后的百煉,具備更多的接入模式和流程,能讓不同類型的企業(yè)與開發(fā)者根據(jù)自身的大模型應用開發(fā)上下游需求和資源投入,進行靈活選擇和決策。百煉平臺的服務對象也因此有了新的界定。
百煉平臺的服務對象從單一的不具備開發(fā)能力的初級開發(fā)者,擴展為兩類:第一類是具備代碼能力,希望通過API調用、RAG整合、微調和定制化訓練行業(yè)模型的企業(yè)和個人開發(fā)者;第二類是缺乏代碼能力且期望以低成本接軌大模型時代的企業(yè)。
其中第一類用戶群體又可進一步細分為三個層次,針對不同需求的企業(yè),百煉平臺也設計了不同層次服務。例如,對于有基礎大模型推理服務需求的企業(yè),平臺提供了易于調用的API;對于希望整合RAG功能的企業(yè),平臺提供了包括數(shù)據(jù)分類、企業(yè)知識庫建設和RAG鏈路搭建等服務;而對于需要對模型進行微調和持續(xù)訓練的用戶,平臺還提供了從預訓練到強化學習的全鏈路訓練服務。
針對第二類用戶群體,即算法能力有限、但迫切需要模型賦能的企業(yè),阿里云百煉提供了一個全面、易用的一站式模型開發(fā)及服務平臺。即使用戶不具備深厚的編程技能,也能夠借助“拖拽式”的無代碼工具,直觀地構建應用。
升級后的百煉,不僅能服務AI創(chuàng)業(yè)初期的中小企業(yè),也能為尋求AI業(yè)務與場景創(chuàng)新的大型企業(yè)提供定制化支持,讓企業(yè)和開發(fā)者不再受限于技術門檻。
在技術實現(xiàn)層面,阿里云百煉的兩大核心工具——全鏈路模型服務工具和多樣化應用Agent構建工具,也在本次升級中實現(xiàn)了新的能力迭代。
全鏈路模型服務覆蓋數(shù)據(jù)管理、模型訓練、評估和部署等關鍵環(huán)節(jié)。數(shù)據(jù)管理整合了離線和在線數(shù)據(jù)集,確保訓練數(shù)據(jù)的質量和完備性。模型訓練允許用戶選擇通義系列或第三方開源大模型,并通過透明化工具監(jiān)控模型狀態(tài)。模型評估提供多種資源,包括單模型和多模型對比,以對標行業(yè)標準。模型部署則通過一鍵功能簡化云端應用流程。
模型訓練完成后,為了使其能在真實場景中發(fā)揮實效,還需與Agent結合賦予模型實際操作能力。
升級后的阿里云百煉正式推出了智能體API,并為企業(yè)和開發(fā)者提供智能體API的調用。其中,智能體應用包含支持RAG、分析、創(chuàng)作等鏈路。同時,為保持開放性,百煉整合并優(yōu)化了開源框架如LlamaIndex,提供封裝的原子級服務和SDK。插件中心預設了多樣插件,并支持企業(yè)和開發(fā)者自定義插件,以提升大模型的調用效率。此外,平臺提供Prompt模板和優(yōu)化工具,增強智能體API的服務質量。
具體來說,在升級后的阿里云百煉平臺上,企業(yè)實際業(yè)務可以通過Agent能力無縫銜接大模型,例如嵌入企業(yè)知識庫檢索、天氣查詢、機票預訂等功能,將方便快捷地融入日常業(yè)務流程。對于涉及多步驟的任務應用,如需多次調用大模型推理能力和第三方插件進行向量檢索、天氣信息抓取、庫存數(shù)據(jù)查詢等,阿里云百煉的Agent業(yè)務流程設計中也實現(xiàn)了全流程自動化串聯(lián)。
專屬大模型的訓練流程,一般從數(shù)據(jù)管理開始。百煉則提供了內置數(shù)據(jù)集,例如SFT(Supervised Fine-Tuning,監(jiān)督微調)的數(shù)據(jù)集,以供快速應用,并給用戶提供實際參考。一旦數(shù)據(jù)集管理就緒并被引入,便可以進入訓練模塊。從訓練數(shù)據(jù)到訓練模塊,整個過程可以在平臺上一鍵完成。
關于復雜專屬模型的訓練,阿里云百煉經(jīng)過較長周期的內部測試,積累了豐富的實踐經(jīng)驗。用戶若要使用百煉平臺進行復雜專屬模型訓練,具體可分為微調訓練、持續(xù)預訓練和強化學習三個階段(其中部分能力將在后續(xù)更新中逐步產品化上線)。
首先,在微調訓練階段,用戶可以使用內置的SFT數(shù)據(jù)集快速啟動項目,并利用SFT+LoRA(Low-Rank Adaptation,低秩自適應)等微調技術進行模型定制。阿里云百煉提供了十多個超參數(shù)配置選項,允許用戶根據(jù)自己的需求調整模型。此外,訓練過程透明化,時長預估精準,底層框架加速效果顯著。
用戶也可以自定義訓練數(shù)據(jù),將SFT基模訓練數(shù)據(jù)與自有數(shù)據(jù)按特定比例混合,以執(zhí)行有針對性的訓練。這樣既能夠在特定內容或子任務上取得卓越效果,同時又能確保模型不會丟失原有的基礎與通用能力。
其次,在持續(xù)預訓練階段,即Continual Training(CT),用戶可以通過海量未標注數(shù)據(jù)進行無監(jiān)督訓練,同時可進行自定義和多次增量訓練。百煉的多模態(tài)持續(xù)預訓練功能,進一步提升了模型的適應性和學習能力。
之后,是RM(Reward Model,獎勵模型)+RLHF(Reinforcement Learning from Human Feedback,基于人類反饋的強化學習)強化學習階段。在這一階段,百煉提供了序列化訓練數(shù)據(jù)的一鍵拉取、在線標注工具以及自定義獎勵模型訓練和多策略強化學習訓練。用戶可以利用開放且豐富的自定義訓練參數(shù),在訓練前進行詳細配置,滿足特定應用需求。多策略強化學習訓練,使得模型能夠在復雜環(huán)境中進行有效學習。
模型訓練完成后,即可實現(xiàn)一鍵部署,并通過在線評測工具進行評估。百煉提供的多種評測方法,包括自動化評測和半自動化訓練,甚至后續(xù)將提供ELO評測方法,通過這一競技評估,用戶可以看到自己訓練的模型相對于基礎模型或第三方模型的大致排名,從而直觀感受模型能力。
整個訓練過程中,評測模塊與標注工具相結合,實現(xiàn)了基于人類反饋的強化學習訓練理念。阿里云百煉通過提供眾多訓練工具,將這一理念具體化并融入整個訓練鏈路中,從而幫助用戶實現(xiàn)模型訓練的自動化,并快速評估模型能力。
在實際的使用過程中,阿里云百煉團隊也為企業(yè)和開發(fā)者提供了若干項使用Tips,以便更好的運用平臺進行模型構建和應用開發(fā)。
目前,已有諸多用戶運用阿里云百煉平臺打造企業(yè)或行業(yè)專屬大模型,以及進行AI應用的創(chuàng)新嘗試。
在實際應用過程中,用戶對于專屬模型的構建和創(chuàng)新應用的開發(fā),提出了一系列具體要求,包括優(yōu)質的模型效果、穩(wěn)定且可彈性擴縮容的模型服務、內容的安全合規(guī)、企業(yè)數(shù)據(jù)在傳輸和存儲時的安全等級,以及模型調用支持上層應用的快速構建(如知識問答、對接口調用)等。
對于用戶提出的關于模型的優(yōu)質效果要求,百煉可通過模型訓練幫助用戶訓練企業(yè)專屬大模型,并通過預置數(shù)據(jù)和數(shù)據(jù)混合工具,訓練出兼具行業(yè)能力和通用能力的大模型,再通過模型測評方便用戶快速評估模型效果。多輪訓練和測評螺旋推進,最終可讓用戶獲得效果最佳的行業(yè)/企業(yè)專屬大模型。
在模型服務方面,基于阿里云十余年所積累的公共云基礎建設和多元算力融合調度的服務能力,百煉提供了高性價比的公共云資源和云端VPC多種模型推理服務能力。用戶所訓練出來的專屬大模型也可以通過多種計費方式,實現(xiàn)快速擴縮容,從而保證模型的整體成本。
在數(shù)據(jù)安全方面,百煉產品級別接入云上OSS、ADB-PG、SLS等多個數(shù)據(jù)中間件服務,并采用了最高級別的數(shù)據(jù)傳輸和存儲加密方案,方便用戶按需選擇數(shù)據(jù)服務,保證企業(yè)內部數(shù)據(jù)安全。
在內容安全方面,百煉內置了阿里云沉淀多年的內容安全服務能力,并有多個內容安全服務可供用戶選擇。用戶可按照行業(yè)、業(yè)務場景,來定義專屬大模型的數(shù)據(jù)安全水位。
在模型應用方面,百煉具備如前所述的智能體和RAG等應用能力,可以讓用戶實際業(yè)務通過Agent無縫銜接大模型,并實現(xiàn)業(yè)務全流程自動化串聯(lián)。
例如,電力行業(yè)是一個多學科交叉、專業(yè)性和復雜性都極高的行業(yè),需集成先進電力工程、能源轉換與傳輸、電網(wǎng)自動化與控制、可再生能源和智能電網(wǎng)等技術,來實時運營一個可靠安全、多層次、廣泛互聯(lián)的國民基礎設施網(wǎng)絡。
在新型電力系統(tǒng)建設等新挑戰(zhàn)和智能決策等新技術的沖擊下,電力行業(yè)正處于能源革命與數(shù)字革命相融并進的關鍵時期。在此背景下,電力行業(yè)迫切需要將人工智能與電力業(yè)務有機融合,包括快速實現(xiàn)智能感知和智能決策、高級數(shù)據(jù)的智能分析等。
然而,大模型在電力行業(yè)的深度應用卻面臨著諸多挑戰(zhàn)。電力行業(yè)的特殊性和復雜性給通用大模型應用帶來一系列難題,包括:模型所包含的參數(shù)量巨大,訓練和部署對算力的消耗十分巨大,成本高昂;模型可解釋性仍然較弱,通常需要增加內容管控手段,保證結果的安全性;模型對訓練數(shù)據(jù)依賴性仍然很強,對超出訓練數(shù)據(jù)的任務效果不盡如人意。
同時,在復雜技術含量的電力行業(yè),AI應用落地也呈現(xiàn)一系列難點,例如電力屬于高度專業(yè)化和復雜的領域,行業(yè)內有專業(yè)術語和標準,而通用大模型可能不了解或混淆這些術語;不同行業(yè)的數(shù)據(jù)特點各不相同,電力行業(yè)的數(shù)據(jù)可能涉及到時間序列數(shù)據(jù)、能源消耗數(shù)據(jù)、市場價格數(shù)據(jù)等多種類型,通用大模型未必能夠有效地處理這些多樣化的數(shù)據(jù);電網(wǎng)企業(yè)通常需要個性化的解決方案以滿足獨特業(yè)務需求;電力行業(yè)涉及大量客戶數(shù)據(jù)和敏感信息,受到嚴格的法規(guī)和合規(guī)性要求監(jiān)管,因此數(shù)據(jù)隱私和安全性是至關重要的考慮因素。
無論是通用大模型所帶來的高門檻,還是電力行業(yè)復雜性和特殊性所提出的特別要求,這些都對大模型在電力行業(yè)的應用提出了挑戰(zhàn)。
在這樣的背景下,朗新集團與阿里云圍繞打造電力行業(yè)大模型場景下的算力資源、語料處理、定制化訓練、數(shù)據(jù)安全保障等多領域,開展深度合作。
為了增強模型的穩(wěn)定性與精準性,朗新集團借助百煉通過行業(yè)無監(jiān)督數(shù)據(jù)進行自監(jiān)督訓練,采用有監(jiān)督數(shù)據(jù)進行有監(jiān)督的調優(yōu)。
第一階段,增量預訓練(PT,Continue PreTraining),在海量文檔數(shù)據(jù)進行大模型的二次預訓練,以注入電力領域專業(yè)知識。
第二階段,有監(jiān)督微調(SFT,Supervised Fine-tuning),構造指令微調數(shù)據(jù)集,在預訓練模型基礎上做指令精調,以對齊指令意圖。
第三階段,RM(Reward Model)獎勵模型建模,構造人類偏好排序數(shù)據(jù)集,訓練獎勵模型,用來對齊人類偏好。
第四階段,基于人類反饋的強化學習(RLHF),用獎勵模型來訓練SFT模型,生成模型使用獎勵或懲罰來更新其策略,以便生成更高質量、更符合人類偏好的文本。
朗新集團通過百煉深度融合電力行業(yè)特性,構建Prompt工程,實現(xiàn)了管理智能化、業(yè)務自動化和服務互動化。
除此之外,朗新集團依托阿里云百煉構建了多層級大模型產品,包括電力行業(yè)大模型、電力企業(yè)大模型、專業(yè)場景大模型,以滿足不同市場應用需求;同時打造豐富應用場景,諸如賬單智能解讀、電力問答、智能問數(shù)等,支撐不同專業(yè)智能化需求。
作為專業(yè)場景大模型應用——“電力賬單解讀智能助手”可以代替電力計費專家,解讀各類專業(yè)賬單,為電力客戶答疑解惑,并依據(jù)電價政策、電費計算規(guī)則及電力業(yè)務規(guī)范,提出針對性的節(jié)能建議。例如,它能通過自然語言交互自動獲取客戶信息匹配電費賬單信息;圍繞電費電量疑問開展交互式診斷分析;幫助分析開通峰谷用電可行性;幫助分析電費頻繁催交鬧心事。測試環(huán)境下,電力賬單AI解讀的應用讓電費賬單服務交互效率提高超50%、人工處理工單量下降超70%。
除了朗新集團,央視網(wǎng)、亞信科技等企業(yè)也都已率先在阿里云百煉上開發(fā)專屬模型和應用,大模型正引發(fā)千行百業(yè)的新一輪創(chuàng)新。
百煉以平臺形式提供服務,可以讓企業(yè)的業(yè)務和技術團隊通過平臺上的模型工具快速訓練出SFT專屬模型,并通過智能體API關聯(lián)搜索引擎服務,快速構建大模型應用。
例如,某手機廠商通過在百煉上對業(yè)務數(shù)據(jù)進行SFT訓練并定制Prompt改寫和安全模塊,加之某搜索引擎的實時信息檢索能力,實現(xiàn)通識類問答和文案撰寫,解決了傳統(tǒng)手機助手在語義識別方面能力差、不具備通識問答和生成等痛點。
百煉也支持企業(yè)使用智能體API和RAG插件,搭配企業(yè)自定義API插件,快速構建大模型服務應用。
例如,某軟件服務公司通過百煉的插件功能,關聯(lián)企業(yè)的“工單創(chuàng)建”接口及其他5個數(shù)據(jù)查詢接口,同時使用預置的“文檔檢索”功能,實現(xiàn)企業(yè)數(shù)據(jù)、企業(yè)文檔打通的大模型問答??蛻舴請鼍跋碌闹悄芸头柎?,解決了大量客服人物問題,也克服了傳統(tǒng)客服機器人數(shù)據(jù)查詢、工單創(chuàng)建能力差等弊端。
企業(yè)對智能技術的應用需求正在加深,阿里云百煉也將持續(xù)加碼模型服務,基于阿里云豐富的底層計算能力與通義系列模型的最佳實踐,構建訓練評測、標注、部署全生命周期模型工具,幫助企業(yè)、開發(fā)者在云上一站式調用、優(yōu)化大模型,成為大模型時代的商業(yè)化基礎設施。4166am金沙信心之選