掃一掃
下載數(shù)字化報(bào)APP
文章來(lái)源:量子位
大模型下半場(chǎng)拉開(kāi)序幕。
Agent成為最受重視的方向。
OpenAI創(chuàng)始成員Andrej Karpathy就在黑客馬拉松演講中表示,相比大模型訓(xùn)練,OpenAI內(nèi)部目前更關(guān)注Agent領(lǐng)域。每當(dāng)有新的Agent論文出來(lái)的時(shí)候,團(tuán)隊(duì)都會(huì)很興奮并且認(rèn)真地討論。你們(開(kāi)發(fā)者們)都正站在Agent開(kāi)發(fā)的最前沿,這個(gè)領(lǐng)域OpenAI也沒(méi)什么積累。
什么是Agent?在大模型語(yǔ)境下,可以理解成能自主理解、規(guī)劃、執(zhí)行復(fù)雜任務(wù)的系統(tǒng)。
以AutoGPT和BabyAGI為代表的技術(shù)演示型項(xiàng)目,今年4月短暫的火了一陣,但離真正應(yīng)用到業(yè)務(wù)中還有一段距離。
現(xiàn)在,Agent第二輪爆發(fā)正在醞釀中,標(biāo)志就是新一輪應(yīng)用與場(chǎng)景結(jié)合更緊密了。不出意外,先行動(dòng)起來(lái)的又是編程開(kāi)發(fā)行業(yè)。最近的熱門開(kāi)源項(xiàng)目Sweep,直接與GitHub的Issue和Pull Request場(chǎng)景整合,自動(dòng)“清掃”bug報(bào)告和功能請(qǐng)求,直接完成對(duì)應(yīng)代碼。創(chuàng)業(yè)公司中,也有OpenAI支持的Cursor代碼編輯器,把生成代碼抬到了一句話生成整個(gè)項(xiàng)目框架的高度。
接下來(lái),Agent也將成為新的起點(diǎn),成為各行各業(yè)構(gòu)建新一代AI應(yīng)用必不可少的組成部分。對(duì)此,初創(chuàng)公司Seednapse AI創(chuàng)始人提出構(gòu)建AI應(yīng)用的五層基石理論,受到業(yè)界關(guān)注。
Models,也就是我們熟悉的調(diào)用大模型API。
Prompt Templates,在提示詞中引入變量以適應(yīng)用戶輸入的提示模版。
Chains,對(duì)模型的鏈?zhǔn)秸{(diào)用,以上一個(gè)輸出為下一個(gè)輸入的一部分。
Agent,能自主執(zhí)行鏈?zhǔn)秸{(diào)用,以及訪問(wèn)外部工具。
Multi-Agent,多個(gè)Agent共享一部分記憶,自主分工相互協(xié)作。
創(chuàng)業(yè)先鋒之外,連AI基礎(chǔ)設(shè)施的巨頭也已經(jīng)開(kāi)始在Agent上發(fā)力。比如亞馬遜云科技紐約峰會(huì)上宣布的Amazon Bedrock Agents新功能,便是這種趨勢(shì)最有代表性的體現(xiàn)。
Amazon Bedrock Agents在全托管基礎(chǔ)模型服務(wù)的基礎(chǔ)上,又把開(kāi)發(fā)、部署和管理多個(gè)Agent的能力打包集成在一起。如果按照前面的五層基石理論,這類服務(wù)相當(dāng)于直接從第五層開(kāi)始,大大降低開(kāi)發(fā)門檻。正如亞馬遜云科技在發(fā)布會(huì)上所形容:只用幾次點(diǎn)擊,搞定能執(zhí)行任務(wù)的生成式AI應(yīng)用。可以預(yù)見(jiàn)的是,降低了門檻的Agent應(yīng)用也將在各行各業(yè)全面爆發(fā)。
Agent,AI應(yīng)用新時(shí)代的起點(diǎn)
怎樣才算一個(gè)Agent應(yīng)用?OpenAI華人科學(xué)家翁麗蓮給出直觀的“配方”:Agent = 大模型+記憶+主動(dòng)規(guī)劃+工具使用
以亞馬遜云科技平臺(tái)為例,開(kāi)發(fā)Agent應(yīng)用首先要根據(jù)具體任務(wù)場(chǎng)景給Agent選擇合適的基礎(chǔ)模型。Amazon Bedrock上除了自家的Amazon Titan大模型,還集結(jié)了擅長(zhǎng)安全可控的Anthropic、擅長(zhǎng)檢索匯總信息的Cohere、以及專攻文生圖的stability.ai等各家模型。
選好后,把要執(zhí)行的任務(wù)指令直接用文字描述出來(lái),讓Agent明白要扮演的角色和要完成的目標(biāo)。
指令可以是包括一系列“問(wèn)題-思考步驟-行動(dòng)步驟-示例”的結(jié)構(gòu)化提示詞,在ReAct(協(xié)同推理和行動(dòng))技術(shù)支持下,基礎(chǔ)模型可以通過(guò)推理和決策找出相應(yīng)的解決方案。
接下來(lái)的重頭戲便是Add Action Group(添加動(dòng)作組)。Agent要完成的具體任務(wù),以及能使用的工具如企業(yè)系統(tǒng)API、Lambda函數(shù)等都是在這里設(shè)置。官方演示中是一個(gè)保險(xiǎn)索賠管理場(chǎng)景,Agent通過(guò)提取未結(jié)索賠的列表、確定每個(gè)索賠的未完成文書工作并向保單持有人發(fā)送提醒來(lái)管理保險(xiǎn)索賠。
所有動(dòng)作組設(shè)置好后,創(chuàng)建Agent和部署都是幾次點(diǎn)擊就能完成。部署完成后,在測(cè)試中就可以看到Agent理解用戶請(qǐng)求、將任務(wù)分解為多個(gè)步驟(收集未結(jié)保險(xiǎn)索賠、查找索賠ID、發(fā)送提醒)并執(zhí)行相應(yīng)的操作。
Amazon Bedrock通過(guò)向?qū)浇换ソ缑?,減少了配置基礎(chǔ)模型所需的編碼工作量。動(dòng)作組提供調(diào)用API實(shí)現(xiàn)特定功能,以及使用自己的數(shù)據(jù)構(gòu)建差異化應(yīng)用程序,又讓基礎(chǔ)模型能夠完成更復(fù)雜的實(shí)際業(yè)務(wù)任務(wù)。在整個(gè)流程中,還可以配合亞馬遜云科技平臺(tái)上的各種安全服務(wù)。比如使用PrivateLin建立基礎(chǔ)模型和本地網(wǎng)絡(luò)之間的私有連接,所有流量都不會(huì)暴露給互聯(lián)網(wǎng)。又通過(guò)提供完全托管的服務(wù),讓開(kāi)發(fā)者不需要管理底層系統(tǒng)就能發(fā)揮基礎(chǔ)模型的能力。最終縮短從基礎(chǔ)模型到實(shí)際應(yīng)用的周期,加速基礎(chǔ)模型為業(yè)務(wù)創(chuàng)造的價(jià)值。
加速大模型應(yīng)用,還應(yīng)關(guān)注什么
有了Amazon Bedrock的Agent能力,我們得以快速將大模型投入實(shí)際業(yè)務(wù),為企業(yè)實(shí)現(xiàn)降本增效或創(chuàng)新。但要真正利用生成式AI的全部?jī)r(jià)值、發(fā)揮全部潛力,并與其他競(jìng)爭(zhēng)對(duì)手拉開(kāi)潛力,私有數(shù)據(jù)才是其中根本。換言之,大模型應(yīng)用落地的關(guān)鍵,是企業(yè)自己寶貴的行業(yè)數(shù)據(jù)。如何集成這些豐富的資源到我們的Agent之中,保證我們的大模型應(yīng)用在執(zhí)行任務(wù)時(shí)能夠高效訪問(wèn)到正確的信息——是當(dāng)下每一個(gè)企業(yè)都要面對(duì)的問(wèn)題。當(dāng)然,這一切都必須以保證隱私為前提。除了私有數(shù)據(jù)的集成和調(diào)用,在大模型應(yīng)用落地的路上,最為底層的支撐,算力,也始終是一個(gè)百說(shuō)不厭的話題。
眾所周知,當(dāng)下的顯卡資源異常稀缺,且價(jià)格不菲。譬如有調(diào)查就發(fā)現(xiàn),像英偉達(dá)的H100,今年4月中旬在海外電商平臺(tái)就已炒到超4萬(wàn)美元,甚至標(biāo)價(jià)6.5萬(wàn)美元的也不算罕見(jiàn)。無(wú)論是購(gòu)買還是租用,這都成了全球各企業(yè)在探索生成式AI應(yīng)用上的一大筆支出。如何讓這一筆花銷更為經(jīng)濟(jì)實(shí)惠?這也是每個(gè)企業(yè)的思慮所在。值得關(guān)注的是,以馬遜云科技為代表的領(lǐng)先供應(yīng)商,正在針對(duì)生成式AI落地過(guò)程中的這些挑戰(zhàn)和痛點(diǎn)提供系統(tǒng)性的解決方案,對(duì)上述問(wèn)題一一破解。
針對(duì)個(gè)性化數(shù)據(jù)問(wèn)題,亞馬遜云科技宣布為三款數(shù)據(jù)服務(wù)提供向量引擎,用來(lái)助力生成式AI應(yīng)用與業(yè)務(wù)整合。我們知道,在生成式AI爆發(fā)之后,向量數(shù)據(jù)庫(kù)也實(shí)在火爆不已。因?yàn)橄啾葌鹘y(tǒng)的關(guān)系數(shù)據(jù)庫(kù),它能給予與模型上下文更相關(guān)的響應(yīng)(如下圖所示)。
亞馬遜云科技這一最新服務(wù),就是將我們的私有數(shù)據(jù)存儲(chǔ)到具有向量引擎的數(shù)據(jù)庫(kù)中,在進(jìn)行生成式AI應(yīng)用時(shí),通過(guò)簡(jiǎn)單的API調(diào)用就能方便地查詢企業(yè)內(nèi)部的數(shù)據(jù)。而根據(jù)當(dāng)前數(shù)據(jù)存儲(chǔ)位置、對(duì)數(shù)據(jù)庫(kù)技術(shù)的熟悉程度、向量維度的擴(kuò)展、Embeddings的數(shù)量和性能需求等不同需求,亞馬遜云科技提供了3個(gè)選項(xiàng)來(lái)滿足:
-Amazon Aurora PostgreSQL兼容版關(guān)系型數(shù)據(jù)庫(kù),支持pgvector開(kāi)源向量相似性搜索插件;
-分布式搜索和分析服務(wù) Amazon OpenSearch,帶有k-NN(k最近鄰)插件和適用于Amazon OpenSearch Serverless的向量引擎;
-兼容 PostgreSQL的Amazon RDS(Amazon Relational Database Service)關(guān)系型數(shù)據(jù)庫(kù),支持pgvector插件。
當(dāng)然,最值得說(shuō)道的是這次最新推出的Amazon OpenSearch Serverless服務(wù),它最大的優(yōu)點(diǎn)就是讓企業(yè)只關(guān)心向量數(shù)據(jù)的存儲(chǔ)和檢索,而不用背上任何底層運(yùn)維的負(fù)擔(dān)。解決完數(shù)據(jù)集成問(wèn)題,在底層支撐上,亞馬遜云科技這次也直接推出H100支持的全新Amazon EC2 P5實(shí)例,這一曾經(jīng)對(duì)于大多數(shù)企業(yè)都相當(dāng)難得的算力資源,現(xiàn)在也變得“唾手可得”了。
據(jù)了解,該實(shí)例包含8個(gè)英偉達(dá)H100 Tensor Core GPU,640GB高帶寬GPU內(nèi)存,同時(shí)提供第三代AMD EPYC處理器、2TB 系統(tǒng)內(nèi)存和30TB本地NVMe存儲(chǔ),以及3200Gbps的聚合網(wǎng)絡(luò)帶寬和GPUDirect RDMA支持,可實(shí)現(xiàn)更低延遲和高效的橫向擴(kuò)展性能。相比上一代基于GPU的實(shí)例,Amazon EC2 P5可以讓訓(xùn)練時(shí)間最多可縮短6倍(從幾天縮短到幾小時(shí)),降低高達(dá)40%的訓(xùn)練成本。
再加上亞馬遜云科技之前基于自研芯片發(fā)布的Amazon EC2 Inf2和Amazon EC2 Trn1n等性能也表現(xiàn)不錯(cuò)的實(shí)例,我們?cè)谒懔π枨筮@一問(wèn)題上,可以說(shuō)是有了非常多的按需選擇空間。除了以上這些基礎(chǔ)支持,各種開(kāi)箱即用的AI服務(wù)也不“缺席”:如針對(duì)開(kāi)發(fā)環(huán)節(jié)的AI編程助手Amazon CodeWhisperer,現(xiàn)在它與Amazon Glue實(shí)現(xiàn)集成,將AI代碼生成的場(chǎng)景又?jǐn)U展到一個(gè)新人群:數(shù)據(jù)工程師,只需自然語(yǔ)言(比如“利用json文件中的內(nèi)容創(chuàng)建一個(gè)Spark DataFrame”),這些開(kāi)發(fā)人員即可搞定各種任務(wù);再如針對(duì)商業(yè)智能(BI)的Amazon QuickSight,也能夠讓業(yè)務(wù)分析師們使用自然語(yǔ)言執(zhí)行日常任務(wù),在幾秒鐘內(nèi)創(chuàng)建各種數(shù)據(jù)可視化圖表;還有Amazon HealthScribe,可以用于醫(yī)療行業(yè)生成臨床文檔,節(jié)省醫(yī)生時(shí)間。這些工具都是主打讓企業(yè)專注于核心業(yè)務(wù),提高生產(chǎn)效率。
最后,簡(jiǎn)單總結(jié),我們能夠發(fā)現(xiàn):從今年4月起,亞馬遜云科技就結(jié)合自身定位并基于真實(shí)用戶需求出發(fā),正式宣布進(jìn)軍生成式AI市場(chǎng),為一切想要利用生成式AI技術(shù)加速或創(chuàng)新業(yè)務(wù)的企業(yè)提供服務(wù)。在短短的4個(gè)月期間,亞馬遜云科技已推出了各類底座資源,從基礎(chǔ)模型到算力支撐,從私人數(shù)據(jù)存儲(chǔ)到高效開(kāi)發(fā)工具,應(yīng)用盡有。而這次在紐約峰會(huì)釋出的最新動(dòng)向,則是繼續(xù)加碼生成式AI應(yīng)用開(kāi)發(fā)所需的一切。從Amazon EC2 P5實(shí)例代表的算力層、到Amazon OpenSearch Serverless向量引擎、Amazon Bedrock Agents代表的工具層、再到Amazon QuickSight等代表的應(yīng)用層,一項(xiàng)端到端的解決方案已然形成。在這之中,亞馬遜云科技不斷降低生成式AI的門檻,無(wú)論是初創(chuàng)企業(yè)還是傳統(tǒng)行業(yè),無(wú)論是處于生成式AI進(jìn)程的哪一層,都能在這里找到合適的工具,無(wú)需耗費(fèi)太多精力在底層邏輯之上,便可快速投入實(shí)際業(yè)務(wù)。如亞馬遜云科技數(shù)據(jù)庫(kù)、數(shù)據(jù)分析和機(jī)器學(xué)習(xí)全球副總裁Swami Sivasubramanian所說(shuō):
我相信生成式AI將改變每一個(gè)應(yīng)用程序、行業(yè)和企業(yè)。在各行各業(yè)都全力奔赴的這場(chǎng)全新技術(shù)變革之下,亞馬遜云科技的這一系列服務(wù),無(wú)疑為普通玩家贏得了寶貴的時(shí)間和機(jī)會(huì)。
我們可以期待:越來(lái)越多的生成式AI應(yīng)用將被開(kāi)發(fā)出來(lái),生成式AI的創(chuàng)造力也得以滲透到各個(gè)領(lǐng)域,去改變、去顛覆每一個(gè)行業(yè)。
— 完 —
未經(jīng)數(shù)字化報(bào)網(wǎng)授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
特別提醒:如內(nèi)容、圖片、視頻出現(xiàn)侵權(quán)問(wèn)題,請(qǐng)發(fā)送郵箱:tousu_ts@sina.com。
風(fēng)險(xiǎn)提示:數(shù)字化報(bào)網(wǎng)呈現(xiàn)的所有信息僅作為學(xué)習(xí)分享,不構(gòu)成投資建議,一切投資操作信息不能作為投資依據(jù)。本網(wǎng)站所報(bào)道的文章資料、圖片、數(shù)據(jù)等信息來(lái)源于互聯(lián)網(wǎng),僅供參考使用,相關(guān)侵權(quán)責(zé)任由信息來(lái)源第三方承擔(dān)。
數(shù)字化報(bào)(數(shù)字化商業(yè)報(bào)告)是國(guó)內(nèi)數(shù)字經(jīng)濟(jì)創(chuàng)新門戶網(wǎng)站,以數(shù)字技術(shù)創(chuàng)新發(fā)展為中心,融合數(shù)字經(jīng)濟(jì)和實(shí)體經(jīng)濟(jì)發(fā)展,聚焦制造業(yè)、服務(wù)業(yè)、農(nóng)業(yè)等產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型,致力為讀者提供最新、最權(quán)威、最全面的科技和數(shù)字領(lǐng)域資訊。數(shù)字化報(bào)并非新聞媒體,不提供新聞信息服務(wù),提供商業(yè)信息服務(wù);
商務(wù)合作:Hezuo@szhww.com
稿件投訴:help@szhww.com
Copyright ? 2013-2023 數(shù)字化報(bào)(數(shù)字化報(bào)商業(yè)報(bào)告)
數(shù)字化報(bào)并非新聞媒體,不提供新聞信息服務(wù),提供商業(yè)信息服務(wù)
浙ICP備2023000407號(hào)數(shù)字化報(bào)網(wǎng)(杭州)信息科技有限公司 版權(quán)所有浙公網(wǎng)安備 33012702000464號(hào)