隨著大模型迭代的浪潮一波接一波地推高技術前沿,Agent技術已經成為大模型落地的主流選擇,并被視為賦予大模型更廣闊能力的最佳路徑。從理解復雜的指令,到處理多模態信息,從簡單的問答系統到復雜的決策支持系統,從個性化推薦到自動化的業務流程管理,陸續在更多領域展現出其巨大的潛力和價值,它正在為社會帶來深刻的變革。
在這場趨之若鶩的群體行動中,面對這項持續發展變化的技術簇,我們應采取一種積極探索與謹慎評估并重的策略——既要保持理性,也要保持樂觀,以此來應對不確定性。技術的更新迭代需要時間與耐心,而技術的應用則需了解其限制和準確判斷業務場景。
要有效利用大模型,首先,必須明確他們的優勢和不足(圖1)。接下來,整理業務操作流程即業務SOP,確保對業務場景有深刻理解和準確的認知。其次,對領域知識進行必要的梳理。第四,在搭建Agent的過程中,盡可能的規避LLM的局限(例如,通過多輪對話精準捕捉識別用戶意圖)。第五,要做好企業內專業資料的處理和必要工具的建設。最后,準備好對Agent進行持續的優化(效果優化),從而在應用大型模型時發揮其優勢,規避弱點。
一、大模型原生能力&局限
大模型擅長語義理解、邏輯推理以及生成和創作內容。然而,它們目前存在一些限制,包括對特定領域的深入理解和時效性不足、有限的記憶能力、在實際情況中的魯棒性不夠,導致錯誤、潛在的安全風險、推理和規劃能力尚待提升、缺少合作意識而無法協同解決復雜問題、以及缺乏視覺和聽覺等感官能力,有時生成的信息可能不精確或是虛構的。在構建Agent時,可以通過集成其他技術和能力來補充和改進大模型的這些不足。
另外,一些限制更多地取決于大型模型自身能力的提升。例如,泛化能力和過度擬合現象,這可能導致對含糊不清的信息的理解出現歧義,或者混淆了特定領域的知識。模型處理上下文的能力也受到長度的限制。模型的可解釋性和可調試性不足,使其在某些情況下表現得像一個局部的黑箱。由于模型參數眾多,推理過程耗時較長。此外,微調模型對高性能的GPU和TPU計算資源的需求也相對較大。
二、Agent
為讓大模型更充分的發揮價值,突破當前的局限,主流趨勢是通過Agent增強能力(大腦),為大模型增加眼耳鼻口手腳的能力。
2.1 Agent框架
Agent為大模型提供了執行復雜任務、與環境交互、自主決策和長期記憶等關鍵能力,使得大模型的應用從單純的語言處理擴展到更廣泛的領域,包括自動化任務執行、客戶服務、內容創作等,極大地擴展了AI的實用性和影響力。為了實現這樣一套解決方案(圖2),背后需要用工程化的手段落地——工具鏈。
2.2 一站式AI Agent開發工具鏈
Agent開發平臺是面向智能體生產場景的一站式開發工具,具備智能體編排、流程搭建、知識庫管理、大小模型交互、計量、開放、私有化部署等功能,能夠有效提升智能體研發效率,降低研發成本。目前國內知名的Agent開發平臺包括百度的千帆、阿里的百煉、字節的Coze、Dify以及騰訊的元器等。
2.3 工具鏈競品分析
1)字節Coze
Coze平臺專為零代碼或低代碼(可視化編排)開發者設計,極大地降低了開發門檻,使得非技術人員也能快速上手。
優勢:
功能強大(圖像流、通過觸發器實現自動化的任務調度和執行、多渠道發布)
高度可定制
支持豐富的主流第三方插件
數據源多樣
但整體的動線繁瑣,用好的門檻比較高。
2)騰訊元器
網站風格一如既往的“節制”,功能布局清晰易懂,用戶無需花費腦力去理解網站的結構、布局和導航。該有的元素都有,后續在生態建設上,期待看到更多的可能,包括且不限于更豐富的大模型可選、插件……
3)Dify
是做LLM應用開發平臺中最早的一批之一,且功能性甚至比國內頭部大廠更突出,相比之下,目前它是是Github上Star數最多的大模型應用開發工具(54000星),是全球LLM Tools增速Top1的開源項目(300萬的安裝量)。
優勢:
AI生態相對最好:支持40多家廠商的大模型,對接大模型平臺、對接開源大模型,全鏈路免費。上百種插件
成功打開海外市場
提供云服務和本地部署兩種方式,滿足了不同用戶的需求,同時支持多平臺發布應用
自動化流程搭建和數據處理方面具有明顯的優勢,適合需要構建復雜自動化流程或處理大量數據的用戶
4)百度千帆AppBuilder
千帆AppBuilder提供全面便捷的應用開發套件與資源環境,包括大模型驅動的開發組件(文字識別、文生圖等多模態能力),內置RAG(檢索增強生成)、Agent(智能體)、GBI(智能數據分析)等常用的AI原生應用框架,語音識別、TTS、文生圖等AI能力組件,以及各類IAAS云資源。使得開發者能夠在一個平臺上完成從應用開發到部署的全過程,大大提高了開發效率。
優勢:
千帆大模型平臺提供了從模型設計、訓練到部署、優化的全流程支持
平臺42個大模型,預置41個數據集。內置103套Prompt模版及自動化Prompt工程能力
預置的安全模塊可以有效控制輸入和輸出的安全風險,為用戶提供全面的模型安全、內容安全和數據安全保障
自研集群,為企業節約了算力成本和時間成本
生態能力強大,預置100+優質官方組件
自主規劃準確,支持人工編排以高效還原業務SOP