FIND研究員:蔡璨宇
大家現在對AI的印象,應該還停留在「我問一句、它回一句」的聊天機器人吧?但說實話,如果AI只能通過對話幫你解決問題,那它的戰鬥力真的只發揮了一半。
隨著大型語言模型(Large Language Model,LLM)的進化,AI漸漸演進為真正能在實務場景中發揮價值的AI Agent(人工智慧代理人),簡單來說,它不再只是個「理論派」跟你談天說地,而是變成一個「實踐派」,能幫你判斷任務、找工具、最後把事情做完。想做出一個厲害的Agent?重點不在於模型多會說話,而在於你的架構設計。
今天我們就來聊聊,開發一個 Agent 必須搞定的四件事:
一、給它一個腦袋:別讓它瞎猜,要學會「想好了再動」
如果你直接叫AI去做一件複雜的事,它很容易會「腦補」出一個似是而非的答案。要讓Agent變強,第一步就是教它一套思考流程,其中一種常見的方式叫ReAct模式,翻譯成白話就是:
先思考(Thought):收到任務後,先別急著做,先分析現在是什麼狀況?下一步該幹嘛?
動手做(Action):根據思考結果,決定要去開哪個網頁、或是查哪個資料庫。
看結果(Observation):看了查回來的資料後,再評估:「這是我要的嗎?任務成功完成了沒?如果沒有成功要怎麼在試一次?」
重點: 這種「想一下、做一下、看一下」的循環,才是 Agent 聰明的關鍵。
二、給它工具箱:主管負責下決定,專業的交給工具
你要把Agent想像成一個「專案經理(Project Manager,PM)」,而它手邊有一群專門負責寫code、查天氣、翻資料庫的「工程師(外部工具)」:
PM(AI本身):負責理解客人的需求,規劃流程。
工程師(工具):負責執行具體任務。
比如說,問AI「今天台股怎麼樣?」,別讓它瞎猜,直接給它一個連到股市網站的工具去查詢,「規劃歸規劃,計算歸計算」,把這兩者分開,AI就不會在那邊一本正經地胡說八道了。
三、別讓它變「魚」:記憶力是基本功
如果你跟AI說「我預算兩萬」,下一句問「那飯店呢?」,結果它回你「請問你的預算多少?」,你一定會想翻白眼,開發Agent時,你得幫它準備兩種記憶:
短期記憶:讓它記得這場對話前面聊了什麼,不要問過即忘。
長期記憶:像是一個檔案庫,存著使用者的偏好(例如:他不吃辣、他喜歡靜態活動)。
有了記憶,Agent才會越用越貼心,像個真正的私人助理。
四、講話要講重點:別說廢話,給我資料!
一般的AI喜歡長篇大論,但Agent的輸出通常是要給「後面的程式」接手,所以在設計時,你要規定它:「別跟我說廢話,請直接給我JSON格式(或是表格數據)!」這樣你的後台系統才能自動抓取這些資料去訂機票、發郵件。
舉個例子:如果你想做一個「出差小幫手」:
用戶說:「幫我排下週三去花蓮出差。」
Agent思考:「下週三,我得先確認路線、訂車票並確認費用、最後協助核銷。」
動手做:呼叫地圖API確認如何乘車->呼叫訂票系統找到對應班次訂票->呼叫費用計算工具估算所有交通費(計程車、台鐵等)->自動登入公司網站->填寫出差核銷表單。
給結果:給你一份行程,並告訴你已經完成了訂票及表單填寫。
寫AI Agent其實不是在玩文字遊戲,而是在設計一套系統,你要給它大腦(思考循環)、給它雙手(工具)、給它記性(記憶機制),最後還要規定它講話的格式。只要這架構搭好了,AI就不再只是個陪聊機器人,而是能幫你省下大把時間的「數位分身」!
參考資料來源:
A Survey on the Memory Mechanism of Large Language Model based Agents(https://arxiv.org/abs/2404.13501)
A practical guide to building agents(https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf)
What are the components of AI agents?( https://www.ibm.com/think/topics/components-of-ai-agents)
How to Build an AI Agent: 7 Main Steps(https://www.uptech.team/blog/how-to-build-an-ai-agent)
沒有留言:
張貼留言