在人們印象中,使用大語言模型是極其簡單的操作——只需輸入一個問題,立刻就能得到回答。但實際上,要想“用好”大語言模型,也是需要技巧的。
如何有效地與這些人工智能模型互動,發揮出它們的最大潛力?中國科學技術大學心理學系特任研究員林志成在最近發表于《自然-人類行為》的評論文章中,提供了一系列策略和指導,以此幫助人們更好地理解和“用好”這些先進工具,生成更精準的回答。
“從本質上看,大語言模型是一個數學模型,缺乏對語義的理解。它只能‘預測下一個文字’出現的概率,而不能生成‘真理’。”在接受《中國科學報》采訪時,林志成建議在輸入指令時可以使用8個小技巧。
拆分復雜任務
由于缺乏對語義的理解,想要大語言模型“舉一反三”是很難的。但是,它有海量的數據、珍貴的“記憶”,可以從中提取信息。
因此,用好大語言模型,林志成給出的第一個小技巧是拆分復雜任務。
比如,不要直接給出“將文本翻譯成中文”這樣寬泛的指令,而是將指令拆解成兩步——首先按字面意思翻譯,保持含義不變;然后意譯,讓文本符合中文的語言習慣。
再比如,讓大語言模型寫出一篇1000字的論文,可以嘗試把任務分解成子任務,用具體的指令分別生成概述、結論和中心論點。
林志成說:“清晰、逐步的指令會降低模糊性和不確定性,從而生成更準確的答案。”
添加相關語境
大語言模型比人類的“短期記憶”多太多。因此,想要讓它提供精準且符合問題語境的回復,在輸入指令時添加相關語境就很重要。這是第二個小技巧。
林志成說,一個限定語境的問題應當包含具體內容和細節,從而引導大語言模型產生更準確的理解力,生成有洞察力、更精細的回復。
例如,讓大語言模型起草一份求職簡歷,事先要把企業發布的具體職位需求、個人基本情況等內容一并提供給它,如此一來,輸出的簡歷就更具有針對性。
明確的指令
當你走進一間咖啡廳,想要點一杯喜歡的咖啡,應該不會說“請來杯咖啡”,而是會說“來杯摩卡或拿鐵”。同樣,你也不要期待大語言模型能讀懂你的心。
林志成指出,要想降低大語言模型預測時的不確定性,就要給出明確的指令。這是第三個小技巧。
例如,想讓大語言模型修改文章,不要說“潤色這篇文章”,而是具體到修改成什么風格、文章的目標受眾是誰……
林志成說,一段更具體的指令甚至可以是“像頂級期刊的頂級編輯那樣,潤色這篇文章,讓它更為清晰流暢”。
提供多種選項
大語言模型還擁有超強的“長期記憶”和生產能力。因此,它可以提供多個版本,而不是一個。
“很多時候,人們潛意識里認為,大語言模型給出的答案是最優的。但就文本寫作而言,帶有很多主觀色彩,并不是一個簡單量化的東西。因此很難判斷大語言模型第一次給出的就是最優答案。”林志成說,此時,可以讓大語言模型提供多種選項,再從中選出符合個人需求的答案。這是第四個小技巧。
此外,林志成建議,還可以考慮重復用同樣的指令多次生成回復。
設定角色
大語言模型特有的“長期記憶”意味著它能夠模擬各種角色,提供專業的反饋或獨特的視角解讀。因此,設定角色是第五個小技巧。
例如,輸入指令時,可以讓它模仿典型讀者提供寫作上的反饋,也可以讓它扮演一名寫作教師幫助修訂文稿,甚至可以讓它扮演一頭擅長人類生理學的西藏牦牛,以其獨特的視角解釋高海拔對心肺功能的影響。
“讓大語言模型扮演不同角色,不僅能獲得更多有針對性和符合語境的回復,還能在整個過程中獲得更多樂趣。”林志成說。
提供具體例子
大語言模型擅長小樣本學習。“一個特別有效的手段就是使用具體例子豐富大模型的想法。就像你去理發店,對理發師描述想要的發型,最好的方法是給他看照片。”林志成說,提供具體例子是第六個小技巧。
比如,輸入指令時,不要模糊地說“以這些數據制圖”,而是提供一個例子,如“為這些數據畫個條形圖,類似附件論文中的圖”。再比如,當你讓大語言模型根據文稿生成摘要時,可以提供幾份期刊中的摘要樣例,大語言模型就可以參考這些例子生成符合期刊風格的摘要。
“這些具體的例子就像路線圖一樣,指導大語言模型朝著你期望的方向生成內容。”林志成說。
聲明回復格式
林志成說,大語言模型經常“廢話太多”。例如,讓它修改一篇文章,它可能會把修改的細節一并反饋,但其實你只需要最后的成稿。
此時,可以要求大語言模型僅輸出修改后的內容。比如,可以指定回復格式,包括列表格式、閱讀水平和語言等。用列表格式和通俗的語言能夠提升回復的可讀性;限制回復的長度可以使內容更加簡潔;設定閱讀水平則有助于更好地理解。這是第七個小技巧。
例如,與其讓大語言模型“總結關鍵發現”,不如聲明回復格式,“用列表形式總結關鍵發現,并使用高中生能夠理解的語言”。
實驗、實驗再實驗
“需要指出的是,如何使指令更有效,尚無確切答案。有時稍微調整一下,可能就會收獲意外驚喜。”林志成說,實驗、實驗再實驗,是最好的辦法。這也是第八個小技巧。
例如,在一系列推理問題中,在指令中簡單加入“一步一步思考”就可以讓大語言模型表現得更好。
有意思的是,大語言模型還能回應“情緒性的信息”。假如你讓它修改一篇未經同行審議的論文,可以在指令中加入一些短語,比如“深呼吸一下,這事對我的職業生涯很重要”。
林志成說,這些例子證明大語言模型對指令非常敏感。不過,并非所有嘗試都會成功,但每次嘗試都會有新的收獲,并在一定程度上提升工作效率、增加樂趣。
來源:《中國科學報》