從失望到精通:AI 大模型的掌握與運用技巧(1)
前言
曾經(jīng)有一批強大的 AI 模型擺在我面前,我卻未曾珍惜,知道發(fā)現(xiàn)別人能夠輕松駕馭它發(fā)揮巨大價值,才后悔莫及,如果上天給我重來一次的機會,我會努力學(xué)習(xí)經(jīng)驗和技巧,成為第一批熟練駕馭 AI 模型的人!
隨著 ChatGPT 的問世,各行各業(yè)深受震撼,國內(nèi)外各種新的大模型也如雨后春筍般相繼出現(xiàn)。一些對機遇反應(yīng)迅速的人已經(jīng)開始將 AI 運用到學(xué)習(xí)和工作中,甚至已經(jīng)開始借助 AI 賺錢了。
目前市場上的 AI 模型眾多,包括國外的 ChatGPT、Claude、Bard 等,國內(nèi)的文心一言、通義千問、訊飛星火大模型等?,F(xiàn)階段不是缺少 AI 工具,而是缺乏使用這些工具的經(jīng)驗。多人由于缺乏經(jīng)驗,用了幾次大模型后發(fā)現(xiàn)回答不符合預(yù)期就感到失望棄之不用,這非??上АF鋵嵅煌哪P椭g能力有差異,但是相同的模型不同人用起來效果也會相差很大,這里的關(guān)鍵在于提示詞技巧和使用和業(yè)務(wù)接入過程中遇到的常見問題是否有好的辦法去解決。
雖然現(xiàn)在已經(jīng)進入 AI 時代,已經(jīng)可以用自然語言和模型交互,但對提示詞的要求還是有點高,在 AI 工具發(fā)展的相對早期,很多問題還沒有完全解決,很多功能還不完善。在我看來,現(xiàn)在大多數(shù)人使用大模型存在兩類主要問題:
一類是提示詞寫的不夠好,導(dǎo)致回答不滿意;
一類是大模型的使用和接入經(jīng)驗不足,很多常見問題不知道該如何解決。
提示詞掌握不好,可能會遇到下面的困惑:
大模型的回答總是簡略、空洞和機械,怎么辦?
大模型的回答總是不能夠按照自己想要的格式輸出,怎么辦?
大模型的回答總是不夠完善,怎么辦?
大模型使用技巧掌握不足,可能會遇到下面的困惑:
優(yōu)化了很多版本提示詞,答案總不滿意,怎么辦?
想在公司里使用 ChatGPT ,但是又擔(dān)心數(shù)據(jù)泄露,怎么辦?
和 AI 多輪對話之后, AI 似乎忘記了自己的任務(wù)是什么,怎么辦?
問 AI 問題,但又擔(dān)心它“說假話”,怎么辦?
每次都要輸入相似的提示詞,嫌麻煩,怎么辦?
收費模型有次數(shù)限制(如 GPT-4),如何讓它發(fā)揮更大作用?
業(yè)務(wù)接入大模型的經(jīng)驗不足,可能會遇到下面的問題:
認(rèn)為大模型是萬能的,啥功能都想用大模型來解決,結(jié)果事倍功半。
剛開始調(diào)通模型就匆忙上線,導(dǎo)致效果不理想,用戶流失。
構(gòu)造人工標(biāo)注太耗費時間。
算法工程師不足,開發(fā)人員自己訓(xùn)練模型,做了很多優(yōu)化效果都不理想。
如果你也遇到上述問題,那么本文將對你有所幫助。接下來我將主要介紹如何通過精準(zhǔn)的提示詞技巧獲得想要的答案,以及在使用大模型使用和接入的過程中遇到的常見問題該如何解決。
很多人試用幾次大模型,得不到想要的答案,頓感失望然后棄之不用。其實多半是自己的提示詞寫的不夠好導(dǎo)致的。網(wǎng)上的提示詞教程五花八門,要么不成體系,要么過于復(fù)雜。接下來將用相對接地氣的方式,談?wù)勌崾驹~的標(biāo)準(zhǔn)、提示詞該如何寫效果更好。
2.1.1 提示詞的標(biāo)準(zhǔn)和原則在我看來,一個粗略而簡單的標(biāo)準(zhǔn)就是:你身邊的人是否能夠輕松聽懂。如果你寫一個提示詞,還需要別人再問你好幾個問題才能真正明白什么意思,那么這個提示詞就不是好的提示詞。
好的提示詞應(yīng)該遵循清晰具體,重點突出,充分詳盡的原則。在提示詞中給出他回答問題所需要的主要信息,并且清楚具體地告訴它要做什么事情。
2.1.2 提示詞公式
對于相對簡單、通用的任務(wù),由于模型對這類任務(wù)通常比較擅長,一般遵循前面所講的原則直接寫提示詞即可
示例 1:
請根據(jù) XXX 起 5 個有吸引力的標(biāo)題
示例 2:
請幫我找出下面段落中的錯別字,段落內(nèi)容為:XXX。
示例 3:
請給我一個 Java 語言實現(xiàn)策略設(shè)計模式的示例代碼。
對于相對復(fù)雜、專用的任務(wù),可以參考下面的公式:立角色 + 說問題 + 定目標(biāo) + 給示例 + 加背景+ 補要求,往往可以得到更好的回答。實際使用過程中并非這四項都要有,可以根據(jù)實際情況進行靈活組合。
示例:
2.1.3 提示詞技巧我想讓你充當(dāng)我的導(dǎo)游(立角色),我計劃從青島出發(fā)去杭州旅游,預(yù)算是 10000 元,總共 2 個人,行程 3 天,請給我出一份攻略(說問題,定目標(biāo))。注意行程不要安排過于緊湊,不想去網(wǎng)紅打卡點,想去有文化底蘊的景點,另外推薦景點時,請附上景點的價格,不去太高檔的餐廳吃飯(補要求)。
提示詞的技巧有很多,這里給出一些自己實踐過的非常有用的一些經(jīng)驗,更多進階技巧大家可以再網(wǎng)上搜索更多資料進一步學(xué)習(xí)。
加分隔符幫助模型區(qū)分不同的區(qū)塊如果提示詞包含多個部分,為了更好地區(qū)分開來,可以使用分隔符。如使用三個反引號將命令和待處理的段落分開。
示例 :
執(zhí)行下面的步驟:
1 將下面由三個引號分隔的文本總結(jié)為一句話。
2 將總結(jié)翻譯成英文
3 統(tǒng)計英文中的每個字母的數(shù)量
4 參考三個#分割的文本格式進行輸出
"""{text}"""
###{"a":1,"b":2}###
通過加限定詞提要求規(guī)范模型的輸出
如果 AI 模型輸出的風(fēng)格不符合你的要求,可以通過設(shè)置口吻、說明面向的人群等,讓大模型按照你的意圖來回答問題。如果 AI 模型輸出的內(nèi)容存在 Bad Case,你可以通過強勢的情態(tài)副詞對結(jié)果進行干預(yù),如“一定要”,"一定不要","必須"、“不許”、“應(yīng)該”等。身邊就有朋友反饋用 AI 寫出的內(nèi)容有“機器味道”,采用了通過設(shè)置口吻和設(shè)定要求等優(yōu)化提示詞后,寫出的內(nèi)容讓他非常滿意。
示例 1:
你是一位知名兒童文學(xué)作家,請使用親和力的口吻,幫我寫一篇面向幼兒園兒童的,能夠體現(xiàn)親情重要性的故事。
要求:
1 文章內(nèi)容需要涉及至少兩個動物。
2 文章內(nèi)容要具有想象力。
3 文章內(nèi)容需積極向上,絕不能出現(xiàn)血腥、暴力的內(nèi)容。
4 ...
說明:提示詞中講口吻、面向人群和具體要求給出到模型,更容易寫出讓你滿意的故事。在提示詞中通過“絕不能”的限定,模型構(gòu)造故事時會刻意避免。
示例 2:
請使用 PlantUML 的語法,幫我生成一個時序圖。
時序的對象包括:A、B、C。時序如下:XXX
說明:如果不交代時序?qū)ο螅P吞崛〉膶ο罂赡芎湍阆氲挠衅?,而提示詞中直接將時序?qū)ο蠼淮o AI 模型,更容易繪制出讓你滿意的時序圖。
示例3:
執(zhí)行下面的步驟:
1 將下面由三個引號分隔的文本總結(jié)為一句話。
2 將總結(jié)翻譯成英文
3 統(tǒng)計英文中的每個字母的數(shù)量
4 參考三個#分割的文本格式進行輸出
5 不需要輸出中間過程,只需要參考三個#分割的文本格式輸出最終結(jié)果即可(一定不要輸出開頭和結(jié)尾分隔符#)
"""{text}"""
###{"a":1,"b":2}###
說明:如果不加上 “一定不要輸出開頭和結(jié)尾的分隔符#”,有些模型會輸出結(jié)果時前后帶上三個 #,通過限定可以完美解決這個問題。
提供參考示例讓模型更好理解你的意圖
在提示詞中給出一些示例,有助于大模型更好地理解你的意圖,回答出更符合你要求的答案。
示例 1:
請你充當(dāng)標(biāo)題優(yōu)化助手,我將給你發(fā)送一個主題,請從下面的原則中選擇最適合的一個原則,給出 5 個參考標(biāo)題。
好的文章標(biāo)題遵循三個原則:
(1)數(shù)字法則。如“寫文章的 5 種技巧”、“工作 5 年,我學(xué)到了這 10 點”、“3 種姿勢幫你做出精美簡歷”。
(2)給出結(jié)論和價值。如“重構(gòu)的必要性和方法”、“關(guān)于軟件復(fù)雜度的思考”、“工程師也要有產(chǎn)品思維”。
(3)激發(fā)好奇心。如“DDD 最短學(xué)習(xí)路徑”、“原來設(shè)計模式還可以這么用”、“ 99% 程序員理解錯了字符串的可變性”、“不寫代碼,程序員最重要的技能”。
主題:XXX
示例 2:
請幫我寫一個正則表達(dá)式,匹配的規(guī)則如下:數(shù)字或下劃線#some.com,并且不能以下劃線開頭。
正確示例:123#some.com 、 123#some.com、1_23#some.com
錯誤示例:123#some.com、12ac#some.com
示例 3:
你是一個知名互聯(lián)網(wǎng)論壇的編輯,請幫我校對一篇專業(yè)博文,請指出其中的專業(yè)術(shù)語錯誤、拗口的句子等,并給出修改建議。
參考輸出格式見三個引號分隔的部分:
"""
第1處
原文:在軟件開發(fā)流程中代碼審校非常重要,能夠幫助程序員提前發(fā)現(xiàn)問題。
原因:“代碼審?!睂I(yè)術(shù)語錯誤,應(yīng)該是“代碼審查”
修改:在軟件開發(fā)流程中代碼審校非常重要,能夠幫助程序員提前發(fā)現(xiàn)問題。
第2處
原文:使用命令 dune init project my_compiler 創(chuàng)建新項目。
原因:此句中對命令的描述不夠通順,建議增加“來”字來連接動作與目的。
修改:使用命令 dune init project my_compiler 來創(chuàng)建新項目。
"""
思維鏈 (Chain-of-Thought,CoT)
人們解決復(fù)雜問題時,通常會將其分為一些中間的步驟逐步解決,最終得到答案。思維鏈就是參考人類的解決辦法,思維鏈提示詞模式包括輸入問題、思維鏈和輸出結(jié)論。讓模型可以學(xué)習(xí)這種推理過程,從而提高大模型在復(fù)雜推理時的準(zhǔn)確率。
(圖片來源:《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models 》論文)
2.2 模型使用過程中常見問題和解決辦法2.2.1 想使用外部大模型,又擔(dān)心業(yè)務(wù)數(shù)據(jù)泄露很多人想在公司里使用 AI 工具,但對業(yè)務(wù)數(shù)據(jù)泄露持有顧慮。
如果你在大廠,可以考慮公司內(nèi)部自研的合規(guī)模型。也可以選擇公司代理(會進行安全過濾)的外國 AI 模型。如果想直接使用 ChatGPT 、Bard 之類的外國大語言模型試試效果,可以將數(shù)據(jù)先脫敏、構(gòu)造 mock 數(shù)據(jù)或者嘗試將遇到的問題轉(zhuǎn)成一個通用的問題來提問即可,得到靠譜的方案或代碼再移植到公司內(nèi)部。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。