向ChatGPT提問的藝術
目錄
第一章:PROMPT 工程技術簡介 ………………………………………………………………………………………………………… 5
第二章:指令提示技術………………………………………………………………………………………………………………………….. 5
第三章:角色提示………………………………………………………………………………………………………………………………….. 6
第四章:標準提示………………………………………………………………………………………………………………………………….. 7
第五章:零、一和少樣本提示 ……………………………………………………………………………………………………………… 8
第六章:“讓我們思考一下”提示 …………………………………………………………………………………………………………. 8
第七章:自洽提示………………………………………………………………………………………………………………………………….. 9
第八章:種子詞提示……………………………………………………………………………………………………………………………..10
第九章:知識生成提示…………………………………………………………………………………………………………………………11
第十章:知識整合提示…………………………………………………………………………………………………………………………12
第十一章:多項選擇提示 …………………………………………………………………………………………………………………….13
第十二章:可解釋的軟提示…………………………………………………………………………………………………………………14
第十三章:控制生成提示 …………………………………………………………………………………………………………………….14
第十四章:問答提示……………………………………………………………………………………………………………………………..15
第十五章:概述提示……………………………………………………………………………………………………………………………..16
第十六章:對話提示……………………………………………………………………………………………………………………………..16
第十七章:對抗性提示…………………………………………………………………………………………………………………………17
第十八章:聚類提示……………………………………………………………………………………………………………………………..18
第十九章:強化學習提示 …………………………………………………………………………………………………………………….18
第二十章:課程學習提示 …………………………………………………………………………………………………………………….19
第二十一章:情感分析提示…………………………………………………………………………………………………………………20
第二十二章:命名實體識別提示…………………………………………………………………………………………………………20
第二十三章:文本分類提示…………………………………………………………………………………………………………………21
第二十四章:文本生成提示…………………………………………………………………………………………………………………22
結語………………………………………………………………………………………………………………………………………………………….23
第一章:Prompt 工程技術簡介
什么是 Prompt 工程?
Prompt 工程是創建提示或指導像 ChatGPT 這樣的語言模型輸出的過程。它允許用戶控制模型的輸出并
生成符合其特定需求的文本。
ChatGPT 是一種先進的語言模型,能夠生成類似于人類的文本。它建立在 Transformer 架構上,可以處
理大量數據并生成高質量的文本。
然而,為了從 ChatGPT 中獲得最佳結果,重要的是要了解如何正確地提示模型。 提示可以讓用戶控制
模型的輸出并生成相關、準確和高質量的文本。 在使用 ChatGPT 時,了解它的能力和限制非常重要。
該模型能夠生成類似于人類的文本,但如果沒有適當的指導,它可能無法始終產生期望的輸出。
這就是 Prompt 工程的作用,通過提供清晰而具體的指令,您可以引導模型的輸出并確保其相關。
Prompt 公式是提示的特定格式,通常由三個主要元素組成:
- 任務:對提示要求模型生成的內容進行清晰而簡潔的陳述。
- 指令:在生成文本時模型應遵循的指令。
- 角色:模型在生成文本時應扮演的角色。
在本書中,我們將探討可用于 ChatGPT 的各種 Prompt 工程技術。我們將討論不同類型的提示,以及如
何使用它們實現您想要的特定目標。
第二章:指令提示技術
現在,讓我們開始探索“指令提示技術”,以及如何使用它從 ChatGPT 中生成高質量的文本。
指令提示技術是通過為模型提供具體指令來引導 ChatGPT 的輸出的一種方法。這種技術對于確保輸出相
關和高質量非常有用。
要使用指令提示技術,您需要為模型提供清晰簡潔的任務,以及具體的指令以供模型遵循。
例如,如果您正在生成客戶服務響應,您將提供任務,例如“生成響應客戶查詢”的指令,例如“響應應
該專業且提供準確的信息”。
提示公式:“按照以下指示生成[任務]:[指令]”
示例:
生成客戶服務響應:? 任務:生成響應客戶查詢
- 指令:響應應該專業且提供準確的信息
- 提示公式:“按照以下指示生成專業且準確的客戶查詢響應:響應應該專業且提供準確的信
息。”
生成法律文件:
- 任務:生成法律文件
- 指令:文件應符合相關法律法規
- 提示公式:“按照以下指示生成符合相關法律法規的法律文件:文件應符合相關法律法規。”
使用指令提示技術時,重要的是要記住指令應該清晰具體。這將有助于確保輸出相關和高質量。可以將指
令提示技術與下一章節中解釋的“角色提示”和“種子詞提示”相結合,以增強 ChatGPT 的輸出。
第三章:角色提示
角色提示技術是通過為 ChatGPT 指定一個特定的角色來引導其輸出的一種方式。這種技術對于生成針對
特定上下文或受眾的文本非常有用。
要使用角色提示技術,您需要為模型提供一個清晰具體的角色。
例如,如果您正在生成客戶服務回復,您可以提供一個角色,如“客戶服務代表”。
提示公式:“作為[角色]生成[任務]”
示例:
生成客戶服務回復:
- 任務:生成對客戶查詢的回復
- 角色:客戶服務代表
- 提示公式:“作為客戶服務代表,生成對客戶查詢的回復。”
生成法律文件:
- 任務:生成法律文件
- 角色:律師
- 提示公式:“作為律師,生成法律文件。”
將角色提示技術與指令提示和種子詞提示結合使用可以增強 ChatGPT 的輸出。
下面是一個示例,展示了如何將指令提示、角色提示和種子詞提示技術結合使用:
- 任務:為新智能手機生成產品描述? 指令:描述應該是有信息量的,具有說服力,并突出智能手機的獨特功能
- 角色:市場代表 種子詞:“創新的”
- 提示公式:“作為市場代表,生成一個有信息量的、有說服力的產品描述,突出新智能手機的創
新功能。該智能手機具有以下功能[插入您的功能]”
在這個示例中,指令提示用于確保產品描述具有信息量和說服力。角色提示用于確保描述是從市場代表的
角度書寫的。而種子詞提示則用于確保描述側重于智能手機的創新功能。
第四章:標準提示
標準提示是一種簡單的方法,通過為模型提供一個特定的任務來引導 ChatGPT 的輸出。例如,如果您想
生成一篇新聞文章的摘要,您可以提供一個任務,如“總結這篇新聞文章”。
提示公式:“生成一個[任務]”
例如:
生成新聞文章的摘要:
- 任務:總結這篇新聞文章
- 提示公式:“生成這篇新聞文章的摘要”
生成一篇產品評論:
- 任務:為一款新智能手機撰寫評論
- 提示公式:“生成這款新智能手機的評論”
此外,標準提示可以與其他技術(如角色提示和種子詞提示)結合使用,以增強 ChatGPT 的輸出。
以下是如何將標準提示、角色提示和種子詞提示技術結合使用的示例:
- 任務:為一臺新筆記本電腦撰寫產品評論
- 說明:評論應客觀、信息豐富,強調筆記本電腦的獨特特點
- 角色:技術專家
- 種子詞:“強大的”
- 提示公式:“作為一名技術專家,生成一個客觀而且信息豐富的產品評論,強調新筆記本電腦的
強大特點。”
在這個示例中,標準提示技術用于確保模型生成產品評論。角色提示用于確保評論是從技術專家的角度寫
的。而種子詞提示用于確保評論側重于筆記本電腦的強大特點。
第五章:零、一和少樣本提示
零樣本、一樣本和少樣本提示是用于從 ChatGPT 生成文本的技術,最少或沒有任何示例。當特定任務的
數據有限或任務是新的且未定義時,這些技術非常有用。
當任務沒有可用的示例時,使用零樣本提示技術。模型提供一個通用任務,根據對任務的理解生成文本。
當任務只有一個示例可用時,使用一樣本提示技術。模型提供示例,并根據對示例的理解生成文本。
當任務只有有限數量的示例可用時,使用少樣本提示技術。模型提供示例,并根據對示例的理解生成文
本。
提示公式:“基于[數量]個示例生成文本”
例如:
為沒有可用示例的新產品編寫產品描述:
- 任務:為新的智能手表編寫產品描述
- 提示公式:“基于零個示例為這款新智能手表生成產品描述”
使用一個示例生成產品比較:
- 任務:將新款智能手機與最新的 iPhone 進行比較
- 提示公式:“使用一個示例(最新的 iPhone)為這款新智能手機生成產品比較”
使用少量示例生成產品評論:
- 任務:為新的電子閱讀器撰寫評論
- 提示公式:“使用少量示例(3 個其他電子閱讀器)為這款新電子閱讀器生成評論”
這些技術可用于根據模型對任務或提供的示例的理解生成文本。
第六章:“讓我們思考一下”提示
“讓我們思考一下”提示是一種技巧,可鼓勵 ChatGPT 生成反思和思考性的文本。這種技術適用于撰寫
論文、詩歌或創意寫作等任務。
“讓我們思考一下”提示的公式非常簡單,即“讓我們思考一下”后跟一個主題或問題。
例如:
生成一篇反思性論文:
- 任務:就個人成長主題寫一篇反思性論文
- 提示公式:“讓我們思考一下:個人成長”
生成一首詩:? 任務:寫一首關于季節變化的詩
- 提示公式:“讓我們思考一下:季節變化”
這個提示要求對特定主題或想法展開對話或討論。發言者邀請 ChatGPT 參與討論相關主題。
模型提供了一個提示,作為對話或文本生成的起點。
然后,模型使用其訓練數據和算法生成與提示相關的響應。這種技術允許 ChatGPT 根據提供的提示生成
上下文適當且連貫的文本。
要使用“讓我們思考一下提示”技術與 ChatGPT,您可以遵循以下步驟:
- 確定您要討論的主題或想法。
- 制定一個明確表達主題或想法的提示,并開始對話或文本生成。
- 用“讓我們思考”或“讓我們討論”開頭的提示,表明您正在啟動對話或討論。
以下是使用此技術的一些提示示例:
- 提示:“讓我們思考氣候變化對農業的影響”
- 提示:“讓我們討論人工智能的當前狀態”
- 提示:“讓我們談談遠程工作的好處和缺點” 您還可以添加開放式問題、陳述或一段您希望模
型繼續或擴展的文本。
提供提示后,模型將使用其訓練數據和算法生成與提示相關的響應,并以連貫的方式繼續對話。
這種獨特的提示有助于 ChatGPT 以不同的視角和角度給出答案,從而產生更具動態性和信息性的段落。
使用提示的步驟簡單易行,可以真正提高您的寫作水平。嘗試一下,看看效果如何吧。
第七章:自洽提示
自洽提示是一種技術,用于確保 ChatGPT 的輸出與提供的輸入一致。這種技術對于事實核查、數據驗證
或文本生成中的一致性檢查等任務非常有用。
自洽提示的提示公式是輸入文本后跟著指令“請確保以下文本是自洽的”。
或者,可以提示模型生成與提供的輸入一致的文本。
提示示例及其公式:
示例 1:文本生成
- 任務:生成產品評論
- 指令:評論應與輸入中提供的產品信息一致
- 提示公式:“生成與以下產品信息一致的產品評論[插入產品信息]”示例 2:文本摘要
- 任務:概括一篇新聞文章
- 指令:摘要應與文章中提供的信息一致
- 提示公式:“用與提供的信息一致的方式概括以下新聞文章[插入新聞文章]”
示例 3:文本完成
- 任務:完成一個句子
- 指令:完成應與輸入中提供的上下文一致
- 提示公式:“以與提供的上下文一致的方式完成以下句子[插入句子]”
示例 4:
- 事實核查:
任務:檢查給定新聞文章的一致性
輸入文本:“文章中陳述該城市的人口為 500 萬,但后來又說該城市的人口為 700 萬。”
提示公式:“請確保以下文本是自洽的:文章中陳述該城市的人口為 500 萬,但后來又說該城市
的人口為 700 萬。”
- 數據驗證:
任務:檢查給定數據集的一致性
輸入文本:“數據顯示 7 月份的平均溫度為 30 度,但最低溫度記錄為 20 度。”
提示公式:“請確保以下文本是自洽的:數據顯示 7 月份的平均溫度為 30 度,但最低溫度記錄
為 20 度。”
第八章:種子詞提示
種子詞提示是一種通過提供特定的種子詞或短語來控制 ChatGPT 輸出的技術。種子詞提示的提示公式是
種子詞或短語,后跟指令“請根據以下種子詞生成文本”。
示例:
文本生成:
- 任務:編寫一篇有關龍的故事
- 種子詞:“龍”
- 提示公式:“請根據以下種子詞生成文本:龍”
語言翻譯:
- 任務:將一句話從英語翻譯成西班牙語
- 種子詞:“你好”? 提示公式:“請根據以下種子詞生成文本:你好”
這種技術允許模型生成與種子詞相關的文本并對其進行擴展。這是一種控制模型生成文本與某個特定主題
或背景相關的方式。
種子詞提示可以與角色提示和指令提示相結合,以創建更具體和有針對性的生成文本。通過提供種子詞或
短語,模型可以生成與該種子詞或短語相關的文本,并通過提供有關期望輸出和角色的信息,模型可以以
特定于角色或指令的風格或語氣生成文本。這樣可以更好地控制生成的文本,并可用于各種應用程序。
以下是提示示例及其公式:
示例 1:文本生成
- 任務:編寫一首詩
- 指令:詩應與種子詞“愛”相關,并以十四行詩的形式書寫。
- 角色:詩人
- 提示公式:“作為詩人,根據以下種子詞生成與“愛”相關的十四行詩:”
示例 2:文本完成
- 任務:完成一句話
- 指令:完成應與種子詞“科學”相關,并以研究論文的形式書寫。
- 角色:研究員
- 提示公式:“作為研究員,請在與種子詞“科學”相關且以研究論文的形式書寫的情況下完成以
下句子:[插入句子]”
示例 3:文本摘要
- 任務:摘要一篇新聞文章
- 指令:摘要應與種子詞“政治”相關,并以中立和公正的語氣書寫。
- 角色:記者
- 提示公式:“作為記者,請以中立和公正的語氣摘要以下新聞文章,與種子詞“政治”相關:
[插入新聞文章]”
第九章:知識生成提示
知識生成提示是一種從 ChatGPT 中引出新的、原創的信息的技術。
知識生成提示的公式是“請生成關于 X 的新的和原創的信息”,其中 X 是感興趣的主題。
這是一種利用模型預先存在的知識來生成新的信息或回答問題的技術。要將此提示與 ChatGPT 一起使用,需要將問題或主題作為輸入提供給模型,以及指定所生成文本的任務
或目標的提示。
提示應包括有關所需輸出的信息,例如要生成的文本類型以及任何特定的要求或限制。
以下是提示示例及其公式:
示例 1:知識生成
- 任務:生成有關特定主題的新信息
- 說明:生成的信息應準確且與主題相關
- 提示公式:“生成有關[特定主題]的新的準確信息”
示例 2:問答
- 任務:回答問題
- 說明:答案應準確且與問題相關
- 提示公式:“回答以下問題:[插入問題]”
示例 3:知識整合
- 任務:將新信息與現有知識整合
- 說明:整合應準確且與主題相關
- 提示公式:“將以下信息與有關[特定主題]的現有知識整合:[插入新信息]”
示例 4:數據分析
- 任務:從給定的數據集中生成有關客戶行為的見解
- 提示公式:“請從這個數據集中生成有關客戶行為的新的和原創的信息”
第十章:知識整合提示
這種技術利用模型的現有知識來整合新信息或連接不同的信息片段。
這種技術對于將現有知識與新信息相結合,以生成更全面的特定主題的理解非常有用。
如何與 ChatGPT 一起使用:
- 模型應該提供新信息和現有知識作為輸入,以及指定生成文本的任務或目標的提示。
- 提示應包括有關所需輸出的信息,例如要生成的文本類型以及任何特定的要求或限制。
提示示例及其公式:
示例 1:知識整合
- 任務:將新信息與現有知識整合
- 說明:整合應準確且與主題相關? 提示公式:“將以下信息與關于[具體主題]的現有知識整合:[插入新信息]”
示例 2:連接信息片段
- 任務:連接不同的信息片段
- 說明:連接應相關且邏輯清晰
- 提示公式:“以相關且邏輯清晰的方式連接以下信息片段:[插入信息 1] [插入信息 2]”
示例 3:更新現有知識
- 任務:使用新信息更新現有知識
- 說明:更新的信息應準確且相關
- 提示公式:“使用以下信息更新[具體主題]的現有知識:[插入新信息]”
第十一章:多項選擇提示
這種技術向模型提供一個問題或任務以及一組預定義的選項作為潛在答案。
該技術對于生成僅限于特定選項集的文本非常有用,可用于問答、文本完成和其他任務。模型可以生成僅
限于預定義選項的文本。
要使用 ChatGPT 的多項選擇提示,需要向模型提供一個問題或任務作為輸入,以及一組預定義的選項作
為潛在答案。提示還應包括有關所需輸出的信息,例如要生成的文本類型以及任何特定要求或限制。
提示示例及其公式:
示例 1:問答
- 任務:回答一個多項選擇題
- 說明:答案應該是預定義的選項之一
- 提示公式:“通過選擇以下選項之一回答以下問題:[插入問題] [插入選項 1] [插入選項 2] [插入
選項 3]”
示例 2:文本完成
- 任務:使用預定義選項之一完成句子
- 說明:完成應該是預定義的選項之一
- 提示公式:“通過選擇以下選項之一完成以下句子:[插入句子] [插入選項 1] [插入選項 2] [插入
選項 3]”
示例 3:情感分析
- 任務:將文本分類為積極、中立或消極
- 說明:分類應該是預定義的選項之一? 提示公式:“通過選擇以下選項之一,將以下文本分類為積極、中立或消極:[插入文本] [積極]
[中立] [消極]”
第十二章:可解釋的軟提示
可解釋的軟提示是一種技術,可以在提供一定的靈活性的同時控制模型生成的文本。它通過提供一組受控
輸入和關于所需輸出的附加信息來實現。這種技術可以生成更具解釋性和可控性的生成文本。
提示示例及其公式:
示例 1:文本生成
- 任務:生成一個故事
- 指令:故事應基于一組給定的角色和特定的主題
- 提示公式:“基于以下角色生成故事:[插入角色]和主題:[插入主題]”
示例 2:文本完成
- 任務:完成一句話
- 指令:完成應以特定作者的風格為基礎
- 提示公式:“以[特定作者]的風格完成以下句子:[插入句子]”
示例 3:語言建模
- 任務:以特定風格生成文本
- 指令:文本應以特定時期的風格為基礎
- 提示公式:“以[特定時期]的風格生成文本:[插入上下文]”
第十三章:控制生成提示
控制生成提示是一種技術,可讓模型在生成文本時對輸出進行高度控制。
這可以通過提供一組特定的輸入來實現,例如模板、特定詞匯或一組約束條件,這些輸入可用于指導生成
過程。
以下是一些示例和它們的公式:
示例 1:文本生成
- 任務:生成一個故事
- 說明:該故事應基于特定的模板? 提示公式:“根據以下模板生成故事:[插入模板]”
示例 2:文本補全
- 任務:完成一句話
- 說明:完成應使用特定的詞匯
- 提示公式:“使用以下詞匯完成以下句子:[插入詞匯]:[插入句子]”
示例 3:語言建模
- 任務:以特定風格生成文本
- 說明:文本應遵循一組特定的語法規則
- 提示公式:“生成遵循以下語法規則的文本:[插入規則]:[插入上下文]”
通過提供一組特定的輸入來指導生成過程,控制生成提示使得生成的文本更具可控性和可預測性。
第十四章:問答提示
問答提示是一種技術,可以讓模型生成回答特定問題或任務的文本。通過將問題或任務與可能與問題或任
務相關的任何其他信息一起作為輸入提供給模型來實現此目的。
一些提示示例及其公式如下:
示例 1:事實問題回答
- 任務:回答一個事實性問題
- 說明:答案應準確且相關
- 提示公式:“回答以下事實問題:[插入問題]”
示例 2:定義
- 任務:提供一個詞的定義
- 說明:定義應準確
- 提示公式:“定義以下詞匯:[插入單詞]”
示例 3:信息檢索
- 任務:從特定來源檢索信息
- 說明:檢索到的信息應相關
- 提示公式:“從以下來源檢索有關[特定主題]的信息:[插入來源]” 這對于問答和信息檢索等任
務非常有用。
第十五章:概述提示
概述提示是一種技術,允許模型在保留其主要思想和信息的同時生成給定文本的較短版本。
這可以通過將較長的文本作為輸入提供給模型并要求其生成該文本的摘要來實現。
這種技術對于文本概述和信息壓縮等任務非常有用。
如何在 ChatGPT 中使用:
- 應該向模型提供較長的文本作為輸入,并要求其生成該文本的摘要。
- 提示還應包括有關所需輸出的信息,例如摘要的所需長度和任何特定要求或限制。
提示示例及其公式:
示例 1:文章概述
- 任務:概述新聞文章
- 說明:摘要應是文章主要觀點的簡要概述
- 提示公式:“用一句簡短的話概括以下新聞文章:[插入文章]”
示例 2:會議記錄
- 任務:概括會議記錄
- 說明:摘要應突出會議的主要決策和行動
- 提示公式:“通過列出主要決策和行動來總結以下會議記錄:[插入記錄]”
示例 3:書籍摘要
- 任務:總結一本書
- 說明:摘要應是書的主要觀點的簡要概述
- 提示公式:“用一段簡短的段落總結以下書籍:[插入書名]”
第十六章:對話提示
對話提示是一種技術,允許模型生成模擬兩個或更多實體之間對話的文本。通過為模型提供一個上下文和
一組角色或實體,以及它們的角色和背景,并要求模型在它們之間生成對話。
因此,應為模型提供上下文和一組角色或實體,以及它們的角色和背景。還應向模型提供有關所需輸出的
信息,例如對話或交談的類型以及任何特定的要求或限制。
提示示例及其公式:
示例 1:對話生成? 任務:生成兩個角色之間的對話
- 說明:對話應自然且與給定上下文相關
- 提示公式:“在以下情境中生成以下角色之間的對話[插入角色]”
示例 2:故事寫作
- 任務:在故事中生成對話
- 說明:對話應與故事的角色和事件一致
- 提示公式:“在以下故事中生成以下角色之間的對話[插入故事]”
示例 3:聊天機器人開發
- 任務:為客服聊天機器人生成對話
- 說明:對話應專業且提供準確的信息
- 提示公式:“在客戶詢問[插入主題]時,為客服聊天機器人生成專業和準確的對話”
因此,這種技術對于對話生成、故事寫作和聊天機器人開發等任務非常有用。
第十七章:對抗性提示
對抗性提示是一種技術,它允許模型生成抵抗某些類型的攻擊或偏見的文本。這種技術可用于訓練更為穩
健和抵抗某些類型攻擊或偏見的模型。
要在 ChatGPT 中使用對抗性提示,需要為模型提供一個提示,該提示旨在使模型難以生成符合期望輸出
的文本。提示還應包括有關所需輸出的信息,例如要生成的文本類型和任何特定要求或約束。
提示示例及其公式:
示例 1:用于文本分類的對抗性提示
- 任務:生成被分類為特定標簽的文本
- 說明:生成的文本應難以分類為特定標簽
- 提示公式:“生成難以分類為[插入標簽]的文本”
示例 2:用于情感分析的對抗性提示
- 任務:生成難以分類為特定情感的文本
- 說明:生成的文本應難以分類為特定情感
- 提示公式:“生成難以分類為具有[插入情感]情感的文本”
示例 3:用于語言翻譯的對抗性提示
- 任務:生成難以翻譯的文本? 說明:生成的文本應難以翻譯為目標語言
- 提示公式:“生成難以翻譯為[插入目標語言]的文本”
第十八章:聚類提示
聚類提示是一種技術,它可以讓模型根據某些特征或特點將相似的數據點分組在一起。
通過提供一組數據點并要求模型根據某些特征或特點將它們分組成簇,可以實現這一目標。
這種技術在數據分析、機器學習和自然語言處理等任務中非常有用。
如何在 ChatGPT 中使用:
應該向模型提供一組數據點,并要求它根據某些特征或特點將它們分組成簇。提示還應包括有關所需輸出
的信息,例如要生成的簇數和任何特定的要求或約束。
提示示例及其公式:
示例 1:客戶評論的聚類
- 任務:將相似的客戶評論分組在一起
- 說明:應根據情感將評論分組
- 提示公式:“將以下客戶評論根據情感分組成簇:[插入評論]”
示例 2:新聞文章的聚類
- 任務:將相似的新聞文章分組在一起
- 說明:應根據主題將文章分組
- 提示公式:“將以下新聞文章根據主題分組成簇:[插入文章]”
示例 3:科學論文的聚類
- 任務:將相似的科學論文分組在一起
- 說明:應根據研究領域將論文分組
- 提示公式:“將以下科學論文根據研究領域分組成簇:[插入論文]”
第十九章:強化學習提示
強化學習提示是一種技術,可以使模型從過去的行動中學習,并隨著時間的推移提高其性能。要在
ChatGPT 中使用強化學習提示,需要為模型提供一組輸入和獎勵,并允許其根據接收到的獎勵調整其行
為。提示還應包括有關期望輸出的信息,例如要完成的任務以及任何特定要求或限制。這種技術對于決策
制定、游戲玩法和自然語言生成等任務非常有用。提示示例及其公式:
示例 1:用于文本生成的強化學習
- 任務:生成與特定風格一致的文本
- 說明:模型應根據為生成與特定風格一致的文本而接收到的獎勵來調整其行為
- 提示公式:“使用強化學習來生成與以下風格一致的文本[插入風格]”
示例 2:用于語言翻譯的強化學習
- 任務:將文本從一種語言翻譯成另一種語言
- 說明:模型應根據為生成準確翻譯而接收到的獎勵來調整其行為
- 提示公式:“使用強化學習將以下文本[插入文本]從[插入語言]翻譯成[插入語言]”
示例 3:用于問答的強化學習
- 任務:回答問題
- 說明:模型應根據為生成準確答案而接收到的獎勵來調整其行為
- 提示公式:“使用強化學習來回答以下問題[插入問題]”
第二十章:課程學習提示
課程學習是一種技術,允許模型通過先訓練簡單任務,逐漸增加難度來學習復雜任務。
要在 ChatGPT 中使用課程學習提示,模型應該提供一系列任務,這些任務逐漸增加難度。
提示還應包括有關期望輸出的信息,例如要完成的最終任務以及任何特定要求或約束條件。
此技術對自然語言處理、圖像識別和機器學習等任務非常有用。
提示示例及其公式:
示例 1:用于文本生成的課程學習
- 任務:生成與特定風格一致的文本
- 說明:模型應該在移動到更復雜的風格之前先在簡單的風格上進行訓練。
- 提示公式:“使用課程學習來生成與以下風格[插入風格]一致的文本,按照以下順序[插入順
序]。”
示例 2:用于語言翻譯的課程學習
- 任務:將文本從一種語言翻譯成另一種語言
- 說明:模型應該在移動到更復雜的語言之前先在簡單的語言上進行訓練。
- 提示公式:“使用課程學習將以下語言[插入語言]的文本翻譯成以下順序[插入順序]。”示例 3:用于問題回答的課程學習
- 任務:回答問題
- 說明:模型應該在移動到更復雜的問題之前先在簡單的問題上進行訓練。
- 提示公式:“使用課程學習來回答以下問題[插入問題],按照以下順序[插入順序]生成答案。”0