人工智慧(AI)的世界在不斷發展,一直有新的突破和進步。但有一項發展特別引起了人工智慧界的注意,那就是 ChatGPT的出現。GPT是Generative Pre-trained Transformer的簡稱,中文全名為生成型預訓練變換模型。ChatGPT是指能夠對話的GPT版本。它於2022年12月首次公布,由於能力和潛在的應用令人印象深刻,讓人工智慧社群興奮不已,並引發了熱烈的討論。
ChatGPT與過往其他版本不同,它的亮相之所以吸睛,是因為眾人在與它接觸後,發現向ChatGPT提問不僅能夠得出有意義的答案,更能夠得出超過自身能力的答案,這讓大家意識到,若能善用 ChatGPT,等同於擁有一位隱形的超級智能夥伴。
OpanAI的註冊會員在短時間內就站上了一億人數大關。但由於大量的會員使用,使得系統負荷過重,因此OpenAI提議開設收費20美元的版本。儘管如此,市場依然趨之若鶩。這也是生平第一次,大家晚上聊天的對象從社群網路上的網友變成了需收費的生成式機器人。
到底GPT是什麼?為什麼具有如此強大的能力?
GPT的版本和進化
要深入下去前,首先需要瞭解GPT家族的沿革。GPT受到技術領域注目是2019年的GPT-2。當時這一個版本已有辦法接續舊文章,生成新的有意義的內容。2020年,OpenAI又發表了GPT-3。這個版本,遠較GPT-2先進許多。
GPT-2與GPT-3的比較
(圖片來源:《都問AI吧!ChatGPT上手的第一本書》)
值得一提的是,GPT-3在自然語言處理(NLP)領域中取得了重大的突破,成為了當時最大、最強大的自然語言生成模型,同時它的應用領域也非常廣泛,從機器翻譯到文章總結輸出,都有著非常出色的表現。
儘管GPT家族在技術上取得了重大突破,但卻始終未能引起大眾的關注。這主要是由於兩個因素所致:
首先,當時正值全球疫情嚴峻的時期,人們被迫將注意力集中在應對疫情方面,對於人工智慧領域的發展缺乏足夠的關注和時間。
其次,儘管GPT-3在當時被認為是目前最先進的自然語言處理模型,但是還存在一個致命的缺陷,那就是它無法進行智能對話。這意味著GPT-3只能執行單向任務,需要人工執行指令操作,這限制了其實際應用的範圍。這也是為什麼只有少數開發者才有能力和興趣去應用GPT-3。
相比之下,ChatGPT在推出後很快獲得了廣泛的關注和認可,主要是因為 ChatGPT具備智能對話的能力,使用者可以與ChatGPT自然地對話,產生有意義的對話內容。這使得ChatGPT在應用領域上擁有了更廣泛的可能性,因此受到許多開發者和使用者的追捧和喜愛。
GPT-3與ChatGPT的背景比較
(圖片來源:《都問AI吧!ChatGPT上手的第一本書》)
ChatGPT之所以受到如此廣泛的關注和喜愛,是因為它具備了GPT-3所缺乏的關鍵功能:對話設計。
對於許多人來說,評估一個人工智慧模型的好壞,往往是看它是否能夠在一次來回的對話中聽懂使用者的問題,並給出令人滿意的答案。相比於背後的知識量,人們更關注AI模型的「溝通能力」。
ChatGPT的出現大大提升了人工智慧模型的溝通能力,因此讓世人驚覺人工智慧的先進程度。這就是ChatGPT受到廣泛關注的原因。同時,ChatGPT的成功也讓人們重新關注GPT家族的潛力和威力,進一步推動了自然語言處理技術的發展。
你有沒有想過,人工智慧是如何理解和回應人類語言的?答案就在於提示的力量。
我們向ChatGPT或GPT-3下的指令,在領域術語裡面叫做Prompt(提示)。這是一種向語言模型輸入的方式,以便能夠生成相關和適當的輸出。
在本章中,我們將探討人類實際上是如何交流的,為什麼我們無法讓AI 按照我們的指令執行出我們想要的結果,以及如何改善這方面的問題,進而編寫好的提示,有效地使用提示。
探索人類交流原理:上下文與意圖猜測
我們之所以錯過GPT這個神器幾年,其實還有一個原因,是因為我們不滿意過往AI生成的結果。不滿意主要有兩個面向:
1. AI似乎沒有辦法抓到指令的意圖。
2. AI生出的結果不夠好。
依據過去的使用經驗,人類認為AI的能力還有待提高。然而,這是AI引擎不好所造成的嗎?
要解釋這個問題,我們得從人類之間交流的模式說起。人類的語言其實是一種非常模糊且隨意的交流方式,彼此之間能溝通是仰賴以下因素:
1. 環境背景襯托出來的上下文。
2. 來回詢問以挖掘意圖與目標。
3. 經年累月下的更多背景猜測。
比如說,一名顧客走進一家汽車展售中心想要買車。
顧客:我想要買一台車。
汽車業務:(先是打量顧客的穿著,推斷其年收入)請問您買車的用途是?預算多少?
顧客:我要買來載家人出去玩的(我怎麼可能跟你說預算)。
汽車業務:(再次觀察顧客推算其年紀,猜測是要載小孩還是長輩)平時都會去哪裡玩呢?為什麼想換車呢?
這個簡單的例子是想表達,人類平常在交流時,說出來的訊息其實非常簡短且模糊,所謂的交流是靠兩三次來回詢問與大量猜測而完成的。但是我們在跟 AI交流時,往往期望AI能靠一個問句就理解我們的意圖,並且給出令人滿意的回答。
GPT-3與ChatGPT的交流模式比較
(圖片來源:《都問AI吧!ChatGPT上手的第一本書》)
為什麼ChatGPT參數與資料較少,卻遠較於其他GPT版本受歡迎,原因是互動模式解決了「AI看起來不夠聰明」的原因。先採取了意圖猜測,並使用上下文不斷提升回答的品質。
作者簡介_維圖歐索Virtuoso
人工智慧(AI)專家,在相關研究領域和創新應用上有多年經驗,並曾擔任世界頂尖科技公司的顧問。一直都在關注人工智慧的快速發展及其無限可能,以自己的專業知識和見解,分享最新的人工智慧技術,概述當前發展狀況。
本文摘自商周出版《都問AI吧!ChatGPT上手的第一本書》