GPT-4 發佈了，趕緊申請 API 候補名單_zkj

theme: geek-black

介紹

GPT-4（Generative Pre-trained Transformer 4）是 OpenAI 開發的一種大型語言模型。它在 GPT-3 的基礎上進一步優化和擴展，提供了更加精確和全面的語言理解與生成能力。以下是官網介紹： 1. GPT-4 是一個多模態大型語言模型（支持接受圖像和文本輸入，以文本形式輸出），也是 OpenAI 努力擴展深度學習的最新里程碑。雖然 GPT-4 對於許多現實場景的處理比人類差，但它在各種體現專業和學術能力的 benchmark 上，已表現出和人類相當的水平。 2. 例如，GPT-4 通過了模擬律師考試，其分數在應試者的前 10% 左右；相比之下，GPT-3.5 的得分卻在倒數 10% 左右。OpenAI 表示，他們花了 6 個月的時間來使用對抗性測試程序，以及通過 ChatGPT 的經驗教訓迭代調整 GPT-4，從而在真實性和可控性等方面取得了有史以來最好的結果（儘管遠非完美）。 3. 我們還開源了 OpenAI Evals，這是我們用於自動評估 AI 模型性能的框架，允許任何人報告我們模型中的缺點，以幫助指導進一步改進。

對比

在隨意的談話中，GPT-3.5 和 GPT-4 之間的區別可能很微妙。當任務的複雜性達到足夠的閾值時，差異就會出現——GPT-4 比 GPT-3.5 更可靠、更有創意，並且能夠處理更細微的指令。

OpenAI 還將機器學習模型的傳統 benchmark 用於評估 GPT-4。結果顯示，GPT-4 已經遠遠超過現有的大型語言模型，以及大多數最先進的 SOTA（state-of-the-art）模型。benchmark 數據如下：

在 MMLU benchmark 中（一個基準數據集，包括來自於 STEM、人文、社科等 57 個學科的選擇題，它用於測試 LLM 的世界知識和問題解答的能力），GPT-4 處理中文的準確度大約是 80%，已經優於其他 LLM 的英文表現，比如 GPT-3.5、Chinchilla、PALM。

示例

創造力：GPT-4 比以往任何時候都更具創造性和協作性。它可以生成、編輯並與用户一起迭代創意和技術寫作任務，例如創作歌曲、編寫劇本或學習用户的寫作風格。
輸入

用一個句子解釋灰姑娘的情節，其中每個單詞必須以字母表中從 A 到 Z 的下一個字母開頭，不重複任何字母。 - 輸出

A beautiful Cinderella, dwelling eagerly, finally gains happiness; inspiring jealous kin, love magically nurtures opulent prince; quietly rescues, slipper triumphs, uniting very wondrously, xenial youth zealously.（翻譯：美麗的灰姑娘，熱切的棲居，終於獲得幸福；激起嫉妒的親人，愛情神奇地孕育出富貴的王子；悄悄拯救，拖鞋勝利，團結無比，熱心青年。）
視覺輸入：GPT-4 可以接受圖像作為輸入並生成説明、分類和分析。
輸入

我可以用這些原料做什麼？
輸出

你可以用這些原料做很多選擇！一些可能性包括：- 煎餅或華夫餅 - 可麗餅 - 法式吐司 - 煎蛋卷或菜肉餡煎蛋餅 - 乳蛋餅 - 奶油凍或布丁 - 蛋糕或紙杯蛋糕 - 鬆餅或麪包 - 餅乾。這些只是幾個例子，但可能性是無窮無盡的！
輸入

這張圖有什麼好笑的？並對圖片中的每部分進行描述。
輸出

圖片顯示了一個 "Lightning Cable" 適配器的包裝，總共包含三個部分。

圖片 1：一部智能手機，其充電端口插着一個 VGA 接口（大的藍色 15 針接口，通常用於電腦顯示器）。

圖片 2："Lightning Cable" 適配器的包裝上有一張 VGA 接口的圖片。

圖片 3：VGA 連接器的特寫，末端是一個小的 Lightning 連接器（用於為 iPhone 和其他蘋果設備充電）。

這張圖片中的幽默來自將過時的大型 VGA 連接器插入小型現代智能手機充電端口的荒謬做法。

更長的上下文：GPT-4 能夠處理超過 25,000 個單詞的文本，允許使用長格式內容創建、擴展對話以及文檔搜索和分析等用例。
輸入

[文章來自：http://en.wikipedia.org/wiki/Rihanna] 描述她在超級碗比賽中的表現以及它的特別之處（文章很長，要比 GPT3.5 能處理的文本長出一倍，下面是截圖）。
輸出

出於多種原因，蕾哈娜 (Rihanna) 的超級碗 LVII 中場秀表演很特別。首先，這是她五年多來的第一次現場表演，也是她第一次登上超級碗中場秀的頭條新聞。此外，她還創造了歷史，成為第一個在懷孕期間在超級碗上表演的人。該節目本身廣受好評，許多人稱讚她充滿活力的表演和令人印象深刻的歌聲。它還獲得了巨大的收視率，成為歷史上收視率第二高的中場秀。