OpenAI GPT-4o來了！懂你的情緒更像人類、能打斷互動對話…為何發佈會特別感謝黃仁勳？

shutterstock

2024-05-14 09:48

+A -A

加入收藏

OpenAI 周一 (13 日) 在線上發表會上推出新型人工智慧 (AI) 模型「GPT-4o」，該模型能進行語言、文本和視覺推理，而且在文本、影片和音頻方面的能力都有所提高，所有用戶將能免費使用。此外，該公司還推出桌上型電腦版本 ChatGP 和新的用戶介面，為擴大其廣受歡迎的聊天機器人做足準備。

OpenAI 科技長穆拉提 (Mira Murati) 在當天的直播活動中表示，此次更新將把 GPT-4o 帶給所有人，包括免費用戶，不過 GPT-4o 的付費用戶受的容量限制會比企業付費用戶更多。

值得一提的是，穆拉提在發表會尾聲還感謝輝達 (NVDA-US) 執行長黃仁勳及其公司替 OpenAI 的技術提供必要的圖形處理器 (GPU)。她說：「我只想感謝令人難以置信的 OpenAI 團隊，也感謝黃仁勳(Jensen Huang) 和輝達團隊為我們帶來最先進的 GPU，讓今天發表會的功能展示成真。」

新模型「GPT-4o」的特點方面，穆拉提表示其速度比 GPT-4 Turbo 快一倍，而且成本還只有後者的一半，在文本、影片和聲音方面的能力都有所提升，她稱這是該公司首次在使用方便方面邁出一大步。

穆拉提還說 GPT-4o 提高 ChatGPT 的品質以及 50 種不同語言的速度，新模型將透過 OpenAI 的 API 提供，如此一來軟體開發商就能使用新模型建構應用程式。

值得注意的是，OpenAI 研究員 Mark Chen 展示新模型的音頻功能，展現其感知使用者情緒功能，透過播放音樂舒緩情緒，而且還能處理被使用者突然打斷的狀況，甚至還能透過分析用戶臉部表評估當下情緒反應。

有趣的是，新模型能講睡前床邊故事，可以要求改變語調，使其更戲劇化或更機械式，或是以歌唱方式說故事。

不只如此，該模型的翻譯功能進一步延伸至聽聲翻譯。展示過程中，Mark Chen 與穆拉提分別講義大利文和英文，隨後新模型把雙方交談的內容翻譯成各自的語言。

另外，OpenAI 團隊成員也展示新模型解決數學方程式和輔助編寫程式碼的能力，並將其定位微軟 (MSFT-US) 自家 GitHub Copilot 的有力競爭對手。對於 OpenAI 來說，這是該公司自去年 8 月推出 ChatGPT Enterprise 以來向前邁出的最大一步。

微軟 (MSFT-US) 投資的 OpenAI，估值已超過 800 億美元，但這家成立於 2015 年的公司面臨著壓力，一方面要保持在生成式 AI 市場的領先地位，另一方面要想辦法賺錢，因為其在處理器和基礎設施投入大量資金構建和訓練其模型。

包含 OpenAI，微軟和 Google(GOOGL-US) 正引領著一場生成式 AI 淘金熱，似乎每個行業的公司都在競相將 AI 聊天機器人添加到關鍵服務中，以避免落後於競爭對手。本月早些時候，OpenAI 的競爭對手 Anthropic 宣布其首個企業產品和免費的 iPhone 應用程式。

PitchBook 的數據顯示，2023 年，近 700 筆生成式 AI 交易的投資額達到創紀錄的 291 億美元，比前一年成長 260% 以上，預估該市場的收入將在十年內突破 1 兆美元。

不過一些業內人士對未經測試的新服務進入市場的速度表示擔憂，學者和倫理學家對這項技術傳播偏見的傾向感到憂慮。

本文授權自鉅亨網，原文見此。