LIFESTYLE熱門話題
OpenAI新模型「GPT-4o」是什麼?能即時翻譯對話,3大亮點一次看
by 美麗佳人編輯部-更新
Text/YZ、Photo/X@ OpenAI
美國人工智慧研究實驗室OpenAI在5/13舉辦線上發表會,由OpenAI的技術總監米拉穆拉蒂(Mira Murati)主持,推出新模型「GPT-4o」。GPT-4o的「o」來自「Omnimodel」全能模型,能接受文字、聲音和圖像3種格式的輸入,最快更能夠在232毫秒內回應,等同人類反應時間。最重要的是,拉穆拉蒂也宣布GPT-4o將免費提供給所有用戶。
GPT-4o亮點|1. 擬真對話還能算數學
GPT-4o平均反應時間是320毫秒,最快則可在232毫秒內回應,與人類的對話反應時間相似,因此使用者與GPT-4o對話時,無需等待延遲時間就能獲得即時回答。反應時間縮短,GPT-4o能夠以更自然、就像人類的聲音進行互動,也能模仿機器人的語氣,或模擬人類說睡前故事,甚至也會唱歌。除了語音技術提升外,也進化視覺化技術,透過鏡頭能帶著使用者一步一步解開數學題。
GPT-4o亮點|2.感測使用者情緒
GPT-3.5與GPT-4,是以三個獨立的模型構成與使用者的對話,第一個模型將音訊轉換為文字,第二個模型輸出成文字,最後一個模型將文字轉換回音訊,這樣繁瑣的過程會讓GPT無法觀察到語調及情感等等。因此OpenAI特別在GPT-4o模型上進行調整,輸入和輸出都由同一神經網路處理後,能感測到使用者的「情緒」,即使是對話過程中打岔GPT-4o,它也能迅速接上。
GPT-4o亮點|3.即時翻譯語言
GPT-4o語音技術的提升,不只在反應速度與情緒感知,更能夠即時翻譯語言。在發表會上,米拉穆拉蒂與多模態與尖端研究部門主管Mark Chen分別以義大利文和英文交談,GPT-4o迅速將內容翻譯成雙方各自的語言,展示強大的即時翻譯能力。
GPT-4o亮點|4.所有用戶免費
米拉穆拉蒂宣布GPT-4o模型將開放所有用戶免費使用,針對付費用戶則有5倍的容量上限,而預計未來幾周推出的GPT-4o alpha版,具有新版語音模式,將提供給ChatGPT Plus用戶。原先只有ChatGPT Plus用戶能使用的「GPT Store」,也在GPT-4o免費開放後,同步免費。除此之外,Mac用戶也有桌面版ChatGPT App可以使用, Windows用戶的版本則將在今年推出。
延伸閱讀