• 【超完整懶人包】認識比特幣!原理與應用全面解析|動區新手村
  • Account
  • Account
  • BlockTempo Beginner – 動區新手村
  • Change Password
  • Forgot Password?
  • Home 3
  • Login
  • Login
  • Logout
  • Members
  • Password Reset
  • Register
  • Register
  • Reset Password
  • User
  • 不只加密貨幣,談談那些你不知道的區塊鏈應用|動區新手村
  • 動區動趨 BlockTempo – 最有影響力的區塊鏈新聞媒體 (比特幣, 加密貨幣)
  • 所有文章
  • 最完整的「區塊鏈入門懶人包」|動區新手村
  • 服務條款 (Terms of Use)
  • 關於 BlockTempo
  • 隱私政策政策頁面 / Privacy Policy
動區動趨-最具影響力的區塊鏈新聞媒體
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
動區動趨-最具影響力的區塊鏈新聞媒體
No Result
View All Result
Home 區塊鏈商業應用 AI

Google強打OpenAI:Gemini Live和GPT-4o誰能更勝一籌?

元宇宙之心 by 元宇宙之心
2024-05-17
in AI, Uncategorized, 區塊鏈商業應用
A A
Google強打OpenAI:Gemini Live和GPT-4o誰能更勝一籌?
73
SHARES
分享至Facebook分享至Twitter

Google 近日推出了一款全新的人工智慧產品「Gemini Live」,支援實時語音對話功能,被外界認為是要與 OpenAI 的「ChatGPT Voice」抗衡,本文將比較兩者間的差異。
(前情提要:Google I/O大會猛攻AI:影片生成模型Veo、個人助手Project Astra、Gemini 1.5 Pro..亮點一次看)
(背景補充:iPhone將整合ChatGPT!彭博:Apple與OpenAI達成合作、最快六月發表 AI Siri)

 

在本週二舉行的Google I/O 大會上,Google推出了一款全新的人工智慧產品「Gemini Live」。人們原本以為安卓系統的 Gemini 助手會帶來某些新東西,但這就是 Google,一切皆有可能。

值得一提,Gemini Live 是在 OpenAI 首次消費者產品活動的第二天釋出的,很難不讓人猜想該產品是否是為了對抗 ChatGPT Voice 而釋出的。

而且兩者都採用了原生多模態人工智慧模型,並擁有出彩的語音和視訊功能。

目前,在全球人工智慧競賽中,領跑者無疑是 OpenAI 和 Google,前者似乎與蘋果和 iPhone 建立了緊密的聯絡,而後者則掌控著安卓系統。

並且,相對於 Rabbit r1 或 Humane Pin 這樣的人工智慧裝置而言,智慧手機才是短期的贏家。ChatGPT Voice 和 Gemini Live 都被整合到了現有的智慧手機產品中,而且這兩款產品目前都還未上市。至於下一代助手是否能夠與之相比,這是後話了。

Gemini Live 與 GPT-4o 誰更勝一籌?

下圖是 Google 釋出 Gemini Live 時的發言:

「今年夏天,我們將擴展套件 Gemini 的多模態功能,包括使用語音進行深入的雙向對話。這種新體驗被稱為 Live。」

在即時視訊分析和語音功能方面,Google 是有所欠缺的。去年 Google 釋出 Gemini Ultra 時,它釋出了一段響應「即時視訊」的視訊,但生成的結果並不理想。不過,這一次 Google 把這項技術放在了 I/O 上試用,包括語音和視訊對話。

OpenAI 和 Google 都為視訊及語音對話提供了一個介面,都可以通過手機攝像頭進行即時的視訊分析。並且語音和視訊的響應都很快,能夠進行真正自然的對話,甚至可以中途打斷人工智慧。

不過,兩者也有一些明顯的不同之處。OpenAI 的 ChatGPT Voice 聽起來更自然,能檢測並響應情緒和聲調,甚至能根據你的要求即時調整說話方式。在 Gemini Live 上並沒有看到這種功能。

二者另一個最大的不同是多模態。Gemini 仍然依賴其他模型進行輸出,包括使用 Imagen 3 輸出影象和 Veo 輸出視訊。但 GPT-4o 是雙向的原生多模態,「o」代表了全方位,可以建立自己的影象和聲音。

AI 的下一步發展:全方位語音助手

總的來看,目前人工智慧的發展趨勢似乎正在從文字輸入轉向語音輸入。

當人們看到 OpenAI 的公告時,可能就會意識到,這是人機介面的一次正規化轉變,其意義不亞於滑鼠或觸控式螢幕的推出。

Google 也將繼續推出原生、自然的語音介面,Meta 公司在其 VR 頭顯和 Ray-Ban 智慧眼鏡中配備了語音機器人 MetaAI。

雖然智慧手機可能是目前的贏家,但這些語音 AI 模型真正的適配裝置顯然是智慧眼鏡。因為眼鏡上的攝像頭與眼睛同高,眼鏡臂也可以將聲波送入使用者的耳朵,我們可以稱之為完美的人工智慧裝置。

目前的問題在於,OpenAI 是否會進軍硬體領域,推出自己的智慧眼鏡,或者這會成為新的 Siri,並為未來的蘋果眼鏡產品提供動力。此外,Google 是否真的有勇氣復活 Google 眼鏡,也是一個問題。

📍相關報導📍

OpenAI傳下周一將發布ChatGPT搜尋引擎!路透:與Google直球對決

OpenAI正面對決Google!驚傳5/9發布ChatGPT搜尋引擎,挑戰谷歌本命產品

ChatGPT大規模升級!五個必知新功能:即時編輯圖像、加強隱私、多重身份驗證..

Tags: AndroidGemini LiveGoogleGPT-4oiPhoneOpenAI

熱門文章

  • 對幣安復仇?SEC主席曾與CZ午餐「尋求擔任Binance顧問」未果

    對幣安復仇?SEC主席曾與CZ午餐「尋求擔任Binance顧問」未果

    163 shares
    Share 65 Tweet 41

最新文章

馬克庫班考慮發迷因幣:賭狗快來吧!收入全捐財政部拯救美國債務

馬克庫班考慮發迷因幣:賭狗快來吧!收入全捐財政部拯救美國債務

2025-01-21
HashKey 三大牌照佈局完成:深度解析其全球化戰略

HashKey 三大牌照佈局完成:深度解析其全球化戰略

2025-01-21
馬斯克慶川普就職疑兩度「行納粹禮」遭轟,傳在白宮有個人辦公室、政府效率部(DOGE)成立

馬斯克慶川普就職疑兩度「行納粹禮」遭轟,傳在白宮有個人辦公室、政府效率部(DOGE)成立

2025-01-21

關於我們

動區動趨

為您帶來最即時最全面
區塊鏈世界脈動剖析
之動感新聞站

主題分類

訂閱我們的最新消息

動區精選-為您整理一週間的國際動態

  • 關於 BlockTempo

動區動趨 BlockTempo © All Rights Reserved.

No Result
View All Result
  • 所有文章
  • 搶先看
  • 市場脈動
  • 商業應用
  • 區塊鏈技術
  • 數據洞察
  • 新手特輯:比特幣超完整懶人包
  • 政府法規
  • 登入

動區動趨 BlockTempo © All Rights Reserved.