Claude 3 VS GPT-4! 全球最強大模型易主?

Claude 3 VS GPT-4! 全球最強大模型易主?一起來看網友的腦洞實測!
AI-GitHub

AI-GitHub

專註GitHub開源AI項目、AI前沿資訊、最新AI工具分享

昨晚,OpenAI最強競爭選手,Anthropic公司突然驚喜上線,時隔八個月推出了 Claude 3,世界目光再次聚焦到這一被視為 ChatGPT 強大競爭對手之一的多模態模型。
體驗鏈接:https://claude.ai/ (文章後方有詳細功能測評)


本次新發布的Claude 3系列包括三款型號:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。

  • 中杯 Haiku,輕量級的選擇
  • 大杯 Sonnet,平衡性能與速度
  • 超大杯 Opus,AI 模型的巔峰之作

無論哪一款模型,在推理、數學、編碼、多語言理解和視覺處理等方面的表現都相當亮眼。
其中作為旗艦級別的超大杯 Opus 模型,更是對複雜任務表現出接近人類的理解力和流利度,能夠遊刃有餘地應對開放式問題,並巧妙解決各種複雜挑戰。

Claude 3 型號與其它模型在多個性能基準上的比較

有看客甚至驚呼:Claude 3終結了GPT-4時代。

那麼,坐上了全球最強大模型新王座Claude 3是否名副其實呢?
Claude 3發布後,網友對它的各種測試(刁難)就接踵而來。

有網友把OpenAI前科學家Karpathy不久前剛出的《構建分詞器》教程(2個小時13分鐘),扔給Claude 3總結。Claude 3不負眾望,只靠一輪提示詞,就成功製作出了一篇內容豐富、圖文並茂的 HTML 格式博客文章。

動圖封面

有網友讓它為零基礎小白創建一個聊天機器人的前端webUI——結果Claude 3毫無猶豫地就完成任務拆解,從核心代碼到樣式美化以及API本地配置,三大部分一氣呵成,並可以直接部署到GitHub。

動圖封面

還有網友讓Claude 3解謎題,被漂亮的答出。

甚至有網友在線挖坑,不過Claude 3好像不上當。

更有些網友看熱鬧不嫌事大,把Claude 3和 GPT-4放在一起進行了比拼:
有網友神仙發問,扔出修羅場問題讓Claude 3回答。

有網友扔出了理綜題目,並表示Claude 3更勝一籌。

有網友甩下複雜的英文文本,測評出Opus 的翻譯不僅條理分明,而且分段和排版得當,使得閱讀體驗大幅提升。但若論翻譯的流暢度與準確性,GPT-4 依舊略佔上風。

有網友用一張風格複雜的設計稿截圖考驗 Opus 的細節還原能力。在網友明確指出需要還原樣式後,Opus 精準把握設計元素,整體表現要比 GPT-4 要好。

有網友分別用 Opus 和 GPT-4 玩起了井字遊戲,遺憾的是 Opus 並不能順利地畫出網格,而 GPT-4 則宣告成功。

形形色色,不一而足……總得來說是各有千秋。最強競對的稱號,絕非浪得虛名。

有趣的是,Claude 3 發布後,網友們討論最多的卻是它的老對手 ChatGPT。
圈內人也看熱鬧不嫌事大,英偉達高級科學家 Jim Fan 已經在期待 GPT-5 的亮相了:

至於是GPT-4.5,Sora開放測試,還是直接GPT-5?
OpenAI下一個產品又能否蓋過Claude3的風頭?
讓我們拭目以待。

官方網址:https://www.anthropic.com/news/claude-3-family
體驗鏈接:https://claude.ai/
報告鏈接:https://www-cdn.anthropic.com/d

Posted in AI