Claude 3 VS GPT-4! 全球最强大模型易主?

Claude 3 VS GPT-4! 全球最强大模型易主?一起来看网友的脑洞实测!
AI-GitHub

AI-GitHub

专注GitHub开源AI项目、AI前沿资讯、最新AI工具分享

昨晚,OpenAI最强竞争选手,Anthropic公司突然惊喜上线,时隔八个月推出了 Claude 3,世界目光再次聚焦到这一被视为 ChatGPT 强大竞争对手之一的多模态模型。
体验链接:https://claude.ai/ (文章后方有详细功能测评)


本次新发布的Claude 3系列包括三款型号:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。

  • 中杯 Haiku,轻量级的选择
  • 大杯 Sonnet,平衡性能与速度
  • 超大杯 Opus,AI 模型的巅峰之作

无论哪一款模型,在推理、数学、编码、多语言理解和视觉处理等方面的表现都相当亮眼。
其中作为旗舰级别的超大杯 Opus 模型,更是对复杂任务表现出接近人类的理解力和流利度,能够游刃有余地应对开放式问题,并巧妙解决各种复杂挑战。

Claude 3 型号与其它模型在多个性能基准上的比较

有看客甚至惊呼:Claude 3终结了GPT-4时代。

那么,坐上了全球最强大模型新王座Claude 3是否名副其实呢?
Claude 3发布后,网友对它的各种测试(刁难)就接踵而来。

有网友把OpenAI前科学家Karpathy不久前刚出的《构建分词器》教程(2个小时13分钟),扔给Claude 3总结。Claude 3不负众望,只靠一轮提示词,就成功制作出了一篇内容丰富、图文并茂的 HTML 格式博客文章。

动图封面

有网友让它为零基础小白创建一个聊天机器人的前端webUI——结果Claude 3毫无犹豫地就完成任务拆解,从核心代码到样式美化以及API本地配置,三大部分一气呵成,并可以直接部署到GitHub。

动图封面

还有网友让Claude 3解谜题,被漂亮的答出。

甚至有网友在线挖坑,不过Claude 3好像不上当。

更有些网友看热闹不嫌事大,把Claude 3和 GPT-4放在一起进行了比拼:
有网友神仙发问,扔出修罗场问题让Claude 3回答。

有网友扔出了理综题目,并表示Claude 3更胜一筹。

有网友甩下复杂的英文文本,测评出Opus 的翻译不仅条理分明,而且分段和排版得当,使得阅读体验大幅提升。但若论翻译的流畅度与准确性,GPT-4 依旧略占上风。

有网友用一张风格复杂的设计稿截图考验 Opus 的细节还原能力。在网友明确指出需要还原样式后,Opus 精准把握设计元素,整体表现要比 GPT-4 要好。

有网友分别用 Opus 和 GPT-4 玩起了井字游戏,遗憾的是 Opus 并不能顺利地画出网格,而 GPT-4 则宣告成功。

形形色色,不一而足……总得来说是各有千秋。最强竞对的称号,绝非浪得虚名。

有趣的是,Claude 3 发布后,网友们讨论最多的却是它的老对手 ChatGPT。
圈内人也看热闹不嫌事大,英伟达高级科学家 Jim Fan 已经在期待 GPT-5 的亮相了:

至于是GPT-4.5,Sora开放测试,还是直接GPT-5?
OpenAI下一个产品又能否盖过Claude3的风头?
让我们拭目以待。

官方网址:https://www.anthropic.com/news/claude-3-family
体验链接:https://claude.ai/
报告链接:https://www-cdn.anthropic.com/d

Posted in AI