OpenAI 发表满血版 o1 模型和新订阅方案 ChatGPT Pro,月费 200 美元值得吗?”/> <body class="post-template-default single single-post postid-384924 single-format-standard wp-embed-responsive jeg_toggle_light jeg_single_tpl_1 jnews jsc_normal elementor-default elementor-kit-49429

OpenAI 正式推出完整版推理模型 o1,取代先前的预览版,提供更快、更准确的推理能力,特别在程式设计、数学和写作方面表现卓越。另外还推出 ChatGPT Pro 订阅方案,月费 200 美元,提供独享的升级版 o1 Pro。
(前情提要:OpenAI 宣布将连续 12 天直播:推出许多新功能,AI 概念币可埋伏?)
(背景补充:能像人类一样思考!OpenAI o1 新模型亮相:数理、编程能力大幅跃进)

ChatGPT 背後开发商 OpenAI 昨(5)日预告,将於今日凌晨 2 点开始进行为期 12 天的新产品发布,首日登场的是完整版推理模型 o1,取代先前的预览版,目前 ChatGPT Plus、Team 和 Pro 用户已可以使用(企业和教育用户则将在一周内获得使用权限)。

直得注意的是,OpenAI 推出新的订阅方案「ChatGPT Pro」,月费 200 美元能无限制使用 o1 模型、高级语音模式以及独享升级版 o1「o1 Pro」。该模型可以进行更长时间的思考,从而提供更可靠的回应。

完整版 o1 模型回应更快、支援图片推理

OpenAI 的发言人表示,OpenAI 在 9 月发布了 o1 的预览版,而这个新版本,总的来说,性能更高。

与预览版相比,使用者可以期待更快、更强大、更准确的推理模型,在程式设计、数学和写作方面好得多。在国际奥林匹克数学竞赛的测验中,o1 模型得分达到 83%,远高於 4o 版本的 13%。

此外,o1 现在可以对上传的图片进行推理(这在预览版是不行的),并且已经被训练为「更简洁的思维」以缩短回覆时间。官方表示,o1 比 o1-preview 表现更出色,特别是在应对复杂现实问题时,重大错误的发生率降低了 34%。

不过,据官方文档显示,o1 在部分常见基准测试中的表现比预览版差,像是机器学习工程(MLE)、某些代理任务的执行(如启动 Docker)等。

在安全性方面,OpenAI 表示,最新 o1 system card 基於先前的安全工作进一步改进,涵盖稳健性测试、红队模拟(Red Teaming)测试,以及透过指令层级结构提升系统的安全性。经过全面的测试评估後,虽然 o1 系统仍被评为「中等风险」,但结果显示其已具备足够的安全性,可以投入实际应用。

注:o1 和其他推理模型与一般 AI 模型的不同之处在於,它们会在执行任务时检查自己的工作,以避免常见错误。虽然这可能会导致解答过程花费更多时间,但它们能通过推理和提前规划,从而更精确地解决问题。

o1 Pro 撰写程式更强

对於推出昂贵的 ChatGPT Pro 订阅方案,OpenAI 技术人员 Jason Wei 在周四的直播新闻发布会上表示:

我们认为 ChatGPT Pro 的受众将是 ChatGPT 的高级使用者——那些已经在数学、程式设计和写作等任务上将模型推向极限的人。

在 Pro 用户独享的「o1 Pro」模型性能上,OpenAI 发言人表示,在外部专家测试者的评估中,o1 Pro 能更稳定地生成准确且全面的回应,特别是在数据科学、编程和案例法分析等领域。

「与 o1 和 o1-preview 相比,o1 pro 在数学、科学和程式设计等高难度的机器学习基准测试中表现更佳,尤其是在较基础的编程竞赛问题(更接近日常程式设计需求)上,错误率降低了 75%。」

下一步,OpenAI 表示 o1 将支援网页浏览和档案上传等功能,并提供 o1 API,支援函数呼叫、开发人员讯息和结构化输出等。

📍相关报导📍

ChatGPT被爆「拒绝回复David Mayer」等人名,OpenAI遭疑刻意封锁资讯

马斯克申请禁令「阻止OpenAI转型营利企业」罗列四大罪状:垄断AI市场、图利微软…

OpenAI 惊爆 2018 原计画「ICO 发币」!但遭马斯克一理由否决

 

Leave a Reply

Your email address will not be published. Required fields are marked *