首页热门报告计算机行业投资策略周报:OPENAI推出O3、O4 MINI 实现带图深度思考

计算机行业投资策略周报:OPENAI推出O3、O4 MINI 实现带图深度思考

时间2025-05-03 05:00:02浏览2

计算机行业投资策略周报:OPENAI推出O3、O4 MINI 实现带图深度思考

OpenAI 发布o3、o4 mini,首次实现“用图像思考”。4 月17 日,OpenAI联创Greg Brockman 和首席研究官Mark Chen 带队,开启了20 分钟线上直播。
如同AI 智能体,两款模型在不到1 分钟内,自主判断并组合运用ChatGPT 内置工具,生成了详尽周全的答案。其中包括,搜索网页、用Python 分析上传的文件及数据、对视觉输入进行深度推理,乃至生成图像。o3 定位旗舰级推理引擎。o3 在编码、数学、科学和视觉感知等需要深度思考的领域表现尤为突出,是处理那些答案不明显、需要多方面综合分析的复杂查询的理想选择。
根据外部专家的严格评估,在处理困难的现实世界任务时,o3 犯下的严重错误比其前代旗舰o1 减少了20%,尤其在编程、商业咨询和创意构思方面进步显著。o4-mini 是一款针对速度和成本效益优化的产品。虽然体量更小,但它在数学、编码和视觉任务上实现了“令人瞩目的性能”。它在AIME 2024 和2025 数学竞赛基准上的表现甚至超越了更大的模型。专家评估也指出,即使在非STEM 领域和数据科学方面,o4-mini 也优于其前代o3-mini。
实例测试,o3 结合使用工具解决复杂任务。
①o3 实现估算电荷数量。多模态团队研究员Brandon McKinzie 上传了一张2015 年完成的一个物理实习海报,让ChatGPT 估算质子同位标量电荷的数量。
o3 开始推理的同时,逐一分析图片中内容,并确定Brandon 提出问题的正确数量。
②实现编码任务,找到软件包错误。在编码任务中,研究人员让o3-high 找出一个名为symbols 软件包的错误。首先,模型会主动检查指令中,所说的问题是否存在,并尝试了解代码储存库的概况。然后,它发现一可以mro 的解释类继承信息的Python 结构,基于已有的世界知识,找到了问题所在。
③视觉推理更新,让模型看见问题。可以直接向o3 发送图片进行提问,不用担心物体摆放问题——不论文字是不是倒的,即使东西乍一看不太清楚,视觉推理也能让模型放大看清细节。
风险提示:技术迭代不及预期的风险;商业化落地不及预期的风险;政策支持不及预期风险;全球宏观经济风险。

动保行业3月跟踪报告:一季度疫苗批签发增长显著 大环内酯类兽药原料药延续涨价势头 计算机周报行业周报:英伟达GTC大会发布多款产品 腾讯CAPEX符合预期