计算机行业周报：国内外大模型持续更新迭代

时间2025-05-13 22:00:01浏览50

报告摘要
行情回顾：本周（2025.4.14-2025.4.18）申万计算机行业指数下跌0.84%，在31 个申万一级行业中排名第29 位。年初至本周五（4 月18日），计算机行业累计下跌1.10%，跑赢沪深300 指数3.03pct。
OpenAI 发布o 系列两款最新模型o3 和o4-mini。OpenAI 声称，o3 是其迄今推出的最强大推理模型，在编程、数学、科学、视觉理解等多个领域均取得了突破性进展。它在多项基准测试中都创下新纪录，包括Codeforces、SWE-bench 和MMMU。与o3 相比，OpenAI o4-mini 是一款更小巧、但高效能的推理模型，专为快速、成本友好的应用场景而优化，在数学、编程和视觉任务上性价比突出。o4-mini 是AIME 2024 和AIME2025基准测试中表现最好的模型之一。
o3 和o4-mini 实现视觉推理和工具使用两项核心突破。1）实现图像与思维链的整合：o3 和o4-mini 首次实现“用图像思考”（thinking withimages），模型在推理过程中可动态调用图像处理工具，如旋转、缩放、局部放大，结合文本推理生成结构化答案。例如，用户上传模糊手绘图表时，o3 能自主放大图像细节并分析数据。这种能力在MMMU（多模态理解）、MathVista（视觉数学推理）等基准测试中达到95.7%的准确率。2）自主完成工具调用：o3 和o4-mini 模型在ChatGPT 中拥有对所有工具的完整访问权限，能够使用并组合ChatGPT 中的每一个工具，包括搜索互联网、用 Python 分析上传的文件和其他数据、深入推理视觉输入以及生成图像。开发者还可以通过API 中的函数调用功能接入自定义工具。
豆包1.5·深度思考模型发布，性能提升，高并发低延迟，支持多模态。豆包1.5·深度思考模型在数学、代码、科学等专业领域推理任务中表现出色，已经达到或接近全球第一梯队水平。豆包1.5·深度思考模型采用 MoE 架构，总参数为200B，激活参数仅20B，具备显著的训练和推理成本优势。基于高效算法，豆包1.5·深度思考模型在提供行业极高并发承载能力的同时，实现20 毫秒极低延迟。此外，豆包1.5·深度思考模型还具备视觉理解能力。
投资建议：AI 模型进一步得到加强，得以推动产业链继续发展。重点推荐金山办公（办公）、用友网络（企业软件）、赛意信息（工业）、熵基科技（零售）等，AI 应用的发展也会促进基础设施的发展，重点推荐海光信息、智微智能、联想集团等。
风险提示：AI 技术发展不及预期，AI 应用落地不及预期，市场竞争加剧。

此文章来源于网络,如有侵权,请联系第一时间删除

建筑材料周报：B端提价困境反转初显端倪传媒行业周报：关注广告行业二季度表现