计算机行业周报:国内外大模型持续更新迭代
行情回顾:本周(2025.4.14-2025.4.18)申万计算机行业指数下跌0.84%,在31 个申万一级行业中排名第29 位。年初至本周五(4 月18日),计算机行业累计下跌1.10%,跑赢沪深300 指数3.03pct。
OpenAI 发布o 系列两款最新模型o3 和o4-mini。OpenAI 声称,o3 是其迄今推出的最强大推理模型,在编程、数学、科学、视觉理解等多个领域均取得了突破性进展。它在多项基准测试中都创下新纪录,包括Codeforces、SWE-bench 和MMMU。与o3 相比,OpenAI o4-mini 是一款更小巧、但高效能的推理模型,专为快速、成本友好的应用场景而优化,在数学、编程和视觉任务上性价比突出。o4-mini 是AIME 2024 和AIME2025基准测试中表现最好的模型之一。
o3 和o4-mini 实现视觉推理和工具使用两项核心突破。1)实现图像与思维链的整合:o3 和o4-mini 首次实现“用图像思考”(thinking withimages),模型在推理过程中可动态调用图像处理工具,如旋转、缩放、局部放大,结合文本推理生成结构化答案。例如,用户上传模糊手绘图表时,o3 能自主放大图像细节并分析数据。这种能力在MMMU(多模态理解)、MathVista(视觉数学推理)等基准测试中达到95.7%的准确率。2)自主完成工具调用:o3 和o4-mini 模型在ChatGPT 中拥有对所有工具的完整访问权限,能够使用并组合ChatGPT 中的每一个工具,包括搜索互联网、用 Python 分析上传的文件和其他数据、深入推理视觉输入以及生成图像。开发者还可以通过API 中的函数调用功能接入自定义工具。
豆包1.5·深度思考模型发布,性能提升,高并发低延迟,支持多模态。豆包1.5·深度思考模型在数学、代码、科学等专业领域推理任务中表现出色,已经达到或接近全球第一梯队水平。豆包1.5·深度思考模型采用 MoE 架构,总参数为200B,激活参数仅20B,具备显著的训练和推理成本优势。基于高效算法,豆包1.5·深度思考模型在提供行业极高并发承载能力的同时,实现20 毫秒极低延迟。此外,豆包1.5·深度思考模型还具备视觉理解能力。
投资建议:AI 模型进一步得到加强,得以推动产业链继续发展。重点推荐金山办公(办公)、用友网络(企业软件)、赛意信息(工业)、熵基科技(零售)等,AI 应用的发展也会促进基础设施的发展,重点推荐海光信息、智微智能、联想集团等。
风险提示:AI 技术发展不及预期,AI 应用落地不及预期,市场竞争加剧。