电子行业动态点评:多款AI大模型陆续发布 积极关注AI产业链变化
上周,AI 大模型发布应接不暇,阿里巴巴发布了其2 款新模型。3 月27 日,阿里巴巴通义千问发布 Qwen2.5-Omni 并开源。这是Qwen 系列中全新的旗舰级多模态大模型,专为全面的多模式感知设计,可以无缝处理包括文本、图像、音频和视频的各种输入,同时支持流式的文本生成和自然语音合成输出。开源后的模型可供开发者和企业免费下载商用Qwen2.5-Omni,手机等终端智能硬件也可轻松部署运行。3月28 日,通义千问宣布推出QVQ-Max 视觉推理模型第一版。QVQ-Max是去年12 月推出的QVQ-72B-Preview 之后的新一代产品,多模态处理能力显著提升,不仅能识别理解图片和视频内容,还能结合信息进行深入分析和推理,甚至提供解决方案。其应用范围广泛,从数学题、生活小问题到编程代码和艺术创作,均展现出卓越性能。
大模型侧,多家公司均发布了大模型的更新:DeepSeek-V3 最新发布的0324 小版本升级,主要借鉴了DeepSeek-R1 在模型训练中使用的强化学习技术,针对推理、写作、编程能力做了进一步优化。Google上周推出的Gemini 2.5 Pro,在编码、数学、视觉推理、搜索调度等能力上都得到了全面增强。OpenAI 公司3 月28 日发布公告,宣布其ChatGPT 产品中的GPT-4o 版本已完成一系列功能升级,GPT-4o 在多个方面相较于过去的模型进行了改进,具有更好的文本集成、增强的上下文理解、改进的多对象绑定、多样化风格等多重突出优势。
AI 应用侧,字节豆包上线了“深度思考”能力,可实现“边想边搜”。
3 月28 日字节方面也测试上线了豆包新版“深度思考”能力,该功能将推理过程的思维链与搜索深度结合,支持“边想边搜”。豆包开启深度思考模式后,豆包在思考过程中可以基于推理多次调用工具、搜索信息,提供更全面,更丰富、准确性更高的结果。AI 搜索此前多是“先搜后想”模式,模型根据用户需求先全面搜索信息后,根据统一的搜索结果进行思考。此次豆包测试的新版深度思考的“边搜边想”模式更贴近“检索+推理”的组合,这种分步骤处理机制在面对需要外部数据支持的问题和复杂问题时,能明显提升回复质量。
【评论】
随着DeepSeek 等头部模型推动AI 应用落地,推理算力需求进入拐点期,国产算力生态的优化与技术创新正成为关键驱动力。看好AI 大模型更新及其带来的算力-应用生态推进,建议积极关注AI 算力产业链的变化情况及AI 应用落地的相关催化。
【风险提示】
行业发展不及预期;
AI 应用落地不及预期;
宏观环境的风险;
地缘政治的风险。