华安证券-全球科技(计算机)行业周报:DeepSeek V3.1发布有望催化国产算力需求及Agent应用
“精选摘要:tokens,价格将于9月6日0时生效。具体表现来看:1)工具调用/智能体支持增强:编程智能体:在代码修复测评SWE与命令行终端环境下的复杂任务(TerminalBench)测试中得分相比之前明显提高,DeepSeek-V3.1在多项搜索评测指标上取得了较大提升;搜索智能体:在需要多步推理。”
1. DeepSeekV3.1正式发布,思考效率提提升、Agent能力显著增强8月21日,DeepSeek最新发布V3.1版本,本次升级包含1)混合推理架构:同时支持思考与非思考模式;2)思考效率提高:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;3)Agent能力增强:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。
2. DeepSeekAPI也已同步升级,Deepseek-chat对应非思考模式,Deepseek-reasoner对应思考模式,且上下文均已扩展为128K。
3. API调用价格:输入0.5元/百万tokens(缓存命中)、4元/百万tokens(缓存未命中),输出12元/百万tokens,价格将于9月6日0时生效。
4. 具体表现来看:1)工具调用/智能体支持增强:编程智能体:在代码修复测评SWE与命令行终端环境下的复杂任务(TerminalBench)测试中得分相比之前明显提高,DeepSeek-V3.1在多项搜索评测指标上取得了较大提升;搜索智能体:在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1性能已大幅领先R1-0528;2)思考效率提升:测试结果显示经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平,非思考模式相比DeepSeek-V3-0324能够在输出长度明显减少的情况下保持相同的模型性能。
5. 催化国产算力板块,加速AIAgent商业化应用DeepSeekV3.1发布后即带动国产算力产业链标的大幅上涨,芯片代工、半导体设备端、华为算力供应链均表现良好。
6. DeepSeek表示DeepSeekV3.1使用UE8M0FP8Scale参数精度,这是针对即将发布的下一代国产芯片设计,未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。
7. DeepSeekV3.1在AIAgent能力端显著提升,未来将继续推动AIAgent商业化场景应用。
8. 我们认为,DeepSeek作为国产顶尖大语言模型新发布V3.1版本,长期来看有望拉动国内算力需求,助力国产算力生态加速建设,赋能垂类大模型研发,利好AIAgent商业化应用。
9. 相关公司:神州数码、寒武纪、品高股份、北京利尔、安博通、优刻得、浪潮信息、紫光股份、超讯通信、首都在线等。
10. 风险提示1)下游预算限制信息化支出;2)财政与货币政策低于预期;3)供应链波动加大,影响科技产业发展。
此文章来源于网络,如有侵权,请联系第一时间删除