首页最新数据第一上海-AI行业大模型周报

第一上海-AI行业大模型周报

时间2025-08-29 14:14:57浏览2

第一上海-AI行业大模型周报

精选摘要:(HLE)上,DeepSeek-V3.1性能已大幅领先R1-0528。经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。需要注意的是,DeepSeek-V3.1使用了UE8M0FP8Scale的参数精度。另外,V。”

1. Llama:Meta宣布两位资深研究者离职8月26日,Meta宣布两位资深研究者离职。

2. 强化学习专家RishabhAgarwal在Meta领导Llama团队的强化学习与推理研究,曾参与了谷歌Gemini1.5、Gemma2以及Meta推理模型后训练方面的重要工作,2021年还以一篇RL算法评估论文拿下了NeurIPS杰出论文奖。

3. 另一位离职员工是BertMaher,曾在Meta工作12年,参与了PyTorch构建和多个重要项目,包括HHVM、ReDex、PyTorch和Triton。

4. 他将加入Anthropic的推理团队。

5. Claude:推出了一款内置于Chrome中的ClaudeAI代理8月27日,Anthropic公司宣布即将推出一款基于浏览器的人工智能代理的研究预览版,该代理由其ClaudeAI模型驱动。

6. 这款名为ClaudeforChrome的代理正在向AnthropicMax套餐用户推出,该套餐每月费用在100至200美元之间。

7. 通过向Chrome添加扩展程序,部分用户现在可以在Sidecar窗口中与Claude聊天,该窗口会保留其浏览器中所有事件的上下文。

8. 用户还可以授权Claude代理在其浏览器中执行操作并代表他们完成某些任务。

9. 用户可以在应用设置中限制Claude的浏览器代理访问某些网站,并且该公司已默认阻止Claude访问提供金融服务、成人内容和盗版内容的网站。

10. Deepseek:正式发布DeepSeek-V3.18月21日,深度求索正式发布DeepSeek-V3.1。

11. 本次升级包含:混合推理架构:(一个模型同时支持思考模式与非思考模式)、更高的思考效率(相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案)、更强的Agent能力(通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升)。

12. 用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。

13. DeepSeek-V3.1在多项搜索评测指标上取得了较大提升。

14. 在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1性能已大幅领先R1-0528。

15. 经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。

16. 需要注意的是,DeepSeek-V3.1使用了UE8M0FP8Scale的参数精度。

17. 另外,V3.1对分词器及chattemplate进行了较大调整,与DeepSeek-V3存在明显差异。

18. Gemini:推出图像模型Gemini2.5FlashImage8月26日,谷歌推出了Gemini2.5FlashImage(又名nano-banana),是谷歌目前最先进的图像生成和编辑模型。

19. 此次更新支持将多幅图像融合成一幅图像,保持角色的一致性以丰富叙事,使用自然语言进行有针对性的转换,并利用Gemini的世界知识来生成和编辑图像。

20. 该模型现已通过GeminiAPI和GoogleAIStudio(面向开发者)以及VertexAI(面向企业)提供。

21. Gemini2.5FlashImage的定价为每100万个输出令牌30.00美元,每张图片包含1290个输出令牌(每张图片0.039美元)。

22. 所有其他输入和输出模式均遵循Gemini2.5Flash定价。

23. Grok:马斯克旗下xAI宣布Grok2.5正式开源8月25日,埃隆·马斯克的xAI开源Grok2.5,并发布在了开放源代码平台HuggingFace上。

24. 马斯克在社交媒体X上写道。

25. “去年xAI最出色的Grok2.5模型现已开源。

26. 至于Grok3,其将在大约6个月内实现开源。

27. xAI很快就会超越除谷歌外的任何公司,然后也将超越谷歌。

28. 但中国公司将会是最强劲的竞争对手,因为他们的电力比美国多得多,而且在硬件建设方面实力超强。

29. ”此次开源Grok2.5可以视作马斯克兑现当初的承诺。

30. 去年8月Grok2.5发布时,马斯克曾公开表示,每当创建Grok新版本的时候,就会开源之前的一个版本。

31. Mistral:据悉苹果曾内部讨论收购Perplexity与Mistral8月27日,有消息称苹果内部曾讨论收购人工智能(AI)初创公司Perplexity与Mistral。

32. 苹果的AI模型“FoundationModels”不尽如人意,该公司因此推迟了新版Siri的发布。

33. 此前苹果正就使用谷歌Gemini来支持其新版Siri进行初步讨论,还曾与Anthropic和OpenAI探讨合作,评估Claude或ChatGPT能否为新版Siri提供支持。

34. 苹果CEO蒂姆·库克上个月表示,公司对更大规模的AI相关收购持开放态度,以加速产品路线图,这与其历来保守的并购策略形成对比。

此文章来源于网络,如有侵权,请联系第一时间删除

民生证券-学大教育-000526-2025年中报点评:盈利能力显著提升,个性化龙头业绩加速释放 信达国际-港股早晨快讯