DePseek再次更新,并期望Liang Wenfeng“吹”场景

日期:2025-08-21 11:52 浏览:

文字“错误”周温门列 DeepSeek再次进行了更新,但不幸的是,它还不是预期的R2模型。 这次,DeepSeek在线模型版本已更新为v3.1。在实际的“错误”列中,我们发现上下文长度和更新的Speek相互作用的友善性得到了显着改善,并且他们的编程功能得到了高度赞赏。从经济使用的角度来看,一些开发人员注意到“ DePseek可以将V3和R1模型结合在一起,这将有助于降低模型的实施成本。” 在回应“错误”列时,DePseek坦率地宣称,这是“官方广告的目标”。 巧合的是,今天是R1正式启动七个月。在此期间,Openai,Google,Alibaba,Moon的黑暗面,Zhipu和其他人都使用R1作为参考。 R2一直是该行业作为R1后来产品的关注。 lArge Companies需要新的参考资料,每个人都期待Liang Wenfeng。 测试:更长的上下文,更高的成本绩效 DepSeek网页和应用程序的最新版本扩展了上下文长度与最后一个128K的长度兼容。 经过详细的体验,一些开发人员发现此更新后添加了与上下文相关的内容。 “它具有更大的稳定性和更好的推理能力。” “错误”列的比较表明,与先前发布的DeepSeek V3(参数671b)相比,该更新v3.1(参数685b)在模型的大小上没有太大变化。但是,v3.1显着改善了互动经验。 除了支持最大,更长的文本输入外,DePseek还使用更多的义务来摘要和呈现信息,使互动更加友好,并且响应内容与人类代表的习惯和最NA的习惯一致刺色的音调。与DeepSeek R1相比,额外的进步。 在真实的“错误”列测试中,v3.1对于使用指令设计宫崎骏风格的喷气游戏界面是必需的,其中两个模拟按钮“所有战斗”和“人类机器之战”最终以2D HTML和V3 Illustrution样式呈现。给定的结果是在交互式模式下,编码结果基本上接近nive practical l 除了模型功能外,“错误”列还注意到,入口框中的“深思想(R1)”按钮已在最后一个DeepSeek应用程序和官方网站中变为“深”。 这意味着,在打开深度思维方式之后,DeepSeek所调用的推理模型可能不限于R1模型,但是在合并V3/R1或新模型之后,它也可能是其他新模型。 一些开发人员还注意到了变化,并经过研究和测试,“此更新集成了V3和R1,并且非常适合提出DeepSeek实施和计算机科学的能源效率。” 开发人员在“错误”列中对其进行了解释。 “以前,V3和R1分别部署,每张需要60张卡。现在,R1和V3已集成,只有1张必须部署。最初需要120张卡以使用60张卡。他添加了“ IFV3.1使用120张卡片展开,缓存的增加,您可以增加三到三次的性能估计。 “ 开发商的观点是:“此更新为第3.1节,是一种前卫 - garde技术模型,主要旨在降低成本。” 当前,HuggingFace(著名的开源社区)具有最新的深度更新,Seek-V3.1基本版本已经是开源的。但是,当局简短地提到,这次他们没有提供特定的信息,模型的大小为685B,并接受了数据类型BF16,F8_E4M3和F32。 国家制造商期待新的“参考” 不幸的是,此v3.1更新h由于用户和经济经验给人带来了一些惊喜,但是一直关注该行业的新一代R2模型尚未出现。 今年1月,迪(Dee)被推出了R1,迅速引起了生活的所有领域的注意,而DeepSeek的钦佩和行业的钦佩和最爱迅速增加。在启动DeepSeek R1的月份,DeepSeek网站和应用程序用户增加了1.25亿(包括累积的网站和应用程序),其中80%以上来自一月的最后一周。到今年1月28日,DeepSeek(Daus)的日常活跃用户首次超越了Doubao,成为世界上增长最快的AI应用程序之一。 很快,其积极的开源方法使该行业能够直接学习或将DeepSeek的完整版本整合到其自己的应用中。新产品,例如腾讯Yuanbao,Baidu和360。 此后不久,主要制造商组织了“轮盘战争”,并以R1为参考他们是否都有成功的职业生涯。 在中国,来自阿里巴巴的QWEN本质上每月都保持大量发行版,其两周的释放频率很小,并且具有全模式模型的高频。阿里巴巴上个月推出的Qianwen3的旗舰型QWEN3-235B-A22B指出,在中央功能的分类中,它与诸如Gemini-2.5 Pro和O4-Mini之类的封闭代码模型匹配,超过了DeeldSeek R1。 此外,7月,由月球黑暗面推出的Kimi K2型号以及Zhipu的最后一次新发布(第一代旗舰型型号GLM-4.5)现已提供。 SO称为API的价格低于0.8元/数百万个令牌。 Liang Wenfeng,你为什么忙? 在与“错误”列的通信过程中,DepSeek没有透露有关后续版本的新消息,回答了诸如R2,D WI时的问题将发布,丁多(Dingando)说:“详细内容将受到官方广告的约束”。 但是,接近Depseek的人们曾经透露,“ DepSeek-R2没有八月的启动计划”。这意味着在更新模型v3.1之后,八月推出的新DepSeek型号可能没有更大的版本。 此前,联想风险投资集团的主要合作伙伴Song Chunyu与Liang Wenfeng进行了详细的交流,两人之间有家庭关系。 最近,Song Chunyu在与“ Bug”列的交流中叹了口气。他认为:“ Liang Wenfeng是一个对AGI坚定信念并且具有书呆子的技术背景的人。他的任务是了解AGI限制的位置。可以达到基于硅的情报的人类的极限是多少? 但是,这种情况越多,对DepSeek市场的期望就越大。 行业官员说:“当今主要模型的CAPA限制已经非常强大。您要做的不是太低。能够不断生产的好模型。 “ 回顾Openai GPT-5,也有一个发布延迟,但不幸的是,最终推出的产品受到了批评。主要原因是大型AI模型中的数据,计算机功率和限制等局限性可能不会改善太大。 下一步是如何使更便宜,可用性以及更多的关键创新,以证明最大型号能力的实力。 “ V3和R1的融合和部署对应于DeepSeek多模型的释放,因为它放置了沉重的推理负载和非单独多模式的非参与。这不是太远。” 长期以来,充满活力的国家AI模型市场没有看到有关Depseek和Liang Wenfeng的“爆炸性”新闻,但对它们的市场期望仍在积累。 官方NINA Finance帐户 24-最新信息和财务视频的流离失所,以及扫描QR码以关注更多粉丝(Sinafinance)

0
首页
电话
短信
联系