k8凯发(中国)天生赢家·一触即发_AI应用_凯发k8官网登录计算机｜DeepSeek V3发布加速AI应用落地|差差漫画账号

凯发k8官网登录计算机｜DeepSeek V3发布加速AI应用落地|差差漫画账号

2025-03-01 凯发k8一触即发生物

　　凯发天生赢家一触即发官网ღღ，凯发首页官网登录ღღ。天生赢家一触即发糖尿病ღღ，凯发K8天生赢家一触即发官网ღღ！K8凯发(中国)天生赢家·一触即发ღღ。近日ღღ，DeepSeek-V3的正式发版引起AI业内广泛高度关注ღღ，其在保证了模型能力的前提下ღღ，训练效率和推理速度大幅提升差差漫画账号登录页面ღღ。我们认为ღღ，DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠ღღ，助力AI应用广泛落地ღღ；同时训练效率大幅提升ღღ，亦将助力推理算力需求高增ღღ。我们持续看好AI产业链的加速落地机遇ღღ，建议重点关注AI应用ღღ、AI Infraღღ、AI算力三大主线ღღ。

　　12月26日ღღ，DeepSeek-V3（深度求索）首个版本正式发布并同步开源ღღ，已在网页端和API全面上线凯发k8官网登录ღღ。其在训练效率和推理速度上相较历史模型有了大幅提升ღღ，同时可保证领先的模型能力表现ღღ，引起业内高度关注ღღ。

　　参考官方论文ღღ，DeepSeek v3为6710亿参数MoE架构模型ღღ，激活37Bღღ，在14.8T token上进行了预训练ღღ。能力上ღღ，模型暂不支持多模态输入ღღ，但在通识和专业知识测试集上表现优秀差差漫画账号登录页面ღღ，MMLU pro正确率75.9%差差漫画账号登录页面ღღ，GPQA-Diamond正确率59.1%ღღ，达到国内第一梯队ღღ，接近Claude 3.5 Sonnet的水平ღღ；并且在数学和代码领域测试表现突出ღღ，MATH 500正确率90.2%ღღ，SWE-bench正确率42.0%ღღ，Codeforces得分51.6ღღ，超越所有非o系列模型ღღ。模型生成速度达到60TPSღღ，是前代模型的三倍ღღ。定价上ღღ，API定价为输入每百万tokens 0.5元（缓存命中）/2元（缓存未命中）ღღ，输出每百万tokens 8元ღღ，与字节Doubao-pro-256k定价输入每百万tokens 5元ღღ，输出每百万tokens 9元的水平相当ღღ，在国产模型中性价比较高ღღ。

　　豆包proღღ、DeepSeek v3等国产模型连续发布ღღ。模型能力上凯发k8官网登录ღღ，国产模型在文本和知识能力上接近GPT-4差差漫画账号登录页面ღღ、Claudeღღ、Llama等海外前沿模型水平ღღ，多模态能力逐步完备ღღ，逻辑和代码能力在非o1技术路线下达到可用水平ღღ。价格上ღღ，国产模型API百万tokens输出普遍定价10元以内ღღ，是GPT-4o的1/3甚至更低ღღ。我们预计模型性价比持续提升下ღღ，国内AI应用依托丰富生态和成熟流量加速各领域落地ღღ。其中ღღ，Agent模式有望以更长的任务流程ღღ、更好的场景理解ღღ、更高的自主能力ღღ，成为所有互联网用户的数字助手ღღ，在企业管理ღღ、教育ღღ、办公ღღ、金融等领域展现应用价值ღღ。

　　1）训练效率大幅提升ღღ，GPT4的训练成本约为DeepSeek V3的6.2倍ღღ。根据DeepSeek V3的官方技术文档ღღ，本次DeepSeek的训练仅使用了2048个H800 GPUღღ，总训练GPU卡时为2788千小时（其中预训练为2664千小时）ღღ，平均到每个GPU上ღღ，仅为1361小时ღღ，约合56.7天差差漫画账号登录页面ღღ。与之相对比ღღ，根据英伟达CEO黄仁勋在GTC2024上的演讲内容ღღ，GPT-4 MoE使用8000个H100训练了90天ღღ，合计约为17280千卡时ღღ，相当于DeepSeek V3的6.2倍ღღ。

　　2）训练效率提升归因ღღ：我们认为DeepSeek V3训练提效的原因主要包括低精度计算ღღ、小参数量ღღ、高质量数据等方面ღღ。精度方面ღღ，根据英伟达官方文档ღღ，其GPU的8位精度算力通常是16位精度算力的2倍ღღ，因此数据精度从FP16降低到FP8可以贡献一倍效率提升ღღ。参数方面ღღ，GPT-4 MoE模型总参数量达到1800Bღღ，而按照DeepSeek V3官方文档ღღ，其总参数量只有671Bღღ，约为GPT-4 MoE的1/3ღღ，同时ღღ，DeepSeek的激活参数大约为37Bღღ，而GPT4-MoE每次推理激活的参数量约为280B差差漫画账号登录页面ღღ，二者约为7.57倍关系ღღ；数据方面ღღ，GPT-4 MoE使用了13万亿（1300B）token凯发k8官网登录ღღ，而DeepSeek V3使用的token数量约为14.8万亿（1480B）凯发k8官网登录ღღ，数据量相差不大ღღ，但DeepSeek V3技术文档提及了使用模型生成训练数据等ღღ，因此我们认为数据质量或有较大幅度提升ღღ。此外ღღ，采用负载均衡ღღ、更好的流水线策略亦是其官方提及的提升训练效率的重要原因ღღ。

　　3）从推理侧助推AI普惠ღღ，带动推理算力需求倍增ღღ，打开更广阔算力市场空间ღღ。我们认为ღღ，DeepSeek模型相比GPT4模型更小的参数量也意味着更低的推理成本凯发k8官网登录ღღ，推理成本的降低ღღ，将是AI应用普及的前奏ღღ，正如4G提速降费给我国移动互联网产业提供了助力ღღ。当前AI应用渗透率仍然较低ღღ，产业仍在早期ღღ，根据我们在2024年12月13日外发的报告《计算机行业“智能网联”系列报告54—算力需求测算ღღ：Agent+Sora》ღღ，随着Agent成为流量入口ღღ，渗透率达到30%左右ღღ，全球Agent的推理token数量将增长3个数量级以上ღღ，且视频生成与实时视频理解等形态的AI同样有望带来巨量需求增长ღღ，并且根据我们对视频生成模型的测算差差漫画账号登录页面ღღ，视频推理算力需求将有望达到训练算力需求的2-3个数量级以上ღღ。算力需求的指数级提升与模型训练推理成本的下降将构成产业飞轮ღღ，带动全产业链扩张ღღ，随着AI进一步普及到日常生活与产业当中ღღ，我们认为推理算力需求将仍然驱动AI算力产业链持续增长ღღ。

　　AI核心技术发展不及预期ღღ，AI被不当使用造成严重社会影响ღღ，企业数据安全风险ღღ，信息安全风险ღღ，行业竞争加剧ღღ。

　　▍投资策略ღღ：建议关注AI全产业相关投资机会ღღ，综合梳理以下投资主线）AI 应用ღღ：伴随模型能力升级ღღ，Agent等应用形式有望加速落地ღღ，带动办公ღღ、教育ღღ、管理ღღ、端侧ღღ、具身智能等应用领域公司加速兑现业绩弹性ღღ。