DeepSeek 从热潮到应用,腾讯云携手行业专家共探 AI 下一步

互联网
2025
03/25
18:05
分享
评论

2025年,技术圈的新晋“顶流”DeepSeek 在短短七天内完成一亿用户的增长,成为全球增速最快的 AI 应用,其发展堪称现象级。DeepSeek 在全球范围内掀起新一轮技术热潮,彻底颠覆人工智能行业的发展模式,国内外厂商纷纷积极拥抱 DeepSeek。

随着 DeepSeek 的迭代发展,新的应用场景和产品如雨后春笋般涌现,推动全球的智能化变革。面对这股 AI 热潮,如何结合 DeepSeek的优势来落地 AI 应用,以迎接 AGI 新时代的到来,成为每个开发者和企业必须思考的问题。

3 月 1 日,由腾讯云 TVP 主办的「DeepSeek 从热潮到应用」TVP AI 创变研讨会在北京成功举办。本次活动汇聚多位 AI 领域大咖,围绕 DeepSeek 的技术演进、应用趋势及行业实践展开 研讨,共同探索大模型从“技术爆发”到“价值创造”的跃迁逻辑,更设置“DeepSeek 热点头脑风暴”环节,各位专家畅所欲言,进行精彩的观点碰撞,梳理技术发展脉络,共探AI 创新发展未来。

主持人文因互联 CEO、联合创始人、腾讯云TVP 鲍捷

主持人文因互联 CEO、联合创始人、腾讯云TVP 鲍捷在开场时表示,他期待 DeepSeek 所带来的新一轮应用狂潮,这股浪潮正在重新点燃人们内心对人工智能的激情和信心,而这种激情与信心是非常珍贵的。在场的老师们作为“种下种子的人”,不仅见证 AI 的发展并积极贡献自己的经验和能力,还为年轻人带来希望,激发他们的潜力,共同开拓出全新的世界,推动科技的进步。

从DeepSeek的成功看大语言模型的技术演进与未来趋势

碳硅智慧联合创始人、腾讯云TVP 邓亚峰

碳硅智慧联合创始人、腾讯云TVP 邓亚峰发表题为《从DeepSeek的成功看大语言模型的技术演进与未来趋势》的主题演讲,解读DeepSeek 的发展历程、技术创新、总结成功经验,展望未来语言模型应用和技术发展。

邓亚峰从 DeepSeek 的成功讲起,指出 DeepSeek 作为史上增速最快的产品,仅用七天就增长了1亿用户。DeepSeek得到广泛的认可的主要有以下几个原因:它是由中国团队开发;DeepSeek开源开放,赋予它强大的生命力;DeepSeek 是大多数人首次接触到的推理模型,让每个人无需任何成本就能体验到 AI 。

邓亚峰介绍 AI 学习范式的四个发展阶段:

· 传统AI阶段(1956-2012年),主要依赖于传统机器学习方法,特征提取多为手工完成;

· 新AI阶段一(2012-2018年),以有监督学习和 模型为特点;

· 新AI阶段二(2018-2024年),该阶段的标志是自监督学习和通用大模型的发展;

· 新AI阶段三(2024年及以后),思维链与强化学习相结合,致力于开发推理模型。

在新 AI 阶段三中,DeepSeek在开源届一直是中国顶流。DeepSeek 系列模型从最初的 LLM 版本到 V2、V3 和 R1 版本,逐步在架构设计、训练效率和推理能力上实现突破。随后,邓亚峰详细介绍DeepSeek在提高计算效率和降低训练成本方面的工作,包括使用混合专家(MOE)系统,在每次预测时激活部分网络参数以加快速度;通过 MLA 方法压缩中间信息来提升处理速度;使用 fp8 训练以及 PTX 等底层优化技术,DeepSeek在保持效果的同时大幅降低成本,DeepSeek-V3 使用1/20 的算力训练就达到 Llama 同等效果,DeepSeek-V3使用成本约为 GPT 4o 的1/100,DeepSeek R1 使用成本约为 GPT-o1 的 1/30,显著提升速度和效率。

在实现推理能力上,DeepSeek采用的路线是无需收集大量思维链数据(无SFT),直接采用强化学习机制,模型自己学会自我验证、反思和长思维链,从而获得更好的效果。

邓亚峰总结 DeepSeek 团队获得成功的三大原因:由 AI 算法系统成功经验的技术专家领衔,创始人梁文峰有坚定的技术信仰,持续在对的方向上不断尝试;有足够的算力及对数据的重视;团队极致的工程优化。 

邓亚峰预测大预言模型的未来发展:基础模型的推理能力将进一步增强;DeepSeek的开源将极大地促进应用的普及和发展,特别是在 AI 搜索、AI 助手等领域;大模型的下一步是让模型能自动完成任务。这一轮 AI 革命为什么影响深远?邓亚峰表示,关键是通用,技术统一和能力通用。他强调,模型架构统一是未来趋势。 

最后,他从人类的角度探讨 AI 带来的影响。随着 AI 的发展,教育和学习方式正在发生根本性的变化,这不仅影响下一代的学习模式,也让我们反思自身在新时代中的价值与作用,人类需要重新定义自身的价值所在。邓亚峰说,“我们非常幸运,既见证中国的蓬勃发展,也亲历 AI 技术的巨大飞跃。”

腾讯云大数据+DeepSeek,共创 Data 新生态

腾讯云大数据基础产品中心总经理 程彬

腾讯云大数据基础产品中心总经理 程彬在《跨越边界:腾讯云大数据+DeepSeek 共创 Data 新生态》的主题演讲中,分享腾讯云大数据如何结合 DeepSeek 等大模型技术,创新打造 Data+AI 一体化平台。

程彬介绍了以 DeepSeek 为代表的大模型对传统大数据领域带来的三大变革与思考:如何使用AI技术来提升数据系统的效率、如何提升数据开发和数学科学为代表的 Data+A链路的生产效率;如何使用已有的大数据来实现production 级别的LLM应用。

然而,当前传统数据平台在面对这些变化时遇到一些挑战。例如,大数据和 AI 平台是割裂的,基于两套独立系统建设的,因此企业需要不同的团队来完成相关任务;大模型应用对接困难,传统数据平台的使用对象是人,AI Agent 难调用平台分析能力;面向 SQL 专业用户而生,限制数据平台的服务范围,想通过自然语言查询获取确定性信息面临诸多挑战;运维投入大,海量告警、监控需要人力处理,大多数系统为传统 AIOps 设计,缺乏“自动驾驶”的能力。

针对上述挑战,腾讯云大数据团队提出构建基于 AI 时代的统一数据平台的设想。该平台旨在简化用户的使用界面,比如引入自然语言查询技术,同时提供一体化平台支持实时数据分析,并将数据从采集到分析再到模型训练和推理的过程整合起来。具体来说,下一代数据平台涵盖四大关键能力:一是集成 DataOps+MLOps+LLMOps 的一体化平台;二是面向 Agent 的数据分析工具;三是支持自然语言查询 NL2SQL;四是 AIOps 实现运维数据平台的“自动驾驶”。

基于 DeepSeek 出色的多模态推理能力与性价比,它可以推动下一代数据平台加速往数据智能演进。因此,腾讯云大数据+DeepSeek 构建 Data+AI 一体化平台。该平台架构分为四层:最底层为 Lakehouse 底座服务,第三层为基础大模型服务,第二层为 Data+AI 一体化分析和训推;最上层为统一DataOps+MLOps+LLMOps 开发平台。

基于以上理念和设计,腾讯云大数据在去年底推出新一代数据智能平台TCHouse-X,拥有一体化架构、易用、高性能、实时高效、智能化等优势。

DeepSeek 为 Data+AI 一体化平台带来哪些价值?程彬以智能自治、AI Search 和 NL2SQL 三个场景为例,详细阐述 DeepSeek 所具备显著的差异化优势:复杂任务推理能力出色,语义理解和意图识别能力,推理成本低,强数学推理和代码推理,更重要的是开源开放。程彬着重强调DeepSeek开源开放的重要性。他认为,一个好的平台不应该锁定用户,而是要让用户自由选择。正因如此,腾讯云大数据平台遵循开源开放的原则,希望为更多人提供一个易于上手的开发环境无论是传统数据工程师还是从事 AI 研究的专业人士,都能在这个平台上轻松实现数据分析和 AI 应用的落地,共创 Data+AI 新生态。

DeepSeek 发展启示录与未来展望

硅基流动联合创始人、增长副总裁、腾讯云 TVP 杨攀

在本次大会上,硅基流动联合创始人、增长副总裁、腾讯云TVP 杨攀带来《聊聊 DeepSeek 的那些事儿:发展观察与未来展望》的分享。他指出,大模型算力正在经历根本性转变——从训练向推理倾斜,"训练在这个星球上所占用的 GPU 比重会越来越小,最后应该大部分都放在推理上"。作为专注于大模型推理服务的创业公司,硅基流动在 DeepSeek 官网瘫痪期间承接了大量用户流量,亲历了这一变革。

杨攀表示,“DeepSeek 的历史意义在于认知上的破圈,让所有企业都意识到可以低成本的拥有一个自己的模型,当模型成本趋近于零的时候,带来下一波应用和算力的爆发。”杨攀以“杰文斯悖论”来分析 DeepSeek 带来的影响。具体来说,成本每下降十倍就会催生百倍千倍市场——看似 DeepSeek 降低了算力需求,实则是用推理成本重构打开了千万级新场景。

关于 DeepSeek 的商业应用,杨攀提出了三个明确方向:一是 AI 编码,企业大量采购用于内部员工提效;二是 AI 搜索,不仅整合结果还形成 分析;三是 Agent 能力提升,随着 Reasoning 能力增强,复杂工作流可被简化甚至直接内化到模型中。关于中国 AI 应用出海,杨攀指出两条明确路径:一是以低成本复制已被硅谷验证的产品;二是专注发展 AI 工具本身。他同时坦言,目前将 AI 融入既有业务的商业价值仍不明朗,真正有收益的往往是专门针对 AI 的新工具和应用。

他同时提出随着模型能力提升,可能从"模型作为能力"转变为"模型本身成为终极产品":"随着R1推出以后,我越来越觉得终极的AGI或ASI,它有可能本身就变成一个产品,这个产品不是你手机里装的APP,本身它就具有完整的功能,能解决问题,能做事,正在往这个方向发展。"

最后,杨攀总结道:"如果有一个技术诞生出来,整个产业迅速达成共识,意味着它已经形成了事实上的标准。标准形成后,产业整体成本会大幅降低,因为降低了沟通成本、协作成本、接口成本和认知成本。"他强调,企业越早对齐 DeepSeek 这样的新标准,越能享受到产业红利,这是每个企业需要深刻思考的问题。

DeepSeek 时代的 AI 投研变革:机遇、挑战与实践

熵简科技联合创始人、腾讯云 TVP 李渔

熵简科技联合创始人、腾讯云 TVP 李渔进行《DeepSeek 时代的 AI 投研机遇、挑战与落地实践》的主题分享。

李渔认为,DeepSeek 团队的核心优势之一在于基础设施层面的极致优化。例如,使用 FP8 混合精度训练、MLA 架构以及GRPO算法,这些改进显著降低计算开销和显存消耗。通过这些优化,DeepSeek 能在 60 多天内完成 V3 版基座模型的训练,成本为 600 万美元,相比同等规模的Llama 模型节省约 20 倍的成本。此外,DeepSeek 通过纯强化学习的方式实现自我提升的能力,这在业界是一个重要的里程碑。DeepSeek 的成功表明,在偏通用场景下,关键在于为模型提供更广阔的探索空间和更明确的反馈信号,使其能持续自我提升。这一技术路线 DeepSeek 在 2025 年继续推进,包括后续 R2 和 R3 的工作。

接着,李渔分享熵简科技在 AI 投研的场景探索。2018年,熵简科技开始探索构建智能投研体系,旨在构建基于大数据和AI的全天候自动化投资研究系统。其智能投研体系架构包括海量外部数据和私有数据的接入与治理,并通过统一的数据中台处理后,利用AI逻辑实现投资信号挖掘和最终执行。

熵简的技术路线分为 L1 到 L5,当前正处于从 L2 向 L3 过渡阶段。L2 阶段的大模型可以实现部分投资研究过程的自动串联,但无法做出最终决策;L3 阶段预计在未来一两年内实现特定市场的端到端投资决策。具体应用场景包括数据层的海量数据接入及治理工作,覆盖全球资本市场的一手资料;模型层采用大小模型配合的方式,结合 DeepSeek R1 开源基座和行业小模型,用于推理和生成任务;应用端的AlphaEngine平台提供了面向全球资本市场的 AI 工具,支持实时会议记录、纪要生成AI 研究等功能,提升分析师的工作效率。

技术创新方面,熵简采用大模型代理层来负责编排和调度各种应用,连接模型底座和数据底座,优化推理链路。文本模型方面,早期针对金融文本进行增量训练,现已升级并集成DeepSeek-R1模型,提升有用性和用户满意度。语音识别方面,专业词汇识别能力提升38%。向量化模型上,FinBERT模型已扩展至 640 亿金融语料,广泛应用于金融机构和学术研究团队。

李渔表示,目前有一个初步结论,即对于资管机构而言,AI 已成为其超额收益的重要来源。随着DeepSeek-R1 等模型的发展,它们接近专业分析师的水平,这种能力仍在不断增强。未来几年内,这些模型的能力将会越来越强,进一步提升超额收益的可能性。

最后,李渔表示,AI 技术发展日新月异,当下我们正在经历一场持续至少 20 年以上的生产力大变革,并且是全行业的。只要真心想参与,任何时候开始都是最好的时机。从投资角度来类比,一旦确定某个趋势具有确定性,买入点并不那么重要,关键是能“上车”。

头脑风暴,开放论道

TVP AI 创变研讨会以注重交流互动为特色,特别设计开放式的头脑风暴环节作为本次活动的压轴部分。在这一环节中,数十位 AI 专家被分为十个小组,围绕主持人鲍捷提出的五个关于DeepSeek 的热点问题展开讨论。每相邻的两个小组聚焦同一话题,分别从正反两方的角度深入探讨PK,激发思维碰撞。各小组代表随后进行总结发言,分享讨论成果。现场气氛热烈,专家们见解独到、妙语连珠,为AI创新带来新的灵感与思路。

话题一:企业部署DeepSeek是否需要建立行业专属的数据壁垒?

碳硅智慧联合创始人、腾讯云 TVP 邓亚峰

来自第一组的发言代表,碳硅智慧联合创始人、腾讯云 TVP 邓亚峰表示,企业系统架构分为业务层、数据层和模型能力层,其中模型能力又分为通用能力和差异化能力。其中,通用模型能力如 DeepSeek 等提供行业红利,可以直接利用,无需自行开发。若要实现差异化竞争,则需专注于小模型层面进行差异化设计。

邓亚峰小组有以下观点:一是通用模型能力是基础模型公司要做的工作,其投入成本高,对于业务型企业而言,无需在里边过多投入;二是除了业务层的产品体验优势外,企业的差异化主要通过高质量数据构建来实现的;三是由于AI技术是动态发展的,持续的数据迭代对于提升系统的AI能力至关重要。四是除了数据壁垒外,企业在业务上也应寻求差异化或壁垒,以确保竞争力。

彩食鲜 CTO、腾讯云 TVP 乔新亮

针对以上发言,第二组持反方观点,彩食鲜 CTO、腾讯云 TVP 乔新亮表示,一是通用模型能力不应仅由基础模型公司承担,而应通过开源开放的方式共享,如DeepSeek所示,开源开放更有助于社会进步。二是针对通过数据构建差异化壁垒的观点,业务本身也能建立壁垒,但实际操作中难度较大且与数据壁垒无关。他还强调,企业在追求差异化价值时,需要关注数据质量,因为数据质量差往往是业务执行不佳的结果。最后他提出,要做好人工智能必须先做好数字化转型。

话题二:金融、制造、医疗行业中挑选一个行业,如何落地DeepSeek智能客服平台?

腾讯云TVP 蒋锦鹏

发言代表腾讯云 TVP 蒋锦鹏表示,我们重点探讨在医疗领域如何落地 AI 应用,如何通过 AI 客服提升患者体验。系统架构设计覆盖患者就诊的诊前、诊中和诊后全过程,包括预问诊、导诊、检验、检查、解读及康复指导等场景。为了实现这一目标,我们设计一个基于DeepSeek的系统,该系统不仅包含一个支持语音交互的Chat BOT,还需要与医院的HIS(医院信息系统)和EMR(电子病历系统)打通,以获取患者的详细信息并提供个性化建议。此外,系统还需具备与真实世界交互的能力,如自动挂号等功能,确保流程的完整性和实用性。

然而,医疗行业的保守性和数据质量问题为 AI 的应用带来诸多挑战。首先,现有数据库如 EMR 和 HIS 的数据质量参差不齐,难以直接用于 AI 分析。其次,医学领域的知识库需要从大量的文献、指南和临床路径中提取并结构化,才能被 AI 理解并应用于实际场景。此外,AI 的幻觉问题在医疗行业尤为重要,任何错误的指导都可能对患者健康产生严重影响,因此必须确保所有建议都有临床循证的支持,并通过人类专家的校验来保证安全性。他强调,在证明 AI 价值时,不应仅着眼于替代现有业务人员的存量市场,而应关注提升用户满意度和增加服务使用量的增量市场,这才是 AI 在医疗领域更大的价值所在。

话题三:在互联网巨头、垂直AI企业和传统行业转型中各选择一家公司作为研究对象,讨论其在DeepSeek布局中的三大核心优势和三大劣势。预测未来三年内哪一类玩家最有可能在DeepSeek应用领域取得成功,并分析其发展趋势。

智鹤科技首席科学家、腾讯云 TVP 王晔

智鹤科技首席科学家、腾讯云 TVP 王晔代表发言,他们选择了互联网行业作为研究对象,特别是像腾讯这样的企业,具有以下显著优势:第一,互联网行业的数据量最大且增量持续,远超传统行业,这使得其在AI应用上更具潜力,能基于DeepSeek不断训练出更强大的模型。第二,互联网行业汇聚大量顶尖人才,随着DeepSeek的发展,人才的价值被进一步放大。第三,互联网公司在数字技术积累方面更为深厚,最大化发挥大模型的商业价值。然而,互联网行业也存在劣势,由于它太通用了,在垂直领域缺乏数据壁垒,这反而促使它们通过激烈的竞争来弥补不足。互联网公司面临资本市场压力,可能会影响其长期战略方向,不像 DeepSeek 那样能在无资本压力下专注于学术研究和追求 AGI 成就。

话题四:结合技术成熟度、商业价值、市场规模、实施难度,谈谈 DeepSeek 最具落地潜力的五大企业级应用场合。

立购在线CTO、腾讯云架构师同盟名人堂专家 闫国旗

小组代表立购在线 CTO、腾讯云架构师同盟名人堂专家 闫国旗表示,我们基于 DeepSeek 对未来场景的 预测分析进行深入探讨,发现很多场景更侧重于当下企业的的发展现状。各组员结合自身所在行业和经验,从各个场景的跨行业适用性、落地可行性和商业回报率聚焦出在线客服、企业知识库、AI编程、智能营销和销售管理五大核心场景。

数据质量与算力支持是AI落地的关键因素。企业落地 AI 应用需要针对自身的需求特点进行模型的训练或微调。避免因为数据质量问题,导致模型得不到预期的落地效果。算力部署方面,企业可根据自身需求选择私有部署或MaaS云服务。随着 DeepSeek 技术迭代,本地化部署成本持续降低,在满足数据合规的同时有效控制企业投入。此外,需持续关注法规完善对AI应用提出的新要求。

他强调”与其追逐技术空想,不如深耕落地价值。" 通过场景驱动实现 AI 技术与业务需求的 耦合,确保技术投入能快速转化为实际商业价值与社会价值。这一务实策略既符合当前技术发展阶段,也为企业在不确定环境中建立可持续的竞争优势提供有效路径。

话题五:DeepSeek如何变革行业与就业岗位,五年之内哪些行业和岗位会受到DeepSeek的冲击或利好?

软通动力研发总监、腾讯云架构师同盟名人堂专家 鲍丹

小组代表软通动力研发总监、腾讯云架构师同盟名人堂专家 鲍丹说,随着大模型的发展,许多传统岗位正在经历变革。初级投研顾问、初级医生、法务助理、客服、流水线操作员等重复性脑力劳动岗位需求量正在减少。这些岗位的工作可以被 AI 替代,例如审计助理、合同审查和翻译等任务可通过 AI 更高效地完成。然而,新的职业机会也在出现,比如模型部署与微调专家、垂直领域的数据专家及数据伦理治理师等。

在岗位进化方面,强依赖于 AI 提效的岗位更容易被替代,那些需要高度人际互动的岗位则较难被替代。例如销售和复杂决策者仍需人类独特的社交技能和背景知识来做出准确判断,则不容易被替代。此外,教师和研发人员虽然面临 AI 带来的挑战,但如果能掌握并运用 AI 工具,则能显著提升工作效率和质量。

结语

在精彩的观点 PK 讨论下,本次「DeepSeek从热潮到应用」TVP AI 创变研讨会圆满落幕。通过今天的交流与探讨,各位专家帮助我们梳理DeepSeek技术发展脉络,分析热潮背后的逻辑与创新,更重要的是探索 AI 落地实践,为我们带来许多启发与思考。

TVP AI 创变研讨会,是为 TVP 等技术管理者、AI 创业者打造的专属交流活动,旨在聚焦 AI 前沿,通过系列专题研讨,共同探索 AI 变革浪潮下的创业与创新机遇。未来,TVP AI 创变研讨会将走进更多城市,期待与您见面。

TVP,即腾讯云最具价值专家(Tencent Cloud Valuable Professional),是腾讯云授予云计算领域技术专家的一个奖项。TVP 致力打造与行业技术专家的交流平台,促进腾讯云与技术专家和用户之间的有效沟通,从而构建云计算技术生态,实现“用科技影响世界”的美好愿景。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

相关推荐

1
3
Baidu
map