文 | 智能相对论
作者 | 陈泊丞
2019年,彼时的AI赛道还不像今天这么热。
这一年,人工智能连续第三年出现在政府工作报告中,政策关键词从“加快”“加强”转变为“深化”,开始进入行业需求快速增长的应用探索期。而华为也在这个阶段完成了初步的战略布局和自主技术储备,向更深层次迈进。科大讯飞也前瞻性地联合多家国内厂商围绕根技术进行科研攻关,并希望通过一系列自主创新,提升AI领域的自主化水平,从而真正与国际科技巨头们能在同一起跑线上进行竞争。相似的经历、一致的目标,让科大讯飞和华为意识到对根技术的探索任重道远,并开始寻求 的合作。
本土科技厂商的双向奔赴:“敢用-真用-会用-用好”步步深入
回顾讯飞星火大模型和华为昇腾的合作之路,科大讯飞副总裁、AI工程院院长潘青华梳理出了四个关键阶段,即“敢用-真用-会用-用好”,双方在每一个阶段都遇到了大量的问题、顾虑,最终携手克服困难,才把原生创新的路径走通。在与昇腾合作之前,科大讯飞就已经做了很多技术上的行动,比如自研 学习并行训练框架和训推工具链,基于国内优秀软硬件基础设施打造稳定高效的大规模 学习训练平台等等,但是在核心算力层面上始终没有很好的国产化解决方案,算力资源成了本土科技厂商发展AI大模型的一个关键限制。在这种情况下,科大讯飞走出了“敢用”的第一步。
随着对根技术需求的认识加深以及对昇腾AI平台性能的了解,科大讯飞开始尝试基于昇腾AI进行模型训练和推理工作。昇腾以其高度专业的服务态度和服务能力,全力支持讯飞AI训练移植优化,包含语音识别、语音理解、机器翻译等模型在昇腾算力资源上的移植适配。这让科大讯飞与昇腾AI的合作继续进入了“真用”阶段,开始寻求发展中解决大模型训练推理的核心难题。
以国内首个支持万亿参数大模型训练的智算集群“飞星一号”正式上线为标志性节点,科大讯飞不仅在业界首创基于RoCE的大规模无损组网,还与昇腾AI联合解决500余次软硬件问题,首次实现千亿参数大模型训练效率达到业界水平。在这个过程中,科大讯飞与昇腾AI共同攻坚克难,解决大规模集群训练中保存断点后性能“抖动”、性能“爬坡”等疑难杂症。有了这些成功的探索与验证,科大讯飞与昇腾AI的合作进入了以原生创新为主导的“会用”阶段,双方在根技术上的攻关取得显著回馈。
基于昇腾硬件亲和特性,科大讯飞对星火大模型的模型结构进行重新设计,不仅让星火大模型训练性能较之前提升10%,还创新实现了混合长序列并行算法,促使星火大模型在昇腾上的长序列性能提升了15%。今年6月,科大讯飞正式发布完全基于昇腾算力训练的星火大模型V4.0,其中星火V4.0在国内外中英文12项主流测试集的8项中,实现了对GPT-4Turbo的超越,成功晋升为业界领先的通用大模型底座。
未来,科大讯飞将继续思考如何进一步“用好”昇腾AI,面向更大规模集群和更大规模训练任务,共同探索如何持续挖潜集群性能、大模型推理性能如何进一步提升等等一系列问题。
一路走来,步步深入,科大讯飞与昇腾AI从最初的接触探索到后来的深入协同,再到原生创新的成功实践,双方以 合作的姿态,在AI原生创新之路上越走越坚定。
本土化技术创新完成了一次很好的验证
本土化技术创新难在两大方面,一是技术难做,没有解题思路,二是项目难坚持,没有持续解决问题的理念,往往就会无疾而终。这是一段长期的探索历程,技术决定了起步,而理念决定了起步后的发展是否能长期。
一、技术与理念的双向奔赴。
科大讯飞与昇腾AI的这场合作之所以能成功,不仅是技术层面的深入协同,还有理念层面的双向奔赴。比如针对大规模集群训练两个月后“越训越慢”的问题,科大讯飞与昇腾AI通过集合通信-驱动-内核的层层分析,最终发现操作系统内核问题,导致算子下发时间变长、训练性能下降,才有了后续的解决方案。
二、互为反哺的价值共生。
此次合作中,业界看到的更多是科大讯飞基于昇腾AI完成了一系列成就,但与此同时,昇腾AI也在接受反哺。科大讯飞深入参与并助力昇腾持续完善面向大模型的软件生态,共同开发和优化了基础算子和通信算子共120多个,基于底层开放API接口也开发了自定义融合算子30多个。同时,双方共同组建的联合项目组还推动了昇腾工具50多项关键特性的开发,促使Mindstudio工具不断完善,也持续丰富了昇腾的大模型工具集。
好的合作关系一定是互相成就的,双方在本次合作中收获的巨大成果便是具象化呈现,若要实现本土化技术创新,就应该在互为反哺的价值共生关系中去寻求答案。
三、惠及产业发展的生态成果。
科大讯飞和昇腾AI的这场合作,在惠及企业自身的同时,也在推动着中国AI产业的跨越发展。比如,双方联合打造的国内首个支持万亿参数规模大模型训练的智算集群“飞星一号”,大幅提升我国在人工智能领域的行业竞争力。接下来双方将继续深入探索未来中国人工智能产业发展的关键问题,相信将有更多技术创新与生态成果,更广泛地惠及千行万业。
大模型原生创新时代开了个好头
科大讯飞和昇腾AI的双向奔赴为中国AI产业发展开了一个好头。正如潘青华院长在演讲中强调,“只有持续跑得快才能最终跑得赢。”中国AI产业发展需要持续跑得快。
现阶段,“原生创新”概念经常被行业所提及。但大部分的讨论只停留在了应用原生创新之上,认为只要把AI应用孵化在技术平台上,就是做到了原生创新,往往却忽视了根技术的原生创新。
如果孵化到国外的技术平台,做到了应用的原生创新,那确实是“跑得快”,但是能“持续”吗?其中客观存在的不稳定性和高风险,或许会在未来的某天突然“暴雷”,给企业经营和产业发展带来不可挽回的损失。
而只有基于根技术的自主创新,放在自家的技术平台上孵化、培育,那才有“持续跑得快、跑得稳”,最终“跑得赢”,跑向一个真正的大模型原生创新时代。科大讯飞和昇腾AI就一直在为这样的时代而努力。
基于讯飞星火医疗大模型平台和昇腾AI基础软硬件,科大讯飞与华为联合打造了一体化医疗健康私有化解决方案。同时,讯飞医疗还携手华为,与四川大学华西医院达成了三方战略合作伙伴关系,共同围绕创新医疗服务模式、改善就医体验、医疗大模型技术应用等重点领域展开深入合作。
这将是医疗大模型应用落地的一个里程碑,未来一个“AI为每个医生打造诊疗助理,为每个居民打造健康助手的世界”或许很快就会到来。那么,站在社会民生的角度来看,大模型原生创新时代的到来,不仅仅是对产业发展有助益,更将是AI普惠社会民众的开端。
据多家媒体统计,2024年上半年,在已公开的行业大模型中标信息中,科大讯飞的合同数量、合同金额均保持行业领先,行业场景逐步拓宽。今天,随着AI赛道越来越热,千行万业都在向AI领域发起冲锋,而产业经济的高质量发展需要持续跑得快、跑得稳,最终才能跑得赢。这一目标离不开本土企业对根技术的攻关以及对原生创新的坚持。
在讯飞星火与昇腾AI的双向奔赴中,业界看到了一条从技术攻关到应用探索的完整路径。以此为标杆,中国的AI产业又完成了一次探索验证,将跨入一个更稳定、坚实的发展新阶段。
*本文图片均来源于网络
此内容为【智能相对论】原创,
仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。
部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。
•AI产业新媒体;
•澎湃新闻科技榜单月度top5;
•文章长期“霸占”钛媒体热门文章排行榜TOP10;
•著有《人工智能 十万个为什么》
•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。