支持平台部署!金山云完成基于国产芯片的DeepSeek满血版适配

互联网
2025
03/07
15:39
分享
评论

近日,金山云完成基于国产芯片的DeepSeek满血版适配。同时,金山云星流训推平台也已完成DeepSeek满血版的部署,且支持多机部署实现分布式推理。

通过提供稳定且强大的算力支持,金山云能助力模型充分发挥其性能优势,使得其在自然语言处理、智能问答、文本生成等多个领域表现优秀,这将为用户带来更强大、更高效的人工智能体验。

  【裸金属服务器部署步骤】

金山云在搭载国产GPU的裸金属机型上进行了适配,公司提供已预装好包含 DeepSeek满血版和所有依赖环境的自定义镜像,用户只需在金山云裸金属服务器控制台选择地域与机型、选定内置DeepSeek满血版的自定义镜像、配置网络与安全、设置基本信息并确认配置后,即可轻松完成部署。

金山云裸金属服务器控制台创建入口

1.jpg

2.金山云裸金属服务器控制台创建流程,选择内置DeepSeek满血版的自定义镜像创建

2.jpg

创建完成后,开发者和企业一键启动模型就能立即投入使用,大大降低了模型的使用门槛。这不仅能让更多开发者和企业快速享用DeepSeek满血版的强大功能,还将加速人工智能项目的落地与应用。

经过测试和验证,DeepSeek满血版在搭载国产GPU的裸金属机型上于多个领域都展现出了不凡的性能。在智能客服场景中,能够快速理解用户的复杂问题,并给出准确且人性化的回答。与其他同类模型相比,在语义理解的准确性和文本生成的流畅性方面都具有明显优势,为各行业的智能化升级提供了有力支持。

  【金山云星流训推平台多机部署步骤】

为加速企业AI规模化落地,金山云推出了模型在线服务功能,提供从模型部署到调用的服务能力。聚焦高效部署与分布式推理协同,该平台可通过智能任务调度与跨节点并行计算,实现模型的高效推理。无需复杂配置,用户即可在公有云环境构建稳定、高性价比的模型服务。

此前金山云星流训推平台已支持DeepSeek蒸馏版的部署,现支持多机部署DeepSeek满血版,可实现分布式推理。

多机部署步骤详情如下:

1. 进入算力平台控制台并创建资源池

2. 进入模型在线服务导航页

3. 点击新建,创建模型在线服务

a. 选择R1或V3模型,平台默认勾选多机部署,用户可自主配置服务副本数以及多机部署的节点数量

b. 填写基本信息、资源、网络等配置

c. 点击确认,模型开始部署

注:R1、V3模型部署所需时间较长,请耐心等待

3.jpg

4. 调用模型服务。模型部署成功后,即可对模型进行调用,金山云当前支持接口和WebUI两种调用方式,相应的调用操作流程如下:

a. 接口调用

b. WebUI调用,模型部署成功后点击模型名称进入模型概览页,点击访问WebUI即可通过WebUI形式实现模型调用

首次进入WebUI页面需注册用户账号,注册完成后登录即可使用界面实现调用。

4.jpg

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

相关推荐

1
3
Baidu
map