金山云完成阶跃星辰最新两款开源多模态大模型适配

2025-04-18 01:04:29 围观 : 53 次 0 评论

金山云已完成对阶跃星辰最新开源的两款多模态大模型的适配,包括全球参数量最大的开源视频生成模型Step-Video-T2V,以及业界首款产品级开源语音交互模型Step-Audio。目前,用户可登录金山云官方网站进行体验。


*登录金山云账号控制台选择裸金属服务器-新建实例

Step-Video-T2V 模型


金山云针对Step-Video-T2V模型,为用户提供强大的算力支持和稳定的运行环境让模型性能得以充分释放,带来流畅的视频生成体验。


据悉,Step-Video-T2V模型的参数达300亿,可直接生成204 帧、540P 分辨率的高质量视频。评测结果显示,该模型在指令遵循、运动平滑性、物理合理性、美感度等方面的表现均显著超过市面上既有的效果最佳的开源视频生成模型。


2.png

*图为Step-Video-T2V-Eval评测结果

阶跃星辰官方提供了多卡并行部署的支持,其中文本编码器和VAE部分由独立的进程维护,DiT部分可以选择4卡并行或8卡并行,每张卡需要至少80G显存。如果要在单台机器上运行,推荐使用5个80G显存的GPU。


模型部署


在部署方面,金山云已预装好ubuntu22.04-Step-Video-T2V模型和依赖环境的镜像。在多卡并行部署时,金山云的云计算环境可精准协调各卡资源,保障文本编码器、VAE 和 DiT 等部分协同工作,大幅提升视频生成效率。

*金山云裸金属服务器控制台创建流程,选择内置Step-Video-T2V的自定义镜像创建,创建完成即可启动模型并使用

运行测试

登录服务器进入Step-Video-T2V-main目录启动服务

cd Step-Video-T2V-main

python3 api/call_remote_server.py--model_dir /models/stepvideo-t2v

出现如下提示后服务启动成功

* Running on all addresses (0.0.0.0)

* Running on http://127.0.0.1:8080

Step-Audio模型

金山云同时完成了实时语音对话系统Step-Audio模型的适配工作。金山云将借助先进的云计算技术,降低模型响应延迟,让用户与模型的对话更加自然流畅。在实际应用中,无论是实时语音聊天,还是语音指令控制,金山云都能确保 Step-Audio 模型快速准确地响应,为用户提供优质的语音交互服务。


Step-Audio作为业内创新性的开源语音模型,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,并且能和用户自然地进行高质量对话。根据 LlaMA Question等五大主流公开测试,Step-Audio 模型性能均位列第一,并在HSK-6(汉语水平考试六级)评测中表现突出,是最懂中国话的开源语音交互大模型。


4.png

*图为5大主流公开评测结果

模型部署

在部署方面,金山云已预装好ubuntu22.04-Step-Audio模型和依赖环境的镜像。


*金山云裸金属服务器控制台创建流程,选择内置Step-Audio的自定义镜像创建,创建完成即可启动模型并使用

运行测试

登录服务器进入Step-Audio-main目录启动服务

cd Step-Audio-main

python3 tts_inference.py--

model-path/models/Step-Audio/model--output-path/root/Step-Audio-output--synthesis-type tts

在人工智能高速发展的当下,秉承技术立业的金山云将始终与前沿技术同频,继续携手生态合作伙伴为前沿技术的落地转化提供助力。

相关文章

  • 技术 | 当背包侠邂逅3D高斯,数字孪生迎来“瞬时”革命
    技术 | 当背包侠邂逅3D高斯,数字孪生迎来“瞬时”革命

    在数字化的浪潮中,我们渴望在数字虚拟的世界中复刻出现实的每一个细节。然而,对于仓库、地下工事、码头等结构复杂且无GNSS信号的“信息孤岛”,传统的三维重建技术往往面临效率低下、模型笨重、真实感不足的困境。其生成的数字孪生模型,常常只是空有点...

    2025-07-28 13:01:06 立得空间
  • 携手越南BW Industrial集团,共建高标准TPO屋面系统
    携手越南BW Industrial集团,共建高标准TPO屋面系统

    近年来,东方雨虹以产业基础、科创平台、资源优势及实践探索经验为支撑,积极抢抓国际发展新机遇、探索全球发展新路径、加速全球化布局,陆续在美国、加拿大、马来西亚、越南、菲律宾等多国开设海外分公司及办事处,为夯实海外发展基础、拓展海外发展空间奠定...

    2025-07-28 11:09:19 东方雨虹
  • SNEC2025开展首日| 利珀科技在2.1H-D110展位等你
    SNEC2025开展首日| 利珀科技在2.1H-D110展位等你

    6月11日,SNEC第十八届国际太阳能光伏与智慧能源(上海)大会暨展览会在上海盛大开幕,利珀科技携光伏电池端通用解决方案,BC电池与组件端视觉解决方案亮相。利珀展位 2.1H-D110 leapers合影展会现场,利珀科技的技术团...

    2025-07-27 21:02:52 新能源杭州利珀科技
  • 用友BIP:打造企业数智化的战略级“操作系统”
    用友BIP:打造企业数智化的战略级“操作系统”

    来源:新华网客户端yonyou在新一代信息技术持续突破、人工智能加速应用落地、产业体系深度重构的时代背景下,软件已从传统的“辅助工具”跃升为“新型生产力”。国家持续推进《“十四五”数字经济发展规划》《数字中国建设整体布局规划》等顶层设计落地...

    2025-07-23 10:31:02 用友
  • 捷昌驱动:以科技重构适老化生活,赋能银发经济新未来
    捷昌驱动:以科技重构适老化生活,赋能银发经济新未来

    在人口老龄化趋势加速的当下,如何让老年群体享有更有尊严、更具品质的生活,已成为社会发展的重要命题。2025年6月11日至13日,上海国际养老、辅具及康复医疗博览会(AID)上,线性驱动领域领军企业捷昌驱动(展位号:W5F32)以"从零部件供...

    2025-07-22 22:16:10 捷昌驱动
  • 数智服务·智慧运营——用友四川用户企业报表赋能培训圆满结束!
    数智服务·智慧运营——用友四川用户企业报表赋能培训圆满结束!

    yonyou为助力客户企业加速财务数字化转型,深化数智应用能力,用友网络科技股份有限公司四川分公司于6月13日在蓉成功举办“数智服务·智慧运营——四川用户系统操作与价值提升培训会”。本次培训聚焦企业报表核心场景,通过系统化赋能,助力客户高效...

    2025-07-22 11:48:19 软件用友四川
  • 正式介绍美团闪购,欢迎10亿消费者来购物!
    正式介绍美团闪购,欢迎10亿消费者来购物!

    正式向大家介绍新一代购物平台——美团闪购!我们把“等快递”升级为“30分钟送达”海量商品,吃的用的,应有尽有24小时随时随地陪伴大家更有每日神价,就是便宜就是快为大家打造下一代购物体验诚邀全国10亿消费者,随时来美团闪购逛逛我们特地准备了开...

    2025-07-20 18:16:00 美团Meituan
  • 数智焕新进行时,用友BIP助力企业跨越周期、迈向高质量发展
    数智焕新进行时,用友BIP助力企业跨越周期、迈向高质量发展

    用友BIP全球经济波动加剧、技术迭代加速,当关税战如迷雾般笼罩全球贸易航道、AI 大模型开始重塑整个行业生态,全球范围内的企业都面临着关税壁垒、政策合规、AI技术落地难以及全球化运营复杂性等多重挑战。加速推进数智化转型成为企业突破困境、实现...

    2025-07-19 15:46:37 用友
  • 国际权威认证!凌云光通过CMMI四级评估
    国际权威认证!凌云光通过CMMI四级评估

    近期,凌云光成功通过国际公认最权威的软件研发管理体系认证——CMMI(软件能力成熟度模型集成)DEV四级评估,这标志着公司在软件研发过程管理能力、项目交付质量等方面持续进阶,目前已具备高成熟度的量化管理能力,将为客户提供更高确定性的交付保障...

    2025-07-19 07:17:55 软件凌云光技术
  • 北京市科委报道双鹤创新平台:AI驱动药物研发全链条  塑造医药创新“国家队”新范式
    北京市科委报道双鹤创新平台:AI驱动药物研发全链条 塑造医药创新“国家队”新范式

          在创新药物研发领域,面对漫长的周期、高昂的成本以及巨大的风险,北京双鹤润创科技有限公司(以下简称“双鹤润创”),作为华润双鹤旗下的科技创新平台,提出了一种创新的解决方案。该平台以“人工智能...

    2025-07-18 21:33:57 药品华润双鹤药业
发表评论