11月5日消息,近日,摩尔线程上线了大语言模型高速推理框架开源项目vLLM的MUSA移植版本,为开发者提供基于摩尔线程全功能GPU进行开源项目MUSA移植的范例。
摩尔线程表示,正努力围绕自主研发的统一系统架构GPU、MUSA软件平台,构建完善好用的MUSA应用生态。;
vLLM是一个高效且易用的大模型推理和服务框架,支持创新的PagedAttention内存管理、连续批处理请求、CUDA/HIP图的快速模型执行、CUDA核心优化、分布式推理支持等,可显著提高大语言模型(LLM)的推理性能。
目前,vLLM已在各种大语言模型中得到广泛应用,成为业界常用的开源大模型推理框架。
摩尔线程基于vLLM v0.4.2版本,进行了移植适配,使之支持摩尔线程GPU后端Device,并完全开源,开发者可以二次开发、升级vLLM到社区更新版本等。
值得一提的是,得益于摩尔线程MUSA架构的先进性、软件栈对CUDA的优良兼容性,通过MUSIFY代码自动转换工具,用户可以快捷地将原有的CUDA代码迁移到MUSA平台,实现替代。
同时,CUDA相关库的调用,也可以快速替换为相应的MUSA加速库,如算子库muDNN、集合通信库MCCL、线性代数库muBLAS等。
摩尔线程通过MUSA软件栈对CUDA软件栈接口兼容,大幅提升了应用移植的效率,缩短了开发周期,还提供MUSIFY自动代码移植工具等一系列实用工具和脚本。
摩尔线程vLLM-MUSA开源地址:
https://github.com/MooreThreads/vLLM_musa
以上就是关于【加速替代CUDA!摩尔线程开源vLLM-MUSA 加速国产GPU AI】的相关消息了,希望对大家有所帮助!
11月15日消息,据国外媒体报道称,IEA预计明年全球石油将供应过剩115万桶/日,若OPEC+解除减产计划,则过剩规模将进一步扩大,这也意味着全球油价还会继续大幅下滑。
11月15日消息,心系天下三星W25 Flip将于今天上午10:08正式开售,定价9999元。 三星W25 Flip延续了系列的经典设计,采用竖折方案,背板为陶瓷材质,带来温润如玉的手感。 采用高端黑金配色,搭配超轻薄金属磨砂质感铰链盖,金色的边框处还有类宝石状花纹 ...
11月15日消息,联想集团今日公布了截至2024年9月30日的2024/25财年第二财季业绩:营收1279亿人民币,同比增长近24%,所有主营业务营收均实现双位数强劲增长。
11月15日消息,根据洛图科技(RUNTO)最新发布的报告,2024年第三季度中国智能盒子线上市场的零售量为31.2万台,同比下降5.5%。该季度的平均成交价为188元。
这是一种极具争议的美食,它来自日本,似乎出现又很合理。 前段时间,媒体上兴起了一股美食潮流,以非常规的方式制作了日本传统小吃饭团。 一些餐厅不再用传统的手捏方式来制作,而是用腋窝代替手来完成。 一般来说,制作者是年轻的女性,在开始制作之前 ...
11月15日消息,联想集团最新发布了2024/25财年第二财季业绩,营收1279亿人民币,同比增长近24%,所有主营业务营收均实现双位数强劲增长。
这购物节一来,不管咱打开什么 APP ,最后,命运都会让我们相聚在购物平台。 闭眼在屏幕上随机一点,马上就能传送到各种橙色、红色的软件里。这直接导致,差评君最近购物的时间大幅上升。连蹲坑的必备任务,都从刷抖音,变成了刷购物车。 结果,昨天我在 ...
11月15日消息,据国外媒体报道称,韩国2025学年度大学修学能力考试(高考)当地时间11月14日上午在全国85个考区的1282个考场同时开考。