立足算力租赁行业,需要哪些核心竞争力?
算力租赁,简单来说,就是由算力租赁公司设计并建造高性能集群后,将其所能提供的真实算力出租给有需求的客户。搭建高性能AI服务器集群需要采购高性能网络模块、建设机房(自有或租赁)、配备可靠的电源系统、进行硬件维护,并优化软硬件调度。集群的设计决定了其在不同规模任务下能够提供的理论算力上限。在此基础上,算力租赁厂商的核心竞争力主要体现在以下几个方面:
一. 拿卡能力
在美国制裁和封锁后,国内厂商获取高性能算力卡变得更加困难,拥有拿卡渠道的公司因此具备巨大优势。尽管目前只要有足够的资金,愿意支付较高价格,仍然可以通过各种方式获得卡,但不同渠道的拿卡成本差异较大。因此,虽然拿卡能力很重要,但也没有外界传言的那么难以实现。
二. 资金实力
截止到今年7月,一套8卡H800服务器的价格大约在260万左右。 1000P算力(按H800具备2P算力计算)所需的服务器成本就达到1.3亿元。随着进一步的出口限制,预计服务器价格还会有较大幅度的上涨。据国泰君安分析师透露,目前算力租赁公司的算力成本已达到20-30万元每P。算力租赁业务需要大量一次性资本支出,因此只有现金充裕或融资能力强的公司才能成功运营。
三. 基础设施能力
有些人认为只要购买了卡和服务器就能开始运营,这种想法是错误的。没有机房和相关配套设施,一切都是空谈。尤其是布局超大规模AI服务器集群的公司,建设周期更长。自有高散热能力、高功率电源的机房,或拥有良好网络资源的公司在这方面具备明显优势。
四. 运营能力
拥有持续运营和运维能力的公司在市场上更具竞争力。要在算力租赁行业中生存并发展,不仅需要强大的拿卡能力,还需要雄厚的资金支持、稳定的客户基础、完善的基础设施,以及强大的运维能力。AI算力的客户分布广泛,需要有效的客户组织和协调能力。能够获取稳定的大客户或与运营商有良好合作关系的公司更具优势。
互联互通,专注于新型数据中心和网络的高质量定制服务,在算力租赁领域也提早进行了战略布局,为用户提供稳定的、专业的、高效的GPU算力服务,满足高校、科研院所及企事业单位在人工智能和高性能计算方面的需求。
展望未来,算力租赁将继续成为企业增强竞争力的核心手段之一。互联互通将持续为企业提供全方位、多层次的服务,助力企业在竞争激烈的市场中脱颖而出,实现稳定、快速和可持续的发展。
另:鉴于市场上多数人对算力租赁业务的理解还处于初级阶段。因此以下两点还需特别注意:
a. 算力卡选择
AI算力所需的卡特指支持高速互联的数据中心用卡(如H100、H800),不包括如4090、3090等非专业卡。这些非专业卡通常只能满足视频渲染或小型科研用户的需求。如果某些租赁公司只提到其拥有多少P的算力而未说明卡的类型,客户就需要提前弄清楚卡的具体型号和性
b. GPU服务器整租 vs. 高性能GPU集群出租
带GPU服务器的整租与高性能GPU集群出租有本质区别。GPU服务器整租仅涉及多个单节点的整体出租,由于普通集群节点间通常没有高速连接,客户无法将多个单节点组成集群进行训练。从商业模式上看,服务器节点出租后使用权属于客户,如何使用或闲置与出租方无关,与传统的IDC模式相似。
而具备算力调度平台的高性能GPU集群不仅能提供远高于普通集群的吞吐量,还能实现算力资源的智能管理,通过合理的峰谷算力调度,实现多个客户间的算力共享,达到大于100%的实际算力使用率。