公告,36氪首发 从快手独立的AI芯片公司融资数亿元,视频压缩机能超英伟达
36氪获悉,人为智能芯片企业「凌川科技」近日实现数亿元A轮融资,由北京市人为智能产业投资基金和快手集团领投,亦庄产投、顺禧基金、九智本钱等跟投。本轮融资将重要用于下一代芯片研发、现有产品SL200的量产扩产及海表市场拓展。 「凌川科技」成立于2024年3月,由北京市人为智能基金与快手集团共同提议,前身为快手集团异构推算与芯片事业部。「凌川科技」CEO刘凌志通知36氪,“2018年快手日活破亿,传统堆算力服务器的成本压力已不成持续。我们从异构推算平台切入,2020年正式立项芯片,2023年SL200在快手部署数万颗,节俭超预期成本后,拆分独立成为必然选择。” 目前,SL200芯片集成了视频编码、AI推理、多核CPU等主题职能,部署量近数万颗,服务7亿用户,并获评2023世界互联网大会“创新发展典型案例”。刘凌志强调:“互联网基因让我们从利用反推芯片设计,客户需要直接界说产品,这是传统芯片公司难以复造的优势。” 目前,全球AI芯片市场持久由英伟达主导,其CUDA生态形成技术壁垒,但大模型推理场景对成本与能效的敏感度催生了ASIC架构的差距化需要。国内智能视频赛路高速增长,涌现快手、字节跳动等头部利用及“可灵”“即梦”等大模型技术,但算力芯片仍面对美国出口限度的“卡脖子”风险。「凌川科技」对准垂直领域,通过ASIC架构降低推理成本,单颗芯片可处置36路视频工作,较传统规划节能30%,成为国产代替的关键蹊径。 36氪相识到,SL200芯片为国内首款集成视频编码、AI推理、多核CPU等职能的ASIC芯片,支持万分之一超低故障率,头部客户直播覆盖率近100%。其视频压缩机能在MSU大赛中超过英特尔、英伟达,单路处置成本降低40%。下一代芯片针对大模型训练推理场景设计,支持LLM、文生图、文生视频、推荐算法等高算力需要,沉点支持以快手可灵为代表的文生视频模型。公司同步开发类CUDA编程接口,适配PyTorch框架及主流大模型推理引擎,降低客户迁徙成本。 「凌川科技」Transtreams Advanced Compute Unified Architecture 是一种融合 CPU 与 NPU 协同运作的异构运算平台。它结合传统 CUDA/OpenCL 优势,选取由 CPU 掌管节造与调度、NPU 处置密集推算的架构,实现高效工作协同与机能优化。其编程框架支持统一套代码在 CPU 与 NPU 间无缝切换,TC 编译器可凭据负载自动分配工作,提升资源利用与负载平衡。在说话层面,TC 编程说话提供了对张量(Tensor)及其分歧档次数据布局(layout)的统一暗示,并抽象出面向 TC NPU 架构的 Tiling 与 Pipeline 机造。说话级封装使得开发者可能简洁、正确地表白复杂的特殊 layout、跨档次 memory(如 DDR、SRAM)的排布,以及多核并行推算中的 Tiling 与流水线调度,从而削减法式开发中的谬误和复杂性,提高编程效能。同时,运算平台提供了丰硕的系统和利用治理工具,方便用户可能更高效地进行矫捷的开发、验证、环境部署及质量监控等。 目前,SL200芯片已覆盖快手、阿里、百度等互联网数据中心,并利用在广播电视、广电领域、智慧城视注智能巡检等场景,合作案例超20个。同时,也与华为、超聚变、海潮等厂商形成行业解决规划。此表,SL200海表通过快手海表出海业务进入东南亚新加坡、巴西市场。刘凌志泄漏:“公司下一代芯片已与多家大模型公司实现适配测试,今明年将沉点拓展自动驾驶机械人、低空经济、自动驾驶等机械人与边缘推算场景。” 团队方面,「凌川科技」CEO刘凌志为上海交大博士、华盛顿大学博士后,曾任快手副总裁及华为、英特尔主题技术治理岗。自拆分至今,团队规模已增长三倍,成员涵盖芯片及互联网行业专业人才。公司研发人怨丶比80%以上,70%以上为硕士学历,20%以上为博士学历,60%的员工拥有十年以上从业经验。团队累计申请中表专利超百项,涵盖大模型压缩、视频编码等关键技术。团队主题成员也深度参加NeurIPS’21等国际较量,并主导多项北京视注上海视装卡脖子”技术攻关项目。




京公网安备11010202000001号

spider
spider
-->