让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

10W功耗掀翻160TOPS算力!后摩智能发布首款存算一体芯片漫界M50 端边AI打算迎来破局者

发布日期:2025-08-06 18:05    点击次数:168

  在2025天下东说念主工智能大会前夜,7月25日,后摩智能千里淀两年,为AI打算市集带来全新的国产端边AI芯片决策——后摩漫界M50。

image

  漫界M50采选的是产业界最前沿、确切真谛真谛上的存内打算架构,芯片大小仅有20×23mm,但在性能上,却不错提供单芯片最高160TOPS的澎湃算力,并配备最大48GB内存和153.6GB/s的超高带宽。

  漫界M50当今一经罢了了7B/8B大模子25+Tokens/s的推理速率,况兼针对DeepSeek一经完成70B参数的模子适配,最大还可救济千亿参数的大模子。

  关连词在功耗方面,漫界M50又具备极致的高能效比,典型功耗可端正到10W。这为家具在刻下腾达的端边新兴市集结提供坚实的算力救济,带来无限思象。

  漫界M50背后的缔造者——吴强博士,对业界来说并不目生,他曾任职于AMD、Facebook等科技公司,并在2020年底创立后摩智能。但吴强及他指导的后摩智能在近两年却相配低调。

  漫界M50的出身也并非坦途。当作一家初创公司,从家具定位到利用场景遴荐,不得不在外界产业环境的一波又一波潮水中被迫作念出治愈。但好在这次后摩智能收拢了市集窗口,在机器东说念主、智能工业、个东说念主消耗终局等新的机遇爆发前,拿到了核默算力底座的入场券。

  存算一体技艺破局

  2020年底,当吴强遴荐存算一体当作创业方针时,这项技艺还鲜有主流芯片公司饶恕。彼时英伟达GPU已主导AI教练市集,国内初创公司则多扎堆云霄GPGPU赛说念。5年岁后,业内确切推出存内打算芯片家具的公司也唯有凤毛麟角。

  “遴荐存算一体出于两个朴素原因。”吴强坦言,“一是要确切料理功耗墙和存储墙问题必须走存算一体门道;二是创业公司与国外巨头竞争,需要创新架构罢了弯说念超车。”

  存算一体技艺通过将打算单位镶嵌存储器,突破传统芯片中数据在存储与打算单位间平淡搬运的瓶颈。这一架构止境符合大模子这类既需算力密集又需带宽密集的场景。但技艺罢了难度极高,尤其在量产表率靠近电流端正、电源自在性等工程化挑战。

  四年间,后摩团队在国外顶刊发表30余篇论文,其与北京大学勾通的DRAM存算论文刚入选打算机体绑缚构顶会ISCA最好论文。吴强笑称,对技艺的执着就像他几十年坚捏通顺的自律民风,一朝认定方针便与水滴石穿。

  这次发布的M50芯片,背后有着后摩智能这家初创公司向生而行的到手转型故事。

  据吴强回忆,2023年下半年,后摩靠近远程抉择:首代大算力芯片对准自动驾驶赛说念,却遭逢行业价钱鏖战。

  “其时业内齐在喊千元级智驾芯片,而咱们的算力瞎想太超前,忽略了市集需求,出现算力冗余。”吴强示意,好在2023年恰逢大模子爆发,团队发现有算一体与大模子需求高度契合,坚强决定转向端边大模子芯片。

  2024年头,后摩快速推出针对大模子场景治愈优化的家具M30,在中国移动巴塞罗那展上到手初始600亿参数模子,给了他们团队极大信心,外汇平台并坚定转向端边打算芯片方针。

  打算决策全面升级收货多家重磅级意向客户

  这次发布的M50,则是在前代家具上的全面进化。

  M50采选第二代存算IPU瞎想,自研“天璇”架构,不错创新性罢了有内浮点运算,能够很好地针对大模子优化,救济按bit位弹性加快;编译器“后摩通衢”可自动优化打算策略。M50还可平直初始FP16浮点模子,大幅裁汰开垦者适配门槛。

  “传统GPU需4个相邻的16bit数字,其中2个16bit数字全为零才气寥落加快,执行很难自尊。而存内打算的决策按bit位串行的打算,只须某个bit位全为零就能弹性加快,较传统GPU决策赢得更快的打算才略。”吴强现场演示,一样模子下,M50打算速率显贵升迁,其单颗M50芯片可畅通初始千问14B模子完成公文写稿、会议纪要等任务。

  除了M50芯片,后摩智能这次还一并发布与芯片相配套的家具矩阵,酿成袒护端侧到角落的多元算力决策。

image

  其中,力擎LQ50 M.2卡仅有口香糖大小,救济7B/8B模子推理超25tokens/s,为 AI PC、AI Stick、伴随机器东说念主等移动终局提供端侧AI才略。

  力擎LQ50 Duo M.2卡,则集成双M50芯片,具备320TOPS 算力,可罢了14B/32B大模子端侧部署;力谋LM5050 加快卡与力谋LM5070 加快卡差别集成2颗、4颗M50芯片,为单机及超大模子推理提供高密度算力,最高算力高达640TOPS;此外,BX50打算盒子则以紧凑机身适碎裂落场景,救济32路视频分析与土产货大模子初始。

  当今联思、讯飞听见、中国移动已成为漫界M50首批意向客户,这意味着异日联思AI PC、讯飞听见智能语音建树、中移5G+AI角落打算平台齐有极能够率集成M50芯片。

  极致效果锚定端边打算蓝海

  按照吴强勾画出的后摩智能的市集疆城,英伟达、华为等袒护云边端的巨头,多家国产云霄AI芯片阵营专注GPGPU,后摩则锚定端边大模子这片蓝海。

  “具身智能是咱们刻下重心布局的方针之一。”吴强炫耀,后摩正与机器东说念主勾通伙伴测试视觉言语模子(VLA)。

  显着吴强长久铭记创业初心——创造出能照料家东说念主的伴随机器东说念主。“诚然这个市集尚未训诫,但就像十年前的自动驾驶,一朝爆发将比手机市集更重大。”

  关于端边市集对产业链老本的敏锐特色,吴强强调,“后摩不拼价钱拼价值”。

  “后摩但愿用创新技艺罢了极致效果的芯片,这是公司从创立之初的行状愿景。”吴强示意:“咱们但愿用跳跃的存算一体的技艺,用跳跃的芯片,去打造一个‘低功耗、高安全、好体验’的端边智能更生态。但愿有一天大模子能够走出云霄,确切走入千家百户,确切地赋能千行百业。”

image

  跟着M50芯片Q4量产托付,后摩技艺才略和蓝海政策将迎来实战检修。吴强炫耀,公司来岁将推出基于DRAM存算的下一代芯片,进一步攻克带宽瓶颈。

  在巨头林立的AI芯片战场,后摩智能有望猜度正在腾达兴起的终局产业,掀翻一场效果蜕变。