CA88

EN CA88(ÖйúÇø)Ψһ¹Ù·½ÍøÕ¾ CA88(ÖйúÇø)Ψһ¹Ù·½ÍøÕ¾
www.ahsjsjt.cn

爱液视频ÉáÆúCUDA±à³Ì!CMUµÅ×ôúÂ뽫LLM±àÒë³É¾ÞÐÍÄÚºË,ÍÆÀíÑÓ³¤½µ6.7±¶

½üÈÕ £¬CMU ÖúÀí½ÌÊÚ¼ÖÖ¾ºÀ£¨Zhihao Jia£©ÍŶӴ´ÐÂÍæ·¨ £¬ÍƳöÁËÒ»¸öÃûΪ¡¸Mirage Persistent Kernel£¨MPK£©¡¹µÄ±àÒëÆ÷ £¬Äܹ»×Ô¶¯½« LLM ת»¯ÎªÓÅ»¯µÄ¾ÞÐÍÄںˣ¨megakernel£© £¬´Ó¶ø½« LLM ÍÆÀíÑÓ³¤½µµÍ 1.2 µ½ 6.7 ±¶ ¡£ ÔÚÕâÖÖÉè¼ÆÖÐ £¬ÏµÍ³½öÆô¶¯Ò»¸ö GPU ÄÚºËÀ´Ö´ÐÐÕû¸öÄ£ÐÍ ¡ª¡ª ´ÓÖð²ãÍÆËãµ½ GPU ¼äͨѶ ¡ª¡ª Õû¸ö¹ý³ÌÎÞÐèÖжÏ ¡£ÕâÖÖ²½ÖèÌṩÁËÒÔϼ¸¸ö¹Ø¼üµÄ»úÄÜÓÅÊÆ£º ½â³ýÄÚºËÆô¶¯¿ªÏú£ºÍ¨¹ýÔ¤·À³Á¸´µÄÄÚºËŲÓà £¬¼´±ãÊÇÔÚ¶à GPU »·¾³Ï £¬Ò²Äܽâ³ýÄÚºËÆô¶¯¿ªÏú £»ÊµÏÖ¿ç²ãÈí¼þ pipeline ÔÊÐíÄÚºËÔÚÍÆË㵱ǰ²ãµÄͬʱ £¬ÆðͷΪÏÂÒ»²ã¼ÓÔØÊý¾Ý £»³ÁµþÍÆËãÓëͨѶ£ºÓÉÓÚ¾ÞÐÍÄÚºËÄܹ»Í¬Ê±Ö´ÐÐÍÆËã²Ù×÷ºÍ GPU ¼äͨѶ £¬´Ó¶ø°µ²ØÍ¨Ñ¶ÑÓ³¤ ¡£ ÏÖÓеĸ߼¶ ML ¿ò¼Ü ¡ª¡ª Èç PyTorch¡¢Triton ºÍ TVM £¬ËüÃÇ×ÔÉí²¢²»Ö§³Ö¶Ëµ½¶Ë¾ÞÐÍÄÚºËÌìÉú ¡£´Ë±í £¬ÏÖ´ú LLM ϵͳÓɸ÷Àà·ÖÆçµÄרÓÃÄں˿⹹½¨¶ø³É£ºÓÃÓÚͨѶµÄ NCCL »ò NVSHMEM £¬ÓÃÓÚ¸ßЧ°ÑÎÈÁ¦ÍÆËãµÄ FlashInfer »ò FlashAttention £¬ÒÔ¼°ÓÃÓÚ×Ô½çËµÍÆËãµÄ CUDA »ò Triton ¡£ ÄÇôÄÜ·ñͨ¹ý±àÒë×Ô¶¯»¯Õâ¸ö¹ý³ÌÄØ£¿Êܵ½Õâ¸öÎÊÌâµÄÆô·¢ £¬À´×Ô CMU¡¢»ªÊ¢¶Ù´óѧ¡¢¼ÓÖÝ´óѧ²®¿ËÀû·ÖУ¡¢Ó¢Î°´ïºÍÇ廪´óѧµÄÍŶӿª·¢³öÁË MPK¡ª¡ª Ò»¸ö±àÒëÆ÷ºÍÔËÐÐʱϵͳ £¬ËüÄÜ×Ô¶¯½«¶à GPU µÄ LLM ÍÆÀíת»»Îª¸ß»úÄܵľÞÐÍÄÚºË ¡£MPK ¿ªÊÍÁ˶˵½¶Ë GPU ÈںϵÄЧÁ¦ÓÅÊÆ £¬Í¬Ê±Ö»±ØÒª¿ª·¢ÕßÖ§³ö¼«Ó×µÄÊÖ¶¯ÖÂÁ¦ ¡£ MPK µÄÒ»¸ö¹Ø¼üÓÅÊÆÔÚÓÚ£ºÍ¨¹ý½â³ýÄÚºËÆô¶¯¿ªÏú £¬²¢×î´óˮƽµØ³Áµþ¿ç²ãµÄÍÆËã¡¢Êý¾Ý¼ÓÔØºÍ GPU ¼äͨѶ £¬ÊµÏÖÁ˼«µÍµÄ LLM ÍÆÀíÑÓ³¤ ¡£ ³ýÁ˵¥ GPU ÓÅ»¯ £¬MPK »¹½«ÍÆËãÓë GPU ¼äͨѶÈںϽøÒ»¸öµ¥Ò»µÄ¾ÞÐÍÄÚºË ¡£ ÕâÖÖÉè¼ÆÊ¹µÃ MPK ¿ÉÄÜ×î´óˮƽµØ³ÁµþÍÆËãÓëͨѶ ¡£Òò¶ø £¬MPK Ïà¶ÔÓÚµ±Ç°ÏµÍ³µÄ»úÄÜÌáÉýËæ×Å GPU ÊýÁ¿µÄÔö³¤¶øÔö´ó £¬Ê¹ÆäÔÚ¶à GPU ²¿Ê𳡾°ÏÂÓÈΪ¸ßЧ ¡£ Part 1£ºMPK ±àÒëÆ÷ £¬Æä½« LLM µÄÍÆËãͼת»¯ÎªÓÅ»¯µÄ¹¤×÷ͼ £»Part 2£ºMPK ÔËÐÐʱϵͳ £¬¸ÃϵͳÔÚµ¥¸ö¾ÞÐÍÄÚºËÄÚÖ´Ðй¤×÷ͼ £¬ÒÔʵÏÖ¸ßÍÌÍÂÁ¿ÓëµÍÑÓ³¤ ¡£ LLM µÄÍÆËã¹ý³Ìͨ³£°µÊ¾ÎªÍÆËãͼ £¬ÆäÖÐÿ¸ö½Úµã¶ÔÓ¦Ò»¸öÍÆËãËã×Ó£¨Èç¾ØÕó³Ë·¨¡¢°ÑÎÈÁ¦»úÔ죩»ò¼¯ÖÐͨѶԭÓÈç all-reduce£© £¬±ß°µÊ¾Ëã×Ó¼äµÄÊý¾ÝÒÀÀµ¹ØÏµ ¡£ÏÖÓÐϵͳͨ³£ÎªÃ¿¸öËã×ÓÆô¶¯¶ÀÁ¢µÄ GPU ÄÚºË ¡£ È»¶ø £¬ÕâÖÖ¡¸µ¥Ëã×Óµ¥Äںˡ¹µÄÖ´ÐÐÄ£ÐÍÄÑÒÔʵÏÖ pipeline ÓÅ»¯ £¬ÓÉÓÚÒÀÀµ¹ØÏµÊÇÔÚÕû¸öÄں˵ĴÖÁ£¶È²ãÃæÇ¿ÔìÖ´ÐÐµÄ £¬¶ø·ÇÏÖʵÊý¾Ýµ¥Ôª²ãÃæ ¡£ µäÐͰ¸ÀýÈç¾ØÕó³Ë·¨£¨matmul£©ºó½Ó all-reduce ²Ù×÷£ºÏÖÓÐϵͳÖÐ £¬all-reduce Äں˱ØÐëÆÚ´ýÕû¸ö matmul ÄÚºËʵÏÖ ¡£¶øÏÖʵÉÏ £¬all-reduce µÄÿ¸öÊý¾Ý·Ö¿é½öÒÀÀµ matmul Êä³öµÄ²¿ÃÅÁ˾Ö ¡£ÕâÖÖÂß¼­ÒÀÀµÓëÏÖʵÒÀÀµµÄ´íÅä £¬ÑϳÁÏÞ¶ÈÁËÍÆËãÓëͨѶµÄ³ÁµþDZÁ¦ ¡£ ÏÂͼ 2 չʾÁË MPK ±àÒëÆ÷½« PyTorch ½ç˵µÄ LLM ÍÆËãͼת»¯ÎªÓÅ»¯Ï¸Á£¶È¹¤×÷ͼ £¬×î´ó»¯Â¶³ö²¢ÐÐÐÔ ¡£ÓÒ²àչʾ´ÎÓŹ滮 ¡ª¡ª ÆäÒýÈë²»ÓÃÒªµÄÊý¾ÝÒÀÀµÓëÈ«¾Ö·®Àé £¬µ¼Ö¿ç²ãÁ÷Ë®ÏßÓÅ»¯»úÓöÊÜÏÞ ¡£ ΪÏàʶ¾ö´ËÎÊÌâ £¬MPK ÒýÈëµÄ±àÒëÆ÷¿É½« LLM ÍÆËãͼ×Ô¶¯×ª»¯ÎªÏ¸Á£¶È¹¤×÷ͼ ¡£¸Ã¹¤×÷ͼÔÚ×ÓÄں˼¶±ðÏÔʽ²¶»ñÒÀÀµ¹ØÏµ £¬ÊµÏÖ¸ü¼¤½øµÄ¿ç²ãÁ÷Ë®ÏßÓÅ»¯ ¡£ ¹¤×÷£¨¾ØÐΰµÊ¾£© £¬´ú±í·ÖÅ䏸µ¥¸ö GPU Á÷ʽ¶à´¦ÖÃÆ÷£¨SM£©µÄÍÆËã / ͨѶµ¥Ôª ¡£ÊÂÎñ£¨Ô²ÐΰµÊ¾£© £¬°µÊ¾¹¤×÷¼äµÄͬ²½µã ¡£´¥·¢»úÔì £¬Ã¿¸ö¹¤×÷·¢³öÖ¸Ïò´¥·¢ÊÂÎñµÄ±ß £¬¸ÃÊÂÎñÔÚ¹ØÁª¹¤×÷È«ÊýʵÏֺ󼤻î ¡£ÒÀÀµ»úÔì £¬Ã¿¸ö¹¤×÷½Ó¹ÜÀ´×ÔÒÀÀµÊÂÎñµÄ±ß £¬Åú×¢ÊÂÎñ¼¤»îºó¹¤×÷Á¢¼´Æô¶¯ ¡£ ¹¤×÷ͼʹ MPK ¿ÉÄÜÍÚ¾òÍÆËãͼÖÐÎÞ·¨ÊµÏÖµÄ pipeline ÓÅ»¯»úÓö ¡£ÀýÈç £¬MPK Äܹ»¹¹½¨ÓÅ»¯¹¤×÷ͼ ¡ª¡ª ÆäÖÐÿ¸ö all-reduce ¹¤×÷½öÒÀÀµÓÚÌìÉúÆäÊäÈëµÄ¶ÔÓ¦ matmul ¹¤×÷ £¬´Ó¶øÊµÏÖ·Ö¿éÖ´ÐÐÓëÍÆËãͨѶ³Áµþ ¡£ MPK Ô̺¬ÄÚÖà GPU ÔËÐÐʱϵͳ £¬¿ÉÔÚµ¥¸ö GPU ¾ÞÐÍÄÚºËÄÚÆëȫִÐй¤×÷ͼ ¡£ÕâʹµÃϵͳÄÜÔÚÍÆÀí¹ý³ÌÖÐÎÞÐè¶î±íÄÚºËÆô¶¯µÄÇé¿öÏ £¬ÊµÏÖ¹¤×÷Ö´ÐÐÓëµ÷¶ÈµÄϸÁ£¶È½ÚÔì ¡£ »ñÈ¡¹¤×÷£º´Ó¶ÓÁÐÖÐÌáÈ¡ÏÂÒ»´ýÖ´Ðй¤×÷ ¡£Ö´ÐÐÍÆË㣺ÔËÐй¤×÷£¨Èç¾ØÕó³Ë·¨ / °ÑÎÈÁ¦»úÔì / GPU ¼äÊý¾Ý´«Ê䣩 ¡£ÊÂÎñ´¥·¢£º¹¤×÷ʵÏÖºó֪ͨ´¥·¢ÊÂÎñ ¡£Ñ­»·Ö´ÐУº³Á¸´ÉÏÊö¹ý³Ì ¡£ µ÷¶È¾ö²ßÓÉ MPK µÄÉ¢²¼Ê½µ÷¶Èµ¥Ôª´¦Öà £¬Ã¿¸öµ÷¶Èµ¥ÔªÔËÐÐÓÚµ¥¸öÏß³ÌÊø£¨warp£©ÉÏ ¡£ÓÉÓÚÿ¸öÁ÷ʽ¶à´¦ÖÃÆ÷£¨SM£©Äܹ»°üÈݶà¸öÏß³ÌÊø £¬Òò¶øµ¥ SM ×î¶à¿É²¢·¢ÔËÐÐ 4 ¸öµ÷¶Èµ¥Ôª ¡£Ã¿¸öµ÷¶Èµ¥ÔªÊØ»¤¼¤»îÊÂÎñ¶ÓÁÐ £¬²¢³ÖÐøÖ´ÐÐÒÔϲÙ×÷£º ÏÂͼ 3 չʾÁË MPK µÄÖ´Ðй¦·òÏß £¬ÆäÖÐÿ¸ö¾ØÐδú±íÒ»¸öÔÚ¹¤×÷µ¥ÔªÉÏÔËÐеŤ×÷ £»Ã¿¸öԲȦ´ú±íÒ»¸öÊÂÎñ ¡£µ±Ò»¸ö¹¤×÷ʵÏÖʱ £¬Ëü»áµÝÔöÆä¶ÔÓ¦´¥·¢ÊÂÎñµÄ¼ÆÊýÆ÷ ¡£µ±ÊÂÎñ¼ÆÊýÆ÷´ïµ½Ô¤ÉèãÐֵʱ £¬¸ÃÊÂÎñ±»ÊÓΪÒѼ¤»î £¬²¢±»²ÎÓëµ÷¶Èµ¥ÔªµÄÊÂÎñ¶ÓÁÐ ¡£Ëæºó £¬µ÷¶Èµ¥Ôª»áÆô¶¯ËùÓÐÒÀÀµÓÚ¸ÃÊÂÎñµÄÏÂÓι¤×÷ ¡£ ÓÉÓÚËùÓеĵ÷¶ÈºÍ¹¤×÷Çл»¶¼²úÉúÔÚµ¥Ò»Äں˸ߵÍÎÄÄÚ £¬¹¤×÷¼äµÄ¿ªÏú¼«µÍ £¬Í¨³£½öÐè 1-2 ΢Ãë £¬´Ó¶ø¿ÉÄܸßЧµØÖ´Ðжà²ã¡¢¶à GPU µÄ LLM ¹¤×÷¸ºÔØ ¡£ ÍÅ¶Ó¶Ô MPK µÄÔ¸¾°ÊÇʹ¾ÞÐÍÄں˱àÒë¼ÈÒ×ÓÚʹÓÃÓ־߱¸¸ß»úÄÜ ¡£Ä¿Ç° £¬ÄãÖ»Ð輸ʮÐÐ Python ´úÂë£¨ÖØÒªÓÃÓÚÖ¸¶¨¾ÞÐÍÄں˵ÄÊäÈëºÍÊä³ö£©¼´¿É½«Ò»¸ö LLM ±àÒë³ÉÒ»¸ö¾ÞÐÍÄÚºË ¡£´Ë·½ÏòÈÔÓÐÁÉÀ«µÄË÷Çó¿Õ¼ä £¬Ä¿Ç°ÔÚ»ý¼«¹¥¹ØµÄһЩ¹Ø¼üÁìÓòÔ̺¬ÈçÏ£º Ö§³ÖÏÖ´ú GPU ¼Ü¹¹ ¡£ÏÂÒ»¸öÀï³Ì±®Êǽ« MPK À©´óµ½Ö§³ÖÏÂÒ»´ú¼Ü¹¹ £¬ÀýÈç NVIDIA Blackwell ¡£Ò»¸öÖØÒªÌôÕ½ÔÚÓÚÈôºÎ½«Ïß³ÌÊø×¨Òµ»¯ £¬ÕâÊÇÐÂÐÍ GPU µÄÒ»Ïî¹Ø¼üÓÅ»¯¼¼Êõ £¬Óë MPK µÄ¾ÞÐÍÄÚºËÖ´ÐÐÄ£ÐÍÏ༯³É ¡£´¦Öù¤×÷¸ºÔض¯Ì¬ÐÔ ¡£MPK Ŀǰ¹¹½¨µÄÊǾ²Ì¬¹¤×÷ͼ £¬ÕâÏÞ¶ÈÁËËü´¦Öö¯Ì¬¹¤×÷¸ºÔØ£¨Èç MoE Ä£ÐÍ£©µÄÄÜÁ¦ ¡£ÍŶÓÔÚ¿ª·¢ÐµıàÒëÕ½Êõ £¬Ê¹ MPK ¿ÉÄÜÔÚ¾ÞÐÍÄÚºËÄÚ²¿Ö§³Ö¶¯Ì¬½ÚÔìÁ÷ºÍǰÌáÖ´ÐÐ ¡£¸ß¼¶µ÷¶Å×빤×÷·ÖÅä ¡£MPK ÔÚÖ°Îñ¼¶±ð½âËøÁËеÄϸÁ£¶Èµ÷¶ÈÄÜÁ¦ ¡£¹ÌÈ»µ±Ç°µÄʵÏÖʹÓõ¥Ò»µÄÂÖѯµ÷¶ÈÔÚÁ÷ʽ¶à´¦ÖÃÆ÷£¨SM£©Ö®¼ä·ÖÅ乤×÷ £¬µ«ÍŶӿ´µ½ÁËÔڸ߼¶µ÷¶ÈÕ½Êõ£¨ÈçÓÅÏȼ¶¸ÐÖª»òÍÌÍÂÁ¿ÓÅ»¯Õ½Êõ£©·½ÃæÁîÈËÐ˷ܵĻúÓö £¬¿ÉÀûÓÃÓÚÖîÈçÑÓ³¤·þÎñµÈ¼¶Ö¸±ê£¨SLO£©Çý¶¯µÄ·þÎñ»ò»ìºÏÅú´¦Öõȳ¡¾° ¡£ ÍŶÓÏàÐÅ £¬MPK ´ú±íÁËÔÚ GPU ÉϱàÒëºÍÖ´ÐÐ LLM ÍÆÀí¹¤×÷¸ºÔØ·½Ê½µÄµ××ÓÐÔת±ä £¬²¢ÈÈÇеȴýÓëÉçÇøºÏ×÷ £¬¹²Í¬Íƶ¯ÕâÒ»Ô¸¾°Ïòǰ·¢Õ¹ ¡£

爱液视频
爱液视频一看这片名估计不少观众会以为这是一部战争大片,但其实它英文片名直译是高压,讲述了盟军首席气象学家詹姆斯·斯塔格上尉根据天气决定登陆日期的故事,整部电影几乎都是文戏,对于内地观众来说有点无聊了,并且电影在北美也只有800来万美元票房。极目新闻记者也注意到,河北省气象台于今日13时18分发布冰雹橙色预警信号:预计未来6小时,保定中东部、雄安新区、廊坊、石家庄中东部、衡水北部、邢台北部等地的局地地区将受冰雹天气影响,请注意防范。爱液视频¡¶Ó×»Ê×Ó´ÓÓ×±»»ÊÐÖ¿ª·¢µÄÓ×˵¡·“因为我当然能理解这种干扰——俱乐部在争夺你,想要签下你,体育总监、经纪人、教练都想给你打电话,这当然是一种干扰,但这也是现实。“简单来说,目前伊布拉希莫维奇和卡尔迪纳莱是核心的决策者,也是负责重构俱乐部管理层架构的人。到目前为止,俱乐部还没有展现出一条完全清晰的发展道路。我可以肯定地告诉大家,米兰未来的体育总监约万-基罗夫斯基的地位目前是非常稳固的,今天我没有收到任何关于基罗夫斯基职位变动的消息。基罗夫斯基和兹拉坦-伊布拉希莫维奇的关系非常紧密,在伊布拉希莫维奇的构想当中,甚至一度产生过让基罗夫斯基直接出任一线队体育总监的想法。”
20260606 ? 爱液视频iOS 27方面,系统将为折叠屏iPhone做好准备,大概率引入类似iPad的“应用并排”多任务处理功能,支持APP自由调整窗口大小。该功能可能由折叠屏iPhone独享。接入Apple Intelligence的Siri将迎来重构,成为拥有独立APP的AI助手,界面类似ChatGPT等聊天应用。苹果还将推出名为“Extensions”的底层框架,使Apple Intelligence可接入Gemini、Claude等第三方云端大模型。相册将新增AI扩图、智能改善光影和清晰度等功能,且大概率在端侧实现。此外,iOS 26中备受争议的Liquid Glass动效将新增系统级透明度调节滑块,用户可自定义效果强度。不过,iPhone 11系列、第二代iPhone SE及更老机型大概率无法升级iOS 27。¡¶ÌìÃÀÐǿմóÏóMVÅÔ¹ÛÃâ·Ñ°Ù¶È¡·具体来看,DeepSeek-V4-Pro 模型的推理输入与推理输出价格均同步下调 75%,分别降至 0.003 元/千 tokens 和 0.006 元/千 tokens,其缓存命中价格则调整为 0.000025 元/千 tokens;同时,DeepSeek-V4-Flash 模型的缓存命中价格也迎来了 90% 的降幅,调整为 0.000025 元/千 tokens。
爱液视频
? À¹ó¼ÇÕß µË¹ãÔ´ Éã
20260606 ? 爱液视频本赛季过后,张镇麟和弗格冠军组合加盟上海首个赛季便成功夺冠。而两人CBA生涯至今的总冠军数量都来到4个(辽宁3个&上海1个)。¡¶ÄÚÒ°칫ÊÒ¡·周四早上,当我坐在爱丁堡机场的停机坪上时,消防车和消防员向我们疾驰而来。推送飞机的拖车冒着浓烟。我们得到保证飞机没有问题,但需要更换拖车。这会是一个预兆吗?我们的世界杯希望会再次化为泡影吗?
爱液视频
? Õ¼Èü»¨¼ÇÕß ²ñ»ª±ó Éã
? 模型本身是在进步的,MSA架构是真创新,长上下文推理效率是实打实提升了,三模态均衡(而且是原生多模态)这件事也确实是难的。¡¶ÐÄÓв»¸ÊPO(1V1)ÇéÍì±ÊȤ¸ó¡·
ɨһɨÔÚÊÖ»ú´ò¿ªµ±Ç°Ò³
¡¾ÍøÕ¾µØÍ¼¡¿