CA88

EN CA88(ÖйúÇø)Ψһ¹Ù·½ÍøÕ¾ CA88(ÖйúÇø)Ψһ¹Ù·½ÍøÕ¾
www.ahsjsjt.cn

公与媳妇ÉáÆúCUDA±à³Ì!CMUµÅ×ôúÂ뽫LLM±àÒë³É¾ÞÐÍÄÚºË,ÍÆÀíÑÓ³¤½µ6.7±¶

½üÈÕ £¬CMU ÖúÀí½ÌÊÚ¼ÖÖ¾ºÀ£¨Zhihao Jia£©ÍŶӴ´ÐÂÍæ·¨ £¬ÍƳöÁËÒ»¸öÃûΪ¡¸Mirage Persistent Kernel£¨MPK£©¡¹µÄ±àÒëÆ÷ £¬Äܹ»×Ô¶¯½« LLM ת»¯ÎªÓÅ»¯µÄ¾ÞÐÍÄںˣ¨megakernel£© £¬´Ó¶ø½« LLM ÍÆÀíÑÓ³¤½µµÍ 1.2 µ½ 6.7 ±¶ ¡£ ÔÚÕâÖÖÉè¼ÆÖÐ £¬ÏµÍ³½öÆô¶¯Ò»¸ö GPU ÄÚºËÀ´Ö´ÐÐÕû¸öÄ£ÐÍ ¡ª¡ª ´ÓÖð²ãÍÆËãµ½ GPU ¼äͨѶ ¡ª¡ª Õû¸ö¹ý³ÌÎÞÐèÖжÏ ¡£ÕâÖÖ²½ÖèÌṩÁËÒÔϼ¸¸ö¹Ø¼üµÄ»úÄÜÓÅÊÆ£º ½â³ýÄÚºËÆô¶¯¿ªÏú£ºÍ¨¹ýÔ¤·À³Á¸´µÄÄÚºËŲÓà £¬¼´±ãÊÇÔÚ¶à GPU »·¾³Ï £¬Ò²Äܽâ³ýÄÚºËÆô¶¯¿ªÏú£»ÊµÏÖ¿ç²ãÈí¼þ pipeline ÔÊÐíÄÚºËÔÚÍÆË㵱ǰ²ãµÄͬʱ £¬ÆðͷΪÏÂÒ»²ã¼ÓÔØÊý¾Ý£»³ÁµþÍÆËãÓëͨѶ£ºÓÉÓÚ¾ÞÐÍÄÚºËÄܹ»Í¬Ê±Ö´ÐÐÍÆËã²Ù×÷ºÍ GPU ¼äͨѶ £¬´Ó¶ø°µ²ØÍ¨Ñ¶ÑÓ³¤ ¡£ ÏÖÓеĸ߼¶ ML ¿ò¼Ü ¡ª¡ª Èç PyTorch¡¢Triton ºÍ TVM £¬ËüÃÇ×ÔÉí²¢²»Ö§³Ö¶Ëµ½¶Ë¾ÞÐÍÄÚºËÌìÉú ¡£´Ë±í £¬ÏÖ´ú LLM ϵͳÓɸ÷Àà·ÖÆçµÄרÓÃÄں˿⹹½¨¶ø³É£ºÓÃÓÚͨѶµÄ NCCL »ò NVSHMEM £¬ÓÃÓÚ¸ßЧ°ÑÎÈÁ¦ÍÆËãµÄ FlashInfer »ò FlashAttention £¬ÒÔ¼°ÓÃÓÚ×Ô½çËµÍÆËãµÄ CUDA »ò Triton ¡£ ÄÇôÄÜ·ñͨ¹ý±àÒë×Ô¶¯»¯Õâ¸ö¹ý³ÌÄØ£¿Êܵ½Õâ¸öÎÊÌâµÄÆô·¢ £¬À´×Ô CMU¡¢»ªÊ¢¶Ù´óѧ¡¢¼ÓÖÝ´óѧ²®¿ËÀû·ÖУ¡¢Ó¢Î°´ïºÍÇ廪´óѧµÄÍŶӿª·¢³öÁË MPK¡ª¡ª Ò»¸ö±àÒëÆ÷ºÍÔËÐÐʱϵͳ £¬ËüÄÜ×Ô¶¯½«¶à GPU µÄ LLM ÍÆÀíת»»Îª¸ß»úÄܵľÞÐÍÄÚºË ¡£MPK ¿ªÊÍÁ˶˵½¶Ë GPU ÈںϵÄЧÁ¦ÓÅÊÆ £¬Í¬Ê±Ö»±ØÒª¿ª·¢ÕßÖ§³ö¼«Ó×µÄÊÖ¶¯ÖÂÁ¦ ¡£ MPK µÄÒ»¸ö¹Ø¼üÓÅÊÆÔÚÓÚ£ºÍ¨¹ý½â³ýÄÚºËÆô¶¯¿ªÏú £¬²¢×î´óˮƽµØ³Áµþ¿ç²ãµÄÍÆËã¡¢Êý¾Ý¼ÓÔØºÍ GPU ¼äͨѶ £¬ÊµÏÖÁ˼«µÍµÄ LLM ÍÆÀíÑÓ³¤ ¡£ ³ýÁ˵¥ GPU ÓÅ»¯ £¬MPK »¹½«ÍÆËãÓë GPU ¼äͨѶÈںϽøÒ»¸öµ¥Ò»µÄ¾ÞÐÍÄÚºË ¡£ ÕâÖÖÉè¼ÆÊ¹µÃ MPK ¿ÉÄÜ×î´óˮƽµØ³ÁµþÍÆËãÓëͨѶ ¡£Òò¶ø £¬MPK Ïà¶ÔÓÚµ±Ç°ÏµÍ³µÄ»úÄÜÌáÉýËæ×Å GPU ÊýÁ¿µÄÔö³¤¶øÔö´ó £¬Ê¹ÆäÔÚ¶à GPU ²¿Ê𳡾°ÏÂÓÈΪ¸ßЧ ¡£ Part 1£ºMPK ±àÒëÆ÷ £¬Æä½« LLM µÄÍÆËãͼת»¯ÎªÓÅ»¯µÄ¹¤×÷ͼ£»Part 2£ºMPK ÔËÐÐʱϵͳ £¬¸ÃϵͳÔÚµ¥¸ö¾ÞÐÍÄÚºËÄÚÖ´Ðй¤×÷ͼ £¬ÒÔʵÏÖ¸ßÍÌÍÂÁ¿ÓëµÍÑÓ³¤ ¡£ LLM µÄÍÆËã¹ý³Ìͨ³£°µÊ¾ÎªÍÆËãͼ £¬ÆäÖÐÿ¸ö½Úµã¶ÔÓ¦Ò»¸öÍÆËãËã×Ó£¨Èç¾ØÕó³Ë·¨¡¢°ÑÎÈÁ¦»úÔ죩»ò¼¯ÖÐͨѶԭÓÈç all-reduce£© £¬±ß°µÊ¾Ëã×Ó¼äµÄÊý¾ÝÒÀÀµ¹ØÏµ ¡£ÏÖÓÐϵͳͨ³£ÎªÃ¿¸öËã×ÓÆô¶¯¶ÀÁ¢µÄ GPU ÄÚºË ¡£ È»¶ø £¬ÕâÖÖ¡¸µ¥Ëã×Óµ¥Äںˡ¹µÄÖ´ÐÐÄ£ÐÍÄÑÒÔʵÏÖ pipeline ÓÅ»¯ £¬ÓÉÓÚÒÀÀµ¹ØÏµÊÇÔÚÕû¸öÄں˵ĴÖÁ£¶È²ãÃæÇ¿ÔìÖ´ÐÐµÄ £¬¶ø·ÇÏÖʵÊý¾Ýµ¥Ôª²ãÃæ ¡£ µäÐͰ¸ÀýÈç¾ØÕó³Ë·¨£¨matmul£©ºó½Ó all-reduce ²Ù×÷£ºÏÖÓÐϵͳÖÐ £¬all-reduce Äں˱ØÐëÆÚ´ýÕû¸ö matmul ÄÚºËʵÏÖ ¡£¶øÏÖʵÉÏ £¬all-reduce µÄÿ¸öÊý¾Ý·Ö¿é½öÒÀÀµ matmul Êä³öµÄ²¿ÃÅÁ˾Ö ¡£ÕâÖÖÂß¼­ÒÀÀµÓëÏÖʵÒÀÀµµÄ´íÅä £¬ÑϳÁÏÞ¶ÈÁËÍÆËãÓëͨѶµÄ³ÁµþDZÁ¦ ¡£ ÏÂͼ 2 չʾÁË MPK ±àÒëÆ÷½« PyTorch ½ç˵µÄ LLM ÍÆËãͼת»¯ÎªÓÅ»¯Ï¸Á£¶È¹¤×÷ͼ £¬×î´ó»¯Â¶³ö²¢ÐÐÐÔ ¡£ÓÒ²àչʾ´ÎÓŹ滮 ¡ª¡ª ÆäÒýÈë²»ÓÃÒªµÄÊý¾ÝÒÀÀµÓëÈ«¾Ö·®Àé £¬µ¼Ö¿ç²ãÁ÷Ë®ÏßÓÅ»¯»úÓöÊÜÏÞ ¡£ ΪÏàʶ¾ö´ËÎÊÌâ £¬MPK ÒýÈëµÄ±àÒëÆ÷¿É½« LLM ÍÆËãͼ×Ô¶¯×ª»¯ÎªÏ¸Á£¶È¹¤×÷ͼ ¡£¸Ã¹¤×÷ͼÔÚ×ÓÄں˼¶±ðÏÔʽ²¶»ñÒÀÀµ¹ØÏµ £¬ÊµÏÖ¸ü¼¤½øµÄ¿ç²ãÁ÷Ë®ÏßÓÅ»¯ ¡£ ¹¤×÷£¨¾ØÐΰµÊ¾£© £¬´ú±í·ÖÅ䏸µ¥¸ö GPU Á÷ʽ¶à´¦ÖÃÆ÷£¨SM£©µÄÍÆËã / ͨѶµ¥Ôª ¡£ÊÂÎñ£¨Ô²ÐΰµÊ¾£© £¬°µÊ¾¹¤×÷¼äµÄͬ²½µã ¡£´¥·¢»úÔì £¬Ã¿¸ö¹¤×÷·¢³öÖ¸Ïò´¥·¢ÊÂÎñµÄ±ß £¬¸ÃÊÂÎñÔÚ¹ØÁª¹¤×÷È«ÊýʵÏֺ󼤻î ¡£ÒÀÀµ»úÔì £¬Ã¿¸ö¹¤×÷½Ó¹ÜÀ´×ÔÒÀÀµÊÂÎñµÄ±ß £¬Åú×¢ÊÂÎñ¼¤»îºó¹¤×÷Á¢¼´Æô¶¯ ¡£ ¹¤×÷ͼʹ MPK ¿ÉÄÜÍÚ¾òÍÆËãͼÖÐÎÞ·¨ÊµÏÖµÄ pipeline ÓÅ»¯»úÓö ¡£ÀýÈç £¬MPK Äܹ»¹¹½¨ÓÅ»¯¹¤×÷ͼ ¡ª¡ª ÆäÖÐÿ¸ö all-reduce ¹¤×÷½öÒÀÀµÓÚÌìÉúÆäÊäÈëµÄ¶ÔÓ¦ matmul ¹¤×÷ £¬´Ó¶øÊµÏÖ·Ö¿éÖ´ÐÐÓëÍÆËãͨѶ³Áµþ ¡£ MPK Ô̺¬ÄÚÖà GPU ÔËÐÐʱϵͳ £¬¿ÉÔÚµ¥¸ö GPU ¾ÞÐÍÄÚºËÄÚÆëȫִÐй¤×÷ͼ ¡£ÕâʹµÃϵͳÄÜÔÚÍÆÀí¹ý³ÌÖÐÎÞÐè¶î±íÄÚºËÆô¶¯µÄÇé¿öÏ £¬ÊµÏÖ¹¤×÷Ö´ÐÐÓëµ÷¶ÈµÄϸÁ£¶È½ÚÔì ¡£ »ñÈ¡¹¤×÷£º´Ó¶ÓÁÐÖÐÌáÈ¡ÏÂÒ»´ýÖ´Ðй¤×÷ ¡£Ö´ÐÐÍÆË㣺ÔËÐй¤×÷£¨Èç¾ØÕó³Ë·¨ / °ÑÎÈÁ¦»úÔì / GPU ¼äÊý¾Ý´«Ê䣩 ¡£ÊÂÎñ´¥·¢£º¹¤×÷ʵÏÖºó֪ͨ´¥·¢ÊÂÎñ ¡£Ñ­»·Ö´ÐУº³Á¸´ÉÏÊö¹ý³Ì ¡£ µ÷¶È¾ö²ßÓÉ MPK µÄÉ¢²¼Ê½µ÷¶Èµ¥Ôª´¦Öà £¬Ã¿¸öµ÷¶Èµ¥ÔªÔËÐÐÓÚµ¥¸öÏß³ÌÊø£¨warp£©ÉÏ ¡£ÓÉÓÚÿ¸öÁ÷ʽ¶à´¦ÖÃÆ÷£¨SM£©Äܹ»°üÈݶà¸öÏß³ÌÊø £¬Òò¶øµ¥ SM ×î¶à¿É²¢·¢ÔËÐÐ 4 ¸öµ÷¶Èµ¥Ôª ¡£Ã¿¸öµ÷¶Èµ¥ÔªÊØ»¤¼¤»îÊÂÎñ¶ÓÁÐ £¬²¢³ÖÐøÖ´ÐÐÒÔϲÙ×÷£º ÏÂͼ 3 չʾÁË MPK µÄÖ´Ðй¦·òÏß £¬ÆäÖÐÿ¸ö¾ØÐδú±íÒ»¸öÔÚ¹¤×÷µ¥ÔªÉÏÔËÐеŤ×÷£»Ã¿¸öԲȦ´ú±íÒ»¸öÊÂÎñ ¡£µ±Ò»¸ö¹¤×÷ʵÏÖʱ £¬Ëü»áµÝÔöÆä¶ÔÓ¦´¥·¢ÊÂÎñµÄ¼ÆÊýÆ÷ ¡£µ±ÊÂÎñ¼ÆÊýÆ÷´ïµ½Ô¤ÉèãÐֵʱ £¬¸ÃÊÂÎñ±»ÊÓΪÒѼ¤»î £¬²¢±»²ÎÓëµ÷¶Èµ¥ÔªµÄÊÂÎñ¶ÓÁÐ ¡£Ëæºó £¬µ÷¶Èµ¥Ôª»áÆô¶¯ËùÓÐÒÀÀµÓÚ¸ÃÊÂÎñµÄÏÂÓι¤×÷ ¡£ ÓÉÓÚËùÓеĵ÷¶ÈºÍ¹¤×÷Çл»¶¼²úÉúÔÚµ¥Ò»Äں˸ߵÍÎÄÄÚ £¬¹¤×÷¼äµÄ¿ªÏú¼«µÍ £¬Í¨³£½öÐè 1-2 ΢Ãë £¬´Ó¶ø¿ÉÄܸßЧµØÖ´Ðжà²ã¡¢¶à GPU µÄ LLM ¹¤×÷¸ºÔØ ¡£ ÍÅ¶Ó¶Ô MPK µÄÔ¸¾°ÊÇʹ¾ÞÐÍÄں˱àÒë¼ÈÒ×ÓÚʹÓÃÓ־߱¸¸ß»úÄÜ ¡£Ä¿Ç° £¬ÄãÖ»Ð輸ʮÐÐ Python ´úÂë£¨ÖØÒªÓÃÓÚÖ¸¶¨¾ÞÐÍÄں˵ÄÊäÈëºÍÊä³ö£©¼´¿É½«Ò»¸ö LLM ±àÒë³ÉÒ»¸ö¾ÞÐÍÄÚºË ¡£´Ë·½ÏòÈÔÓÐÁÉÀ«µÄË÷Çó¿Õ¼ä £¬Ä¿Ç°ÔÚ»ý¼«¹¥¹ØµÄһЩ¹Ø¼üÁìÓòÔ̺¬ÈçÏ£º Ö§³ÖÏÖ´ú GPU ¼Ü¹¹ ¡£ÏÂÒ»¸öÀï³Ì±®Êǽ« MPK À©´óµ½Ö§³ÖÏÂÒ»´ú¼Ü¹¹ £¬ÀýÈç NVIDIA Blackwell ¡£Ò»¸öÖØÒªÌôÕ½ÔÚÓÚÈôºÎ½«Ïß³ÌÊø×¨Òµ»¯ £¬ÕâÊÇÐÂÐÍ GPU µÄÒ»Ïî¹Ø¼üÓÅ»¯¼¼Êõ £¬Óë MPK µÄ¾ÞÐÍÄÚºËÖ´ÐÐÄ£ÐÍÏ༯³É ¡£´¦Öù¤×÷¸ºÔض¯Ì¬ÐÔ ¡£MPK Ŀǰ¹¹½¨µÄÊǾ²Ì¬¹¤×÷ͼ £¬ÕâÏÞ¶ÈÁËËü´¦Öö¯Ì¬¹¤×÷¸ºÔØ£¨Èç MoE Ä£ÐÍ£©µÄÄÜÁ¦ ¡£ÍŶÓÔÚ¿ª·¢ÐµıàÒëÕ½Êõ £¬Ê¹ MPK ¿ÉÄÜÔÚ¾ÞÐÍÄÚºËÄÚ²¿Ö§³Ö¶¯Ì¬½ÚÔìÁ÷ºÍǰÌáÖ´ÐÐ ¡£¸ß¼¶µ÷¶Å×빤×÷·ÖÅä ¡£MPK ÔÚÖ°Îñ¼¶±ð½âËøÁËеÄϸÁ£¶Èµ÷¶ÈÄÜÁ¦ ¡£¹ÌÈ»µ±Ç°µÄʵÏÖʹÓõ¥Ò»µÄÂÖѯµ÷¶ÈÔÚÁ÷ʽ¶à´¦ÖÃÆ÷£¨SM£©Ö®¼ä·ÖÅ乤×÷ £¬µ«ÍŶӿ´µ½ÁËÔڸ߼¶µ÷¶ÈÕ½Êõ£¨ÈçÓÅÏȼ¶¸ÐÖª»òÍÌÍÂÁ¿ÓÅ»¯Õ½Êõ£©·½ÃæÁîÈËÐ˷ܵĻúÓö £¬¿ÉÀûÓÃÓÚÖîÈçÑÓ³¤·þÎñµÈ¼¶Ö¸±ê£¨SLO£©Çý¶¯µÄ·þÎñ»ò»ìºÏÅú´¦Öõȳ¡¾° ¡£ ÍŶÓÏàÐÅ £¬MPK ´ú±íÁËÔÚ GPU ÉϱàÒëºÍÖ´ÐÐ LLM ÍÆÀí¹¤×÷¸ºÔØ·½Ê½µÄµ××ÓÐÔת±ä £¬²¢ÈÈÇеȴýÓëÉçÇøºÏ×÷ £¬¹²Í¬Íƶ¯ÕâÒ»Ô¸¾°Ïòǰ·¢Õ¹ ¡£

公与媳妇
公与媳妇现场,鼎捷数智重磅发布两大核心成果——《未来企业白皮书》与企业智能运行空间(EIOSpace),为制造企业数智化转型构建了“理论指引+落地载体”的完整闭环路径。两者互为支撑、相辅相成,共同破解企业AI转型“看不清方向、落不了实地”的双重困境,为产业转型提供清晰指引。作为造车新手,小米产品矩阵的单一性,也制约了汽车业务的盈利能力。目前小米汽车仅有SU7、YU7两款车型,且价格带存在重叠。相比之下,比亚迪已形成“轿车+SUV+MPV”的多品类矩阵,蔚来、理想也在快速扩充产品线。公与媳妇¡¶¡¶°Ý±ðºó»¹²öǰÄÐÓÑBYÊݰ¡ÊÝ¡·ÊÓÆµ¡·而反对党认为,这是政府“失败的证明”。莫迪的呼吁恰好发生在印度关键邦选举结束几天后,执政党印度人民党首次在西孟加拉邦议会选举中取得压倒性胜利。反对党国大党主席马利卡尔琼·卡尔格在社交媒体上写道,中东冲突最初爆发时莫迪只顾地方选举,一再声称“局势尽在掌控”,“如今选举结束了,国民却要开始听到说教——不要做这个、不要买那个”。谭镒良还注意到,市面上的“上头电子烟”多来自非法小作坊私下加工,一些人为了增强上头感,会将安定类、大麻类甚至来源不明的兴奋性物质直接掺进烟油。赵昀通常从多个卖家购买替来他明电子烟,他发现每家的“味道”都有所差别。
20260604 ? 公与媳妇杜祥琬还主持并参与了关于中国能源发展战略和应对气候变化的咨询研究工作,担任国家能源专家咨询委员会副主任和国家气候变化专家委员会主任。ÂÖµ½ÄãÁËÃÃÃÃÈ«¼¯ÅÔ¹Û埃里克今年已经证明了很多。他踢过边后卫、中后卫、后腰……是一名非常全面、水平也很高的球员。我很高兴他能入选,而且我对他也有一种特别的感情。
公与媳妇
? «Á¢¿ü¼ÇÕß ÍõѧÎä Éã
20260604 ? 公与媳妇主审法官强调,原告及父母这种恶意规避责任、滥用司法资源的行为,不仅扰乱了平台秩序,也增加了法院甄别真实诉求的难度,恶意虚假诉讼还将承担严重的法律后果。ÀֿɽðÒø»¨Â¶È«ÎÄÔĶÁ当地时间周日上午,每位季票持有者都将通过自己的票务账户免费获得一张入场门票。此外,俱乐部还将向公众公开销售部分门票。
公与媳妇
? ³¼ªÁÖ¼ÇÕß Òü°²Ã÷ Éã
? “最新发生的这一系列事件,让人对通过外交途径达成解决方案的条件是否已经成熟产生更多疑虑。不过,美伊目前似乎都无意重新卷入全面战争。”美国中东研究所高级研究员布莱恩·卡图利斯对《国会山报》表示,“我们或许正面临一个漫长、炎热且充满变数的夏季。在此期间,美伊将陷入意志拉锯,定点军事打击与一轮又一轮的外交谈判交替上演。”¡¶×â½èÅ®ÓÑ¡·¶¯ÂþµÚ¶þ¼¾
ɨһɨÔÚÊÖ»ú´ò¿ªµ±Ç°Ò³
¡¾ÍøÕ¾µØÍ¼¡¿