CA88

EN CA88(ÖйúÇø)Ψһ¹Ù·½ÍøÕ¾ CA88(ÖйúÇø)Ψһ¹Ù·½ÍøÕ¾
www.ahsjsjt.cn

17c.COMÉáÆúCUDA±à³Ì!CMUµÅ×ôúÂ뽫LLM±àÒë³É¾ÞÐÍÄÚºË,ÍÆÀíÑÓ³¤½µ6.7±¶

½üÈÕ£¬CMU ÖúÀí½ÌÊÚ¼ÖÖ¾ºÀ£¨Zhihao Jia£©ÍŶӴ´ÐÂÍæ·¨£¬ÍƳöÁËÒ»¸öÃûΪ¡¸Mirage Persistent Kernel£¨MPK£©¡¹µÄ±àÒëÆ÷£¬Äܹ»×Ô¶¯½« LLM ת»¯ÎªÓÅ»¯µÄ¾ÞÐÍÄںˣ¨megakernel£©£¬´Ó¶ø½« LLM ÍÆÀíÑÓ³¤½µµÍ 1.2 µ½ 6.7 ±¶ ¡£ ÔÚÕâÖÖÉè¼ÆÖУ¬ÏµÍ³½öÆô¶¯Ò»¸ö GPU ÄÚºËÀ´Ö´ÐÐÕû¸öÄ£ÐÍ ¡ª¡ª ´ÓÖð²ãÍÆËãµ½ GPU ¼äͨѶ ¡ª¡ª Õû¸ö¹ý³ÌÎÞÐèÖжÏ ¡£ÕâÖÖ²½ÖèÌṩÁËÒÔϼ¸¸ö¹Ø¼üµÄ»úÄÜÓÅÊÆ£º ½â³ýÄÚºËÆô¶¯¿ªÏú£ºÍ¨¹ýÔ¤·À³Á¸´µÄÄÚºËŲÓ㬼´±ãÊÇÔÚ¶à GPU »·¾³Ï£¬Ò²Äܽâ³ýÄÚºËÆô¶¯¿ªÏú£»ÊµÏÖ¿ç²ãÈí¼þ pipeline ÔÊÐíÄÚºËÔÚÍÆË㵱ǰ²ãµÄͬʱ£¬ÆðͷΪÏÂÒ»²ã¼ÓÔØÊý¾Ý£»³ÁµþÍÆËãÓëͨѶ£ºÓÉÓÚ¾ÞÐÍÄÚºËÄܹ»Í¬Ê±Ö´ÐÐÍÆËã²Ù×÷ºÍ GPU ¼äͨѶ£¬´Ó¶ø°µ²ØÍ¨Ñ¶ÑÓ³¤ ¡£ ÏÖÓеĸ߼¶ ML ¿ò¼Ü ¡ª¡ª Èç PyTorch¡¢Triton ºÍ TVM£¬ËüÃÇ×ÔÉí²¢²»Ö§³Ö¶Ëµ½¶Ë¾ÞÐÍÄÚºËÌìÉú ¡£´Ë±í£¬ÏÖ´ú LLM ϵͳÓɸ÷Àà·ÖÆçµÄרÓÃÄں˿⹹½¨¶ø³É£ºÓÃÓÚͨѶµÄ NCCL »ò NVSHMEM£¬ÓÃÓÚ¸ßЧ°ÑÎÈÁ¦ÍÆËãµÄ FlashInfer »ò FlashAttention£¬ÒÔ¼°ÓÃÓÚ×Ô½çËµÍÆËãµÄ CUDA »ò Triton ¡£ ÄÇôÄÜ·ñͨ¹ý±àÒë×Ô¶¯»¯Õâ¸ö¹ý³ÌÄØ£¿Êܵ½Õâ¸öÎÊÌâµÄÆô·¢£¬À´×Ô CMU¡¢»ªÊ¢¶Ù´óѧ¡¢¼ÓÖÝ´óѧ²®¿ËÀû·ÖУ¡¢Ó¢Î°´ïºÍÇ廪´óѧµÄÍŶӿª·¢³öÁË MPK¡ª¡ª Ò»¸ö±àÒëÆ÷ºÍÔËÐÐʱϵͳ£¬ËüÄÜ×Ô¶¯½«¶à GPU µÄ LLM ÍÆÀíת»»Îª¸ß»úÄܵľÞÐÍÄÚºË ¡£MPK ¿ªÊÍÁ˶˵½¶Ë GPU ÈںϵÄЧÁ¦ÓÅÊÆ£¬Í¬Ê±Ö»±ØÒª¿ª·¢ÕßÖ§³ö¼«Ó×µÄÊÖ¶¯ÖÂÁ¦ ¡£ MPK µÄÒ»¸ö¹Ø¼üÓÅÊÆÔÚÓÚ£ºÍ¨¹ý½â³ýÄÚºËÆô¶¯¿ªÏú£¬²¢×î´óˮƽµØ³Áµþ¿ç²ãµÄÍÆËã¡¢Êý¾Ý¼ÓÔØºÍ GPU ¼äͨѶ£¬ÊµÏÖÁ˼«µÍµÄ LLM ÍÆÀíÑÓ³¤ ¡£ ³ýÁ˵¥ GPU ÓÅ»¯£¬MPK »¹½«ÍÆËãÓë GPU ¼äͨѶÈںϽøÒ»¸öµ¥Ò»µÄ¾ÞÐÍÄÚºË ¡£ ÕâÖÖÉè¼ÆÊ¹µÃ MPK ¿ÉÄÜ×î´óˮƽµØ³ÁµþÍÆËãÓëͨѶ ¡£Òò¶ø£¬MPK Ïà¶ÔÓÚµ±Ç°ÏµÍ³µÄ»úÄÜÌáÉýËæ×Å GPU ÊýÁ¿µÄÔö³¤¶øÔö´ó£¬Ê¹ÆäÔÚ¶à GPU ²¿Ê𳡾°ÏÂÓÈΪ¸ßЧ ¡£ Part 1£ºMPK ±àÒëÆ÷£¬Æä½« LLM µÄÍÆËãͼת»¯ÎªÓÅ»¯µÄ¹¤×÷ͼ£»Part 2£ºMPK ÔËÐÐʱϵͳ£¬¸ÃϵͳÔÚµ¥¸ö¾ÞÐÍÄÚºËÄÚÖ´Ðй¤×÷ͼ£¬ÒÔʵÏÖ¸ßÍÌÍÂÁ¿ÓëµÍÑÓ³¤ ¡£ LLM µÄÍÆËã¹ý³Ìͨ³£°µÊ¾ÎªÍÆËãͼ£¬ÆäÖÐÿ¸ö½Úµã¶ÔÓ¦Ò»¸öÍÆËãËã×Ó£¨Èç¾ØÕó³Ë·¨¡¢°ÑÎÈÁ¦»úÔ죩»ò¼¯ÖÐͨѶԭÓÈç all-reduce£©£¬±ß°µÊ¾Ëã×Ó¼äµÄÊý¾ÝÒÀÀµ¹ØÏµ ¡£ÏÖÓÐϵͳͨ³£ÎªÃ¿¸öËã×ÓÆô¶¯¶ÀÁ¢µÄ GPU ÄÚºË ¡£ È»¶ø£¬ÕâÖÖ¡¸µ¥Ëã×Óµ¥Äںˡ¹µÄÖ´ÐÐÄ£ÐÍÄÑÒÔʵÏÖ pipeline ÓÅ»¯£¬ÓÉÓÚÒÀÀµ¹ØÏµÊÇÔÚÕû¸öÄں˵ĴÖÁ£¶È²ãÃæÇ¿ÔìÖ´ÐеÄ£¬¶ø·ÇÏÖʵÊý¾Ýµ¥Ôª²ãÃæ ¡£ µäÐͰ¸ÀýÈç¾ØÕó³Ë·¨£¨matmul£©ºó½Ó all-reduce ²Ù×÷£ºÏÖÓÐϵͳÖУ¬all-reduce Äں˱ØÐëÆÚ´ýÕû¸ö matmul ÄÚºËʵÏÖ ¡£¶øÏÖʵÉÏ£¬all-reduce µÄÿ¸öÊý¾Ý·Ö¿é½öÒÀÀµ matmul Êä³öµÄ²¿ÃÅÁ˾Ö ¡£ÕâÖÖÂß¼­ÒÀÀµÓëÏÖʵÒÀÀµµÄ´íÅ䣬ÑϳÁÏÞ¶ÈÁËÍÆËãÓëͨѶµÄ³ÁµþDZÁ¦ ¡£ ÏÂͼ 2 չʾÁË MPK ±àÒëÆ÷½« PyTorch ½ç˵µÄ LLM ÍÆËãͼת»¯ÎªÓÅ»¯Ï¸Á£¶È¹¤×÷ͼ£¬×î´ó»¯Â¶³ö²¢ÐÐÐÔ ¡£ÓÒ²àչʾ´ÎÓŹ滮 ¡ª¡ª ÆäÒýÈë²»ÓÃÒªµÄÊý¾ÝÒÀÀµÓëÈ«¾Ö·®À飬µ¼Ö¿ç²ãÁ÷Ë®ÏßÓÅ»¯»úÓöÊÜÏÞ ¡£ ΪÏàʶ¾ö´ËÎÊÌ⣬MPK ÒýÈëµÄ±àÒëÆ÷¿É½« LLM ÍÆËãͼ×Ô¶¯×ª»¯ÎªÏ¸Á£¶È¹¤×÷ͼ ¡£¸Ã¹¤×÷ͼÔÚ×ÓÄں˼¶±ðÏÔʽ²¶»ñÒÀÀµ¹ØÏµ£¬ÊµÏÖ¸ü¼¤½øµÄ¿ç²ãÁ÷Ë®ÏßÓÅ»¯ ¡£ ¹¤×÷£¨¾ØÐΰµÊ¾£©£¬´ú±í·ÖÅ䏸µ¥¸ö GPU Á÷ʽ¶à´¦ÖÃÆ÷£¨SM£©µÄÍÆËã / ͨѶµ¥Ôª ¡£ÊÂÎñ£¨Ô²ÐΰµÊ¾£©£¬°µÊ¾¹¤×÷¼äµÄͬ²½µã ¡£´¥·¢»úÔ죬ÿ¸ö¹¤×÷·¢³öÖ¸Ïò´¥·¢ÊÂÎñµÄ±ß£¬¸ÃÊÂÎñÔÚ¹ØÁª¹¤×÷È«ÊýʵÏֺ󼤻î ¡£ÒÀÀµ»úÔ죬ÿ¸ö¹¤×÷½Ó¹ÜÀ´×ÔÒÀÀµÊÂÎñµÄ±ß£¬Åú×¢ÊÂÎñ¼¤»îºó¹¤×÷Á¢¼´Æô¶¯ ¡£ ¹¤×÷ͼʹ MPK ¿ÉÄÜÍÚ¾òÍÆËãͼÖÐÎÞ·¨ÊµÏÖµÄ pipeline ÓÅ»¯»úÓö ¡£ÀýÈ磬MPK Äܹ»¹¹½¨ÓÅ»¯¹¤×÷ͼ ¡ª¡ª ÆäÖÐÿ¸ö all-reduce ¹¤×÷½öÒÀÀµÓÚÌìÉúÆäÊäÈëµÄ¶ÔÓ¦ matmul ¹¤×÷£¬´Ó¶øÊµÏÖ·Ö¿éÖ´ÐÐÓëÍÆËãͨѶ³Áµþ ¡£ MPK Ô̺¬ÄÚÖà GPU ÔËÐÐʱϵͳ£¬¿ÉÔÚµ¥¸ö GPU ¾ÞÐÍÄÚºËÄÚÆëȫִÐй¤×÷ͼ ¡£ÕâʹµÃϵͳÄÜÔÚÍÆÀí¹ý³ÌÖÐÎÞÐè¶î±íÄÚºËÆô¶¯µÄÇé¿öÏ£¬ÊµÏÖ¹¤×÷Ö´ÐÐÓëµ÷¶ÈµÄϸÁ£¶È½ÚÔì ¡£ »ñÈ¡¹¤×÷£º´Ó¶ÓÁÐÖÐÌáÈ¡ÏÂÒ»´ýÖ´Ðй¤×÷ ¡£Ö´ÐÐÍÆË㣺ÔËÐй¤×÷£¨Èç¾ØÕó³Ë·¨ / °ÑÎÈÁ¦»úÔì / GPU ¼äÊý¾Ý´«Ê䣩 ¡£ÊÂÎñ´¥·¢£º¹¤×÷ʵÏÖºó֪ͨ´¥·¢ÊÂÎñ ¡£Ñ­»·Ö´ÐУº³Á¸´ÉÏÊö¹ý³Ì ¡£ µ÷¶È¾ö²ßÓÉ MPK µÄÉ¢²¼Ê½µ÷¶Èµ¥Ôª´¦Öã¬Ã¿¸öµ÷¶Èµ¥ÔªÔËÐÐÓÚµ¥¸öÏß³ÌÊø£¨warp£©ÉÏ ¡£ÓÉÓÚÿ¸öÁ÷ʽ¶à´¦ÖÃÆ÷£¨SM£©Äܹ»°üÈݶà¸öÏß³ÌÊø£¬Òò¶øµ¥ SM ×î¶à¿É²¢·¢ÔËÐÐ 4 ¸öµ÷¶Èµ¥Ôª ¡£Ã¿¸öµ÷¶Èµ¥ÔªÊØ»¤¼¤»îÊÂÎñ¶ÓÁУ¬²¢³ÖÐøÖ´ÐÐÒÔϲÙ×÷£º ÏÂͼ 3 չʾÁË MPK µÄÖ´Ðй¦·òÏߣ¬ÆäÖÐÿ¸ö¾ØÐδú±íÒ»¸öÔÚ¹¤×÷µ¥ÔªÉÏÔËÐеŤ×÷£»Ã¿¸öԲȦ´ú±íÒ»¸öÊÂÎñ ¡£µ±Ò»¸ö¹¤×÷ʵÏÖʱ£¬Ëü»áµÝÔöÆä¶ÔÓ¦´¥·¢ÊÂÎñµÄ¼ÆÊýÆ÷ ¡£µ±ÊÂÎñ¼ÆÊýÆ÷´ïµ½Ô¤ÉèãÐֵʱ£¬¸ÃÊÂÎñ±»ÊÓΪÒѼ¤»î£¬²¢±»²ÎÓëµ÷¶Èµ¥ÔªµÄÊÂÎñ¶ÓÁÐ ¡£Ëæºó£¬µ÷¶Èµ¥Ôª»áÆô¶¯ËùÓÐÒÀÀµÓÚ¸ÃÊÂÎñµÄÏÂÓι¤×÷ ¡£ ÓÉÓÚËùÓеĵ÷¶ÈºÍ¹¤×÷Çл»¶¼²úÉúÔÚµ¥Ò»Äں˸ߵÍÎÄÄÚ£¬¹¤×÷¼äµÄ¿ªÏú¼«µÍ£¬Í¨³£½öÐè 1-2 ΢Ã룬´Ó¶ø¿ÉÄܸßЧµØÖ´Ðжà²ã¡¢¶à GPU µÄ LLM ¹¤×÷¸ºÔØ ¡£ ÍÅ¶Ó¶Ô MPK µÄÔ¸¾°ÊÇʹ¾ÞÐÍÄں˱àÒë¼ÈÒ×ÓÚʹÓÃÓ־߱¸¸ß»úÄÜ ¡£Ä¿Ç°£¬ÄãÖ»Ð輸ʮÐÐ Python ´úÂë£¨ÖØÒªÓÃÓÚÖ¸¶¨¾ÞÐÍÄں˵ÄÊäÈëºÍÊä³ö£©¼´¿É½«Ò»¸ö LLM ±àÒë³ÉÒ»¸ö¾ÞÐÍÄÚºË ¡£´Ë·½ÏòÈÔÓÐÁÉÀ«µÄË÷Çó¿Õ¼ä£¬Ä¿Ç°ÔÚ»ý¼«¹¥¹ØµÄһЩ¹Ø¼üÁìÓòÔ̺¬ÈçÏ£º Ö§³ÖÏÖ´ú GPU ¼Ü¹¹ ¡£ÏÂÒ»¸öÀï³Ì±®Êǽ« MPK À©´óµ½Ö§³ÖÏÂÒ»´ú¼Ü¹¹£¬ÀýÈç NVIDIA Blackwell ¡£Ò»¸öÖØÒªÌôÕ½ÔÚÓÚÈôºÎ½«Ïß³ÌÊø×¨Òµ»¯£¬ÕâÊÇÐÂÐÍ GPU µÄÒ»Ïî¹Ø¼üÓÅ»¯¼¼Êõ£¬Óë MPK µÄ¾ÞÐÍÄÚºËÖ´ÐÐÄ£ÐÍÏ༯³É ¡£´¦Öù¤×÷¸ºÔض¯Ì¬ÐÔ ¡£MPK Ŀǰ¹¹½¨µÄÊǾ²Ì¬¹¤×÷ͼ£¬ÕâÏÞ¶ÈÁËËü´¦Öö¯Ì¬¹¤×÷¸ºÔØ£¨Èç MoE Ä£ÐÍ£©µÄÄÜÁ¦ ¡£ÍŶÓÔÚ¿ª·¢ÐµıàÒëÕ½Êõ£¬Ê¹ MPK ¿ÉÄÜÔÚ¾ÞÐÍÄÚºËÄÚ²¿Ö§³Ö¶¯Ì¬½ÚÔìÁ÷ºÍǰÌáÖ´ÐÐ ¡£¸ß¼¶µ÷¶Å×빤×÷·ÖÅä ¡£MPK ÔÚÖ°Îñ¼¶±ð½âËøÁËеÄϸÁ£¶Èµ÷¶ÈÄÜÁ¦ ¡£¹ÌÈ»µ±Ç°µÄʵÏÖʹÓõ¥Ò»µÄÂÖѯµ÷¶ÈÔÚÁ÷ʽ¶à´¦ÖÃÆ÷£¨SM£©Ö®¼ä·ÖÅ乤×÷£¬µ«ÍŶӿ´µ½ÁËÔڸ߼¶µ÷¶ÈÕ½Êõ£¨ÈçÓÅÏȼ¶¸ÐÖª»òÍÌÍÂÁ¿ÓÅ»¯Õ½Êõ£©·½ÃæÁîÈËÐ˷ܵĻúÓö£¬¿ÉÀûÓÃÓÚÖîÈçÑÓ³¤·þÎñµÈ¼¶Ö¸±ê£¨SLO£©Çý¶¯µÄ·þÎñ»ò»ìºÏÅú´¦Öõȳ¡¾° ¡£ ÍŶÓÏàÐÅ£¬MPK ´ú±íÁËÔÚ GPU ÉϱàÒëºÍÖ´ÐÐ LLM ÍÆÀí¹¤×÷¸ºÔØ·½Ê½µÄµ××ÓÐÔת±ä£¬²¢ÈÈÇеȴýÓëÉçÇøºÏ×÷£¬¹²Í¬Íƶ¯ÕâÒ»Ô¸¾°Ïòǰ·¢Õ¹ ¡£

17c.COM
17c.COM【环球网科技综合报道】6月3日消息,据AOL报道,社交媒体巨头 Meta 针对备受争议的员工办公设备行为数据采集项目作出优化调整,在员工普遍提出异议后,推出数据采集临时暂停、项目豁免申请等新管控措施,进一步完善相关数据收集规则。在“就地保护为主、异地保护为辅、野化放归扩群、政府社会协同、人鸟和谐共生”的科学保护体系下,拯救朱鹮的奇迹,在这个约40万人的县城里,随时上演。17c.COM¡¶±¿²®¼ÑÈËÕÛ»¨¼ÇÍøÅÌ¡·6月1日,有八卦自媒体曝曝张纪中在2016年与前妻樊馨蔓离婚分割前,将两套豪宅过户给张纪中现在的妻子杜星霖,称“张纪中婚内疑似转移夫妻共同财产的一系列操作,包括两套千万级海外豪宅,全都在离婚关键期悄悄转给现任杜星霖,第一套是在2012年购入的洛杉矶房产,恰逢张纪中常年在美国,与樊馨蔓两人关系冷漠。这套房子在2015年紧急挂牌出售,卡点时机十分微妙。第二套豪宅依旧是婚内购买,2014年张纪中以单身身份在美国豪掷375万美元拿下美国圣迭戈富人区顶级豪宅。眼看离婚官司临近,2016年4月18日张纪中一天之内火速完成两次过户:先把房子变成自己和杜星霖共有,紧接着直接全额过户到杜星霖一人名下。两套房产全部是婚姻存续期间购入,理所应当属于夫妻共同财产。张纪中却全都在离婚分割前夕完成转移,彻底避开财产分割……”另外,美国现货比特币ETF遭遇大规模的资金流出,投资者连续11个交易日共撤出约34.5亿美元(约合人民币233亿元)资金。数据提供商SoSoValue的数据显示,自2024年1月这些基金推出以来,此次抛售的周期最长,超过了2025年2月创下的连续8个交易日赎回纪录。
20260606 ? 17c.COM李徽徽不认为英伟达、微软、苹果被真正冷落了,更准确地说,是市场在从“买确定性龙头”转向“买边际变化更大的环节”。过去两年,英伟达是AI资本开支的最大受益者,微软是AI商业化最清晰的巨头,苹果则是消费电子和端侧AI预期的代表。但到2026年这个位置,市场会自然追问:谁的业绩还能继续上修?谁的估值里还有预期差?所以资金短期转向存储、PCB、CPO、光模块、液冷、电力设备,并不奇怪。因为这些环节过去被低估,现在突然变成AI算力基础设施的瓶颈。资本市场喜欢瓶颈,瓶颈意味着议价权、涨价能力和盈利弹性。¡¶¡¶ÎҵĽã½ã¡·¶¯ÂþÈ«¼¯¡·从智力到行动的跃迁指向一个清晰的产业趋势:AI正在从对话工具进化为行动主体。同样100万个词元的价值密度在阶梯式攀升。推理阶段,它是一次深度分析的“电费”;行动阶段,它可能对应一次价值数千元的工程交付。词元不再只是API的计量单位,而是驱动智能经济运转的基础要素。
17c.COM
? ÑîÇàÃ÷¼ÇÕß ¹Ø¸£¾ý Éã
20260606 ? 17c.COM但《星期日卫报》调查发现,没有证据表明有一项已敲定并获得批准的特斯拉印度工厂计划被取消。《金融快报》引述政府消息人士的话报道称,库马拉斯瓦米并未就特斯拉在印度的建厂计划发表过此类声明。然而,两家印度媒体都在报道中表示,特斯拉在印度设厂进展出现停滞,“电动汽车巨头在印度制造的意向处于搁置状态”。¡¶Ô¶³Ì¹«½»ÐíÈïÓ×˵ȫÎÄÃâ·ÑÔĶÁ°Ù¶È¡·据长安测算,整合后,可降低20%-30%的成本。随着行业竞争进入深水区,“降本”可作为对抗上游成本涨价的缓冲垫,助力车企守住利润的底线。当行业增速放缓,先控住成本、活下来,比盲目冲规模、抢份额显然更重要。
17c.COM
? µËÏò»Ô¼ÇÕß ¿µÔªµÂ Éã
? Voltus 去年 9 月推出了一个新项目,允许数据中心资助其所在电网上的灵活用电。公司管这叫“自带容量”(Bring your own capacity)。Google 是第一个公开参与这个项目的客户。¡¶¡¶½¿Éú¹àÑø¡·×÷Õß:Ê®ÓоÅÄç¡·
ɨһɨÔÚÊÖ»ú´ò¿ªµ±Ç°Ò³
¡¾ÍøÕ¾µØÍ¼¡¿