ÕâÌõ²¼¸æÔÚ¹úÄÚ AI ȦˢÁËÒ»ÕûÖÜ¡£Òµ½çµÚÒ»·´Ó³·Ö³É¼¸ÅÉ¡£×î´óÄÇÅÉ˵ÕâÊÇ"ÓÖÒ»ÂÖ¼ÛÖµÕ½"¡ª¡ªÕâÁ½Äê´ÓÖÇÆ×¡¢DeepSeek¡¢×Ö½Ú¶¹°üµ½°¢ÀïͨÒ壬¹ú²ú´óÄ£ÐÍÂÖ׎µ¼Û£¬Ë²»ÔÚ¾í¡£
ÁíÒ»ÅÉÍùÏû¼«´¦¿´£ºÓ×Ã׸ղ¼¸æ½ñÄêÀûÈóÑüÕ¶£¬Õâʱ³½»¹Íù AI ÉÕ 600 ÒÚ¡¢API Ö±½Ó¿³¾Å³É¡ª¡ªµäÐ͵Ä"¿÷±¾ÇÀÊг¡"¡£»¹ÓÐÈ˸д¥ÕâÊÇ DeepSeek ЧӦ³ÖÐø¡ª¡ªºóÕß°ÑÕû¸öÐÐÒµµÄ¶¨¼Û»ù×¼×§µ½Á˵ذåÉÏ£¬Ë²»¸ú˳ö¾Ö¡£
Ëü²»ÊÇȫģÐͽµ¼Û¡£99% µÄÕÛ¿ÛרÃÅÕë¶ÔÒ»µµ½ÐInput (Cache Hit)µÄ¶¨¼Û¡ª¡ªÒ²¾ÍÊÇ"Óû§ÔÚ³¤¶Ô»°Àï³Á¸´¶Áº¹Çà¸ßµÍÎÄ"ÄDz¿ÃÅ¡£Í¨³£µÄÐÂÊäÈ루No Cache Hit£©½µ·ùÓ׺ö࣬ģÐÍÊä³ö£¨Output£©½µ·ù×îÓס£
ÄãµãÒ»±°ëÌÇÄÃÌú£¬¿§·ÈµêÓÐÁ½ÖÖ×ö·¨£ºÃ¿´ÎÖØÐÂÄ¥¶¹×ÓÁ¿Ìǽ¬µ¹ÄÌ£¬ÔÁÏÈËΪ¶¼¸¶Ò»´Î£»µ«ÊÇÄ£ÐÍ֪·ÕâÖÜÄãÿÌì¶¼ÒªºÈͬÑùµÄ°ëÌÇÄÃÌú£¬Ë÷ÐÔ×öÒ»´óºø´æ½ø±ù¹ñ£¬Ï´ΰ´Ò»±Ò¨Ò»·Ý¡£MiMo Õâ´Î×öµÄÊǺóÕß¡ª¡ª°ÑÓû§³Á¸´¶ÁµÄ²¿ÃÅ´Ó"ÏÖËã"¸Ä³ÉÁË"ÏÖÈ¡"£¬ËùÒÔÕⲿÃŵÄÕæÊµ³É±¾¿¿½ü 0£¬ÌìÈ»Äܸø 99% ÕÛ¿Û¡£
Ä£ÐÍÔÚºÍÄã¶Ô»°Ê±£¬Ã¿¸ö token ¶¼ÒªËãÒ»·Ý"ÖÐÑë״̬"£¬´æÆðÀ´¹©ÏÂÒ»²½Óá£Õâ¸öÆ÷²Ä½ÐKVCache¡ª¡ªÄܹ»Àí½â³ÉÄ£Ð͵Ä"¶ÌÆÚÓ°Ïó±Ê¼Ç±¾"¡£Ã¿ËµÒ»¾ä»°£¬Ä£ÐÍÔڱʼDZ¾ÉϼÇÏÂÕâ¾ä»°µÄÌáÒª£¬Ï´ÎÖ±½Ó·±Ê¼Ç£¬²»ÓÃÖØÐÂÌýÒ»±éÄã˵¹ýµÄËùÓÐÄÚÈÝ¡£
´«Í³Ä£ÐÍÿһ²ã¶¼×ö"Full Attention"¡ª¡ªÒ²¾ÍÊÇÿ¸ö token ¶¼Òª¿´ÆëÈ«¶Î¶Ô»°ËùÓÐ token£¬±Ê¼Ç±¾Ô½·Ô½ºñ¡£MiMo-V2.5-Pro ¸ÄÁ˼ܹ¹£º70 ²ãÀï 60 ²ãÖ»¿´×î½ü 128 ¸ö token£¨SWA£¬Sliding Window Attention£©£¬Ö»ÓÐ 10 ²ã"µµ°¸ÖÎÀíÔ±"¿´È«Êý¡£
ÕâÊǽµ±¾µÄµÚÒ»¿éµØ»ù¡£´ò¸öÆ©Ó÷£¬Õý±¾¹«Ë¾Ã¿¸öÔ±¹¤¶¼±»ÒªÇó¼ÇסËùÓеĻáÒé¼Í¼£¬Á˾ÖÿÓ×ÎÒµÄÄÔ×Ó¶¼²»¹»Óá¢Ð§ÄÜÒ²µÍ¡£Ð»®¶¨°Ñ 60 ¸öÔ±¹¤µÄÄÔÖ°ÊØ½µµ½ 1/7£¬Ö»Áô 10 ¸öµµ°¸ÖÎÀíÔ±¹ÜÈ«Êýº¹Çࡪ¡ª¹«Ë¾ÕûÌåÓ°ÏóÄÜÁ¦Ã»½µÂ䣬µ«Ð§ÄÜÌáÉý 7 ±¶¡£
´«Í³µÄ KVCache ϵͳÊǰ´"×î´ó¿ÉÄÜÓÃÁ¿"¸øËùÓвãͳһ·ÖÅäÏÔ´æµÄ¡£Òâ˼ÊÇ£ºÄÄÅ 60 ²ã SWA Ö»±ØÒªÓ×±¾×Ó£¬ÏµÍ³Ò²°´"µµ°¸ÖÎÀíÔ±µÄ´ó±¾×Ó"¸øËùÓв㶼·ÖÅ䡪¡ªSWA Ê¡ÏÂÀ´µÄ¿Õ¼ä±»°×°×Ô¤ÁôÁË£¬µÅ×Úûʡ¡£
´ò¸öÆ©Ó÷£¬Õý±¾¹«Ë¾¸øÃ¿¸öÔ±¹¤¶¼·¢ÁË"ÄÜ×° 100 ÄêÎļþµÄµµ°¸¹ñ"¡ª¡ªµ« 60 ¸öÔ±¹¤Æäʵֻ±ØÒª"×°Ò»ÖÜÎļþµÄÓ×¹ñ×Ó"£¬ÄÇЩ´ó¹ñ×ÓÀï 99% µÄ¿Õ¼äÊǿյġ£ÐÂ×ö·¨Êǰ´ÏÖʵ±ØÒª·Ö¹ñ×Ó¡£Á˾ÖÕû¸ö°ì¹«ÊÒÄܶà×° 5 ±¶ÒÔÉϵÄͬʽøÀ´¹¤×÷¡ª¡ªÍ¬Ñùһ̨ GPU ÄÜ·þÎñµÄ²¢·¢Óû§Êý·ÁË 5 ±¶¡£
ºÃ¶àÓû§µÄ¶Ô»°ÓÐÒ»Ñù¿ªÍ·¡ª¡ªÍ³Ò»¶Î system prompt¡¢Í³Ò»¶Î´úÂë¿â¡¢Í³Ò»·Ý³¤Îĵµ¡£ÏµÍ³»á°ÑÕâЩËã¹ýµÄÁ˾ִæÆðÀ´£¬ÏÂÒ»´ÎÆ¥ÅäÉϾÍÖ±½Ó¸´Óá£Õâ¸ö»úÔì½Ðǰ׺»º´æ¡£
µ« SWA ģʽϳöÏÖÒ»¸ö¿Ó£ºÁ½ÌõÒªÇó token Ò»Ñù£¬²»µÅ×Ú KV »¹ÔÚ¡£¿ÉÄÜǰ׺Ëã¹ý£¬µ« SWA ´°¿Ú±íµÄ²¿ÃÅÔç¾Í±»²Ã¼õÁË¡£ÈôÊÇϵͳ»¹°´"token Ò»Ñù¾ÍÉäÖÐ"µÄ¾É¹æ¶¨¸øÄ㸴Ó㬻á¶Áµ½ÎÞЧ»ò±»¸²¸ÇµÄÊý¾Ý£¬Ä£ÐͳÉЧ»áÖ±½Ó±À¡£
´ò¸öÆ©Ó÷£¬Í¼Êé¹ÝÓÐ 100 Íò±¾Ê飬ÄãÏë½èÈ«Ì×¹²¼ÆÈý±¾µÄ¡¶ÈýÌå¡·¡£ÔÀ´µÄ¼Ü¹¹»á֪ͨÄã"Õâ±¾ÊéÔÚ"£¬ÄãÅÜ´Óǰ·¢ÏÖÊé¼ÜÉÏֻʣ·âÃæºÍµÚÒ»²¿£¬ºóÃæÁ½²¿¶¼±»½è×ßÁË¡£ÕâÖÖ"αÉäÖÐ"ÈÃÄã°×ÅÜÒ»ÌË»¹Òª³Á½è¡£ÐÂϵͳµÄ¹æ¶¨¸Ä³ÉÖ»³ÐŵÄãÄÜÆëÈ«½èµ½µÄÄDz¿ÃÅ¡ª¡ªÏȸøÄãµÚÒ»±¾£¬¶øºó°ÑºóÃæÁ½±¾ÔÙ¸øÄãµ÷¹ýÀ´¡£
ÌýÆðÀ´Èçͬ¸üÑϸñ¡¢ÉäÖÐÂʻήÂä¡£µ«ÏÖʵÏà·´£ºÓÉÓÚ SWA Èà KVCache Ìå»ýѹµ½ 1/7£¬Í¬Ñù´æ´¢¿Õ¼äÄÜ×°µÄÄÚÈݶàÁ˺ü¸±¶£¬ÕæÊµÉäÖÐÂÊ·´¶ø´ó·ù¶ÈÌáÉý¡£
ÏԴ棨GPU É쵀 HBM Äڴ棩ºÜ¹óÒ²ºÜÓÐÏÞ¡ª¡ªÒ»Ì¨ H100 °Ë¿¨»ú²Å 640GB ÏԴ棬µ« MiMo Òª´æµÄ KVCache ¿ÉÄÜÊǼ¸Ê® TB Á¿¼¶¡£ËùÒÔ±ØÐë·Ö²ã£º×î½üÓõķÅÏԴ棨L1£©£¬ÉÔ΢¾ÉµÄ·Å CPU Äڴ棨L2£©£¬ÀäÊý¾Ý´æµ½É¢²¼Ê½»º´æ£¨L3£©¡£
¸úÄã¹ÜǮһ¸ö·Àí¡£Ç®°üÀïµÄÏÖ½ðÊÇÏԴ桪¡ªËæÓÃËæÈ¡µ«·Å²»Á˼¸¶à¡£ÒøÐп¨Óà¶îÊÇ CPU Äڴ桪¡ªÈ¡Ò»´ÎÒª 30 Ã뵫Äܷźöࡣ¶¨ÆÚ´æ¿îÊÇ L3 É¢²¼Ê½»º´æ¡ª¡ªÈ¡Ò»´ÎÒª 2 ·ÖÖÓµ«±ãÒ˺öࡣ
Ó×Ã×´æ´¢ÍŶӵÄ×ö·¨²»Ò»Ñù¡£ËûÃÇ×ÔÑÐÁËÒ»Ì×½ÐGCacheµÄÉ¢²¼Ê½»º´æ£¬Ö±½Ó²¿ÊðÔÚ GPU »úе×Ô´øµÄ SSD ÉÏ¡ª¡ª¸úѵÁ·¹¤×÷¡¢ÍÆÀí¹¤×÷»ì²¼ÔÚͳһ̨»úеÀï¡£
Õâ¼þʵÄɱÉËÁ¦±È¿´ÉÏÈ¥´ó¡£Í¨ÀýµÄ"AI ¹«Ë¾ËãÁ¦ÕË"À´æ´¢³É±¾ÊÇÒ»¸ö¹Ì¶¨Ö§³öÏ¡ªÄãµÄÄ£ÐÍÔ½´ó¡¢Óû§Ô½¶à£¬´æ´¢Õ˵¥Ô½³¤¡£GCache ÕâÌ××ö·¨°ÑÕâÒ»ÏîÖ±½Ó´òµô¡£½áºÏ SWA µÄÓ×Ìå»ý + ÉäÖÐÂÊ 93-95%£¬KVCache ÔÚ L3 µÄ´æ»î¹¦·ò£¨TTL£©´Ó¼¸·ÖÖÓµ¢¸éµ½¼¸Ó×ʱÉõÖÁ¼¸Ì졪¡ªTTL Ô½³¤£¬º¹Çà context µÄ¿ÉÉäÖд°¿ÚÔ½¿í£¬»º´æÉäÖÐÂÊÔ½¸ß£¬99% ÄǸöÕÛ¿Û¾ÍÔ½Õ¾µÃס¡£
ÈýÊÇTTFT ÓÅ»¯¡£ÔÚÁжӵÈÍÆÀíµÄ¶ÓÁÐÀÓÅÏȵ÷¶ÈÕæÊµÍÆËãÁ¿Ó×µÄÒªÇó£¨Ò²¾ÍÊÇ´óÁ¿ÉäÖлº´æµÄÒªÇ󣩡ª¡ªÔ¤·ÀËüÃDZ»"È«ÐÂÊäÈë"ÄÇÖÖ³ÁÍÆËãÒªÇó×èÈû¡£
ºÃ±È£¬ÔÚͨÀýµÄ»ú³¡µ÷¶ÈÖУ¬ËùÓзÉͳһ¸öÖ÷Õŵصij˿ͼ¯Öе½Í³Ò»¸öºò»úÌü£¬¹²ÏíÐÐÀîÌáÈ¡Á÷³Ì¡ª¡ªÕâÊÇÇ׺͵÷¶È¡£´øµÇ»úÏäµÄºÍ´ø 3 ´óÏäÍÐÔ˵ķÖÁ½Ìõ°²¼ìͨ·×ߣ¬¿ìµÄ²»±»ÂýµÄÍÏ¡ª¡ªÕâÊdz¤¶È·ÖͰ¡£µÇ»úʱÓÅÏÈ·ÅÖ»´øµÇ»úÏäµÄÈË£¬ËûÃǵǻú¿ì£¬È÷ɻúÄÜÔçÌÚ·É¡ª¡ªÕâÊÇ TTFT ÓÅ»¯¡£
Ç°ÃæÎå¼þʶ¼ÔÚÓÅ»¯"¶Á"ÄÇÒ»²à¡ª¡ªÈÃÓû§³Á¸´¶Áº¹Çà context µÄ³É±¾Ñ¹µ½¿¿½ü 0¡£µÚÁù¼þÊÂÊÇÓÅ»¯"д"ÄÇÒ»²à¡ª¡ªÒ²¾ÍÊÇÄ£ÐÍÌìÉúÏÂÒ»¸ö token µÄ¹ý³Ì¡£
´ò¸öÆ©Ó÷£¬´«Í³´ò×ÖÊÇÒ»¸ö×ÖÒ»¸ö×Ö´ò¡ª¡ªÄãÏë´ò"½ñÌìÆøÏó"£¬Òª°´ 4 ´Î¼ü¡£MTP ÏñÓиö×Ô¶¯²¹È«ÔÚ²ÂÄãÏÂÒ»¸ö 1-2 ¸ö×ÖÊÇʲô¡ª¡ªÈôÊÇËü²Â¶ÔÁË£¬Äã¾Í²»ÓÃÔÙ°´ÄÇÁ½´Î¡£
Õâ¼þʵÄÒâ˼ÔÚÓÚ£¬99% ÕÛ¿ÛרÃÅÖ¸Ïò Input (Cache Hit)£¬µ«Ä£ÐÍÏÖʵ·þÎñÓû§Ê±£¬input ºÍ output ÊÇͳһ´ÎÒªÇóÀï²úÉúµÄ¡ª¡ªÈôÊÇ output ûʡ£¬ÕûÌåÒªÇó³É±¾¾ÍֻʡÁËÒ»°ë¡£MTP Èà output ÄÇÒ»°ëÒ²½µÏÂÀ´£¬ÕûÌ×½µ¼ÛµÄÓ¯ÀûÄ£ÐͲŹػ·¡£
SWA ¼Ü¹¹ ¡ú KVCache 1/7 ¡ú Ë«³ØÕæÕý¿ªÊÍÈÝÁ¿ ¡ú ͳһ̨ GPU ÄÜ×° 5+ ±¶²¢·¢ ¡ú ǰ׺»º´æÉäÖÐÂÊ 93-95% ¡ú 95% ÒªÇóÏÕЩ²»ÓÃËã ¡ú GCache Èô洢³É±¾¹éÁã ¡ú µ÷¶È°ÑÉäÖÐÒªÇóÓÅÏȵ÷×ß ¡ú MTP ÈÃÌìÉúҲʡ ¡ú µ¥ÔªÒªÇó GPU ¹¦·ò½µÂäÒ»¸öÊýÁ¿¼¶ ¡ú µ¥Ôª³É±¾½µÂä 95%+ ¡ú ¶¨¼Û½µ 99%£¬Ã«ÀûÂÊÈÔΪÕý¡£
»ØÍ·¿´Òµ½çһ·ͷµÄ¼¸ÖÖ½â¶Á£¬Ã¿ÖÖ¶¼Óв¿õè¾¶Àí¡£ÕâÁ½ÄêÖйú´óÄ£Ð͹«Ë¾Ö®¼äµÄ¼ÛÖµÕ½ÊÇÕæµÄ£»Ó×Ã×ÀûÈóÑüÕ¶»¹ÒªÔÒ AI ÊÇÕæµÄ£»DeepSeek °ÑÐÐÒµ¶¨¼Û×§µ½µØ°åÉÏÒ²ÊÇÕæµÄ¡£
µ«ÂÞ¸£ÀòÕâ´Î¹«¿ª¼¼Êõ²©¿Í²¢ÇÒ¾ßÌåµÄ¼¼Êõϸ½Ú¹«¿ª²ð½â£¬ÎÞÒÉÊǵ«Ô¸»Ø»÷¶ÔÓÚ¼ÛÖµÕ½µÄ˵·¨£¬Èá°¼¼ÊõµÄÎÊÌâ¹é¼¼Êõ¡¢ÓªÏúµÄÎÊÌâ¹éÓªÏú¡£¡±
ËýÔÚ²©¿ÍÖÐд·£¬MiMo-V2.5 ϵÁÐÄ£Ð͵ÄÍÆÀíЧÄܲ¢·ÇÀ´×Ôijһ»·½ÚµÄµ¥µãÍ»ÆÆ£¬¶øÊǶàά¶ÈÐͬÓÅ»¯µÄÁ˾֡£Hybrid SWA Èà prefill Óë decode ͬʱÊÜÒæ£¬µ«Î´¾³ä·ÖÓÅ»¯µÄ KVCache ʵÏÖ·´¶ø»áÔÚ¸÷»·½Ú̧¸ß³É±¾¡£ÝÓÈÆÕâÒ»Ö¸±ê£¬MiMoÍŶÓϵͳÐÔ³Á¹¹ÁË KVCache ÖÎÀí¡¢·Ö¼¶»º´æ¡¢Ç°×º»º´æÊ÷£¬¹¥¿Ë SWA KVCache Ö÷ÌâÎÊÌ⣬ÓÅ»¯Á˵÷¶ÈÕ½Êõ¼° Prefill / Decode Á´Â·£¬²¢¾ÏßÉÏÕæÊµ³¡¾°¼ìÑ飬×îÖÕ½«ÆäÀíÂÛЧÄÜÓÅÊÆÕæÕý¶ÒÏÖµ½³ö²ú»·¾³¡£ÖÁ´Ë£¬Hybrid SWA ²Å²ûÑï³öÔÚ³¤ÎÄÍÆÀíÉϼæ¾ßÇ¿¶Å×ëЧÄܵļܹ¹ÓÅÊÆ¡£ÔÙ×éºÏ MoE ÅäÖúͶàÄ£Ì¬ÍÆÀíµÄ¸÷ÀàÓÅ»¯£¬¼«´óˮƽÌá¸ßÁËÏßÉÏÍÆÀí·þÎñµÄ»úÄÜ¡£
糖心VLOG二季度,博通的AI半导体收入为108亿美元,同比增长约143%,略高于市场预期的约107亿美元,接近公司总营收的一半,并占半导体解决方案业务销售额约七成。即便从本次公布的半导体收入看,博通AI硬件和网络基础设施需求仍然强劲,至少没有出现市场担心的放缓迹象。澎湃新闻多次联系抖音平台客服。对方回应称,订单情况建议下单人联系平台核实处理。双重地址,通常指收货地址和发票地址不一致,若未申请开发票,通常不涉及双重地址,并称“该订单仍在备货中,商家有发货能力,建议耐心等待”。糖心VLOG·¨¹ú¿Õ³Ë2023ÎÞɾ¼õ°æ°Ù¶ÈÔÆ她关心的不是这件单品今年有多火,而是:你现在处在人生的什么阶段?你想成为什么样的人?你希望别人看到一个怎样的你?Anthropic的护城河主要依赖于Claude模型的技术领先,但这些都是“软护城河”。一旦核心人才流失或竞争对手推出更强模型,优势可能迅速丧失。
20260606 ? 糖心VLOG上海市公安局奉贤区分局刑事侦查中心主任 陈良:店铺上面留了一个电话号码。我们通过这个电话号码反查,发现是一名女性。她在上海居住的人员里面有她的老公,她的孩子是在外地。¡¶¡¶ÌðÃÀµÄ³ÍÖÎ2¡·µÚÈý¼¾¶¯ÂþÔÚÄÄ¿´°¡¡·马泰奥-斯皮纳塞出生于2006年7月13日,现年19岁,德转身价为100万欧元,2025-2026赛季球员代表国米一线队出场一次,其余时间代表国米二队参加意丙联赛。
20260606 ? 糖心VLOG理想2023年其他销售及服务营收35.57亿元,毛利率47.36%;2025年营收56.29亿元,毛利率降至33.63%。尽管营收规模扩大,但由于毛利率的降低,毛利从16.84亿元仅提升至18.93亿元。¡¶º«¾ç¡¶ÎÞ·¨¿¹¾ÜµÄËû¡·È«¼¯¡·CBA总决赛G4,上海93-101不敌广厦,大比分依旧3-1领先。这场比赛上海开局劣势,不过第二节迫近,奈何下半场却出现了断电的情况,被对手再度拉开分差,最终造成输球。