½ºÆå¿§Áö °³³äµµ. µ¥ÀÌÅͼ¾ÅÍ GPU¿Í ¿§Áö GPU°¡ ¿ªÇÒÀ» ³ª´² LLM Ãß·Ð ÀÎÇÁ¶ó¸¦ ÇÔ²² ±¸¼ºÇÑ´Ù. AI°¡ »ý¼º À̹ÌÁö, KAIST Á¦°ø
êGPT °°Àº ´ë±Ô¸ð ¾ð¾î¸ðµ¨(LLM) ±â¹Ý AI ¼ºñ½º¸¦ ÀÌ¿ëÇÏ·Á¸é °í°¡ÀÇ µ¥ÀÌÅͼ¾ÅÍ GPU°¡ Çʼö´Ù. ±¹³» ¿¬±¸ÆÀÀÌ °³Àοë PC³ª ½º¸¶Æ®Æù¿¡ žÀçµÈ Àú·ÅÇÑ GPU¸¦ Ȱ¿ëÇØ AI ¼ºñ½º ºñ¿ëÀ» ¾à 67% Àý°¨ÇÒ ¼ö ÀÖ´Â ±â¼úÀ» °³¹ßÇß´Ù.
KAIST´Â Çѵ¿¼ö Àü±â¹×ÀüÀÚ°øÇкΠ±³¼öÆÀÀÌ µ¥ÀÌÅͼ¾ÅÍ ¹Û¿¡ ³Î¸® º¸±ÞµÈ °³ÀÎ ¼ÒºñÀÚ°¡ ¾²´Â ¼öÁØÀÇ?GPU¸¦ Ȱ
¸±°ÔÀÓ¸ô ¿ëÇØ LLM ÀÎÇÁ¶ó ºñ¿ëÀ» Å©°Ô ³·Ãâ ¼ö ÀÖ´Â »õ·Î¿î ±â¼ú '½ºÆå¿§Áö(SpecEdge)'¸¦ °³¹ßÇß´Ù°í 28ÀÏ ¹àÇû´Ù. ¿¬±¸ °á°ú´Â 12¿ùÃÊ ¹Ì±¹ »÷µð¿¡ÀÌ°í¿¡¼ ¿¸° ÀΰøÁö´É ºÐ¾ß ÃÖ°í ±ÇÀ§ ±¹Á¦ÇÐȸÀÎ ¡®½Å°æÁ¤º¸Ã³¸®½Ã½ºÅÛÇÐȸ(NeurIPS)¡¯¿¡¼ ½ºÆ÷Æ®¶óÀÌÆ®(»óÀ§ 3.2% ¿ì¼ö ³í¹®)·Î ¼±Á¤µÅ ¹ßÇ¥µÆ´Ù.
½ºÆå¿§Áö´Â µ¥ÀÌÅͼ¾ÅÍ GPU¿Í °³ÀÎ
¸±°ÔÀÓ½ÅõÁö PC³ª ¼ÒÇü ¼¹ö µî¿¡ žÀçµÈ '¿§Áö GPU'°¡ ¿ªÇÒÀ» ³ª´² LLM Ãß·Ð ÀÎÇÁ¶ó¸¦ ÇÔ²² ±¸¼ºÇÏ´Â ¹æ½ÄÀÌ´Ù. ±âÁ¸ µ¥ÀÌÅͼ¾ÅÍ GPU¸¸ »ç¿ëÇÏ´Â ¹æ½Ä¿¡ ºñÇØ ÅäÅ«´ç ºñ¿ëÀ» ¾à 67.6% Àý°¨Çß´Ù.
±âÁ¸ Ãß·Ð ¹æ½Ä°ú ½ºÆå¿§Áö ºñ±³. ±âÁ¸ ¹æ½ÄÀº ´ë±Ô¸ð ¾ð¾î¸ðµ¨ÀÌ ÅäÅ«À» Çϳª¾¿
¾ß¸¶ÅäÅë±â°è »ý¼ºÇÏÁö¸¸ ½ºÆå¿§Áö´Â ¿§Áö ±â±âÀÇ ¼ÒÇü ¸ðµ¨ÀÌ ÃʾÈÀ» ¸ÕÀú »ý¼ºÇÏ°í ¼¹öÀÇ ´ëÇü ¸ðµ¨ÀÌ °ËÁõ¡¤¼öÁ¤ÇÑ´Ù. KAIST Á¦°ø
¿¬±¸ÆÀÀº 'ÃßÃøÀû µðÄÚµù(Speculative Decoding)' ¹æ¹ýÀ» Ȱ¿ëÇß´Ù. ¿§Áö GPU¿¡ ¹èÄ¡µÈ ¼ÒÇü ¾ð¾î¸ðµ¨ÀÌ È®·üÀÌ ³ôÀº ÅäÅ« ½ÃÄö½º¸¦ ºü¸£°Ô »ý¼ºÇÏ¸é µ¥ÀÌÅͼ¾ÅÍÀÇ ´ë
¼Õ¿À°ø¸±°ÔÀÓ ±Ô¸ð ¾ð¾î¸ðµ¨ÀÌ Àϰý °ËÁõÇÏ´Â ¹æ½ÄÀÌ´Ù. ¿§Áö GPU´Â ¼¹öÀÇ ÀÀ´äÀ» ±â´Ù¸®Áö ¾Ê°í °è¼Ó ´Ü¾î¸¦ ¸¸µé¾î LLM Ãß·Ð ¼Óµµ¿Í ÀÎÇÁ¶ó È¿À²À» µ¿½Ã¿¡ ³ô¿´´Ù.
µ¥ÀÌÅͼ¾ÅÍ GPU¿¡¼¸¸ ÃßÃøÀû µðÄÚµùÀ» ¼öÇàÇÏ´Â ¹æ½Ä°ú ºñ±³ÇØ ºñ¿ë È¿À²¼ºÀº 1.91¹è, ¼¹ö 󸮷®Àº 2.22¹è Çâ»óµÆ´Ù. ÀϹÝÀûÀÎ ÀÎÅÍ³Ý ¼Óµµ¿¡¼µµ ¹®Á¦¾øÀÌ ÀÛµ¿ÇØ, º°µµÀÇ Æ¯¼öÇÑ
»çÀÌ´ÙÄð¹Ù´ÙÀ̾߱â°ÔÀÓ ³×Æ®¿öÅ© ȯ°æ ¾øÀ̵µ ½ÇÁ¦ ¼ºñ½º¿¡ ¹Ù·Î Àû¿ëÇÒ ¼ö ÀÖ´Ù.
¼¹ö´Â ¿©·¯ ¿§Áö GPUÀÇ °ËÁõ ¿äûÀ» È¿À²ÀûÀ¸·Î ó¸®Çϵµ·Ï ¼³°èµÆ´Ù. GPU À¯ÈÞ ½Ã°£ ¾øÀÌ ´õ ¸¹Àº ¿äûÀ» µ¿½Ã¿¡ ó¸®ÇÒ ¼ö ÀÖ¾î µ¥ÀÌÅͼ¾ÅÍ ÀÚ¿øÀ» º¸´Ù È¿À²ÀûÀ¸·Î Ȱ¿ëÇÒ ¼ö ÀÖ´Â LLM ¼ºù ÀÎÇÁ¶ó ±¸Á¶¸¦ ±¸ÇöÇß´Ù.
Çѵ¿¼ö ±³¼ö´Â "µ¥ÀÌÅͼ¾Å͸¦ ³Ñ¾î »ç¿ëÀÚÀÇ ÁÖº¯¿¡ ÀÖ´Â ¿§Áö ÀÚ¿ø±îÁö LLM ÀÎÇÁ¶ó·Î Ȱ¿ëÇÏ´Â °ÍÀÌ ¸ñÇ¥"¶ó¸ç "AI ¼ºñ½º Á¦°ø ºñ¿ëÀ» ³·Ãß°í ´©±¸³ª °íǰÁú AI¸¦ Ȱ¿ëÇÒ ¼ö Àִ ȯ°æÀ» ¸¸µé°íÀÚ ÇÑ´Ù"°í ¸»Çß´Ù.
<Âü°íÀÚ·á> - neurips.cc/virtual/2025/loc/san-diego/poster/119940
KAIST Àü±â¹×ÀüÀÚ°øÇкΠ¹ÚÁø¿ì ¹Ú»ç(¿ÞÂʺÎÅÍ), Á¶½Â±Ù ¼®»ç°úÁ¤»ý, Çѵ¿¼ö ±³¼ö. KAIST Á¦°ø
[Á¶°¡Çö ±âÀÚ gahyun@donga.com]