|
|
|
¡ã ¿£ºñµð¾Æ T4 GPU |
[µ¥ÀÌÅͳÝ] ¿£ºñµð¾Æ(CEO Á¨½¼ Ȳ)´Â ¾Æ¸¶Á¸À¥¼ºñ½º(AWS)ÀÇ ¾Æ¸¶Á¸ EC2 G4 ÀνºÅϽº°¡ ¿£ºñµð¾Æ T4 ÅÙ¼ ÄÚ¾î(Tensor Core) GPU¸¦ ÅëÇØ ÇÏÀÌÆÛ½ºÄÉÀÏ ÀΰøÁö´É(AI) ÀÎÆÛ·±½º(inference), Ŭ¶ó¿ìµå °ÔÀ̹Ö, ÃֽŠRTX ±×·¡ÇÈÀ» °¡¼ÓÈÇÑ´Ù°í 23ÀÏ ¹àÇû´Ù.
±¤¹üÀ§ÇÑ ¼ÒÇÁÆ®¿þ¾î ½ºÅÃÀ» Áö¿øÇÏ´Â ¿£ºñµð¾Æ T4 GPU´Â ¾Æ¸¶Á¸ EC2 G4 ÀνºÅϽº »ç¿ëÀÚ¿¡ ³ôÀº ¼º´É, È¿À²¼º ±×¸®°í ´Ù¾çÇÑ ±â´ÉÀ» Á¦°øÇÑ´Ù.
ÇØ´ç ¼ÒÇÁÆ®¿þ¾î Ç÷§ÆûÀº µö ·¯´×À» À§ÇÑ ¿£ºñµð¾Æ cuDNN, µ¥ÀÌÅÍ ºÐ¼® ¹× ¸Ó½Å ·¯´×À» À§ÇÑ ¿£ºñµð¾Æ ·¡ÇÇÁî(RAPIDS), Ŭ¶ó¿ìµå ¿öÅ©½ºÅ×ÀÌ¼Ç ±×·¡ÇÈÀ» À§ÇÑ ¿£ºñµð¾Æ Äõµå·Î °¡»ó ¿öÅ©½ºÅ×À̼Ç(Quadro Virtual Workstation), Ŭ¶ó¿ìµå °ÔÀ̹ÖÀ» À§ÇÑ ¿£ºñµð¾Æ ÁöÆ÷½º(GeForce)¸¦ Æ÷ÇÔÇÑ ´Ù¾çÇÑ ¾ÖÇø®ÄÉÀ̼ǿ¡ ÃÖÀûȵŠÀÖ´Ù.
¶ÇÇÑ ¼ÒÇÁÆ®¿þ¾î ½ºÅÿ¡´Â ´Ù¾çÇÑ API, Äí´Ù(CUDA), ±×¸®°í ÅÙ¼RT(TensorRT), NCCL, ¿Éƽ½º(OptiX), ºñµð¿À ÄÚµ¦ SDK¿Í °°Àº µµ¸ÞÀκ°·Î Æ¯ÈµÈ Äí´Ù-X ¶óÀ̺귯¸®°¡ Æ÷ÇԵȴÙ. »ç¿ëÀÚ´Â ´ÜÀÏ ÀνºÅϽº¸¦ È°¿ëÇØ ¿©·¯ À¯ÇüÀÇ ¿öÅ©·Îµå¸¦ ¿øÈ°ÇÏ°í ºñ¿ë È¿À²ÀûÀ¸·Î °¡¼ÓÈÇÒ ¼ö ÀÖ´Ù.
¸ÅÆ® °¡¸Õ(Matt Garman) AWS ÄÄǻƮ ¼ºñ½º ´ã´ç ºÎ»çÀåÀº “¿ì¸®´Â °í°´µéÀÌ ÄÄǻƮ Áý¾àÀûÀÎ ¾ÖÇø®ÄÉÀ̼ÇÀÇ ÀÌÁ¡À» ´©¸± ¼ö ÀÖµµ·Ï Çϴµ¥ ÁýÁßÇÏ°í ÀÖ´Ù”¸ç “AWS´Â ´Ù¾çÇÑ ¸Ó½Å·¯´× »ç¿ë »ç·Ê¿¡ ÃÖÀûÈµÈ ¾Æ¸¶Á¸ EC2ÀÇ ´Ù¾çÇÑ ÀνºÅϽº À¯ÇüÀ» ±â¹ÝÀ¸·Î ¸Ó½Å ·¯´× ¸ðµ¨À» °³¹ß, ÈÆ·Ã, ±¸ÃàÇÒ ¼ö ÀÖ´Â °¡Àå Æ÷°ýÀûÀÎ Æ÷Æ®Æú¸®¿À¸¦ Á¦°øÇÑ´Ù. T4 GPU·Î ±¸µ¿µÇ´Â »õ·Î¿î G4 ÀνºÅϽº¸¦ ÅëÇØ ¸ðµç °³¹ßÀÚµéÀÌ ¸Ó½Å ·¯´×À» º¸´Ù ÇÕ¸®ÀûÀÎ ºñ¿ëÀ¸·Î È°¿ëÇÒ ¼ö ÀÖ°Ô µÆ´Ù”°í ¸»Çß´Ù.
ÇÕ¸®ÀûÀ¸·Î ´õ ¸¹Àº AI ¼öÇà
¿£ºñµð¾Æ T4´Â 2¼¼´ë ÅÙ¼ ÄÚ¾î GPU·Î, Äí´ÙÀÇ ÇÁ·Î±×·¡¹Ö ¼º´ÉÀ» À¯ÁöÇÏ¸é¼ AI ¾ÖÇø®ÄÉÀ̼ÇÀ» À§ÇÑ ÃÖ°íÀÇ ¼º´ÉÀ» Áö¿øÇÏ´Â GPU·Î ÀçâÁ¶µÈ °ÍÀÌ´Ù. INT8¿¡¼ ÃÖ´ë 130 TOPS(ÃÊ´ç Å×¶ó ¿¬»ê)ÀÇ ¼º´ÉÀ» ±¸ÇöÇÏ´Â ¿£ºñµð¾Æ T4´Â À̹ÌÁö ºÐ·ù, °´Ã¼ °¨Áö, ÀÚ¿¬¾î ÀÌÇØ, ÀÚµ¿ À½¼º ÀÎ½Ä ¹× Ãßõ ½Ã½ºÅÛ°ú °°Àº AI ±â¹Ý ¾ÖÇø®ÄÉÀ̼ÇÀÇ ²÷ÀÓ¾ø´Â Çõ½Å, ´Ù¾ç¼º ¹× º¹À⼺À» °¡¼ÓÈÇϴµ¥ ÇÊ¿äÇÑ È¥ÇÕ Á¤¹Ð ÅÙ¼ ÇÁ·Î¼¼½Ì ±â´ÉÀ» °®Ãè´Ù.
AWS´Â ¾÷°è¿¡¼ °¡Àå ºü¸¥ ÇÏÀÌÆÛ½ºÄÉÀÏ Å¬¶ó¿ìµå Ç÷§Æû Áß Çϳª·Î ÈÆ·Ã ¹× ÀÎÆÛ·±½º¸¦ À§ÇØ Áï½Ã »ç¿ë °¡´ÉÇÑ ¿£ºñµð¾Æ NGC ÄÁÅ×À̳ʸ¦ Áö¿øÇØ ¿£ºñµð¾Æ GPU¸¦ ÇÁ·ÎºñÀú´× ÇÑ´Ù. EC2 P3 ÀνºÅϽº¿¡´Â ¿£ºñµð¾Æ V100 ÅÙ¼ ÄÚ¾î GPU°¡ žÀçµÅ ÀÖ¾î °í°´µéÀº AMP(Automatic Mixed Precision) ±â´ÉÀ» »ç¿ëÇØ ¸Ó½Å·¯´× ÈÆ·Ã ±â°£À» ¸çÄ¥¿¡¼ ´Ü ¸î ½Ã°£À¸·Î ´ÜÃà½Ãų ¼ö ÀÖ´Ù. ¶ÇÇÑ EC2 G4¸¦ ÅëÇØ °í°´µéÀº AI ¼ºñ½º¸¦ ´ë±Ô¸ð·Î ±¸ÃàÇÏ¸é¼ ¿î¿µºñ¿ëÀº Å©°Ô Àý°¨ÇÒ ¼ö ÀÖ´Ù.
±×»Ó¸¸ ¾Æ´Ï¶ó ÃÖ±Ù ¹ßÇ¥µÈ VM¿þ¾î(VMware)¿ÍÀÇ ÆÄÆ®³Ê½ÊÀ» ÅëÇØ VM¿þ¾î Ŭ¶ó¿ìµå ¿Â AWS(VMware Cloud on AWS)ÀÇ »ç¿ëÀÚµéÀº ¿£ºñµð¾Æ T4 GPU¿Í ÃֽŠ¿£ºñµð¾Æ ¹öÃß¾ó ÄÄǻƮ ¼¹ö(NVIDIA Virtual Compute Server, ÀÌÇÏ vÄÄǻƮ¼¹ö) ¼ÒÇÁÆ®¿þ¾î·Î °¡¼Ó鵃 ¾Æ¸¶Á¸ EC2 º£¾î¸ÞÅ»(bare metal) ÀνºÅϽº·Î ±¸¼ºµÈ È®Á¤¼ºÀÌ ¶Ù¾î³ª¸ç ¾ÈÀüÇÑ Å¬¶ó¿ìµå ¼ºñ½º¸¦ ÀÌ¿ëÇÒ ¼ö ÀÖ°Ô µÈ´Ù.
±â¾÷µéÀº ÀÌ·¯ÇÑ ¿£ÅÍÇÁ¶óÀÌÁî±Þ ÇÏÀ̺긮µå Ŭ¶ó¿ìµå Ç÷§ÆûÀ» »ç¿ëÇØ ¾ÖÇø®ÄÉÀ̼ÇÀÇ Çö´ëȸ¦ °¡¼ÓÈÇÒ ¼ö ÀÖ´Ù. µ¥ÀÌÅͼ¾ÅÍ¿¡¼ AWS Ŭ¶ó¿ìµå¿¡ À̸£´Â VM¿þ¾î ÀÎÇÁ¶ó Àü¹Ý¿¡¼ ±¸Ãà, ¸¶À̱׷¹ÀÌ¼Ç ¹× ¿î¿µÀ» ÅëÇÕÇØ AI, ¸Ó½Å·¯´×, µ¥ÀÌÅÍ ºÐ¼®À» Æ÷ÇÔÇÑ °¡Àå ÄÄǻƮ Áý¾àÀûÀÎ ¿öÅ©·Îµå¸¦ Áö¿øÇÒ ¼ö ÀÖ´Ù.
½Ç½Ã°£ ·¹ÀÌ Æ®·¹À̷̽AI °ÈµÈ ±×·¡ÇÈ Á¦°ø
µðÀÚÀÌ³Ê¿Í ¾ÆƼ½ºÆ®µéÀº »ç½ÇÀûÀÎ ½Ç½Ã°£ ·»´õ¸µ(rendering), AI°¡ °ÈµÈ ±×·¡ÇÈ, ¿µ»ó ¹× À̹ÌÁö ÇÁ·Î¼¼½ÌÀ» ÅëÇØ »õ·Î¿î ¹æ½ÄÀ¸·Î ÄÜÅÙÃ÷¸¦ Á¦ÀÛÇÒ ¼ö ÀÖ´Ù.
¿£ºñµð¾Æ T4´Â Ŭ¶ó¿ìµå¿¡¼ ±¸µ¿µÇ´Â ÃÖÃÊÀÇ ¿£ºñµð¾Æ RTX ·¹ÀÌ Æ®·¹ÀÌ½Ì GPU´Ù. T4 GPU´Â Ź¿ùÇÑ È¿À²¼ºÀ¸·Î ·¹ÀÌ Æ®·¹ÀÌ½Ì ÀÛ¾÷À» ¼öÇàÇÏ´Â Àü¿ë ÄÄǻƮ ¸®¼Ò½ºÀÎ RT Äھ Á¦°øÇØ °ú°Å¿¡´Â ¸¹Àº ºñ¿ëÀÌ µé¾ú´ø ·¹ÀÌ Æ®·¹ÀÌ½Ì ÀÛ¾÷ºñ¿ëÀ» ÁÙ¿©ÁØ´Ù.
¿£ºñµð¾Æ Äõµå·Î vWS(Quadro Virtual Workstation, Quadro vWS) AMI(Amazon Machine Image)¿Í °áÇÕµÈ »õ·Î¿î G4 ÀνºÅϽº´Â ¸¶ÀÌÅ©·Î¼ÒÇÁÆ®(Microsoft) DXR, ¿£ºñµð¾Æ ¿Éƽ½º, ¹úÄ(Vulkan)À» Æ÷ÇÔÇÑ ÃֽŠ·¹ÀÌ Æ®·¹ÀÌ½Ì API¸¦ Áö¿øÇÑ´Ù. ¹Ìµð¾î ¹× ¿£ÅÍÅ×ÀθÕÆ®, ¾ÆÅ°ÅØó, Á¦Á¶, ¼®À¯ ¹× °¡½º¿Í °°Àº »ê¾÷ ºÐ¾ßÀÇ ±â¼ú ¹× Å©¸®¿¡ÀÌƼºê Àü¹®°¡´Â AWS Ŭ¶ó¿ìµå¿¡¼ ÃֽŠ±×·¡ÇÈ ¼ÒÇÁÆ®¿þ¾î ¾ÖÇø®ÄÉÀ̼ÇÀ» ½ÇÇàÇÒ ¼ö ÀÖ´Ù.
AWS·Î °¡»ó ¿öÅ©½ºÅ×À̼ÇÀ» ±¸ÃàÇÏ´Â ÀÛ¾÷Àº ½±°í ºü¸£¸ç 5ºÐµµ ä ¼Ò¿äµÇÁö ¾Ê´Â´Ù. AWS ¸¶ÄÏÇ÷¹À̽º(Marketplace)¿¡¼ À©µµ¿ì ¼¹ö 2016°ú À©µµ¿ì ¼¹ö 2019¿¡¼ Á¦°øµÇ´Â ¿£ºñµð¾Æ Äõµå·Î vWS ¸Ó½Å À̹ÌÁö¿Í G4 ÀνºÅϽº¸¦ ¼±ÅÃÇÒ ¼ö ÀÖ´Ù.
GPU ±â¹Ý Ŭ¶ó¿ìµå °ÔÀÌ¹Ö Áö¿ø
T4¸¦ ±¸µ¿ÇÏ´Â Æ©¸µ ¾ÆÅ°ÅØó´Â ¿£ºñµð¾ÆÀÇ °ÔÀÌ¹Ö ±â¼úÀ» AWS¿Í °áÇÕÇØÁØ´Ù. À̸¦ ÅëÇØ ºñµð¿À ÄÚÅØ SDK·Î ÇÁ·Î±×·¡¹ÖÇÒ ¼ö ÀÖ´Â GPUÀÇ Çϵå¿þ¾î ÀÎÄÚ´õ ¿£ÁøÀ» »ç¿ëÇØ °¡Àå ±î´Ù·Î¿î °ÔÀÓÀ» ·»´õ¸µÇÏ°í ½ºÆ®¸®¹ÖÇÒ ¼ö ÀÖ´Ù.
°ÔÀÓ ÆÛºí¸®¼Å´Â ÃֽŠ¿£ºñµð¾Æ ±â¼úÀ» ±â¹ÝÀ¸·Î ÀÚü Ŭ¶ó¿ìµå °ÔÀÌ¹Ö ÀνºÅϽº¸¦ ±¸ÃàÇÏ°í, °ÔÀ̸ӵéÀÌ °ÅÀÇ ¸ðµç µð¹ÙÀ̽º¿¡¼ PC ŸÀÌƲÀÇ Àüü Ä«Å»·Î±×¸¦ ÀÌ¿ëÇÒ ¼ö ÀÖ°Ô ÇÑ´Ù. °ÔÀ̸Ӵ Çϵå¿þ¾î ¾÷±×·¹À̵峪 µå¶óÀ̹ö ȤÀº °ÔÀÓ ÆÐÄ¡¸¦ ¾÷µ¥ÀÌÆ®ÇÒ ÇÊ¿ä¾øÀÌ °íÇػ󵵿¡¼ ºü¸£°í À¯¿¬ÇÑ ÇÁ·¹ÀÓ ¼Óµµ·Î ¸ðµç ÃֽŠ°ÔÀÓÀ» Áñ±æ ¼ö ÀÖ´Ù. ÀÌ ±â´ÉÀ» Áö¿øÇÏ´Â ¿£ºñµð¾Æ µå¶óÀ̹ö´Â AWS ¸¶ÄÏÇ÷¹À̽º¿¡¼ ÀÌ¿ë °¡´ÉÇϸç, À©µµ¿ì ¼¹ö 2016, À©µµ¿ì ¼¹ö 2019, ¸®´ª½º OS¿¡¼ Á¦°øµÇ´Â AWS G4 ÀνºÅϽº¿¡¼ ½ÇÇàµÈ´Ù.
ÇâÈÄ ¸î ÁÖ ¾È¿¡ G4 ÀνºÅϽº´Â ¾Æ¸¶Á¸ EC2 ȤÀº ¾Æ¸¶Á¸ ¼¼ÀÌÁö¸ÞÀÌÄ¿(Amazon SageMaker) ÀνºÅϽº¿¡ GPU °¡¼ÓÀ» Ãß°¡ÇÒ ¼ö ÀÖ´Â ¾Æ¸¶Á¸ ¿¤¶ó½ºÆ½ ÀÎÆÛ·±½º(Amazon Elastic Inference)¸¦ Áö¿øÇÒ ¿¹Á¤ÀÌ´Ù. ÀÌ¿¡ °í°´Àº ´õ¿í ºü¸¥ ÀÎÆÛ·±½º¸¦ »ç¿ëÇÏ¸é¼ ÃÖ´ë 75% ºñ¿ë Àý°¨ ÇýÅÃÀ» ´©¸± ¼ö ÀÖ´Ù. |