fbpx

1.GPU архитектур 

GPU нь олон Streaming Multiprocessor(SM)-тай, тус бүр нь дундын хяналт ба санах ой бүхий олон цөмтэй. 

2.Блокуудыг Streaming Multiprocessor-уудад хуваарилах

Урсгалууд нь блок блокоороо streaming multiprocessor-уудэд хуваарилагдана.

Урсгал/Блокууд биелэхэд нөөц шаардана. Тиймээс streaming multiprocessor-ууд нэг удаадаа хязгаартай тооны урсгал/блок авах боломжтой.

3.Хуваарилалт дээр анхаарах асуудал 

Нэг блокын урсгалууд нь нэг streaming multiprocessor-д хуваарилагддаг.

Энэ нь блок дотор урсгалууд хамтран ажиллахыг дэмжих үр ашигтай. 

4.Урсгал хуваарилалт

  • Streaming Multiprocessor(SM)-д хуваарилсан урсгалууд параллел ажиллана.
  • SM нь урсгалуудын биелэлтийг удирддаг хуваарилалтын системтэй. 
  • SM-д хуваарилсан блокууд хуваарилалтын нэгж болох Warp-уудад хуваагддаг.

Warps

  • Warps нь SM доторх хуваарилалтын нэгж. Хэмжээ нь төхөөрөмжийн онцлогоос хамаарах ч срөнхийдөө 32 урсгалтай.
  • Warp-ийн урсгалуудыг хамтдаа хуваарилагдаж , SIMD(Single Instruction Multiple Data) загварын дагуу биелдэг. 
  • Хэрэв өндөр хоцролттой үйлдлийг хүлээх шаардлагатай бол бэлэн байгаа өөр warp-ийг сонгон хуваарилна. 

SM нөөц

SM хамгийн их урсгалын тоо нь SM цөмийн тооноос харьцангуй их.

Эзэмшилтийн(Occupancy) хязгаарлалт

SM-ийн occupancy нь SM дээр идэвхтэй байгаа warp буюу урсгалын тоог зөвшөөрөгдсөн хамгийн их тоотой харьцуулдаг. 

Блок бүрт байх урсгалын тоо нь эзэмшилтэд хязгаарлалт болдог.

Leave a Reply