Recunoașterea accelerată a obiectelor GPU cu rețele de convoluție neuronală - Descărcare gratuită PDF
Rheinische Friedrich-Wilhelms-Universität Bonn Institute for Computer Science VI Dominik Scherer Recunoașterea obiectelor accelerată de GPU cu rețele de convoluție neuronală 8 iunie 2009 Teză de diplomă Primul recenzor: Prof. Dr. Sven Behnke Al doilea recenzent: Prof. Dr. Joachim K. abordare

2.4. Hardware paralel Figura 2.16: Arhitectura SIMT: Mai multe multiprocesoare cu memorie partajată integrate pe cip (de la [Nvi08c], editat) Memoria partajată de 16 KB, la care pot accesa toate firele unui bloc, este aproape la fel de rapidă, dar oarecum mai flexibilă. Cea mai mare capacitate de pe placa grafică este de 1 GB în memoria dispozitivului, pe care o pot folosi toate multiprocesoarele. Cu toate acestea, deoarece această memorie are o latență relativ mare, fiecare multiprocesor are o memorie constantă de 64 KB care poate fi citită doar. O altă caracteristică specială este memoria texturii, care este optimizată pentru acces bidimensional și a cărei adresare este controlată printr-o unitate de textură specială. Gazda poate accesa doar memoria dispozitivului, toate celelalte zone de memorie sunt disponibile numai pe GPU. Viteza de calcul pentru mulți algoritmi este limitată de memoria disponibilă. Numărul de blocuri pe care un multiprocesor le poate procesa în același timp depinde în primul rând de doi factori: Pe de o parte, de câte registre necesită un thread și, pe de altă parte, de dimensiunea memoriei partajate pe care un bloc 33
4.4. Intrare și ieșire (a) imagine color (b) filtru de margine vertical (c) filtru de margine orizontal (d) component de luminanță Y (e) component de crominanță U (f) component de crominanță V Figura 4.7: Diverse preprocesări ale imaginii de intrare multicolore (a) Amplasare centrată (b) Aleator Plasare (c) Coordonată de poziție verticală în codarea la scară de gri (d) Continuarea pixelilor marginii (e) Decolorarea din margine (f) Decolorarea pixelilor marginii continua Figura 4.8: Opțiuni alternative pentru tratarea unei imagini care este prea mică pentru nivelul de intrare. 55