Arhitectura sistemului eterogen - Ce este, de fapt, Hardwareluxx

AMD continuă să vorbească despre HSA, dar ce este HSA? Arhitectura sistemului heterogen a fost anunțată oficial de AMD la AFDS (AMD Fusion Developer Summit) 2011 cu scopul de a accelera software-ul viitor cu utilizarea simultană a unității grafice și a procesorului. Există sarcini pe care CPU le poate prelua mai eficient și există alte sarcini pe care GPU le poate face mai bine. S-au întâmplat multe de atunci, deoarece AMD este cu patru generații înaintea APU (Accelerated Processing Unit). Cipurile „Llano” și „Bobcat” aparțin primei generații de APU-uri, care în sens clasic sunt pur și simplu un CPU și GPU pe aceeași matriță. Acestea au sau nu au caracteristici HSA. Cu toate acestea, acestea au reprezentat un pas important pentru AMD.

A doua generație este formată din APU-urile „Trinity” și „Richland” bazate pe nuclee „Piledriver”. Acestea oferă deja funcții HSA simple, dar încă nu sunt sfârșitul poveștii. Numai cu „Jaguar” și tehnologia HUMA, inclusiv cu partea grafică GCN, a fost atins nivelul următor. Umbrele GCN pot fi programate folosind C ++ și, prin urmare, pot fi programate într-o manieră mai eficientă în timp decât în cazul în care inginerii software ar trebui să utilizeze limbaje shader complicate. Cu „Kaveri” și succesorul „Jaguar” „Puma”, AMD a atins stadiul actual de dezvoltare în zona setului de caracteristici HSA.

Fundația HSA este o asociație de producători de cipuri, dezvoltatori de microcipuri și dezvoltatori de software din întreaga lume. Cele mai cunoscute nume includ, bineînțeles, fondatorii Advanced Micro Devices (AMD) din California, ARM Limited din Anglia, ARM Qualcomm, tot din California, și alte companii care se bazează în principal pe ARM, precum Samsung și MediaTek.

Cu această fundație, AMD și ceilalți membri doresc să-și optimizeze în continuare propriile cipuri cu un know-how comun și, ca mare greutate majoră, să mute industria software-ului să optimizeze pentru HSA. Mai presus de toate, acest lucru este necesar pentru AMD pe de o parte și, de asemenea, este o oportunitate, deoarece procesoarele de la Intel sunt net superioare în ceea ce privește performanța de calcul x86 pură. Companiile lucrează, de asemenea, cu o serie de universități care le sprijină cu know-how.

Fundația HSA încearcă să utilizeze instrumente dezvoltate în comun pentru a face ca programarea pentru această abordare arhitecturală să fie cât mai simplă și multiplataformă pentru dezvoltatori. Când instrumentele sunt complet dezvoltate, nu ar trebui să conteze dacă programul este compilat ulterior pentru procesoare cu arhitectură ARM sau pentru APU-uri cu arhitectură x86. Compilatorul face apoi optimizări specifice arhitecturii. În plus, presupunând seturile de instrucțiuni corespunzătoare, s-ar putea trimite instrucțiunile RISC direct către nuclee, deoarece pentru multe generații, chiar și în procesoarele x86, setul de instrucțiuni CISC complex a fost tradus într-un set de instrucțiuni RISC prin intermediul decodoarelor mai mult sau mai puțin rapide. Acest pas poate fi omis și astfel simplifică mai întâi programarea simultană a procesorelor ARM și x86 din nou și timpul necesar traducerii prin decodor ar fi eliminat.

hUMA este o tehnologie care permite procesorului și GPU-ului să acceseze aceeași zonă de memorie. Anterior acest lucru nu era posibil deoarece CPU și GPU rezervau fiecare o zonă de memorie în RAM și acest lucru nu mai era accesibil pentru cealaltă unitate. Cu hUMA, este posibil ca CPU-ul și GPU-ul să poată accesa aceleași fișiere fără copierea consumatoare de timp a datelor înainte și înapoi și, în caz de îndoială, se elimină puțin mai multă performanță. Acest lucru se poate întâmpla numai dacă software-ul acceptă în mod explicit acest lucru. Abia prin hUMA a devenit posibil să depășim straturile de abstractizare, cum ar fi DirectCompute sau OpenCL și să programăm direct cu limbajul de nivel înalt C ++.

Programe precum Photoshop sau programe în general care se ocupă de procesele de redare sau grafică ar putea beneficia enorm de pe urma acestei tehnologii, deoarece aici sarcinile pe care un shader le poate face de fapt mai bine decât un nucleu CPU nu ar trebui să fie gestionate exclusiv de CPU. Filtrele Adobe Photoshop sunt deja utilizate astăzi, care sunt accelerate de OpenCL sau CUDA pe placa grafică. Dar nu toate, deoarece, potrivit Adobe, copierea datelor distruge câștigul (de timp) obținut prin calculul pe placa grafică.

[h3] hQ (Coadă heterogenă) [/ h3]

HQ a fost recent anunțat de AMD. Această tehnologie, care va fi utilizată doar în procesoarele „Kaveri” care va fi lansată în ianuarie, permite procesorului și GPU-ului să proceseze sarcini pe picior de egalitate. Anterior, CPU a atribuit întotdeauna sarcinile GPU-ului. Deci ea a fost stăpânul dintre cele două unități. Și aici software-ul trebuie să accepte hQ, deoarece distribuie sarcinile fără influența directă a sistemului de operare. Așa-numitele cozi de sarcini sunt executate de program direct în modul utilizator, ceea ce, mai presus de toate, scurtează timpul care ar fi necesar dacă sarcinile ar fi executate numai prin sistemul de operare în modul kernel. Microsoft în sine are o interfață similară, și anume C ++ AMP, dar aceasta rulează prin DirectCompute și Microsoft aproape că a oprit dezvoltarea ulterioară.

Strategia AMD este clară: chiar dacă APU-urile actuale par mai puțin rapide decât concurența la prima vedere, ele sunt mai potrivite pentru anumite sarcini decât pare. Numai software-ul optimizat în mod adecvat poate exploata pe deplin acest potențial, iar aici AMD încearcă să aducă diversele tehnologii mai bine pe piață prin interacțiunea cu alte dimensiuni ale afacerii. Timpul va trebui să spună dacă acest lucru va reuși.

Sfaturile noastre de cumpărare cu privire la procesoarele Intel și AMD actuale vă vor ajuta să nu pierdeți urma. Acolo arătăm ce procesoare sunt în prezent cea mai bună alegere - indiferent dacă este vorba despre performanța pură sau raportul preț-performanță.