Fascynacje małe i duże: Jak wybrać najlepszą jednostkę obliczeniową?

Odkąd sięgam pamięcią wstecz najbardziej odczuwalne skoki wydajnościowe przynosiły nam nowe procesy technologiczne, w których implementowano coraz więcej jednostek wykonawczych. Oczywiście usprawnienia architektoniczne samych układów obliczeniowych również przynoszą korzyści, ale w większości przypadków wiąże się to z rozszerzeniem palety rozkazów danego procesora, co wymaga wsparcia ze strony systemów operacyjnych i aplikacji (np. wsparcie DirectX 11 dzięki nowym instrukcjom procesora i sterowników). Od czasów produktów z rodziny Pentium 4 zwracamy też uwagę na pobór prądu i emisję ciepła i tutaj również jedyne realne skoki jakościowe odczuwaliśmy przy zmniejszeniu procesu technologicznego.

Na przykładzie ostatnich rodzin procesorów ogólnego przeznaczenia Intela widzimy, że co nieco można poprawić w zakresie samej architektury, bo korzyści w obrębie procesu technologicznego 32nm w Arrandale a w Sandy Bridge sięgają nawet kilkunastu procent bez uwzględnienia nowych instrukcji AVX.

Jeśli jednak porównamy wartości bezwzględne przejście z procesu litograficznego 45nm (rodzina Penryn) na 32nm (rodzina Arrandale) w procesorach Intela przyniosło nam kolosalne korzyści użytkowe. Ta sama reguła ma zastosowanie dla kart graficznych. Różnica w wydajności AMD Northern Islands Barts (Radeon 68x0 i 6970) w stosunku do rodziny AMD Evergreen Juniper (Radeon 57x0) jest względnie niewielka, ponieważ obie wykonane są w technologii litografii 40nm. Podobnie sytuacja wygląda w stajni nVidia rodziny produktów 4xx i 5xx są oparte o architekturę Fermi wykonaną w procesie litograficznym 40nm.

Zwyczajnie: określona liczba tranzystorów w tym samym procesie produkcyjnym będzie pobierała moc w pewnym przedziale i wydzielała w przybliżeniu tę samą część w postaci ciepła, zapewniając określoną liczbę bramek logicznych. Zważywszy że procesory główne i graficzne na wejściu/wyjściu zapewniają zgodność ze standardowymi zestawami rozkazów, należy też się spodziewać zbliżonej wydajności. Oczywiście producenci mogą zapewniać mniej lub bardziej wydajną architekturę procesorów w określonych zastosowaniach, co ładnie przedstawiają różnice w wynikach różnych testów. To jest zazwyczaj kwestia optymalizacji.

Wyścig trwa i każdy stara się wykorzystać każdy tranzystor jak najlepiej. Dotychczas kolejne generacje rodzin procesorów są wciąż oparte o ścieżki krzemowe, a kolejne zmniejszenia procesu litograficznego stawały się coraz trudniejsze. Właściwie ostatnimi laty tylko Intel wdraża kolejne linie produkcyjne zgodnie z oficjalną mapą drogową. Zarówno Global Foundries (dawne AMD), jak i TSMC mają poważne opóźnienia w zejściu poniżej 40nm.

Pamiętajcie, aby zawsze starać się kupować sprzęt oparty na procesorach wykonanych w jak najnowszym procesie litograficznym (obecnie 32nm dla CPU i 40nm dla GPU), a dopiero potem decydować się na architekturę, pojemność buforów czy przepustowość pamięci.

Tymczasem polscy naukowcy opracowali uprzemysłowienie technologii wykonywania ścieżek układów scalonych za pomocą Grafenu, co znacznie powinno obniżyć emisję ciepła. Patrz artykuł tutaj (dziękuję Tacie za cynk). Trudno ocenić, kiedy zaobserwujemy korzyści w produktach dostępnych masowo.

Gratulacje dla naszych naukowców!

Fascynacje małe i duże

środa, 6 kwietnia 2011

Jak wybrać najlepszą jednostkę obliczeniową?

Brak komentarzy:

Prześlij komentarz

O mnie

Obserwatorzy