Lista TOP-500 przynosi nam kolejne fale astronomicznych wyników wydajności superkomputerów (11,2 PFlops!). Nasze komputery domowe mają coraz wyższą wydajność, podwajając ją co około 3 lata, ale wciąż daleko im do rekordzistów. Mój przenośny komputer dysponuje obecnie wydajnością na poziomie 24 GFlops (i5-2467M). Superkomputer zajmujący ostatnie, pięćsetne miejsce na liście top 500 dysponuje mocą 96 TFLops = 96 000 PFlops = 96 000 000 GFlops. Mój laptop dzieli więc sześć rzędów wielkości od najwolniejszego z wyróżnionych.
Tymczasem - jak już wcześniej pisałem - ogromny potencjał surowej mocy obliczeniowej drzemie w kartach graficznych. Rynek zastosowań GPGPU konsekwentnie rośnie i coraz więcej narzędzi przemysłowych je wykorzystuje, mimo że niełatwo jest znaleźć dostatecznie "podzielny" problem obliczeniowy.
Ostatnio zainteresowała mnie bardzo konstrukcja firmy Tyan, o nazwie FT77B7015 (dociekliwym polecam manual):
Ten niepozorny dwu-podstawkowy serwer 4U pozwala na montaż nawet do ośmiu pełnowymiarowych kart PCI-E 16x o podwójnej szerokości. Dzięki zastosowaniu na płycie głównej przełącznika PCI-E 2.0 PLX PEX8647 wszystkie osiem slotów działa z pełną prędkością i współdzieli kanały PCI-E prowadzące do dwóch procesorów Xeon 56xx. Wspomniany partnumber serwera przychodzi w komplecie z ośmioma kartami nVidia Tesla 2090. Zauważcie, że każda z nich posiada maksymalną teoretyczną wydajność 665 GFlops, co daje nam 5,4 TFlops z samych kart. Stosując dwa procesory rzędu Xeon X5680 uzyskamy dodatkowe ~214 GFlops. Dodatkową korzyścią jest możliwość montażu 18 szt. pamięci 8GB, co daje razem 144GB RAM. Teoretycznie maksymalna konfiguracja Tyana dysponowałaby ~5,6 TFlops mocy obliczeniowej, co stawia ją "zaledwie" cztery rzędy wielkości od wspomnianego super komputera. :-) Jest to więc taki, powiedzmy, mili-super-komputer. Koszt? ~4k$ za server + 8 * 3k$ za Tesle + RAM + SSD + akcesoria. Myślę, że rozsądna konfiguracja zamknęłaby się w 40 k$.
Co do zastosowania, to najbardziej oczywisty jest unbiased rendering w sieci lokalnej (są cztery interfejsy 1000Base-T oparte na intel 82574L podatne na 802.3ad :) dla grafików, architektów, filmowców, inżynierów. Mnie osobiście najbardziej spodobała się możliwość analizowania zawartości wideo w czasie rzeczywistym (śledzenie obiektów) opisana w 2006 roku przez grupę naukowców tutaj.
Myślę, że tak relatywnie tania moc obliczeniowa dostępna na rynku przyniesie nam bardzo ciekawe zastosowania z niedalekiej przyszłości.
Brak komentarzy:
Prześlij komentarz