Apple Silicon M1 to pierwszy układ SoC (System on a chip) od Apple dedykowany komputerom Mac. Zmienił on podejście firmy i uniezależnił się od stosowanych dotychczas rozwiązań Intela. Prześledźmy co kryje pierwszy z serii układów M1.
System on a chip to układ łączący w sobie kilka elementów: CPU, pamięć RAM, kontrolery peryferiów, czasem procesor graficzny, czy modemy komunikacji bezprzewodowej. Układ M1 integruje procesor główny, procesor graficzny, zunifikowaną architekturę pamięci (RAM), silnik neuronowy, Secure Enclave, kontroler SSD, procesor sygnału obrazu, silniki kodowania/dekodowania, kontroler Thunderbolt z obsługą USB 4 i wiele innych. CPU składa się z rdzeni wysokowydajnych – Firestorm oraz rdzeni efektywnych – Icestorm. W zależności od skomplikowania zadań, system adaptacyjny decyduje z której jednostki powinien skorzystać. Taki model pracy przekłada się na efektywność energetyczną i pracę na baterii.
M1-budowa
W obciążeniach jednowątkowych rdzenie Apple Firestorm traktowane są zegarem 3,2 GHz, co stanowi wzrost o 6,66% w stosunku do częstotliwości 3GHz z Apple A14 (układów zastosowanych w iPhone’ach i iPadach).
Oprócz czterech wydajnych rdzeni Firestorm, M1 posiada również cztery rdzenie Icestorm, które mają na celu obniżenie zużycia energii w trybie bezczynności i zwiększenie wydajności energetycznej podczas pracy na zasilaniu bateryjnym. Zarówno 4 wysokowydajne rdzenie, jak i 4 efektywne mogą pracować w tandemie, co oznacza, że mamy do czynienia z 8-rdzeniowym SoC, choć wydajność wszystkich rdzeni nie jest identyczna.
Różnice w pamięci
Poza dodatkowymi rdzeniami w CPU i GPU, jednym z głównych czynników wpływających na wydajność M1, który różni go od A14, jest fakt, że pracuje on na 128-bitowej magistrali pamięci, a nie na mobilnej 64-bitowej. Przy 8x 16-bitowych kanałach pamięci i pamięci klasy LPDDR4X-4266 oznacza to, że M1 osiąga maksymalną przepustowość pamięci na poziomie 68,25 GB/s.
Na uwagę zasługuje również 12MB pamięci podręcznej L2 dla wydajnych rdzeni, choć tutaj wydaje się, że Apple kontynuuje podział ilości pamięci, jaką może wykorzystać pojedynczy rdzeń, ponieważ zaobserwowano pewien wzrost opóźnień po przekroczeniu 8MB.
Jednym z aspektów, którego eksperci nigdy nie mieli okazji sprawdzić, jest to, jak dobre są rdzenie Apple pod względem przepustowości pamięci. We wnętrzu M1 wyniki są przełomowe: Pojedynczy Firestorm osiąga prędkość odczytu pamięci na poziomie około 58 GB/s, a zapisu na poziomie 33-36 GB/s. Co najważniejsze, kopie pamięci osiągają od 60 do 62 GB/s, w zależności od tego, czy używasz instrukcji skalarnych czy wektorowych. Fakt, że pojedynczy rdzeń Firestorm jest w stanie niemalże nasycić kontrolery pamięci jest zdumiewający i jest czymś, czego nigdy wcześniej nie widziano w żadnej konstrukcji.
Ponieważ jeden rdzeń jest w stanie wykorzystać prawie całą przepustowość pamięci, jednoczesny dostęp wielu rdzeni nie zwiększa przepustowości systemu, a wręcz obniża efektywną, łączną przepustowość z powodu przeciążenia. Niemniej jednak, szczytowa przepustowość jednego rdzenia wynosząca 59 GB/s jest zasadniczo równa prędkości, z jaką wykonywane są kopie pamięci, niezależnie od liczby aktywnych rdzeni w systemie.
Poza zwiększeniem szybkości zegara, zwiększeniem szybkości L2 i zwiększeniem ilości pamięci, ten wzrost wydajności pamięci najprawdopodobniej pomoże M1 wyróżnić się pod względem wydajności ponad A14 i stanowić konkurencję dla obecnych na rynku procesorów x86.
M1 – Benchmarki
Jednym ze szczególnych benchmarków, który po raz pierwszy ujrzał światło dzienne na macOS i Apple Silicon, jest Cinebench. W tej pierwszej odsłonie popularnego benchmarku opartego na Cinema4D widzimy, jak Apple M1 staje do walki z najwydajniejszymi procesorami x86 na rynku, znacznie przewyższając poprzednie iteracje Apple na krzemie Intela. M1 przegrywa tutaj z procesorami Zen3 i Tiger Lake, które nadal wydają się mieć przewagę, choć nie ma pewności charakterystyki mikroarchitektury w nowym benchmarku. Godna uwagi jest wydajność benchmarku Rosetta2 w trybie x86, który nie tylko jest w stanie dotrzymać kroku poprzednim wersjom komputerów Mac, ale także je pobić.
W wielowątkowych testach R23 M1 absolutnie dominuje nad poprzednimi komputerami Mac z podobnymi procesorami o niskiej mocy. W benchmarkach przeglądarek wiedziano, że procesory Apple zdecydowanie dominują w całym krajobrazie, ale pojawiały się wątpliwości, czy jest to zasługa samych procesorów w iPhone’ach, czy raczej przeglądarek i ich silników. Teraz, pracując na macOS i desktopowym Safari, mogąc porównać dane z innymi systemami Mac z procesorami Intela, można dojść do wniosku, że przewaga wydajnościowa wynika z konstrukcji procesorów Apple.
Wydajność przeglądania stron WWW wydaje się mieć niezwykle wysoki priorytet dla procesorów Apple, co ma sens, ponieważ jest to kluczowe obciążenie dla mobilnych układów SoC i najczęściej wykorzystywane w codziennym życiu.
W teście Geekbench 5 M1 ponownie wypada wyjątkowo dobrze, ponieważ w zestawieniach wydajnościowych wychodzi na prowadzenie. Nawet w trybie zgodności z x86 M1 jest w stanie dorównać najwyższej wydajności jednowątkowej procesorów high-end i znacznie przewyższyć wydajność poprzednich generacji komputerów Mac mini i poprzednich Macbooków.
Wydajność wielowątkowa jest kwestią liczby rdzeni i efektywności energetycznej konstrukcji. M1 demoluje tutaj 15-calowego Macbooka Pro z 2017 roku z procesorem Intel i7-7820HQ z 4 rdzeniami i 8 wątkami, uzyskując ponad dwukrotnie lepszy wynik.
M1 GPU
Oczywiście firma Apple od dawna ma reputację producenta, który wymaga lepszej wydajności układów GPU niż przeciętny producent komputerów. Podczas gdy wielu partnerów Intela chętnie dostarczało systemy z układami graficznymi Intel UHD i innymi podstawowymi rozwiązaniami nawet w niektórych 15-calowych laptopach, Apple zdecydowało się na zastosowanie dyskretnego układu GPU w 15-calowym MacBooku Pro. A gdy nie udało się zmieścić dGPU w 13-calowym modelu, zamiast tego wykorzystano konfiguracje z układami graficznymi Intel Iris klasy premium z większymi procesorami graficznymi i wbudowaną pamięcią podręczną eDRAM, stając się jednym z stałych klientów na te wydajniejsze układy. Już od jakiegoś czasu wiadomo, że Apple chciało uzyskać lepszą wydajność GPU niż ta, którą domyślnie oferuje Intel. Przechodząc na własny układ, Apple wreszcie może postawić na swoim, budując SoC do laptopa z wydajnością GPU, o jakiej zawsze marzyło.
Tymczasem, w przeciwieństwie do przejścia na Apple Silicon od strony CPU, natura programowania grafiki na wyższym poziomie oznacza, że Apple nie jest już tak zależne od deweloperów, by natychmiast przygotowali uniwersalne aplikacje do wykorzystania możliwości GPU Apple. Oczywiście, natywny kod dla CPU nadal będzie dawał lepsze rezultaty, ponieważ prawie niespotykane jest wykonywanie zadań ograniczonych wyłącznie do GPU, ale fakt, że istniejący kod Metal (a nawet OpenGL) może być uruchamiany na procesorze graficznym Apple oznacza, że natychmiastowe korzyści odniosą wszystkie gry i inne zadania wymagające użycia GPU.
Jeśli chodzi o procesor graficzny w M1 SoC, to – co nie jest zaskoczeniem – wygląda on bardzo podobnie do GPU z A14. Firma Apple musiała nieco zmodyfikować swój projekt, aby uwzględnić wrażliwość komputerów Mac (np. różne formaty tekstur i powierzchni GPU), ale zasadniczo różnica została zniwelowana na poziomie API. Ogólnie rzecz biorąc, skoro M1 jest układem A14, ale większym, to Apple przeskalowało swój 4-rdzeniowy układ GPU z tego SoC do 8 rdzeni w M1. Ogólnie rzecz biorąc, 4-rdzeniowy układ GPU w A14 był już dość mocny jak na standardy smartfonów, więc 8-rdzeniowa konstrukcja jest jeszcze mocniejsza. Zintegrowany procesor graficzny M1 nie został zaprojektowany tylko po to, by wyprzedzić zintegrowane procesory graficzne firm AMD i Intel, ale także by gonić dyskretne procesory graficzne.
Na koniec warto zauważyć, że firma Apple dostarcza dwie różne konfiguracje procesorów graficznych dla M1. Mac Mini i MacBook Pro otrzymają układy z aktywnymi wszystkimi 8 rdzeniami GPU. Tymczasem w przypadku Macbooka Air zależy to od SKU: model podstawowy otrzyma konfigurację 7-rdzeniową, a model z wyższej półki – 8-rdzeniową. Oznacza to, że podstawowy model Air jest na papierze najsłabszym procesorem graficznym – ustępuje pełnemu M1 o około 12% – ale interesujące będzie sprawdzenie, jak wyłączenie rdzenia wpłynie na dławienie termiczne w tym pasywnie chłodzonym laptopie.
Na początek przyjrzyjmy się wydajności GPU w teście GFXBench 5.0. Ogólnie rzecz biorąc, nie jest to w pełni sprawiedliwy test, ponieważ Mac Mini jest raczej małym komputerem stacjonarnym niż laptopem, ale ponieważ M1 jest układem przeznaczonym do laptopów, to przynajmniej daje nam wyobrażenie o tym, jak M1 radzi sobie, gdy ma okazję pokazać się z jak najlepszej strony.
Ogólnie rzecz biorąc, procesor graficzny w M1 zaczyna bardzo dobrze.
Zarówno w ustawieniach normalnych, jak i wysokich wyprzedza on znacznie każdy inny zintegrowany procesor graficzny, a nawet oddzielnego Radeona RX 560X. Dopiero gdy dotrzemy do GTX 1650 i lepszych układów NVIDIA, M1 w końcu zaczyna brakować mocy.
Różnica w porównaniu z komputerem Intel Mac Mini z 2018 roku jest szczególnie widoczna. Układ graficzny Intel UHD (Gen 9.5) w tym systemie został zdeklasowany, zapewniając ponad 6-krotny wzrost wydajności. A nawet inne konfiguracje, takie jak 13-calowy MBP z grafiką Iris czy komputer PC z procesorem Ryzen 4700U (grafika Vega 7), zostały bez trudu pokonane. Krótko mówiąc, M1 w nowym Macu Mini zapewnia wydajność na poziomie dyskretnego procesora graficznego.
Uruchomiono wersję x86 benchmarka za pośrednictwem Rosetty, aby przyjrzeć się karom za wydajność. Przynajmniej w GFXBench Aztec Ruins nie ma żadnej. Wydajność GPU jest niemal identyczna zarówno w przypadku natywnej wersji binarnej, jak i przy użyciu translacji binarnej.
Konsumpcja energii – Mac mini 2020 (M1) | ||
Rise of the Tomb Raider (Enthusiast) | GFXBench Aztec (High) | |
Package Power | 16.5 Watts | 11.5 Watts |
GPU Power | 7 Watts | 10 Watts |
CPU Power | 7.5 Watts | 0.16 Watts |
DRAM Power | 1.5 Watts | 0.75 Watts |
Te dwa obciążenia różnią się znacząco pod względem tego, co robią pod maską. Aztec jest testem syntetycznym, który jest uruchamiany poza ekranem, tak by był jak najczystszym testem dla GPU. W rezultacie odnotowuje on najwyższy pobór mocy przez GPU – 10 W – ale jednocześnie praktycznie nie dotyka rdzeni CPU (a także innych elementów, takich jak kontroler wyświetlacza). Tymczasem Rise of the Tomb Raider to obciążenie pochodzące z prawdziwej gry i widzimy, że daje ono popalić całemu SoC. Pobór mocy przez GPU oscyluje wokół 7 W, podczas gdy pobór mocy przez CPU jest znacznie bardziej zmienny, również on osiąga nieco wyższy poziom.
Niezależnie jednak od użytego benchmarku, wynik końcowy jest taki sam: SoC M1 zapewnia taką wydajność przy zużyciu energii na poziomie ultrabooka. Wydajność dyskretnego procesora graficznego klasy low-end na poziomie 10 W (lub mniejszym) jest istotnym powodem, dla którego M1 jest tak potężny: oznacza to, że Apple jest w stanie wyposażyć swoje małe urządzenia w znacznie większą moc GPU, niż byłoby to możliwe w innych przypadkach (lub w przypadku producentów OEM komputerów PC).
W ostatecznym rozrachunku te testy porównawcze stanowią solidny dowód na to, że zintegrowany procesor graficzny M1 sprosta reputacji firmy Apple jako wydajny procesor graficzny. Pierwszy zbudowany przez Apple procesor graficzny dla komputerów Mac jest znacznie szybszy niż jakikolwiek inny zintegrowany procesor graficzny. Na podstawie zdjęć matrycy wykonanych przez firmę Apple widać, że znaczną część matrycy M1 przeznaczono na procesor graficzny i powiązany z nim sprzęt, a rezultatem jest procesor graficzny, który może konkurować nawet z dyskretnymi procesorami graficznymi z najniższej półki. Biorąc pod uwagę, że M1 jest tylko bazą dla przyszłych rozwiązań – Apple będzie potrzebować jeszcze wydajniejszych procesorów graficznych dla laptopów z wyższej półki i pozostałych komputerów stacjonarnych. Bardzo interesujące będzie sprawdzenie, co Apple i jego ekosystem programistów potrafią zrobić, gdy wydajność bazowego procesora graficznego nawet w najtańszych komputerach Mac będzie tak wysoka.
SPEC2006 & 2017: Industry Standard – ST Performance
Wydajność jednowątkowa nowego M1 jest z pewnością jednym z jego kluczowych aspektów, w którym nowe rdzenie Firestorm zdecydowanie wybijają się ponad swoją klasę energetyczną. Należy zauważyć, że porównano M1 z absolutnie najlepszymi platformami stacjonarnymi i laptopami dostępnymi w tamtym czasie na rynku (listopad 2020), biorąc pod uwagę wyłącznie absolutnie najlepszą wydajność jednowątkową.
W SPECint2006 zauważono, jak M1 zamyka drogę do Zen3 firmy AMD, pokonując go w kilku zadaniach, co zwiększa dystans do nowej konstrukcji Tiger Lake firmy Intel, jak również do ich najwydajniejszego procesora do komputerów stacjonarnych, który M1 pokonuje w większości zadań.
Wzrost wydajności M1 w teście 462.libquantum wynika z większej ilości pamięci podręcznej L2, a także z podwojenia przepustowości pamięci. W zadaniach fp2006 M1 odnotowuje bardzo duży wzrost wydajności w stosunku do A14, co oznacza, że może teraz pretendować do miana najlepszego spośród wszystkich porównywanych tu procesorów.
W wynikach ogólnych M1 zwiększa wyniki o 9,5% i 17% w stosunku do A14. W wynikach całkowitych M1 obejmuje prowadzenie, choć gdyby uwzględnić rozbieżność 456,5 mm/s, nadal faworyzowany byłby 5950X z procesorem Zen3. Natomiast w wynikach zmiennoprzecinkowych Apple M1 zdecydowanie prowadzi, co czyni go najwydajniejszym rdzeniem procesora.
Sytuacja nie zmienia się zbytnio w przypadku nowszego pakietu SPECint2017. Rdzeń Firestorm firmy Apple nadal robi ogromne wrażenie – w najgorszym wypadku dorównuje procesorowi Tiger Lake firmy Intel pod względem wydajności jednowątkowej, a w najlepszym dotrzymuje kroku, a czasem nawet bije na głowę nowy procesor Zen3 firmy AMD w układach Ryzen 5000.
Wyniki Apple są bardzo wyrównane, ale wyróżnia się doskonała wydajność 502.gcc_r, w której Apple znacznie wyprzedza konkurencję, co oznacza, że nowy rdzeń Apple radzi sobie wyjątkowo dobrze z bardzo złożonym kodem i jego kompilacją.
W SPECfp2017 widzimy coś dość drastycznego, jeśli chodzi o wyniki. M1 w najgorszym przypadku jest o włos za Zen3 firmy AMD, a w najlepszym osiąga największą wydajność bezwzględną spośród wszystkich procesorów dostępnych na rynku. To są niesamowite wyniki. W ogólnych tabelach int i fp nowego SPEC2017 Apple Silicon M1 ustępuje AMD Zen3 pod względem wydajności w liczbach całkowitych, ale bezsprzecznie prowadzi w pakiecie zmiennoprzecinkowym.
W porównaniu ze współczesnymi konstrukcjami Intela, Apple M1 jest w stanie zaprezentować skok wydajnościowy przewyższający to, co firma ma do zaoferowania, przy czym ponownie odnotowuje znaczną przewagę w wyniku FP.
Choć Zen3 firmy AMD nadal utrzymuje przewagę w kilku obciążeniach, musimy pamiętać, że wiąże się to z dużym kosztem w postaci poboru mocy rzędu +49 W, podczas gdy Apple M1 zużywa 7-8 W całkowitej mocy aktywnej urządzenia.
SPEC2017 – Multi-Core Performance
Choć wiedziano, że Apple M1 będzie osiągał bardzo dobre wyniki w trybie jednowątkowym, jego mocną stroną jest także energooszczędność, co powinno bezpośrednio przełożyć się na wyjątkowo dobre wyniki w trybie wielowątkowym w konstrukcjach o ograniczonej mocy. Zauważono, że chociaż firma Apple nie publikuje żadnych danych o współczynniku TDP, szacowano, że M1 w Macu mini zachowuje się jak układ o współczynniku TDP wynoszącym 20-24 W.
Jako punkty porównawcze eksperci podali system Intel Tiger Lake z procesorem i7-1185G7 o mocy 28 W, procesor AMD Ryzen 7 4800U o mocy 15 W oraz procesor Ryzen 9 4900HS o mocy 35 W. Należy zauważyć, że rzeczywisty pobór mocy tych urządzeń powinien być wyższy od podawanego w reklamach TDP, ponieważ nie uwzględnia on pamięci DRAM ani układów VRM.
W rankingu SPECint2017 Apple M1 walczy z chipsetami AMD, a jego wyniki różnią się w zależności od obciążenia – czasem wygrywa, czasem przegrywa.
W ogólnych wynikach testów wielordzeniowych Apple M1 robi niesamowite wrażenie. W przypadku obciążeń całkowitych nadal wydaje się, że nowsze konstrukcje AMD oparte na architekturze Renoir biją M1 pod względem wydajności, ale tylko w przypadku obciążeń całkowitych i przy wyraźnie wyższym TDP i poborze mocy.
Przewaga Apple nad SoC Tiger Lake firmy Intel przy 28 W jest tutaj bezsporna i pokazuje powód, dla którego firma Apple zdecydowała się porzucić swojego 15-letniego partnera w dziedzinie krzemowej. M1 nie tylko bije najlepsze, co Intel ma do zaoferowania w tym segmencie rynku, ale robi to przy mniejszym poborze mocy.
Eksperci uwzględnili także wyniki wielowątkowe M1, ignorując 4 wydajne rdzenie systemu. Mimo, że jest to konstrukcja „8-rdzeniowa”, heterogeniczna natura procesorów oznacza, że wydajność jest przechylona w stronę dużych rdzeni. Nie oznacza to jednak, że rdzenie wydajnościowe są absolutnie słabe. Ich wykorzystanie wciąż zwiększa całkowitą przepustowość o 20-33%, w zależności od obciążenia, faworyzując zadania wymagające dużej mocy obliczeniowej.
Ogólnie rzecz biorąc, Apple nie tylko dostarcza realną alternatywę krzemową dla AMD i Intela, ale wręcz coś, co znacznie przewyższa je zarówno pod względem wydajności bezwzględnej, jak i efektywności energetycznej.