Ako zistiť, či existuje vyrovnávacia pamäť úrovne 3. Vplyv kapacity vyrovnávacej pamäte na výkon Core i5 3. generácie

Pekný deň všetkým. Dnes sa vám pokúsime vysvetliť niečo ako keška. Vyrovnávacia pamäť procesora je ultrarýchle pole na spracovanie dát, ktoré je 16-17-krát rýchlejšie ako štandardná RAM, pokiaľ ide o DDR4.

Z tohto článku sa dozviete:

Je to množstvo vyrovnávacej pamäte, ktoré umožňuje CPU pracovať pri maximálnych rýchlostiach, bez čakania, kým RAM spracuje akékoľvek dáta a odošle výsledky hotových výpočtov na čip na ďalšie spracovanie. Podobný princíp je možné vysledovať aj v HDD, tam sa používa iba vyrovnávacia pamäť 8–128 MB. Ďalšia vec je, že rýchlosti sú oveľa nižšie, ale proces je podobný.

Čo je vyrovnávacia pamäť procesora?

Ako vo všeobecnosti funguje proces výpočtu? Všetky údaje sú uložené v Náhodný vstup do pamäťe, ktorý je určený na dočasné uloženie dôležitého užívateľa a systémové informácie. Procesor si sám vyberie určitý počet úloh, ktoré sa presunú do ultrarýchleho bloku nazývaného vyrovnávacia pamäť, a začne plniť svoje priame povinnosti.

Výsledky výpočtu sa opäť odošlú do RAM, ale v oveľa menšom množstve (namiesto tisícky výstupných hodnôt dostaneme oveľa menej) a na spracovanie sa odoberie nové pole. A tak ďalej, kým nie je práca hotová.

Rýchlosť práce je určená efektívnosťou RAM. Ani jeden moderný modul DDR4 vrátane riešení pretaktovania s frekvenciami pod 4 000 MHz sa však svojou „pomalou“ vyrovnávacou pamäťou nepriblížil schopnostiam najzakrpatenejšieho procesora.

Rýchlosť CPU totiž prevyšuje výkon operačnej pamäte v priemere 15-krát, ba dokonca aj viac. A nepozerajte len na frekvenčné parametre, okrem nich je rozdielov dosť.
Teoreticky sa ukazuje, že aj ťažkých Intel Xeon a AMD Epyc sú nútené nečinné, ale v skutočnosti oba serverové čipy pracujú na hranici svojich možností. A to všetko preto, že zhromažďujú požadované množstvo údajov podľa veľkosti vyrovnávacej pamäte (až 60 MB alebo viac) a údaje spracovávajú okamžite. RAM slúži ako druh skladu, z ktorého sa odoberajú polia na výpočty. Výpočtová efektivita počítača sa zvyšuje a všetci sú spokojní.

Krátky exkurz do histórie

Prvé zmienky o vyrovnávacej pamäti pochádzajú z konca 80. rokov. Dovtedy bola rýchlosť procesora a pamäte približne rovnaká. Rýchly vývoj čipov si vyžadoval nejakú „barličku“ na zvýšenie rýchlosti RAM, ale používanie ultrarýchlych čipov bolo veľmi drahé, a preto sa rozhodli vystačiť si s ekonomickejšou možnosťou - zavedením vysokorýchlostnej pamäte. pole v CPU.

Modul vyrovnávacej pamäte sa prvýkrát objavil v Intel 80386. V tom čase sa latencie DRAM pohybovali okolo 120 nanosekúnd, zatiaľ čo modernejší modul SRAM znížil latenciu na vtedy pôsobivých 10 nanosekúnd. Približný obraz je jasnejšie demonštrovaný v konfrontácii medzi HDD a SSD.

Spočiatku bola vyrovnávacia pamäť spájkovaná priamo na základných doskách, kvôli úrovni technického procesu tej doby. Počnúc procesorom Intel 80486 bolo 8 kb pamäte zabudovaných priamo do matrice procesora, čím sa ďalej zvýšil výkon a zmenšila plocha matrice.

Táto technológia rozloženia zostala relevantná iba do vydania Pentium MMX, po ktorom bola pamäť SRAM nahradená pokročilejšou SDRAM.
A procesory sa značne zmenšili, a preto zmizla potreba externých obvodov.

Úrovne vyrovnávacej pamäte

Na označovaní moderných CPU okrem a nájdete niečo ako veľkosť vyrovnávacej pamäte 1, 2 a 3 úrovne. Ako sa definuje a čo ovplyvňuje? Pochopme to jednoducho.

  • Cache prvej úrovne (L1) je najdôležitejší a najrýchlejší čip v architektúre CPU. Jeden procesor pojme taký počet modulov, aký sa rovná počtu jadier. Je pozoruhodné, že mikroobvod dokáže uložiť do pamäte najžiadanejšie a najdôležitejšie údaje iba zo svojho jadra. Veľkosť poľa je často obmedzená na 32-64 KB.
  • Cache druhej úrovne (L2) - pokles rýchlosti je kompenzovaný zväčšením veľkosti vyrovnávacej pamäte, ktorá dosahuje 256 alebo dokonca 512 KB. Princíp činnosti je rovnaký ako pri L1, ale frekvencia požiadaviek na pamäť je nižšia v dôsledku uloženia údajov s menšou prioritou.
  • Cache tretej úrovne (L3) je najpomalší a najobjemnejší oddiel spomedzi všetkých uvedených. Napriek tomu je toto pole oveľa rýchlejšie ako RAM. Veľkosť môže dosiahnuť 20 a dokonca 60 MB, pokiaľ ide o serverové čipy. Výhoda poľa je obrovská: je kľúčovým článkom pri výmene údajov medzi všetkými jadrami systému. Bez L3 by boli všetky prvky čipu rozptýlené.

V predaji nájdete dvoj- aj trojúrovňovú pamäťovú štruktúru. Ktorý je lepší? Ak používate procesor iba na kancelárske programy a príležitostné hry, nebudete cítiť žiadny rozdiel. Ak je systém zostavený s ohľadom na komplexné 3D hry, archiváciu, vykresľovanie a grafiku, potom sa zvýšenie v niektorých prípadoch bude pohybovať od 5 do 10%.
Cache L3 je opodstatnená iba vtedy, ak máte v úmysle pravidelne pracovať s viacvláknovými aplikáciami, ktoré vyžadujú pravidelné zložité výpočty. Z tohto dôvodu modely serverov často používajú veľké vyrovnávacie pamäte L3. Aj keď sú chvíle, keď to nestačí, a preto musíte dodatočne nainštalovať takzvané moduly L4, ktoré vyzerajú ako samostatný mikroobvod pripojený k základnej doske.

Ako zistiť počet úrovní a veľkosť vyrovnávacej pamäte na vašom procesore?

Začnime tým, že to možno urobiť 3 spôsobmi:

  • cez príkazový riadok(iba vyrovnávacia pamäť L2 a L3);
  • vyhľadávaním špecifikácií na internete;
  • pomocou nástrojov tretích strán.

Ak vezmeme za základ fakt, že pre väčšinu procesorov je L1 32 KB a L2 a L3 môžu značne kolísať, potrebujeme posledné 2 hodnoty. Ak ich chcete vyhľadať, otvorte príkazový riadok cez "Štart" (zadajte hodnotu "cmd" cez vyhľadávací panel).

Systém zobrazí podozrivo vysokú hodnotu pre L2. Musíte to vydeliť počtom jadier procesora a zistiť konečný výsledok.

Ak sa chystáte hľadať dáta v sieti, tak si najskôr zistite presný názov CPU. Kliknite kliknite pravým tlačidlom myši na ikonu "Tento počítač" a vyberte "Vlastnosti". V stĺpci "Systém" bude položka "Procesor", ktorú skutočne potrebujeme. Prepíšte jeho názov v rovnakom Google alebo Yandex a pozrite si hodnotu na stránkach. Pre spoľahlivé informácie je lepšie vybrať si oficiálne portály výrobcu (Intel alebo AMD).
Tretia metóda tiež nespôsobuje problémy, ale vyžaduje inštaláciu dodatočný softvér ako GPU‑Z, AIDA64 a ďalšie nástroje na štúdium špecifikácií kameňa. Možnosť pre fanúšikov pretaktovania a pretaktovania v detailoch.

Výsledky

Teraz chápete, čo je vyrovnávacia pamäť, od čoho závisí jej veľkosť a na aké účely sa používa ultrarýchle dátové pole. Zapnuté tento moment najviac zaujímavé riešenia na trhu z hľadiska veľkého množstva vyrovnávacej pamäte môžeme menovať zariadenia AMD Ryzen 5 a 7 s ich 16 MB L3.

V nasledujúcich článkoch sa budeme venovať témam, ako sú procesory, výhody čipov a ďalšie. a zostaň s nami. Kým sa znova nestretneme, dovidenia.

Aká dôležitá je vyrovnávacia pamäť L3 pre procesory AMD?

Skutočne má zmysel vybaviť viacjadrové procesory vyhradenou pamäťou, ktorú budú zdieľať všetky dostupné jadrá. V tejto úlohe môže rýchla L3 cache výrazne urýchliť prístup k dátam, ktoré sú najčastejšie žiadané. Potom jadrá, ak existuje takáto príležitosť, nebudú musieť pristupovať k pomalej hlavnej pamäti (RAM, RAM).

Aspoň teoreticky. AMD nedávno oznámilo procesor Athlon II X4, čo je model Phenom II X4 bez vyrovnávacej pamäte L3, pričom naznačuje, že to nie je potrebné. Rozhodli sme sa priamo porovnať dva procesory (s vyrovnávacou pamäťou L3 a bez nej), aby sme zistili, ako vyrovnávacia pamäť ovplyvňuje výkon.

Ako funguje vyrovnávacia pamäť?

Predtým, ako sa ponoríme do testov, je dôležité porozumieť niektorým základom. Princíp cache je celkom jednoduchý. Cache ukladá dáta čo najbližšie k spracovacím jadrám procesora, aby sa zredukovali požiadavky CPU na vzdialenejšiu a pomalšiu pamäť. Na moderných desktopových platformách zahŕňa hierarchia vyrovnávacej pamäte až tri úrovne, ktoré predchádzajú prístupu k RAM. Okrem toho cache druhej a najmä tretej úrovne slúžia nielen na ukladanie údajov do vyrovnávacej pamäte. Ich účelom je zabrániť preťaženiu zbernice CPU, keď si jadrá potrebujú vymieňať informácie.

Hity a neúspechy

Účinnosť architektúry vyrovnávacej pamäte sa meria percentom zásahov. Požiadavky na údaje, ktoré môže vyrovnávacia pamäť uspokojiť, sa považujú za prístupy. Ak táto vyrovnávacia pamäť neobsahuje požadované údaje, požiadavka sa odovzdá ďalej v pamäťovom potrubí a započíta sa chyba. Samozrejme, zmeškania vedú k viac času potrebnému na získanie informácií. V dôsledku toho sa vo výpočtovom potrubí objavujú „bubliny“ (prestoje) a oneskorenia. Zásahy na druhej strane umožňujú udržať maximálny výkon.

Zápis do vyrovnávacej pamäte, exkluzivita, súdržnosť

Zásady nahradenia určujú, ako sa sprístupní priestor vyrovnávacej pamäte pre nové položky. Keďže údaje zapísané do vyrovnávacej pamäte sa musia skôr alebo neskôr objaviť v hlavnej pamäti, systémy to môžu urobiť súčasne so zápisom do vyrovnávacej pamäte (prepisovanie) alebo môžu označiť oblasť údajov ako „špinavú“ (spätný zápis), a zapísať do pamäte, keď bude vymazaný z vyrovnávacej pamäte.

Dáta v niekoľkých úrovniach vyrovnávacej pamäte môžu byť uložené výlučne, to znamená bez redundancie. Potom nenájdete rovnaké dátové riadky v dvoch rôznych hierarchiách vyrovnávacej pamäte. Alebo vyrovnávacie pamäte môžu fungovať inkluzívne, to znamená, že nižšie úrovne vyrovnávacej pamäte budú zaručene obsahovať údaje nachádzajúce sa na vyšších úrovniach vyrovnávacej pamäte (bližšie k jadru procesora). AMD Phenom používa exkluzívnu vyrovnávaciu pamäť L3, zatiaľ čo Intel sa riadi inkluzívnou stratégiou vyrovnávacej pamäte. Koherenčné protokoly udržujú dáta konzistentné a aktuálne naprieč jadrami, úrovňami vyrovnávacej pamäte a dokonca aj procesormi.

Veľkosť vyrovnávacej pamäte

Väčšia vyrovnávacia pamäť pojme viac údajov, ale má tendenciu zvyšovať latenciu. Okrem toho veľká vyrovnávacia pamäť spotrebuje značné množstvo tranzistorov procesora, takže je dôležité nájsť rovnováhu medzi „rozpočtom“ tranzistorov, veľkosťou matrice, spotrebou energie a výkonom / latenciou.

Asociativita

Záznamy v RAM môžu byť priamo mapované do vyrovnávacej pamäte, to znamená, že vo vyrovnávacej pamäti je iba jedna pozícia pre kópiu údajov z pamäte RAM, alebo môžu byť n-smerovo asociatívne, to znamená, že vo vyrovnávacej pamäti je n možných umiestnení. kde môžu byť tieto údaje uložené. Vyššia asociativita (až po plne asociatívne vyrovnávacie pamäte) poskytuje najlepšiu flexibilitu ukladania do vyrovnávacej pamäte, pretože existujúce údaje vo vyrovnávacej pamäti nie je potrebné prepisovať. Inými slovami, vysoký n-stupeň asociatívnosti zaručuje vyššiu mieru úspešnosti, ale zvyšuje latenciu, pretože testovanie všetkých týchto asociácií na nájdenie trvá dlhšie. Spravidla je najvyšší stupeň asociácie primeraný pre poslednú úroveň vyrovnávacej pamäte, pretože tam je k dispozícii maximálna kapacita a vyhľadávanie údajov mimo tejto vyrovnávacej pamäte spôsobí, že procesor bude pristupovať k pomalej RAM.

Aby sme uviedli niekoľko príkladov, Core i5 a i7 používajú 32 KB L1 cache s 8-cestnou asociativitou pre dáta a 32 KB L1 cache L1 so 4-cestnou asociativitou pre inštrukcie. Je pochopiteľné, že Intel chce, aby boli inštrukcie dostupné rýchlejšie a L1 cache pre dáta má maximálne percento zásahov. Cache L2 od Intelu má 8-cestnú asociatívnosť, zatiaľ čo Intel L3 cache je ešte inteligentnejšia, pretože implementuje 16-cestnú asociativitu na maximalizáciu zásahov.

AMD však s procesormi Phenom II X4 presadzuje inú stratégiu, ktorá využíva vyrovnávaciu pamäť L1 s obojsmernou asociatívnosťou na zníženie latencie. Aby sa kompenzovali prípadné zmeškania, kapacita vyrovnávacej pamäte bola zdvojnásobená: 64 KB pre dáta a 64 KB pre inštrukcie. Vyrovnávacia pamäť L2 má 8-smernú asociativitu, podobne ako dizajn Intel, ale AMD L3 cache pracuje so 48-smernou asociativitou. Rozhodnutie o výbere jednej alebo druhej architektúry vyrovnávacej pamäte však nemožno posúdiť bez zohľadnenia celej architektúry CPU. Je celkom prirodzené, že výsledky testov majú praktický význam a naším cieľom bolo len praktické otestovanie celej tejto zložitej viacúrovňovej štruktúry ukladania do vyrovnávacej pamäte.

Dnešný článok nie je nezávislým materiálom – jednoducho pokračuje v štúdiu výkonu troch generácií architektúry Core na rovnakej úrovni (začalo sa koncom minulého roka a pokračovalo nedávno). Pravda, dnes urobíme malý krôčik vedľa – frekvencie jadier a cache pamäte zostanú rovnaké ako doteraz, no kapacita tej druhej sa zníži. Prečo je to potrebné? Pre čistotu experimentu sme použili „úplné“ Core i7 z posledných dvoch generácií, testovali sme ho so zapnutou a vypnutou podporou technológie Hyper-Threading, keďže už rok a pol, odkedy sa Core i5 nedodáva s 8 , ale 6 MiB L3. Je jasné, že vplyv kapacity vyrovnávacej pamäte na výkon nie je taký veľký, ako sa niekedy verí, ale je tu a nedá sa z toho dostať. Core i5 sú navyše masovejšie produkty ako Core i7 a v prvej generácii ich v tomto parametri nikto „neurazil“. Predtým však boli mierne obmedzené iným spôsobom: takt UnCore v prvej generácii i5 bol iba 2,13 GHz, takže náš „Nehalem“ nie je práve zástupcom 700. radu na 2,4 GHz, ale o niečo rýchlejším procesorom. Považovali sme však za zbytočné veľmi rozširovať zoznam účastníkov a prerábať podmienky testovania – každopádne, ako sme už viackrát upozorňovali, testovanie tohto radu neprináša žiadne nové praktické informácie: skutočné procesory pracujú v úplne iných režimoch. Zdá sa nám však, že pre tých, ktorí chcú dôkladne pochopiť všetky jemné body, bude takéto testovanie zaujímavé.

Konfigurácia testovacieho stojana

Rozhodli sme sa obmedziť iba na štyri procesory a budú dvaja hlavní účastníci: oba štvorjadrové Ivy Bridge, ale s rôznymi kapacitami vyrovnávacej pamäte L3. Tretím je „Nehalem HT“: naposledy bol z hľadiska výsledného skóre takmer identický s „Ivy Bridge is simple“. A „len Nehalem“, ktorý, ako sme už povedali, je o niečo rýchlejší ako skutočný Core i5 prvej generácie, pracujúci na frekvencii 2,4 GHz (kvôli tomu, že frekvencia UnCore bola v 700. rade o niečo nižšia) , ale nie príliš radikálne. Zaujímavé je ale aj porovnanie: na jednej strane sú dva kroky na zlepšenie mikroarchitektúry, na druhej strane je pamäť cache obmedzená. A priori môžeme predpokladať, že prvý vo väčšine prípadov preváži, ale koľko a všeobecne - ako sú „prvé“ a „tretie“ i5 porovnateľné (samozrejme upravené o frekvenciu UnCore, aj keď ak je veľa ľudí ktorí chcú vidieť absolútne presné porovnanie, urobíme to neskôr) je už dobrá téma na výskum.

Testovanie

Všetky testy tradične rozdeľujeme do niekoľkých skupín a na diagramoch zobrazujeme priemerný výsledok pre skupinu testov/aplikácií (podrobnosti o metodike testovania nájdete v samostatnom článku). Výsledky na diagramoch sú uvedené v bodoch, za 100 bodov výkon referencie testovací systém ukážka stránky 2011. Je založený na procesore AMD Athlon II X4 620, ale množstvo pamäte (8 GB) a grafická karta () sú štandardné pre všetky testy „hlavnej línie“ a možno ich zmeniť iba v rámci špeciálnych štúdií. Pre tých, ktorých to zaujíma viac detailné informácie, opäť sa tradične ponúka na stiahnutie tabuľka vo formáte Microsoft Excel, v ktorej sú všetky výsledky uvedené ako v prepočte na body, tak aj v „prirodzenej“ forme.

Interaktívna práca v 3D balíkoch

Existuje určitý vplyv kapacity vyrovnávacej pamäte, ale je to menej ako 1%. Obidva mosty Ivy Bridge teda možno považovať za identické, ale vylepšenia architektúry umožňujú novému Core i5 ľahko predbehnúť starý Core i7 rovnakým spôsobom, ako to robí nový Core i7.

Finálne vykreslenie 3D scén

V tomto prípade samozrejme žiadne vylepšenia nedokážu kompenzovať nárast počtu spracovaných vlákien, ale dnes pre nás nie je najdôležitejšie toto, ale úplná absencia vplyvu kapacity vyrovnávacej pamäte na výkon. Tu sú Celeron a Pentium, ako sme už zistili, rozdielne procesory, takže vykresľovacie programy sú citlivé na kapacitu L3, ale iba vtedy, keď tá nestačí. A 6 MiB pre štyri jadrá, ako vidíme, je celkom dosť.

Balenie a vybaľovanie

Prirodzene, tieto úlohy sú náchylné na kapacitu vyrovnávacej pamäte, ale tu je efekt jej zvýšenia zo 6 na 8 MiB pomerne mierny: približne 3,6%. Zaujímavejšie je v skutočnosti porovnanie s prvou generáciou – architektonické vylepšenia umožňujú novému i5 „rozbiť“ aj staré i7 na rovnakých frekvenciách, ale toto je v celkovom poradí: kvôli tomu, že dva zo štyroch testov sú jednovláknové a jedna je dvojvláknová. Kompresia dát pomocou 7-Zip je prirodzene najrýchlejšia na Nehalem HT: osem streamov je vždy rýchlejších ako štyri s porovnateľným výkonom. Ak sa však obmedzíme iba na štyri, potom náš „Ivy Bridge 6M“ stráca nielen svojho predchodcu, ale aj starého Nehalema: vylepšenia mikroarchitektúry úplne obmedzujú kapacitu vyrovnávacej pamäte.

Kódovanie zvuku

Trochu neočakávaná nebola veľkosť rozdielu medzi dvoma Ivy Bridges, ale skutočnosť, že vôbec existuje. Pravda je taká lacná, že ju možno pripísať aj vlastnostiam zaokrúhľovania či chýb merania.

Kompilácia

Vlákna sú dôležité, ale aj kapacita vyrovnávacej pamäte. Ako to však býva, nie príliš veľa – okolo 1,5 %. Zaujímavejšie porovnanie s prvým Generation Core s vypnutým Hyper-Threadingom: úplne nový Core i5 vyhráva „na body“ aj pri rovnakej frekvencii, ale jeden z troch kompilátorov (presnejšie od Microsoftu) pracoval na oboch procesoroch súčasne. Dokonca s 5 sekundovou výhodou pre staršieho - napriek tomu, že v tomto programe má "plná cache" Ivy Bridge o 4 sekundy lepší výsledok ako Nehalem. Vo všeobecnosti tu nemožno uvažovať o tom, že pokles kapacity L3 nejako výrazne ovplyvnil druhú a tretiu generáciu Core i5, existujú však nuansy.

Matematické a inžinierske výpočty

Opäť menej ako 1% rozdiel oproti „staršiemu“ krištáľu a opäť presvedčivé víťazstvo nad prvou generáciou vo všetkých jej podobách. Čo je pri takýchto nízkovláknových testoch skôr pravidlom ako výnimkou, ale prečo sa o tom ešte raz nepresvedčiť? Najmä v takej rafinovanej podobe, kedy (na rozdiel od testov v normálnom režime) neprekáža rozdiel vo frekvenciách („štandardný“ alebo objavujúci sa vďaka Turbo Boostu).

Rastrová grafika

Ale aj pri úplnejšom využití multithreadingu sa obraz nie vždy zmení. A kapacita vyrovnávacej pamäte nedáva vôbec nič.

Vektorová grafika

A tu je to podobné. Je pravda, že je potrebných iba niekoľko výpočtových vlákien.

Kódovanie videa

Na rozdiel od tejto skupiny, kde však ani Hyper-Threading neumožňuje Nehalemovi bojovať za rovnakých podmienok s nasledovníkmi novších generácií. Príliš im ale neprekáža ani pokles kapacity vyrovnávacej pamäte. Presnejšie povedané, prakticky vôbec neprekáža, keďže rozdiel je opäť menší ako 1 %.

Kancelársky softvér

Ako sa dalo očakávať, zvýšenie výkonu vyrovnávacej pamäte (presnejšie jej pokles z jej zníženia) neprinesie žiadny nárast. Hoci ak sa pozriete na podrobné výsledky, môžete vidieť, že jediný viacvláknový test v tejto skupine (konkrétne rozpoznávanie textu vo FineReaderi) je asi o 1,5% rýchlejší pri 8 MiB L3 ako pri 6 MiB. Zdalo by sa - čo je 1,5%? Prakticky povedané, nič. Ale z hľadiska výskumu je to už zaujímavé: ako vidíte, sú to viacvláknové testy, ktorým najčastejšie chýba vyrovnávacia pamäť. Vo výsledku je rozdiel (aj keď malý) niekedy aj tam, kde by nemal byť. V tomto síce nie je nič také nevysvetliteľné – zhruba povedané, pri nízkovláknových testoch máme 3-6 MiB na vlákno, no pri viacvláknových testoch dostaneme na rovnakom mieste 1,5 MiB. To prvé je veľa, no to druhé nemusí stačiť.

Java

Java stroj však s týmto hodnotením nesúhlasí, ale to je tiež pochopiteľné: ako sme už viackrát písali, je veľmi dobre optimalizovaný vôbec nie pre x86 procesory, ale pre telefóny a kávovary, kde môže byť veľa jadier, ale tu je vyrovnávacia pamäť veľmi málo pamäte. A niekedy je málo jadier a vyrovnávacej pamäte - drahé zdroje z hľadiska plochy čipu aj spotreby energie. A ak sa dá niečo urobiť s jadrami a megahertzmi, potom s vyrovnávacou pamäťou je všetko ťažšie: napríklad v štvorjadrovej Tegre 3 je to len 1 MiB. Je jasné, že JVM dokáže „grcať“ ešte viac (ako všetky systémy s bajtkódom), čo sme už videli pri porovnaní Celeronu a Pentia, ale viac ako 1,5 MiB na vlákno, ak sa to môže hodiť, tak nie v tých úlohách , ktoré sú zahrnuté v SPECjvm 2008.

Hry

Do hier sme vkladali veľké nádeje, pretože z hľadiska kapacity vyrovnávacej pamäte sú často náročnejšie ako archivátory. Stáva sa to však, keď je veľmi malý a 6 MiB - ako vidíme, je dosť. A opäť, procesory na úrovni quad-core Core akejkoľvek generácie, dokonca aj na frekvencii 2,4 GHz, sú príliš výkonným riešením pre používané herné aplikácie, takže úzkym hrdlom zjavne nebudú oni, ale iné komponenty systému. Preto sme sa rozhodli striasť prach z režimov s nízkou kvalitou grafiky - je jasné, že pre takéto systémy je to príliš syntetické, ale celé naše testovanie je syntetické :)

Keď všetky druhy grafických kariet a tak ďalej nezasahujú, rozdiel medzi dvoma Ivy Bridge už dosahuje „bláznivé“ 3%: v tomto prípade to môžete v praxi ignorovať, ale teoreticky je to veľa. Viac vyšlo len v archívoch.

Multitaskingové prostredie

Niekde sme to už videli. No áno – keď sme testovali šesťjadrové procesory pod LGA2011. A teraz sa situácia opakuje: zaťaženie je viacvláknové, niektoré používané programy sú „nežravé“ pre vyrovnávaciu pamäť, ale jeho zvýšenie iba znižuje priemerný výkon. Ako sa to dá vysvetliť? Pokiaľ sa neskomplikuje arbitráž a nezvýši sa počet miss. Navyše poznamenávame, že k tomu dochádza iba vtedy, keď je kapacita L3 relatívne veľká a existujú najmenej štyri súčasne pracujúce výpočtové vlákna - v rozpočtovom segmente je to úplne iný obraz. V každom prípade, ako ukázalo naše nedávne testovanie Pentium a Celeron, v prípade dvojjadrových procesorov zvýšenie L3 z 2 na 3 MiB pridáva k výkonu 6 %. Ale štvor- a šesťjadro nedáva, mierne povedané, nič. Dokonca menej ako nič.

Celkom

Celkový logický výsledok: keďže sa nikde nenašiel významný rozdiel medzi procesormi s rôznymi veľkosťami L3, nie je žiadny ani vo „všeobecnom a celku“. Nie je teda dôvod sa rozčuľovať nad poklesom kapacity vyrovnávacej pamäte v Core i5 druhej a tretej generácie – predchodcovia prvej generácie im aj tak nie sú konkurentmi. Áno, a staré Core i7 v priemere tiež predvádzajú iba podobnú úroveň výkonu (samozrejme, najmä kvôli oneskoreniu aplikácií s nízkym vláknom - a existujú scenáre, ktoré za rovnakých podmienok zvládnu rýchlejšie). Ale ako sme už povedali, v praxi sa skutočné procesory, pokiaľ ide o frekvencie, ani zďaleka nevyrovnajú, takže praktický rozdiel medzi generáciami je väčší, ako sa dá získať v takýchto štúdiách.

Otvorená zostáva iba jedna otázka: museli sme výrazne znížiť rýchlosť hodín, aby sme zaistili paritu s prvou generáciou Core, ale budú pozorované vzorce pretrvávať v podmienkach bližších realite? To, že štyri nízkorýchlostné výpočtové vlákna nevidia rozdiel medzi 6 a 8 MiB vyrovnávacej pamäte, totiž neznamená, že v prípade štyroch vysokorýchlostných nebude detekovaný. Pravdaže, opak z toho nevyplýva, takže aby sme konečne uzavreli tému teoretického výskumu, potrebujeme ešte jednu laboratórne práce ktorým sa budeme venovať nabudúce.

Počítačové procesory zaznamenali za posledných pár rokov výrazný pokrok. Veľkosť tranzistorov sa každým rokom zmenšuje a výkon rastie. Zároveň sa už Moorov zákon stáva irelevantným. Čo sa týka výkonu procesorov, treba brať do úvahy nielen počet tranzistorov a frekvenciu, ale aj množstvo vyrovnávacej pamäte.

Pri hľadaní informácií o procesoroch ste už možno počuli o vyrovnávacej pamäti. Ale zvyčajne týmto číslam nevenujeme veľkú pozornosť, dokonca ani v reklamách na procesory príliš nevynikajú. Pozrime sa, čo ovplyvňuje vyrovnávacia pamäť procesora, aké typy vyrovnávacej pamäte existujú a ako to celé funguje.

Ak hovoriť jednoduchými slovami, potom je vyrovnávacia pamäť CPU len veľmi rýchla pamäť. Ako už viete, počítač má niekoľko typov pamäte. Toto je pamäť len na čítanie, ktorá sa používa na ukladanie údajov, operačný systém a programy, ako je SSD resp HDD. Počítač využíva aj pamäť RAM. Toto je pamäť s náhodným prístupom, ktorá je oveľa rýchlejšia ako konštantná. A nakoniec, procesor má ešte rýchlejšie bloky pamäte, ktoré sa súhrnne nazývajú cache.

Ak si predstavíte pamäť počítača ako hierarchiu z hľadiska rýchlosti, vyrovnávacia pamäť bude na vrchole tejto hierarchie. Navyše má najbližšie k výpočtovým jadrám, keďže je súčasťou procesora.

Vyrovnávacia pamäť procesora je statická pamäť (SRAM) a je určená na urýchlenie práce s RAM. Na rozdiel od dynamickej pamäte s náhodným prístupom (DRAM) tu možno ukladať dáta bez toho, aby boli neustále aktualizované.

Ako funguje vyrovnávacia pamäť procesora?

Ako už možno viete, program je súbor inštrukcií, ktoré procesor vykonáva. Keď spustíte program, počítač potrebuje preniesť tieto inštrukcie z pamäte určenej len na čítanie do procesora. Tu vstupuje do hry hierarchia pamäte. Najprv sa údaje načítajú do pamäte RAM a potom sa prenesú do procesora.

V dnešnej dobe dokáže procesor spracovať obrovské množstvo inštrukcií za sekundu. Aby procesor čo najlepšie využil svoje možnosti, potrebuje super rýchlu pamäť. Preto bola cache vyvinutá.

Pamäťový radič procesora vykonáva úlohu získavania údajov z pamäte RAM a ich odosielania do vyrovnávacej pamäte. V závislosti od procesora použitého vo vašom systéme môže byť tento radič umiestnený na severnom mostíku základnej dosky alebo v samotnom procesore. Cache tiež ukladá výsledky vykonávania inštrukcií v procesore. Okrem toho má svoju vlastnú hierarchiu aj samotná vyrovnávacia pamäť procesora.

Úrovne vyrovnávacej pamäte procesora - L1, L2 a L3

Celá vyrovnávacia pamäť procesora je rozdelená do troch úrovní: L1, L2 a L3. Táto hierarchia je založená aj na rýchlosti vyrovnávacej pamäte, ako aj na jej veľkosti.

  • Vyrovnávacia pamäť L1 (vyrovnávacia pamäť prvej úrovne) je najrýchlejší typ vyrovnávacej pamäte v procesore. Pokiaľ ide o prioritu prístupu, táto vyrovnávacia pamäť obsahuje akékoľvek údaje, ktoré môže program potrebovať na vykonanie konkrétnej inštrukcie;
  • L2 Cache (vyrovnávacia pamäť druhej úrovne procesora)- pomalší ako L1, ale väčší. Jeho objem môže byť od 256 kilobajtov do osem megabajtov. Cache L2 obsahuje údaje, ktoré môže procesor v budúcnosti potrebovať. Vo väčšine moderných procesorov sú vyrovnávacie pamäte L1 a L2 prítomné na samotných jadrách procesorov, pričom každé jadro má svoju vlastnú vyrovnávaciu pamäť;
  • Vyrovnávacia pamäť L3 (vyrovnávacia pamäť tretej úrovne) je najväčšia a najpomalšia vyrovnávacia pamäť. Jeho veľkosť môže byť v rozsahu od 4 do 50 megabajtov. V moderných CPU je na čipe pridelené samostatné miesto pre vyrovnávaciu pamäť L3.

V súčasnosti sú to všetky úrovne vyrovnávacej pamäte procesora, Intel sa pokúsil vytvoriť vyrovnávaciu pamäť L4, táto technológia sa však ešte neujala.

Na čo slúži vyrovnávacia pamäť v procesore?

Je čas odpovedať na hlavnú otázku tohto článku, čo ovplyvňuje vyrovnávacia pamäť procesora? Dáta tečú z RAM do vyrovnávacej pamäte L3, potom do L2 a potom do L1. Keď procesor potrebuje dáta na vykonanie operácie, pokúsi sa ich nájsť v L1 cache a ak ich nájde, potom sa táto situácia nazýva cache hit. V opačnom prípade vyhľadávanie pokračuje v cache L2 a L3. Ak sa ani teraz údaje nepodarilo nájsť, odošle sa požiadavka do pamäte RAM.

Teraz vieme, že vyrovnávacia pamäť je navrhnutá tak, aby urýchlila prenos informácií medzi RAM a procesorom. Čas potrebný na získanie údajov z pamäte sa nazýva latencia. L1 cache má najnižšiu latenciu, teda je najrýchlejšia, L3 cache je najvyššia. Keď vo vyrovnávacej pamäti nie sú žiadne údaje, zaznamenávame ešte vyššiu latenciu, pretože procesor musí pristupovať k pamäti.

Predtým sa pri návrhu procesorov vyrovnávacie pamäte L2 a L3 presúvali mimo procesor, čo viedlo k vysokej latencii. Zníženie výrobného procesu, ktorým sa vyrábajú procesory, vám však umožňuje umiestniť miliardy tranzistorov do priestoru oveľa menšieho ako predtým. V dôsledku toho sa uvoľní priestor na umiestnenie vyrovnávacej pamäte čo najbližšie k jadrám, čo ďalej znižuje latenciu.

Ako vyrovnávacia pamäť ovplyvňuje výkon?

Vplyv vyrovnávacej pamäte na výkon počítača priamo závisí od jej účinnosti a počtu prístupov do vyrovnávacej pamäte. Situácie, keď vo vyrovnávacej pamäti nie sú žiadne údaje, výrazne znižujú celkový výkon.

Predstavte si, že procesor načíta dáta z vyrovnávacej pamäte L1 100-krát za sebou. Ak je percento zásahov do vyrovnávacej pamäte 100 %, bude procesoru trvať 100 nanosekúnd, kým tieto údaje získa. Akonáhle sa však percento zásahov zníži na 99 %, procesor bude musieť načítať údaje z vyrovnávacej pamäte L2 a už teraz je oneskorenie 10 nanosekúnd. Získate 99 nanosekúnd za 99 žiadostí a 10 nanosekúnd za 1 požiadavku. Preto zníženie percenta zásahov do vyrovnávacej pamäte o 1 % znižuje výkon procesora o 10 %.

V reálnom čase je percento zásahov do vyrovnávacej pamäte medzi 95 a 97 %. Ale ako viete, rozdiel vo výkonnosti medzi týmito ukazovateľmi nie je 2%, ale 14%. Majte na pamäti, že v príklade predpokladáme, že omilostené údaje sú vždy v L2 cache, in skutočný životúdaje môžu byť odstránené z vyrovnávacej pamäte, čo znamená, že ich bude potrebné získať z pamäte RAM, ktorá má oneskorenie 80-120 nanosekúnd. Tu je rozdiel medzi 95 a 97 percentami ešte výraznejší.

Slabý výkon vyrovnávacej pamäte procesory AMD Bulldozer a Piledriver boli jedným z hlavných dôvodov, prečo prehrali s procesormi Intel. V týchto procesoroch bola vyrovnávacia pamäť L1 zdieľaná medzi viacerými jadrami, čím bola veľmi neefektívna. IN moderné procesory Ryzen tento problém nemá.

Dá sa usúdiť, že čím väčšia vyrovnávacia pamäť, tým vyšší výkon, keďže vo viacerých prípadoch bude procesor schopný rýchlejšie získať potrebné údaje. Za pozornosť však stojí nielen veľkosť vyrovnávacej pamäte procesora, ale aj jej architektúra.

závery

Teraz viete, za čo je vyrovnávacia pamäť procesora zodpovedná a ako funguje. Dizajn vyrovnávacej pamäte sa neustále vyvíja a pamäť je stále rýchlejšia a lacnejšia. AMD a Intel už urobili veľa experimentov s vyrovnávacou pamäťou a Intel sa dokonca pokúsil použiť vyrovnávaciu pamäť L4. Trh s procesormi rastie rýchlejšie ako kedykoľvek predtým. Architektúra cache bude držať krok so stále sa zvyšujúcim výkonom procesorov.

Okrem toho sa veľa robí na odstránenie prekážok moderné počítače. Zníženie latencie pamäte je jedným z najvýznamnejších dôležité časti táto práca. Budúcnosť vyzerá veľmi sľubne.

Podobné záznamy.

Vitajte na GECID.com! Je dobre známe, že rýchlosť hodín a počet procesorových jadier priamo ovplyvňujú úroveň výkonu, najmä pri projektoch s vláknami. Rozhodli sme sa skontrolovať, akú úlohu v tom hrá vyrovnávacia pamäť L3?

Na preskúmanie tohto problému nám internetový obchod pcshop.ua láskavo poskytol 2-jadrový procesor s nominálnou prevádzkovou frekvenciou 3,7 GHz a 3 MB vyrovnávacej pamäte L3 s 12 kanálmi asociatívnosti. Ako protivník pôsobilo 4-jadrové, v ktorom boli vyradené dve jadrá a frekvencia hodín znížená na 3,7 GHz. Má 8 MB L3 cache a 16 asociatívnych kanálov. To znamená, že kľúčový rozdiel medzi nimi spočíva práve vo vyrovnávacej pamäti poslednej úrovne: Core i7 má o 5 MB viac.

Ak to bude mať citeľný vplyv na výkon, bude možné vykonať ďalší test so zástupcom radu Core i5, ktorý má na palube 6 MB vyrovnávacej pamäte L3.

Ale teraz späť k aktuálnemu testu. Účastníkom bude pomáhať grafická karta a 16 GB DDR4-2400 MHz RAM. Tieto systémy porovnáme vo Full HD rozlíšení.

Na začiatok začnime s nesynchronizovanými živými hrami, v ktorých nie je možné jednoznačne určiť víťaza. IN Umierajúce svetlo na maximálne nastavenia kvalitu, oba systémy vykazujú pohodlnú úroveň FPS, hoci zaťaženie procesora a grafickej karty bolo v priemere vyššie v prípade Intel Core i7.

Arma 3 má výraznú závislosť na procesore, čo znamená, že väčšie množstvo vyrovnávacej pamäte by malo zohrávať pozitívnu úlohu aj pri ultravysokých grafických nastaveniach. Okrem toho zaťaženie grafickej karty v oboch prípadoch dosiahlo maximálne 60%.

Hra DOOM na ultravysokých grafických nastaveniach umožňoval synchronizovať len prvých pár snímok, kde výhodou Core i7 je cca 10 FPS. Desynchronizácia ďalšieho hrania neumožňuje určiť mieru vplyvu vyrovnávacej pamäte na rýchlosť videosekvencie. Každopádne sa frekvencia držala nad 120 snímok/s, takže ani 10 FPS nemá na komfort prejazdu zvláštny vplyv.

Dokončuje mini-sériu živej hry 2. fáza vývoja. Tu by sme určite videli rozdiel medzi systémami, keďže v oboch prípadoch je grafická karta zaťažená približne na polovicu. Subjektívne sa teda zdá, že úroveň FPS je v prípade Core i7 vyššia, no s istotou sa to povedať nedá, keďže scény nie sú totožné.

Benchmarky poskytujú informatívnejší obraz. Napríklad v Gta v môžete vidieť, že mimo mesta výhoda 8 MB vyrovnávacej pamäte dosahuje 5-6 snímok / s a ​​v meste - až 10 FPS kvôli vyššiemu zaťaženiu grafickej karty. Samotný videoakcelerátor zároveň v oboch prípadoch zďaleka nie je zaťažený na maximum a všetko závisí od CPU.

Tretí čarodejník sme spustili s poburujúcim grafickým nastavením a vysokým profilom následného spracovania. V jednej zo skriptovaných scén výhoda Core i7 miestami dosahuje 6-8 FPS s prudkou zmenou uhla a nutnosťou načítať nové dáta. Keď zaťaženie procesora a grafickej karty opäť dosiahne 100%, rozdiel sa zníži na 2-3 snímky.

Maximálne prednastavené grafické nastavenia v XCOM 2 sa nestal vážnym testom pre oba systémy a snímková frekvencia bola v oblasti 100 FPS. No aj tu sa väčšie množstvo vyrovnávacej pamäte pretavilo do zvýšenia rýchlosti z 2 na 12 snímok/s. A hoci oba procesory nedokázali vyťažiť grafickú kartu na maximum, 8 MB verzia si v tejto veci počínala miestami lepšie.

Najúžasnejšia hra Dirt Rally, ktorý sme spustili s veľmi vysokým prednastavením. V určitých bodoch dosahoval rozdiel 25 snímok/s len vďaka väčšej vyrovnávacej pamäti L3. To umožnilo o 10-15% lepšie zaťaženie grafickej karty. Priemerné výsledky benchmarku však ukázali skromnejšie víťazstvo Core i7 – iba 11 FPS.

Zaujímavá situácia nastala s dúha šesť obliehanie: na ulici, v prvých snímkach benchmarku, bola výhoda Core i7 10-15 FPS. V interiéri zaťaženie CPU a grafickej karty v oboch prípadoch dosiahlo 100%, takže rozdiel sa znížil na 3-6 FPS. Ale ku koncu, keď sa kamera odsťahovala z domu, Core i3 opäť zaostávalo miestami nad 10 fps. Priemerný údaj sa ukázal byť na úrovni 7 FPS v prospech 8 MB vyrovnávacej pamäte.

Divízia pri maximálnej kvalite grafiky dobre reaguje aj na zväčšenie vyrovnávacej pamäte. Už prvé snímky benchmarku plne zaťažili všetky vlákna Core i3, no celkové zaťaženie Core i7 bolo 70 – 80 %. Rozdiel v rýchlosti bol však v týchto momentoch len 2-3 FPS. O niečo neskôr zaťaženie oboch procesorov dosiahlo 100% a v určitých bodoch bol rozdiel už za hranicou Core i3, ale iba o 1-2 snímky / s. V priemere to bolo asi 1 FPS v prospech Core i7.

Na druhej strane, benchmarkRise of Tomb Riderpri vysokých nastaveniach grafiky vo všetkých troch testovacích scénach jasne ukázal výhodu procesora s výrazne väčšou vyrovnávacou pamäťou. Jeho priemerný výkon je o 5-6 FPS lepší, no ak sa pozorne pozriete na každú scénu, tak na niektorých miestach Core i3 zaostáva o viac ako 10 snímok/s.

Ale pri výbere predvoľby s veľmi vysokými nastaveniami sa zvyšuje zaťaženie grafickej karty a procesorov, takže z väčšej časti sa rozdiel medzi systémami znižuje na niekoľko snímok. A len na krátky čas môže Core i7 ukázať výraznejšie výsledky. Podľa výsledkov benchmarku sa priemerné ukazovatele jeho výhodnosti znížili na 3-4 FPS.

Hitman tiež menej ovplyvnená vyrovnávacou pamäťou L3. Aj keď tu s ultra vysokým profilom detailov bolo poskytnutých ďalších 5 MB najlepšie na stiahnutie grafické karty, čím sa to zmení na ďalšie 3-4 snímky/s. Nemajú obzvlášť kritický vplyv na výkon, ale z čisto športového záujmu je pekné, že existuje víťaz.

Vysoké nastavenia grafiky Deus ex: Ľudstvo rozdelené okamžite požadoval maximálny výpočtový výkon od oboch systémov, takže rozdiel bol prinajlepšom 1-2 snímky v prospech Core i7, ako naznačuje priemer.

Opätovné spustenie na ultravysokú predvoľbu ešte viac zaťažilo grafickú kartu, takže vplyv procesora na celkovú rýchlosť bol ešte menší. Preto rozdiel vo vyrovnávacej pamäti L3 nemal na situáciu prakticky žiadny vplyv a priemerné FPS sa líšili o menej ako polovicu snímky.

Podľa výsledkov testovania je možné poznamenať, že vplyv vyrovnávacej pamäte L3 na výkon v hrách sa prejavuje, ale prejavuje sa až vtedy, keď grafická karta nie je zaťažená na plnú kapacitu. V takýchto prípadoch by bolo možné získať zvýšenie o 5-10 FPS, ak by sa vyrovnávacia pamäť zvýšila 2,5-krát. To znamená, že sa približne ukazuje, že ak sú ostatné veci rovnaké, každý ďalší MB vyrovnávacej pamäte L3 pridáva k rýchlosti zobrazenia videosekvencie iba 1-2 FPS.

Ak teda porovnáme susedné linky, napríklad Celeron a Pentium, alebo modely s rôznymi veľkosťami vyrovnávacej pamäte L3 v sérii Core i3, potom sa hlavný nárast výkonu dosiahne vďaka viac vysoké frekvencie a potom prítomnosť ďalších procesorových vlákien a jadier. Preto sa pri výbere procesora musíte v prvom rade zamerať na hlavné charakteristiky a až potom venovať pozornosť množstvu vyrovnávacej pamäte.

To je všetko. Ďakujem za tvoju pozornosť. Dúfame, že tento materiál bol užitočný a zaujímavý.

Článok bol prečítaný 27046 krát

Prihláste sa na odber našich kanálov