Intel binārās optimizācijas rīks: kā tas maksimāli izmanto jūsu spēles un etalonus

  • Intel Binary Optimization Tool optimizē jau kompilētus bināros failus, nepieskaroties sākotnējam .exe failam, reorganizējot instrukcijas un uzlabojot vektorizāciju.
  • Rīks balstās uz HWPGO un Intel laboratorijās ģenerētiem profiliem, sasniedzot vidēji tuvu 8% un spēlēs virs 20%.
  • Tā pašreizējā darbības joma ir ierobežota: dažas atbalstītas spēles, ekskluzīvas Arrow Lake Refresh, un problēmas ar pretkrāpšanas programmām un etaloniem, piemēram, Geekbench.
  • Ja tā saderība tiks paplašināta un pārredzamības problēmas tiks atrisinātas, tas varētu būt galvenais Intel veiktspējas stratēģijas pīlārs.

Intel binārās optimizācijas rīks

Jauno Intel Core Ultra 200S Plus procesoru, kas pazīstami kā Arrow Lake Refresh, ienākšana piedāvā ne tikai GHz un kodolus. Tam ir arī ļoti specifiska programmatūra: Intel binārās optimizācijas rīks jeb BOT/IBOT, tehnoloģija, kas izstrādāta, lai vēl vairāk uzlabotu veiktspēju reālajā pasaulē, īpaši spēles ar pieticīgām grafikas procesoriem un sarežģītus darba apjomus, izstrādātājiem nepieskaroties nevienai koda rindai.

Šī pieeja ir interesanta, jo tā koncentrējas uz to, kā binārie faili tiek izpildīti centrālajā procesorā (CPU), nevis tikai uz mikroshēmas jaudu. Programmu pārkompilēšanas vai spēļu ielāpu vietā Intel piedāvā slāni jau kompilēta koda dinamiskā optimizācija Šī tehnoloģija darbojas starp izpildāmo failu un procesoru, reorganizējot instrukcijas un labāk izmantojot iekšējo mikroarhitektūru. Tas viss rada ļoti interesantas debates: vai joprojām ir "taisnīgi" salīdzināt procesorus, ja viens no tiem izmanto tik agresīvu atbalstu?

Kas īsti ir Intel Binary Optimization Tool un kā tas atšķiras no citām optimizācijām?

Intel binārās optimizācijas rīks būtībā ir jau kompilētiem binārajiem failiem piemērots intelektuālas tulkošanas un optimizācijas slānisTas nerekompilē, nedekompilē un nemodificē spēles vai lietojumprogrammas sākotnējo izpildāmo failu, tomēr tas maina veidu, kā binārais fails baro centrālo procesoru, lai tas darbotos efektīvāk.

Ideja izriet no fundamentālas problēmas, kas pastāv jau gadiem ilgi: daudzas spēles un programmas tiek izstrādātas, ņemot vērā sekojošo: vecākas arhitektūras, konsoles vai vispārīgi centrālie procesoriRezultātā, darbinot tos uz modernas aparatūras, piemēram, Arrow Lake Refresh, centrālais procesors netiek pilnībā izmantots. Rodas neefektivitāte, atzaru prognozēšanas kļūmes, slikta kešatmiņas izmantošana vai vienkārši vektorizācijas trūkums tur, kur tas varētu būt.

Tradicionālo kompilatoru optimizāciju vai izstrādātāju ielāpu vietā BOT ierosina, ka Intel savās laboratorijās... Analizēt šīs darba slodzes mikroarhitektūras līmenī un ģenerēt optimizētu koda versiju, bet nepieskaroties .exe failam, kas atrodas diskā.

Zīmola programmatūras ekosistēmā BOT apvieno tādus rīkus kā Intel Application Optimizer (APO) un citus veiktspējas komplekta komponentus. Lai gan APO galvenokārt koncentrējas uz kodola un pavedienu piešķiršana un mijiedarbība ar plānotāju No operētājsistēmas BOT darbojas vēl tālāk, instrukciju plūsmā, kas tiek izpildītas pašā centrā, kas liek abām sistēmām viena otru papildināt, nevis pārklāties.

Intel BOT iekšējā darbība

Kā Intel BOT darbojas iekšēji: HWPGO, mikroarhitektūra un binārie profili

Intel BOT tehniskais dzinējspēks balstās uz pieeju, kas balstīta uz Aparatūras balstīta profila vadīta optimizācija (HWPGO)Vienkārši sakot, Intel analizē binārie faili uzvedas, darbojoties tā arhitektūrā, atrod vājās vietas un, izmantojot šo informāciju, ģenerē optimizētu mašīnkoda versiju.

Šīs analīzes laikā tiek detalizēti uzraudzītas tādas lietas kā atzaru prognozēšanas kļūmes, cauruļvada burbuļi, kešatmiņas latentums un slikta priekšielādes izmantošana. Kad tiek identificēti neefektīvi modeļi, sistēma izveido korektīvais profils, kas reorganizē instrukcijas lai līdz minimumam samazinātu šīs problēmas. Mērķis nav veikt mazāk darba vai "izlaist" darbības, bet gan veikt tādu pašu darba apjomu veidā, kas ļauj centrālajam procesoram (CPU) uzturēt daudz augstāku efektīvo IPC.

Svarīgs aspekts ir tas, ka viss šis profilēšanas process nenotiek jūsu datorā, bet gan Intel laboratorijās. Izmantojot pēcsaites optimizācijas metodes, uzņēmums ģenerē pārstrukturēti binārie kodi ar uzlabotu instrukciju blīvumuŠie profili ir īpaši izstrādāti jaunāko mikroshēmu mikroarhitektūrām. Pēc tam tie tiek izplatīti kā daļa no veiktspējas pakotnes, lai lietotājs tos aktivizētu.

Jūsu datorā, aktivizējot Intel BOT, fonā darbojas lietotāja režīma pakalpojums. Šis pakalpojums ir atbildīgs par uzraudzīt, kad tiek izlaisti saderīgi binārie faili un novirzīt tā izpildi uz Intel izveidotajiem optimizētajiem ceļiem. Jūsu cietajā diskā esošais .exe fails netiek modificēts: mainās tikai ceļš, pa kuru instrukcijas seko izpildes laikā, līdzīgi kā grafikas draiveris noteiktās spēlēs aizstāj ēnotājus ar optimizētām versijām.

Tehniski rīks darbojas kā sava veida dinamisks izpildes plūsmas optimizētājs, izmantojot savas iekšējās zināšanas par Arrow Lake Refresh mikroarhitektūru. Tas nedarbojas kā klasisks draiveris vai spēles ielāps; tas ir kaut kas pa vidu. pārkārtot instrukciju izvēlni, nemainot "gabalus", tikai secība, kādā tie tiek pasniegti centrālajam procesoram.

Saistība starp Intel BOT, APO un citiem Intel veiktspējas rīkiem

Intel jaunākajā stratēģijā BOT nerodas viens pats: tas ir daļa no plašāka kopuma, kurā pastāv līdzās arī citas tehnoloģijas. Intel Extreme Tuning Utility (XTU)Intel lietojumprogrammu optimizētājs (APO) un tagad Intel pašu izstrādātais bināro failu optimizācijas rīks (IBOT/BOT). Katrs komponents aptver atšķirīgu veiktspējas aspektu.

XTU koncentrējas uz klasiskāko pusi CPU pārslodze, spriegumi un parametriTas ir, pašas aparatūras regulēšana. APO iedarbojas uz programmatūras un operētājsistēmas slāni, kontrolējot pavedienu un uzdevumu sadalījumu starp dažādiem kodolu veidiem (P-kodoli, E-kodoli) un uzraugot resursu sadali, lai lietojumprogrammas, kurām tas ir nepieciešams, gūtu vislielāko labumu no atbilstošās aparatūras.

Savukārt BOT nonāk vēl zemākā līmenī: pati instrukciju plūsma, ko centrālais procesors izpilda konkrētam binārajam failamKamēr APO cenšas panākt, lai uzdevums pareizajā kodolā iekristu pareizajā laikā, BOT nodrošina, ka šīs instrukcijas ir sakārtotas un vektorizētas tā, lai tās vislabāk atbilstu mikroshēmas iekšējai arhitektūrai.

Praksē tas nozīmē, ka, ja spēle ir atbalstīto nosaukumu sarakstā un lietotājs aktivizē atbilstošo režīmu, APO un BOT var strādāt kopāAPO apstrādā pareizu darba slodzes sadali, un BOT izvelk iegūto mašīnkodu. Tieši šādos scenārijos ir reģistrēti visievērojamākie veiktspējas uzlabojumi, īpaši spēlēs, kas ir vāji pielāgotas Intel hibrīdarhitektūrai.

Jāatzīmē, ka, lai gan BOT filozofija atgādina APO filozofiju (abas ir programmatūras optimizācijas, kas tiek piemērotas "no ārpuses" lietojumprogrammai), Tie nav savstarpēji aizvietojami vai līdzvērtīgiIntel tos piedāvā kā papildinošus rīkus, lai precīzi noregulētu katru veiktspējas steka slāni: sākot no aparatūras un tās konfigurācijas (XTU), procesu sadales (APO) un beidzot ar paša mašīnkoda reorganizāciju (BOT).

Spēļu veiktspējas pieaugums: no nelieliem uzlabojumiem līdz iespaidīgiem lēcieniem

Intel apgalvo, ka pirmajā atbalstīto nosaukumu partijā binārās optimizācijas rīks sasniedz vidējais uzlabojums spēlēs ir aptuveni 8%ar daudz augstākiem maksimumiem konkrētos scenārijos. Pagaidām mēs runājam par samazinātu sarakstu ar aptuveni 12 spēlēm, taču sākotnējie rezultāti ir pārsteidzoši.

Viens no visbiežāk minētajiem piemēriem ir Tomb Raider ēnaŠī spēle, pateicoties sākotnējai optimizācijai, pilnībā neizmantoja mūsdienu Intel procesoru hibrīdarhitektūru. Ar APO + BOT kombināciju dažos etalonos ir izmērīts pieaugums par aptuveni 22% un pat vairāk, piemēram, kadru ātrumam (FPS) palielinoties no 298 līdz 375 kadriem sekundē, kas ir gandrīz 26% lēciens.

Modernākā spēlē, kas ir labāk optimizēta pašreizējiem centrālajiem procesoriem, piemēram, Cyberpunk 2077Tomēr stāsts ievērojami mainās. Šajā gadījumā uzlabojumi ir tikai daži procentpunkti: no aptuveni 210 kadriem sekundē līdz nedaudz vairāk par 220 atsevišķos etalonos vai no aptuveni 173 kadriem sekundē līdz aptuveni 179 citās konkrētās ainās. Mēs runājam par pieaugums par aptuveni 3–5 %kas joprojām ir apsveicami, jo lietotājam tie ir "bezmaksas", taču tie vairs tik daudz nemaina pieredzi.

Šie skaitļi liecina, ka BOT nav ne brīnumlīdzeklis, ne melnā maģija, bet gan Tas ir ļoti atkarīgs no tā, cik slikti (vai labi) ir optimizēta sākuma spēle.Ja sākotnējais binārais fails ir ievērojami nepareizi saskaņots ar Intel arhitektūru, ietekme var būt dramatiska. Kad tas ir diezgan labi noregulēts, BOT izspiež tikai dažus papildu kadrus sekundē, kas joprojām var būt svarīgs kritiskās situācijās vai pie augstiem atsvaidzes intensitātes rādītājiem.

Papildus spēļu pasaulei ievērojama ietekme ir novērota arī noteiktās resursu ietilpīgās lietojumprogrammās, piemēram, Objektu noņemšanas vai HDR apstrādes funkcijakur laboratorijas analīzes liecina par pieaugumu, kas var sasniegt 30%, pateicoties agresīvākai sākotnēji skalāro koda sadaļu vektorizācijai.

Dziļā vektorizācija un instrukciju analīze: Geekbench gadījums

Viens no skaidrākajiem veidiem, kā izprast BOT darbību, ir aplūkot, par ko ir atbildīga Primate Labs. GeekbenchViņi rūpīgi pārbaudīja, kā mainījās viņu etalona veiktspēja, kad Intel rīks bija aktīvs. Lai to izdarītu, viņi izmantoja Intel programmatūras izstrādes emulatoru (SDE), kas mēra izpildīto instrukciju skaitu un veidu.

Standarta Geekbench 6 testā bez robotprogrammatūras tests aizņēma aptuveni 1,26 triljoni instrukciju lai pabeigtu. Aktivizējot BOT, šis skaitlis samazinājās līdz aptuveni 1,08 triljoniem, kas nozīmē aptuveni 14 % samazinājumu kopējā instrukciju skaitā. Citiem vārdiem sakot, darbs tiek veikts kompaktāk un efektīvāk, neierobežojot funkcijas vai neizmantojot īsceļus.

Sadalot to pa instrukciju veidiem, rīka filozofija kļūst vēl skaidrāka. Skalāro instrukciju skaits samazinās no aptuveni no 220.000 miljardiem līdz aptuveni 84.600 miljardiem, savukārt vektoru instrukciju (SSE2, AVX2 utt.) skaits strauji pieaug no 1.250 miljardiem līdz aptuveni 18.300 miljardiem, tas ir, šāda veida instrukciju skaits pieaug aptuveni 13,7 reizes.

Tas skaidri parāda, ka BOT galvenokārt ir veltīts neefektīvus skalārā koda segmentus pārvērst vektorizētā kodā kas labāk izmanto SIMD vienības Intel procesoros. Tur, kur iepriekš tika veiktas daudzas vienkāršas, atkārtotas darbības, tagad tās ir sagrupētas vektoru operācijās, kas paralēli apstrādā vairākus datu punktus, kas lieliski atbilst uzņēmuma jaunāko mikroarhitektūru iekšējam dizainam.

Šī masveida vektorēšana netiek veikta akli. Tā ir balstīta uz aparatūras profilēšanu (HWPGO) un binārā līmeņa pēcoptimizāciju, ko Intel veic savās laboratorijās, kas izskaidro, kāpēc no malas BOT tiek uztverts kā diezgan sarežģīta melnā kasteLietotājs redz tikai to, ka etalons vai spēle darbojas ātrāk, bet viņam nav precīza ieskata par to, kādas transformācijas ir piemērotas izpildes ceļam.

Savietojams ar dažām spēlēm, ekskluzīvs Arrow Lake Refresh un prasa manuālu aktivizēšanu.

Neskatoties uz tā potenciālu, šim rīkam ir vairāki ievērojami ierobežojumi. Pirmais ir tas, ka vismaz šajā sākotnējā fāzē Intel BOT saderība ir ierobežota ar nelielu spēļu sarakstu.aptuveni ducis atlasītu nosaukumu. Intel ir norādījis, ka paplašinās katalogu, taču pagaidām darbības joma ir diezgan ierobežota.

Otrais svarīgais ierobežojums ir tas, ka tas ir ekskluzīva Arrow Lake Refresh procesoru (Core Ultra 200S Plus) funkcija, un Linux atbalsts ir atkarīgs no tādiem risinājumiem kā Protons 11Tas nav kaut kas tāds, ko var aktivizēt iepriekšējās paaudzēs, kas padara BOT par šīs CPU saimes atšķirīgu iezīmi salīdzinājumā ar iepriekšējiem modeļiem un daļēji salīdzinājumā ar tiešajiem konkurentiem.

Turklāt, lai izbaudītu šīs optimizācijas, lietotājam ir jāveic noteiktas darbības: pašlaik BOT tiek aktivizēts, izmantojot "Uzlabotais režīms" Intel veiktspējas pakotnē un, lai profili tiktu lietoti pareizi, ir nepieciešama sistēmas restartēšana. Tas nav sarežģīts process, taču tas nebūt nav pilnīgi caurspīdīgs.

Intel ir uzstājis, ka vēlas, lai galīgā pieredze būtu pēc iespējas automātiskāka, un patiesībā liela daļa maģijas notiek klusībā, tiklīdz tā ir iestatīta, taču pagaidām ir noteikta sastāvdaļa sarežģītība un ekskluzivitāte kas ierobežo tā milzīgo ietekmi mazāk entuziastisku lietotāju vai to vidū, kuri mazāk vēlas pieskarties papildu iestatījumiem.

Vēl viens apsvērums ir tas, ka, darbojoties tik zemā līmenī binārā faila izpildes ceļā, BOT pašlaik ir aizliegts daudzās jutīgās vidēsīpaši tiešsaistes spēlēs ar ļoti stingrām pretkrāpšanas sistēmām.

Problēmas ar pretkrāpšanas sistēmām un šaubas salīdzinošās novērtēšanas pasaulē

Viena no Intel BOT delikātākajām jomām ir tā mijiedarbība ar pretkrāpšanas sistēmas vairāku spēlētāju spēlēsTā kā rīks modificē binārā faila izpildes veidu izpildes laikā, dažas pretkrāpšanas programmas, piemēram, Ricochet vai Vanguard, var to interpretēt kā mēģinājumu manipulēt ar spēli un atzīmēt to kā aizdomīgu rīcību.

Tas nozīmē, ka pagaidām BOT var nebūt piemērots konkurētspējīgām tiešsaistes spēlēmkur galvenā prioritāte ir klientu integritāte. Kamēr starp Intel un pretkrāpšanas sistēmu pārdevējiem nebūs skaidras vienošanās vai tiks izstrādātas konkrētas metodes, lai apliecinātu, ka šīs optimizācijas nerada negodīgas priekšrocības, šī funkcija, visticamāk, paliks ierobežota viena spēlētāja spēlēm vai pieredzei bez šādām agresīvām pretkrāpšanas sistēmām.

Otrs būtisks strīdus punkts ir radies sintētisko etalonu jomā. Uzņēmums Primate Labs, kas izstrādājis Geekbench, ir paziņojis, ka robotprogrammatūru izmantošana var apdraudēt rezultātu derīgumujo tas būtiski maina izpildāmā faila paredzēto uzvedību. Salīdzinošās novērtēšanas vidē, kur paredzēts mērīt sistēmas "tīro veiktspēju", šāds ārējs optimizācijas slānis maina spēles noteikumus.

Lai saglabātu caurspīdīgumu, Geekbench skaidri atzīmēs palaišanas reizes, kad tas konstatēs Intel BOT iejaukšanos. Etalona 6.7. versijā tiks pievienots īpašs karodziņš, lai identificētu rezultātus, kas uzlaboti ar BOTlai tos varētu viegli atšķirt no tradicionālajiem mērījumiem un tie netiktu sajaukti rangos bez pienācīga skaidrojuma.

Šī situācija rosina interesantas debates par to, kā mums vajadzētu interpretēt etalonus laikmetā, kad optimizācijas programmatūra var fundamentāli pārkārtot centrālā procesora (CPU) veikto darbuRobeža starp aparatūras "reālajām" iespējām un programmatūras sniegto palīdzību kļūst izplūdusi, un tas liek mums pārdomāt, ko tieši mēs mēram, salīdzinot divus procesorus ar ļoti atšķirīgām konfigurācijām.

Tomēr no gala lietotāja viedokļa diskusija ir mazāk filozofiska: ja spēle vai lietojumprogramma viņu datorā darbojas ievērojami ātrāk, jo Intel ir izdevies uzlabot izpildes ceļu, neupurējot kvalitāti vai funkcijas, sajūta būs vienkārši tāda, ka "Tā procesors darbojas labāk."lai gan daļa no šī nopelna ir saistīta ar bināro optimizācijas slāni, nevis tikai silīciju.

Intel BOT praktiskās priekšrocības un nākotne salīdzinājumā ar konkurentiem

Raugoties plašāk, BOT tiek pasniegts kā sava veida Intel "slepenais ierocis", lai samazināt daļu no snieguma atšķirībām saskaroties ar ļoti spēcīgām alternatīvām no konkurentu puses, īpaši spēlēs, pirms tādu nākotnes arhitektūru kā Nova Lake un tās solītā BLLC parādīšanās.

Šī rīka galvenā priekšrocība ir tā, ka, ja sākotnējais izpildāmais fails ir slikti optimizēts Intel arhitektūrai, Peļņa var būt milzīga. bez nepieciešamības lietotājam veikt nekādas izmaiņas pašā spēlē, nedz arī izstrādātājam jāizlaiž konkrēts ielāps. Tas ir veids, kā atgūt zaudēto veiktspēju spēlēs, kas sākotnēji bija paredzētas citām platformām vai konsolēm.

Turklāt BOT nesamazina vizuālo kvalitāti, starpsienu ainas vai fiziku: programmas funkcija paliek nemainīga. Mainās tikai instrukciju organizēšana, lai centrālais procesors (CPU)... aizņemtāks, veicot noderīgu darbu, un mazāk jāgaida. izmantojot datus, kešatmiņas vai prognozētājus. No spēļu pieredzes viedokļa tas nozīmē stabilāku kadru ātrumu sekundē (FPS) un dažos gadījumos mazākas veiktspējas svārstības sarežģītās ainās.

Lielais izaicinājums nākotnē būs viņu mērogojamība un pieņemšana nozarēLai Intel BOT radītu patiesi milzīgu ietekmi, atbalstīto spēļu un lietojumprogrammu sarakstam būs ievērojami jāpieaug, un galvenajiem ekosistēmas dalībniekiem (pretkrāpšanas programmatūrai, etalonu izstrādātājiem, izstrādes studijām utt.) būs jāpielāgojas šī jaunā starpprogrammatūras slāņa esamībai.

Būs arī interesanti redzēt, kā reaģēs konkurenti. Ja šī binārās optimizācijas stratēģija izrādīsies efektīva un tirgus to labi uztvers, nebūtu pārsteigums, ja citi uzņēmumi izpētītu līdzīgas stratēģijas. līdzīgi koda risinājumi pēc optimizācijas vai arī iedziļināties draiveru un starpslāņu lietošanā, lai maksimāli izmantotu aparatūru.

Kopumā Intel Binary Optimization Tool rīkam ir liels potenciāls tiem, kas vēlas izspiest katru pēdējo FPS vai papildu punktu noteiktās darba slodzēs, taču tam ir ievērojamas pelēkās zonas attiecībā uz saderību, caurspīdīgumu un darbības jomu. Ja Intel izdosies paplašināt savu atbalstu, uzlabot integrāciju ar pretkrāpšanas programmatūru un normalizēt savu klātbūtni etalonos, tas varētu kļūt par... galvenā viņu darbības stratēģijas sastāvdaļa turpmākajos gados, ne tikai uzlabojot aparatūru.

saistīto rakstu:
Paātriniet spēles kā ellē, izmantojot Wise Game Booster