Power10 Performance Quick Start Guides
(Power10 QSG)
nóvember 2021
Lágmarksminni
- Fyrir hverja örgjörvainnstungu eru að minnsta kosti 8 af 16 DIMM-möppum innbyggðar
- Í hnút eru að lágmarki 32 af 64 fyrir DIMM-kortin
- Í 4-hnúta kerfi eru að lágmarki 128 af 256 DIMM
DDIMM stinga reglur
- Uppfylla lágmarksminni sem leyfilegt er (hver örgjörvainnstungur að lágmarki 8 af 16 DIMM-kortum eru byggðar)
- Allir DIMM undir hverjum örgjörva verða að vera með sömu getu
- Boðið verður upp á uppfærslur á eiginleikum í þrepum um 4 DDIMM, sem allir hafa sömu getu.
- Eini gildi fjöldi DDIMM sem er tengdur við vefsvæði sem tengjast tiltekinni örgjörvaeiningu er 8 eða 12 eða 16.
Minni árangur
- Afköst kerfisins batna eftir því sem minnismagnið dreifist á fleiri DDIMM raufar. Til dæmisample, ef 1TB þarf í hnút, þá er betra að hafa 64 x 32GB DIMM en að hafa 32 x 64GB DIMM.
- Að tengja DIMM sem eru öll af sömu stærð mun veita hæsta afköst
- Afköst kerfisins batna eftir því sem fleiri quads passa hver við annan
- Afköst kerfisins batna eftir því sem fleiri DDIMM örgjörva passa við hvert annað
- Afköst kerfisins batna á fjölskúffukerfi ef minnisgeta á milli skúffa er í jafnvægi.
Bandbreidd minni
DDIMM getu | Fræðileg MaxBandwidth |
32GB, 64GB (DDR4 @ 3200 Mbps) | 409 GB/s |
128GB, 256GB (DDR4 @ 2933 Mbps) | 375 GB/s |
Samantekt
- Fyrir bestu mögulegu frammistöðu er almennt mælt með því að minni sé sett upp jafnt yfir allar kerfishnútaskúffur og allar örgjörvainnstungur í kerfinu. Jafnvægi á minni yfir uppsettu kerfiskortunum gerir minnisaðgang kleift á samkvæman hátt og leiðir venjulega til betri frammistöðu fyrir stillingar þínar.
- Þrátt fyrir að hámarksbandbreidd minni sé náð með því að fylla allar minnisraufarnar, ætti að huga að framtíðaruppbót á minni þegar ákveðið er hvaða minniseiginleikastærð á að nota við upphaflega kerfispöntun.
P10 Compute & MMA arkitektúr
- 2x bandbreidd samsvarandi SIMD*
- 8 sjálfstæðar Fixed & Float SIMD vélar á kjarna
- 4 – 32x Matrix Math hröðun*
- 4 512 bita vél á kjarna = 2048b niðurstöður / lotur
- Matrix stærðfræði ytri vörur með einfaldri, tvöföldu og minni nákvæmni.
- MMA arkitektúrstuðningur kynntur í POWER ISA v3.1
- Styður SP, DP, BF16, HP, Int-16, Int-8 & Int-4 nákvæmnisstig.
P10 MMAA forrit og samþætting vinnuálags
- ML & HPC forrit með þéttum línulegum algebru útreikningum, fylkis margföldun, snúningum, FFT er hægt að flýta með MMA
- GCC útgáfa >= 10 & LLVM útgáfa >=12 styður MMA í gegnum innbyggða.
- OpenBLAS, IBM ESSL og Eigen bókasöfn eru nú þegar fínstillt með MMA leiðbeiningum fyrir P10.
- Auðveld samþætting MMA fyrir fyrirtækjaforrit, ML ramma og Open Community pakka í gegnum ofangreind BLAS bókasöfn.
PowerPC Matrix-Multiply Assist Innbyggðar aðgerðir https://gcc.gnu.org/onlinedocs/gcc/PowerPC-Matrix-Multiply-Assist-Built-in-Functions.html
Matrix-Multiply Assist Leiðbeiningar um bestu starfsvenjur https://www.redbooks.ibm.com/Redbooks.nsf/RedpieceAbstracts/redp5612.html?OpenSýndar örgjörvar
- Summa réttra kjarna allra samnýtra skiptinga má ekki fara yfir fjölda kjarna í sameiginlegu lauginni
- Gakktu úr skugga um að fjöldi stilltra sýndarörgjörva allra sameiginlegra skiptinga á ramma sé ekki meiri en fjöldi kjarna í sameiginlegu lauginni
- Stilltu fjölda sýndargjörva fyrir sameiginlega skiptingu til að viðhalda hámarkseftirspurn
- Stilltu fjölda réttra kjarna fyrir samnýtt skipting í meðalnýtingu á þeirri skipting fyrir betri afköst
- Til að tryggja betri minni og örgjörva sækni (forðastu óþarfa forskot sýndarörgjörvans), tryggðu summan af réttkjörnum allra samnýtra skiptinga nálægt fjölda kjarna í sameiginlega lauginni
Örgjörvasamhæfisstilling
- Það eru 2 örgjörvasamhæfisstillingar í boði fyrir AIX: POWER9 og POWER9_base. Sjálfgefið er POWER9_base mode.
- Það eru 2 örgjörvasamhæfisstillingar í boði fyrir Linux: POWER9 og POWER10 ham. Sjálfgefin er POWER10 stilling.
- Eftir LPM skipting, þarf að kveikja á hringrás þegar skipt er um samhæfni örgjörva
Hugleiðingar um að brjóta saman örgjörva
- Fyrir hlutdeild sem keyrir AIX á Power9, sjálfgefið vpm_throughput_mode = 0, á Power10, sjálfgefið vpm_throughput_mode = 2. Fyrir vinnuálag sem hefur langvarandi störf, getur það hugsanlega hjálpað til við minnkun kjarnanotkunar.
- Fyrir sérstaka skipting sem keyrir AIX er sjálfgefin vpm_throughput_mode = 0 á bæði Power9 og Power10.
LPAR síðutafla Stærðarsjónarmið
• Radix síðutafla er studd frá og með Power10 sem keyrir Linux. Það getur hugsanlega bætt frammistöðu vinnuálags.
Tilvísun:
Ábendingar og ráð til að flytja vinnuálag til IBM POWER Systems: https://www.ibm.com/downloads/cas/39XWR7YM
IBM POWERVirtualization Best Practices Guide: https://www.ibm.com/downloads/cas/JVGZA8RW
Gakktu úr skugga um að stýrikerfisstigið sé núverandi
Fix Central veitir nýjustu uppfærslurnar fyrir AIX, IBM i, VIOS, Linux, HMC og F/W. Að auki veitir FLRT tólið ráðlögð gildi fyrir hverja H/W líkan. Notaðu þessi verkfæri til að viðhalda kerfinu þínu uppfærðu. Ef þú getur ekki fært þig upp á ráðlagt stig skaltu skoða hlutann Þekkt vandamál í Vísbendingum og ráðleggingum um að flytja vinnuálag yfir í IBM POWER10 örgjörva-undirstaða kerfisskjalið.
AIX CPU nýting
Á POWER10 er AIX OS kerfið fínstillt fyrir besta hráafköst við meiri CPU notkun þegar keyrt er með sérstaka örgjörva. Þegar keyrt er með sameiginlegum örgjörvum er AIX OS kerfið fínstillt til að draga úr örgjörvanotkun (tölvu). Ef viðskiptavinurinn krefst þess að draga enn frekar úr örgjörvanotkun (tölvu) skaltu nota áætlunarstillanlega pm_throughput_mode til að stilla vinnuálagið og meta ávinninginn af hráu afköstum vs.
NX GZIP
Að taka forskottage af NX GZIP hröðun á POWER10 kerfum verður LPAR að vera í POWER9 eindrægni ham (ekki POWER9_base ham) eða POWER10 samhæfni ham.
IBM i
Gakktu úr skugga um að IBM I stýrikerfisstigið sé núverandi. Fix Central veitir nýjustu uppfærslur fyrir IBM I, VIOS, HMC og fastbúnað. https://www.ibm.com/support/fixcentral/
Firmware
Gakktu úr skugga um að fastbúnaðarstig kerfisins sé núverandi. Fix Central veitir nýjustu uppfærslur fyrir IBM I, VIOS, HMC og fastbúnað. https://www.ibm.com/support/fixcentral/
Minni DIMM
Fylgdu réttum reglum um viðbætur fyrir minni. Ef mögulegt er, fylltu DIMM-raufa fyrir minni að fullu og notaðu DIMM-minni í svipaðri stærð.
SMT stig örgjörva
Til að sækja að fullutagHvað varðar frammistöðu Power10 örgjörva, mælum við með að viðskiptavinir noti IBM i sjálfgefna fjölverkavinnslustillingar örgjörva, sem hámarkar SMT
stig fyrir LPAR uppsetninguna.
Skipting staðsetning
Núverandi FW-stig tryggja bestu staðsetningu skiptinganna. Hins vegar, ef tíðar DLPAR aðgerðir eru framkvæmdar á skiptingum á CEC, er mælt með því að nota DPO
til að hámarka staðsetningu.
Sýndar örgjörvar - sameiginlegir vs hollir örgjörvar
Notaðu sérstaka örgjörva fyrir hámarksafköst skiptingarstigsins.
EnergyScale
Til að fá sem bestan örgjörvahraða skaltu ganga úr skugga um að hámarksafköst séu stillt (sjálfgefið fyrir IBM Power E1080). Þessa stillingu er hægt að stilla í ASMI.
Geymsla og netkerfi I/O
VIOS veitir sveigjanlega geymslu og netvirkni. Til að fá bestu mögulegu frammistöðu, notaðu innfædd IBM i tengi fyrir I/O.
Ítarlegri upplýsingar
Sjá tengil: IBM I on Power – Algengar spurningar um árangur https://www.ibm.com/downloads/cas/QWXA9XKN
Linux stýrikerfi fyrirtækja (OS) er traustur grunnur fyrir blendingaskýjainnviði þína og fyrir stærri hugbúnaðarlausnir fyrirtækja. Nýlegar útgáfur eru fínstilltar fyrir bestu Power10 Enterprise kerfin í sínum flokki
Kraftur 10
- SLES15SP3, RHEL8.4 styðja Power10 innfæddan hátt
- Stuðningur áttavitastillingar til að leyfa viðskiptavinum að flytja frá eldri kynslóð raforkukerfa (P9 og P8)
- Sjálfgefinn Radix þýðingarstuðningur í Power10 ham
- Veruleg framför í dulkóðunarafköstum
Linux + PowerVM
- Stuðningur við PowerVM fyrirtækjaeiginleika: LPM, Shared CPU Pools, DLPAR
- Nýjungar lausnir: SAP HANA vöxtur framtíðarforrita með 4PB sýndarvistfangarými
- Draga úr tíma til að endurhlaða gögnin: Sýndar PMEM stuðningur fyrir SAP HANA
- Stuðningur og þjónusta á heimsmælikvarða
Stuðningsdreifingar:
- Frá og með Power9 eru aðeins RedHat og SUSE studd í PowerVM skiptingum
- Ítarlegar upplýsingar um distro stuðningsfylki sem nær yfir eldri kynslóð HW
LPM stuðningur:
- Færðu rökrétta Linux skipting frá eldri kynslóð raforkukerfa með næstum núlli niður í niður í notkun
- Tilvísun: LPM Guide og tengdar upplýsingar
Power Sérstakar pakkar:
- PowerPC-utils pakki: Inniheldur tól til viðhalds á IBM PowerPC LPAR. Fáanlegt sem hluti af dreifingunni.
- Advance Toolchain fyrir Linux on Power: Inniheldur nýjustu þýðendur, keyrslusöfn.
Bestu starfsvenjur:
- RHEL veitir fyrirfram skilgreindar stillingar sem hluta af stilltu þjónustunni.
- Skoðaðu nýjustu SAP athugasemdirnar fyrir ráðlagðar stýrikerfisstillingar fyrir SAP forrit. Venjulega er stillt notað í RHEL og capture eða sapconf í SLES
- Tíðni er stjórnað af PowerVM. Tilvísun: Orkustjórnun
- Að ræsa Power8 Huge Dynamic DMA Window hjálpar til við að bæta I/O árangur.
- Starting Power9 24×7-Vöktun er samþætt við perf tólið. Leyfir eftirlit með öllu kerfinu.
- Gakktu úr skugga um að fastbúnaðarstig kerfisins sé núverandi.
- lparnumascore frá PowerPC-utils sýnir núverandi skyldleikastig LPAR. DPO er hægt að nota til að bæta LPAR sæknistigið.
Fleiri lesningar:
- SLES fyrir Power og nokkra sannfærandi eiginleika.
- Byrjaðu með Linux á Power Systems, Linux á Power Systems netþjónum
- Enterprise Linux samfélag
- IBM Power kerfi styðja ýmis net millistykki með mismunandi hraða og fjölda tengi.
- Ef þú ert að nota sömu netmillistykki og fyrra kerfið þitt, ætti upphaflega að nota sömu stillingu á nýja kerfinu.
- Flestir Ethernet millistykki styðja margar móttöku- og sendingarraðir þar sem hægt er að breyta biðminni til að auka hámarksfjölda pakka.
- Sjálfgefnar biðraðarstillingar eru mismunandi með mismunandi millistykki og eru ef til vill ekki ákjósanlegar til að ná hámarkshraða skilaboða í biðlara-miðlara líkani.
- Að nota fleiri biðraðir mun auka CPU-notkun kerfisins; svo ætti að nota ákjósanlega biðröð stillingu fyrir tiltekið vinnuálag.
Hugleiðingar um meiri hraða millistykki
- Hraðari netkerfi með 25 GigE og 100 GigE netkortum krefjast margra samhliða þráða og stillingar á eiginleikum ökumanns.
- Ef það er Gen4 millistykki, vertu viss um að aðlagað sé á Gen4 rauf.
- Viðbótaraðgerðir eins og þjöppun, dulkóðun og tvíverknað geta bætt við leynd
Að breyta biðröðstillingum í AIX
Til að breyta fjölda móttöku/senda biðraða í AIX
- ifconfig enX losa niður
- chdev -l entX -a queues_rx= -a queues_tx=
- chdev -l enX -a ástand=upp
Að breyta biðröðstillingum í Linux
Til að breyta fjölda biðraða í Linux ethtool -L ethX sameinað
Breytir biðröð stærð í AIX
- ifconfig enX losa niður
- chdev -l entX -a rx_max_pkts = -a tx_max_pkts =
- chdev -l enX -a ástand=upp
Breyta biðröð stærð í LinuxP: ethtool -G ethX rx tx
Sýndarvæðing
- Sýndarnet er stutt í formi SRIOV, vNIC, vETH. Sýndarvæðing bætir við leynd og getur dregið úr afköstum samanborið við innbyggt I/O.
- Fyrir utan bakenda vélbúnaðinn, tryggðu að VIOS minni og örgjörva magn sé nóg til að veita nauðsynlegan afköst og viðbragðstíma
- Bestu starfsvenjur IBM PowerVM geta verið mjög gagnlegar við stærð VIOS
- Ef þú ert að nota sömu geymslumillistykki og fyrra kerfið þitt, ætti upphaflega að nota sömu stillingu á nýja kerfinu. Ef óskað er eftir frekari afköstum frá núverandi kerfi, þá ætti að framkvæma venjulega stillingu.
- Ef geymsluundirkerfin eru töluvert frábrugðin nýrra kerfi en fyrra kerfi, gæti eftirfarandi listi yfir íhuganir haft neikvæð áhrif á skynjaðan hraða forrita -
- Að breyta úr beinni tengdri geymslu (DAS eða innri) í geymslusvæðisnet (SAN) eða nettengt geymslurými (NAS) (eða ytri geymslu) getur aukið leynd.
- Viðbótaraðgerðir eins og þjöppun, dulkóðun og aftvíföldun geta bætt við leynd.
- Með því að fækka geymslu LUN getur það dregið úr tilföngum á þjóninum sem þarf til að styðja við nauðsynlega afköst.
- Skoðaðu stillingar- eða uppsetningarleiðbeiningar fyrir nýju tækin til að skilja þessi áhrif.'
- Sýndarvæðing bætir við leynd og getur dregið úr afköstum samanborið við innbyggt I/O. Fyrir utan bakenda vélbúnaðinn, tryggðu VIOS minni og CPU
- Að flytja yfir í sýndarbreyti með meiri hraða í VIOS mun krefjast þess að stilla VIOS uppsetninguna í örgjörva og minni. Bestu starfsvenjur IBM PowerVM geta verið mjög gagnlegar við stærð VIOS.
Stillingarleiðbeiningar – vinsamlegast skoðaðu leiðbeiningar IBM Knowledge Center for AIX og Linux.
PCIe3 12 GB skyndiminni RAID + SAS millistykki Quad-port 6 Gb x8 millistykki Linux:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=availability-ha-asymmetricaccess-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=linux-common-sas-raidcontroller-tasks
AIX:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-multi-initiator-highavailability
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-common-controller-diskarray-management-tasks
IBM
- https://www.ibm.com/docs/en/power9/9223-42H?topic=configurations-dual-storageioa-access-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=i-common-controller-diskarray-management-tasks
PCIe3 x8 2-porta Fiber Channel (32 Gb/s) millistykki
- https://www.ibm.com/docs/en/aix/7.2?topic=iompio-device-attributes
- https://www.ibm.com/docs/en/power9?topic=channel-npiv-multiple-queue-support
Viðbótar AIX stillingar fyrir frammistöðu:
- SCSI yfir trefjarás (MPIO): stilltu fjölbrautaralgrím á round_robin fyrir hvern disk
- NVMe yfir trefjarás: stillt getur átt við 7 fyrir hvern NVMe yfir trefjarás Dynamic stjórnandi sem er búinn til á uppgötvunarstiginu
NVMe Adapter AIX stilling fyrir frammistöðu
Setja getur átt við 8 fyrir hvert NVMe tæki
Næstu kynslóðar C/C++/Fortran þýðendur IBM sem sameina háþróaða hagræðingu IBM við opinn uppspretta LLVM innviði
![]() |
|
LLVM Meiri gjaldmiðill fyrir C/C++ tungumál Hraðari byggingarhraði Samfélagslegar hagræðingar Ýmis tól sem byggja á LLVM |
IBM hagræðingar Full nýting á Power arkitektúr Háþróuð hagræðing sem er leiðandi í iðnaði Stuðningur og þjónusta á heimsmælikvarða |
Framboð
- 60 daga ókeypis prufuáskrift: hlaðið niður af Open XL vörusíðunni
- Fáðu þjónustu og stuðning frá IBM á heimsmælikvarða með sveigjanlegum leyfisvalkostum, allt frá tvípípu (AAS og PA)
- Ævarandi leyfi (á hverjum viðurkenndum notanda eða á samhliða notanda)
- Mánaðarlegt leyfi (fyrir sýndarferliskjarna): miða á skýjanotkunartilvik, td á PowerVR tilviki
Mælt er með valmöguleikum fyrir afköst
Hagræðingarstig | Notkunarráðleggingar |
-O2 og -O3 | Dæmigert upphafspunktur |
Hagræðing tengitíma: -flto (C/C++), -qlto (Fortran) | Fyrir vinnuálag með fullt af litlum aðgerðarköllum |
Profile leiðsögn hagræðingar: -fprofile-mynda, -fprofile-nota (C/C++) -qprofile-mynda, -qprofile-nota (Fortran) |
Fyrir vinnuálag með fullt af útibúum og virknisímtölum |
Fyrir frekari upplýsingar vinsamlega farðu á: https://www.ibm.com/docs/en/openxl-c-and-cpp-aix/17.1.0
https://www.ibm.com/docs/en/openxl-fortran-aix/17.1.0
Full nýting Power10 arkitektúrs með Open XL 17.1.0
- Nýr þýðandavalkostur '–mcpu=pwr10' til að búa til kóða sem nýtir Power10 leiðbeiningar og stillir einnig sjálfkrafa fínstillingarnar fyrir Power10
- Nýjar innbyggðar aðgerðir til að opna nýja Power10 virkni, td Matrix Multiply Accelerator (MMA)
- Nýjum MASS SIMD og vektorsöfnum var bætt við fyrir Power10. Allar MASS bókasafnsaðgerðir (SIMD, vektor, skalar) stilltar fyrir Power10 (einnig Power9).
Athugið: Forrit sem eru sett saman með fyrri útgáfum af XL þýðendum (td XL 16.1.0) til að keyra á fyrri Power örgjörvum munu keyra samhæft á Power10.
Tvöfaldur eindrægni á AIX
Athugið: XL C/C++ fyrir AIX 16.1.0 kynnti nú þegar nýja ákall xlclang++ sem nýtir Clang framenda frá LLVM verkefninu ü C++ hlutir smíðaðir með xlC fyrir
- AIX (byggt á eigin framenda IBM) er ekki tvíundarsamhæft við C++ hluti sem eru byggðir með xlclang++ 16.1.0 fyrir AIX
- C++ hlutir byggðir með xlclang++ 16.1.0 fyrir AIX verða tvíundirsamhæfir nýjum Open XL C/C++ fyrir AIX 17.1.0
- C samhæfni er viðhaldið í öllum AIX þýðendum (eldri XL útgáfur fyrir AIX, Open XL C/C++ fyrir AIX 17.1.0)
- Fortran samhæfni er viðhaldið á milli fyrri XLF útgáfu fyrir AIX og Open XL Fortran fyrir AIX 17.1.0
Framboð
GCC þýðendurnir eru fáanlegir á öllum Enterprise Linux dreifingum og áfram
AIX.
- Uppsetta GCC útgáfan er 8.4 á RHEL 8 og 7.4 á SLES 15. Búist er við að RHEL 9 sendi GCC 11.2.
- Það eru nokkrar leiðir til að fá nægilega nýlega útgáfu af GCC þegar sjálfgefna þýðendur fyrir dreifinguna eru of gamlir til að styðja Power10.
- Red Hat styður GCC Toolset [1] í þessum tilgangi.
- SUSE útvegar þróunarverkfæraeininguna. [2]
- IBM útvegar nýjustu þýðendur og bókasöfn í gegnum Advance Toolchain. [3]
IBM Advance Toolchain
- Advance Toolchain veitir kraftbjartsýni kerfissöfn ásamt þýðendum, kembiforritum og öðrum verkfærum.
- Byggingarkóði með Advance Toolchain getur framleitt mest bjartsýni kóðann sem mögulegt er á nýjustu örgjörvunum.
Tungumál
- C (GCC), C++ (g++) og Fortran (gfortran), ásamt öðrum eins og Go (GCC), D (GDC) og Ada (gnat).
- Aðeins GCC, g++ og gfortran eru venjulega sett upp sjálfgefið.
- Golang þýðandinn [4] er valinn valkostur til að byggja upp Go forrit á Power.
Samhæfni og nýir eiginleikar á Power10
- Forrit sem eru sett saman með fyrri útgáfum af GCC til að keyra á POWER8 eða POWER9 örgjörvum munu keyra samhæft á Power10 örgjörvum.
- Mælt er með GCC 11.2 eða nýrri til að nýta alla nýja eiginleika sem eru tiltækir í Power ISA 3.1 og innleiddir í Power10 örgjörva.
- GCC 11.2 veitir aðgang að Matrix Multiply Assist (MMA) eiginleikanum sem Power10 örgjörvar veita. [5]
- MMA forrit er hægt að setja saman með því að nota hvaða GCC, LLVM og Open XL þýðendur sem er, að því tilskildu að þú notir nægilega nýlegar útgáfur.
Mælt og studd þýðandafánar frá IBM [6]
-O3 eða -Austur | Árásargjarn hagræðing. -East er í meginatriðum jafngilt -O3 -fast-math, sem einnig slakar á takmörkunum á IEEE flottölureikningi. |
-mcpu=powern | Settu saman með því að nota leiðbeiningar sem studdar eru af Power örgjörvanum. Til dæmisample, til að nota leiðbeiningar sem eru aðeins tiltækar á Power10, veldu -mcpu=power10. |
-til | Valfrjálst. Framkvæmdu fínstillingu „tengiltíma“. Þetta fínstillir kóða yfir aðgerðarsímtöl þar sem aðgerðir sem hringir og hringir eru til í mismunandi safneiningum og getur oft veitt verulega aukningu á frammistöðu. |
-afrúlla-lykkjur | Valfrjálst. Framkvæma árásargjarnari fjölföldun á lykkjuhlutum en þýðandinn myndi venjulega gera. Almennt ættirðu að sleppa þessu, en á sumum kóða getur þetta veitt betri afköst. |
Athugið:
Þrátt fyrir að -mcpu=power10 sé stutt strax og GCC 10.3, er GCC 11.2 valinn vegna þess að fyrri þýðendur styðja ekki alla eiginleika sem eru útfærðir í Power10 örgjörvunum. Einnig munu hlutir búnir til með -mcpu=power10 ekki keyra á POWER9 eða eldri örgjörvum! Hins vegar eru til leiðir til að búa til kóða sem er fínstilltur fyrir mismunandi örgjörvaútgáfur. [7] [1] Red Hat: Using GCC Toolset. https://access.redhat.com/documentation/enus/red_hat_enterprise_linux/8/html/developing_c_and_cpp_applications_in_rhel_8/gcc-toolset_toolsets.
[2] SUSE: Skilningur á þróunarverkfæraeiningunni. https://www.suse.com/c/suse-linux-essentialswhere-are-the-compilers-understanding-the-development-tools-module/.
[3] Advance Toolchain fyrir Linux á IBM Power Systems. https://www.ibm.com/support/pages/advancetoolchain-linux-power.
[4] Go Language. https://golang.org. [5] Matrix-Multiply Assist Leiðbeiningar um bestu starfsvenjur. http://www.redbooks.ibm.com/redpapers/pdfs/redp5612.pdf
[6] Notkun GNU þýðandasafnsins. https://gcc.gnu.org/onlinedocs/gcc.pdf
[7] Marksértæk hagræðing með GNUIndirect aðgerðakerfi. https://developer.ibm.com/tutorials/optimized-libraries-for-linux-on-power/#target-specific-optimization-
© 2021 IBM Corporation með-gnu-óbeinu-virkni-kerfi.
Java forrit geta tekið óaðfinnanlega fram úrtage af nýjum P10 ISA eiginleikum á stýrikerfum sem keyra í P10 ham með því að nota Java runtime útgáfurnar sem taldar eru upp hér að neðan eða nýrri:
Java 8
- IBM SDK 8 SR6 FP36
- IBM Semeru Runtime Open Edition 8u302: openj9-0.27.1
Java 11
- IBM Semeru Runtime Certified Edition 11.0.12.1: openj9-0.27.1
- IBM Semeru Runtime Open Edition 11.0.12.1: openj9-0.27.1
Java 17 (reklar eru kannski ekki tiltækar ennþá)
- IBM Semeru Runtime Certified Edition 17: openj9-0.28
- IBM Semeru Runtime Open Edition 17: openj9-0.28
- OpenJDK 17
Tilvísanir í árangursstillingar:
IBM WebSphere Application Server Performance Cookbook
Síðustærð
Almenn ráðlegging fyrir flesta Oracle gagnagrunna á AIX er að nota 64KB síðustærð en ekki 16MB síðustærð fyrir SGA. Venjulega gefa 64 KB síður næstum því það sama
árangursávinningur sem 16 MB síður án sérstakrar stjórnunar.
TNS hlustandi
Oracle 12.1 gagnagrunnur og síðari útgáfur munu sjálfgefið nota 64 þúsund síður fyrir texta, gögn og stafla. Hins vegar, fyrir TNSLISTENER notar það enn 4k síður fyrir texta, gögn og stafla. Til
virkja 64 þúsund síður fyrir hlustandann notar útflutningsskipunina áður en hlustunarferlið er hafið. Athugaðu að keyra í ASM byggt umhverfi sem hlustandinn verður uppiskroppa með
GRID_HOME en ekki ORACLE_HOME.
Skjölin fyrir „stranglega setenv“ skipunina breyttust í 12.1 eða síðari útgáfum. -t eða -T var fjarlægt í þágu -env eða -envs. Í Oracle Listener umhverfinu skaltu stilla og flytja út:
– LDR_CNTRL=DATAPSIZE=64K@TEXTPSIZE=64K@STACKPSIZE=64K - VMM_CNTRL=vmm_fork_policy=COR (bættu við 'Afrita við lestur' skipunina)
Sameiginleg setningafræði
Ekki þarf að stilla LDR_CNTRL=SHARED_SYMTAB=Y stillinguna sérstaklega í 11.2.0.4 eða síðari útgáfum. Valkostir þýðandatengja sjá um þessa stillingu og þurfa ekki lengur að vera sérstaklega stilltir. Ekki er mælt með því að hafa LDR_CNTRL=SHARED_SYMTAB=Y sérstaklega stillt í 12c eða síðari útgáfum.
Sýndargjörva samanbrotin
Þetta er mikilvæg stilling í RAC umhverfi þegar LPAR eru notuð með samanbroti örgjörva virkt. Ef þessi stilling er ekki stillt er mikil hætta á að RAC hnútur verði vísað út við létt vinnuálag í gagnagrunni. Scheda -p -o vpm_xvcpus=2
VIOS & RAC samtenging
Mælt er með sérstakri 10G (þ.e. 10G Ethernet millistykki) tengingu að lágmarki til að veita nægilega bandbreidd fyrir þyrpingartímaviðkvæma umferð. RAC klasaumferð – samtengingarumferð ætti að vera tileinkuð og ekki deilt. Samnýting samtengingar getur valdið töfum á tímasetningu sem leiðir til vandamála með hnútahengingu/eviction.
Netafköst
Þetta er langvarandi tillaga um netstillingar fyrir Oracle á AIX, þó sjálfgefið sé áfram á 0. TCP Stilling á rfc1323=1
Ítarlegri upplýsingar
Sjá tengil: Stjórna stöðugleika og afköstum núverandi Oracle Database útgáfur sem keyra AIX á Power Systems þar á meðal POWER9
https://www.ibm.com/support/pages/node/6355543
Almennt
- Notaðu SMT8 ham
- Notaðu sérstaka CPU LPAR
Db2 vöruhús
- Gakktu úr skugga um að háhraða einkanet sé á milli allra hnúta
- Takmarkaðu MLN stillingar við einn hnút í hverri fals
CP4D
- Notaðu PCIe4 fyrir OCP hnúta net
- Fyrir OCP 4.8 skaltu stilla kjarnabreytu slub_max_order=0
Bestu starfsvenjur Db2
https://www.ibm.com/docs/en/db2/11.5?topic=overviews-db2-best-practices
Net
- Fyrir pod net, notaðu einkanet byggt á innfæddum SRIOV ef LPM er ekki krafist, annars skaltu nota VNIC
- Fyrir forrit sem krefjast mikillar bandbreiddar eða lítillar leynd skaltu íhuga að nota SR-IOV netkerfisstjórann til að úthluta VF beint á pod
- Fyrir þjónustu sem þarfnast lítinn tíma, stilltu sjálfgefna tímamörk fyrir núverandi leið
- Stilltu æskilega MTU-stærð á klasaneti OCP
Stýrikerfi
- Íhugaðu að auka u-takmörkin innan CoreOS breytinganna eftir uppsetningu
- Sjá lágmarkskröfur OCP uppsetningar fyrir Power pallur OCP4.8 uppsetningu á Power
Dreifing
- Þegar forrit eru notuð, hafðu í huga að einn vCPU jafngildir einum líkamlegum kjarna þegar samtímis fjölþráður (SMT), eða ofþráður, er ekki virkur. Þegar SMT er virkt jafngildir VCPU vélbúnaðarþræði.
- Sjá leiðbeiningar um lágmarksstærð fyrir starfsmenn og aðalhnúta Lágmarkskröfur um tilföng
- Úthlutaðu sérstakri geymslu fyrir innbyggðu gámamyndaskrána
- Notaðu eftirfarandi leiðbeiningar um stærðarstærð fyrir helstu möppur OCP aðalmöppur sem OpenShift Container Platform íhlutir skrifa gögn í.
Skjöl / auðlindir
![]() |
IBM Power10 árangur [pdfNotendahandbók Power10, árangur, Power10 árangur |