Udhëzues për fillimin e shpejtë të performancës Power10
(Power10 QSG)
Nëntor 2021
Memorie minimale
- Për çdo prizë procesori, janë të mbushura të paktën 8 nga 16 DIMM
- Në një nyje, janë të populluara një minimum prej 32 nga 64 për DIMM
- Në një sistem me 4 nyje, janë të populluara një minimum prej 128 nga 256 DIMM
Rregullat e prizës DDIMM
- Plotësoni memorien minimale të lejuar (çdo fole procesori janë të mbushura minimalisht 8 nga 16 DIMM)
- Të gjitha DIMM-të nën secilin procesor duhet të kenë të njëjtin kapacitet
- Përmirësimet e veçorive do të ofrohen në rritje prej 4 DDIMM, të cilat të gjitha kanë të njëjtin kapacitet.
- Numri i vetëm i vlefshëm i DDIMM-ve të lidhura në sajte të lidhura me një modul të caktuar procesori është 8 ose 12 ose 16.
Performanca e Kujtesës
- Performanca e sistemit përmirësohet ndërsa sasia e memories shpërndahet në më shumë lojëra elektronike DDIMM. Për shembullampLe, nëse nevojitet 1 TB në një Node, është më mirë të keni 64 x 32 GB DIMM sesa të keni 32 x 64 GB DIMM.
- Lidhja e DIMM-ve që kanë të gjitha të njëjtën madhësi do të sigurojë performancën më të lartë
- Performanca e sistemit përmirësohet pasi më shumë kuadrat përputhen me njëri-tjetrin
- Performanca e sistemit përmirësohet ndërsa më shumë DDIMM të procesorëve përputhen me njëri-tjetrin
- Performanca e sistemit përmirësohet në një sistem me shumë sirtarë nëse kapaciteti i kujtesës ndërmjet sirtarëve është i balancuar.
Gjerësia e brezit të memories
Kapaciteti DDIMM | MaxBandwidth teorik |
32 GB, 64 GB (DDR4 @ 3200 Mbps) | 409 GB/s |
128 GB, 256 GB (DDR4 @ 2933 Mbps) | 375 GB/s |
Përmbledhje
- Për performancën më të mirë të mundshme, përgjithësisht rekomandohet që memoria të instalohet në mënyrë të barabartë në të gjithë sirtarët e nyjeve të sistemit dhe të gjitha prizat e procesorit në sistem. Balancimi i kujtesës nëpër kartat planare të sistemit të instaluar mundëson aksesin e memories në një mënyrë të qëndrueshme dhe zakonisht rezulton në performancë më të mirë për konfigurimin tuaj.
- Megjithëse gjerësia maksimale e brezit të memories arrihet duke mbushur të gjitha hapësirat e memories, planet për shtesat e memories së ardhshme duhet të merren parasysh kur të vendoset se cila madhësi e veçorive të memories të përdoret në kohën e porosisë fillestare të sistemit.
P10 Compute & MMA Arkitekturë
- 2x gjerësi brezi përputhet me SIMD*
- 8 motorë të pavarur SIMD Fixed & Float për bërthamë
- 4 – 32x përshpejtim matematikor i matricës*
- Motori 4 512 bit për bërthamë = 2048b rezultate / cikle
- Produktet e jashtme matematikore të matricës me saktësi të vetme, të dyfishtë dhe të reduktuar.
- Mbështetja e MMA Architecture e prezantuar në POWER ISA v3.1
- Mbështet nivelet e saktësisë SP, DP, BF16, HP, Int-16, Int-8 dhe Int-4.
P10 Aplikacionet MMAA & Integrimi i ngarkesës së punës
- Aplikacionet ML & HPC me llogaritje të dendura algjebër lineare, shumëzimet e matricës, konvolucionet, FFT mund të përshpejtohen me MMA
- Versioni GCC >= 10 dhe versioni LLVM >=12 mbështet MMA përmes integruara.
- Bibliotekat OpenBLAS, IBM ESSL dhe Eigen tashmë janë optimizuar me udhëzime MMA për P10.
- Integrim i lehtë i MMA për aplikacionet e ndërmarrjeve, kornizat ML dhe paketat e Komunitetit të Hapur përmes bibliotekave të mësipërme BLAS.
Funksionet e integruara të PowerPC Matrix-Multiply Assist https://gcc.gnu.org/onlinedocs/gcc/PowerPC-Matrix-Multiply-Assist-Built-in-Functions.html
Udhëzues për praktikat më të mira Matrix-Multiply Assist https://www.redbooks.ibm.com/Redbooks.nsf/RedpieceAbstracts/redp5612.html?OpenPërpunuesit virtualë
- Shuma e bërthamave të titulluara të të gjitha ndarjeve të përbashkëta nuk mund të kalojë numrin e bërthamave në grupin e përbashkët
- Sigurohuni që numri i procesorëve virtualë të konfiguruar të çdo ndarjeje të përbashkët në një kornizë të mos jetë më shumë se numri i bërthamave në grupin e përbashkët
- Konfiguro numrin e procesorëve virtualë për një ndarje të përbashkët për të mbështetur kërkesën për kapacitet maksimal
- Konfiguro numrin e bërthamave me të drejtë për një ndarje të përbashkët në përdorimin mesatar të asaj ndarje për performancë më të mirë
- Për të siguruar memorie më të mirë dhe afinitet të CPU-së (shmangni paragjykimet e panevojshme të procesorit virtual), sigurohuni që shuma e bërthamave të titulluara të të gjitha ndarjeve të përbashkëta të jetë afër numrit të bërthamave në grupin e përbashkët
Modaliteti i përputhshmërisë së procesorit
- Ekzistojnë 2 mënyra të përputhshmërisë së procesorit për AIX: POWER9 dhe POWER9_base. Parazgjedhja është modaliteti POWER9_bazë.
- Ekzistojnë 2 mënyra të përputhshmërisë së procesorit të disponueshme për Linux: modaliteti POWER9 dhe POWER10. Parazgjedhja është modaliteti POWER10.
- Pas ndarjeve LPM, duhet të aktivizoni ciklin kur ndryshoni modalitetin e përputhshmërisë së procesorit
Konsideratat e palosjes së procesorit
- Për ndarjen e përbashkët që ekzekuton AIX në Power9, vpm_throughput_mode i parazgjedhur = 0, në Power10, vpm_throughput_mode i paracaktuar = 2. Për ngarkesat e punës që kanë punë të gjata, mund të ndihmojë potencialisht me reduktimin e përdorimit bazë.
- Për ndarjen e dedikuar që ekzekuton AIX, vpm_throughput_mode i parazgjedhur = 0 në Power9 dhe Power10.
Konsideratat e madhësisë së tabelës së faqes LPAR
• Tabela e faqeve Radix mbështetet duke filluar nga Power10 me Linux. Mund të përmirësojë potencialisht performancën e ngarkesës së punës.
Referenca:
Këshilla dhe këshilla për migrimin e ngarkesës së punës në IBM POWER Systems: https://www.ibm.com/downloads/cas/39XWR7YM
Udhëzuesi i praktikave më të mira të virtualizimit të IBM POWER: https://www.ibm.com/downloads/cas/JVGZA8RW
Sigurohuni që niveli i OS është aktual
Fix Central ofron përditësimet më të fundit për AIX, IBM i, VIOS, Linux, HMC dhe F/W. Përveç kësaj, mjeti FLRT ofron nivelet e rekomanduara për çdo model H/W. Përdorni këto mjete për të mbajtur sistemin tuaj të përditësuar. Nëse nuk mund të ngjiteni në nivelin e rekomanduar, atëherë referojuni seksionit Problemi i njohur i Këshillave dhe Këshillave për migrimin e ngarkesës së punës në dokumentin IBM POWER10 Processor-Based Systems.
Përdorimi i CPU-së AIX
Në POWER10, sistemi AIX OS është optimizuar për performancën më të mirë të papërpunuar me përdorim më të lartë të CPU-së kur funksionon me procesorë të dedikuar. Kur funksionon me procesorë të përbashkët, sistemi AIX OS është optimizuar për të reduktuar përdorimin e CPU-së (pc). Nëse klienti kërkon të zvogëlojë më tej përdorimin e CPU-së (pc), përdorni modalitetin pm_throughput_mode të akorduar në plan për të rregulluar ngarkesën e punës dhe për të vlerësuar përfitimet e xhiros së papërpunuar kundrejt përdorimit të CPU-së.
NX GZIP
Për të marrë përparatage të përshpejtimit NX GZIP në sistemet POWER10, LPAR duhet të jetë në modalitetin e përputhshmërisë POWER9 (jo modalitetin POWER9_bazë) ose në modalitetin e përputhshmërisë POWER10.
IBM i
Sigurohuni që niveli i sistemit operativ IBM I është aktual. Fix Central ofron përditësimet më të fundit për IBM I, VIOS, HMC dhe firmware. https://www.ibm.com/support/fixcentral/
Firmware
Sigurohuni që niveli i firmuerit të sistemit është aktual. Fix Central ofron përditësimet më të fundit për IBM I, VIOS, HMC dhe firmware. https://www.ibm.com/support/fixcentral/
DIMM të memories
Ndiqni rregullat e duhura të shtojcës së kujtesës. Nëse është e mundur, plotësoni plotësisht foletë DIMM të memories dhe përdorni DIMM me përmasa të ngjashme.
Niveli i procesorit SMT
Për të marrë përparim të plotëtagPër sa i përket performancës së CPU-ve Power10, ne rekomandojmë që klientët të përdorin cilësimet e parazgjedhura të procesorit IBM i multitasking, të cilat do të maksimizojnë SMT-në
niveli për konfigurimin LPAR.
Vendosja e ndarjes
Nivelet aktuale FW sigurojnë vendosjen optimale të ndarjeve. Megjithatë, nëse operacionet e shpeshta DLPAR ekzekutohen në ndarjet në KQZ, rekomandohet përdorimi i DPO
për të optimizuar vendosjen.
Procesorët virtualë – procesorë të përbashkët kundrejt përpunuesve të dedikuar
Përdorni procesorë të dedikuar për performancë optimale të nivelit të ndarjes.
Shkalla e Energjisë
Për shpejtësinë më të mirë të procesorit të CPU-së, sigurohuni që të jetë vendosur "Performanca maksimale" (e parazgjedhur për IBM Power E1080). Ky cilësim është i konfigurueshëm në ASMI.
Magazinimi dhe rrjetëzimi I/O
VIOS ofron ruajtje fleksibël dhe funksionalitet rrjeti. Për performancën më të mirë të mundshme, përdorni ndërfaqet vendase IBM i për I/O.
Informacion më gjithëpërfshirës
Referojuni lidhjes: IBM I on Power – FAQ për performancën https://www.ibm.com/downloads/cas/QWXA9XKN
Sistemi operativ Linux i ndërmarrjeve (OS) është një bazë solide për infrastrukturën tuaj hibride të resë kompjuterike dhe për zgjidhjet softuerike të ndërmarrjeve në shkallë të lartë. Publikimet e fundit janë optimizuar për sistemet më të mira në klasë të Power10 Enterprise
Fuqia 10
- SLES15SP3, RHEL8.4 mbështesin modalitetin origjinal Power10
- Mbështetje e modalitetit busull për të lejuar klientët të migrojnë nga sistemet e energjisë të gjeneratës së vjetër (P9 dhe P8)
- Mbështetja e parazgjedhur e përkthimit të Radix në modalitetin Power10
- Përmirësim i ndjeshëm në performancën e kriptimit
Linux + PowerVM
- Mbështetje për veçoritë e ndërmarrjes PowerVM: LPM, Shared CPU Pools, DLPAR
- Zgjidhje inovative: Rritja e aplikacionit në të ardhmen SAP HANA me hapësirën e adresave virtuale 4PB
- Zvogëloni kohën për të ringarkuar të dhënat: Mbështetje virtuale PMEM për SAP HANA
- Mbështetje dhe shërbim i klasit botëror
Distro të mbështetura:
- Duke filluar me Power9, vetëm RedHat dhe SUSE mbështeten në ndarjet PowerVM
- Informacion i detajuar mbi matricën mbështetëse të shpërndarjes që mbulon HW të gjeneratës së vjetër
Mbështetje LPM:
- Zhvendosni ndarjet logjike të Linux-it nga sistemet e gjeneratës së vjetër të energjisë me kohë joproduktive të aplikacionit pothuajse zero
- Referenca: Udhëzuesi i LPM-së dhe informacioni përkatës
Paketat specifike të energjisë:
- Paketa PowerPC-utils: Përmban shërbime për mirëmbajtjen e IBM PowerPC LPAR. Në dispozicion si pjesë e shpërndarjes.
- Advance Toolchain për Linux në Power: Përmban përpiluesit më të fundit, bibliotekat e kohës së funksionimit.
Praktikat më të mira :
- RHEL ofron akordime të paracaktuara si pjesë e shërbimit të akorduar.
- Referojuni shënimeve më të fundit SAP për cilësimet e rekomanduara të OS për aplikacionet SAP. Në mënyrë tipike, akordimi përdoret në RHEL dhe kapja ose sapconf në SLES
- Frekuenca menaxhohet nga PowerVM. Referenca: Menaxhimi i Energjisë
- Nisja e dritares së madhe dinamike DMA Power8 ndihmon në përmirësimin e performancës së hyrjes/daljes.
- Nisja e Power9 24×7-Monitoring është e integruar me mjetin perf. Lejon monitorimin e të gjithë sistemit.
- Sigurohuni që niveli i firmuerit të sistemit është aktual.
- lparnumascore nga PowerPC-utils tregon rezultatin aktual të afinitetit të LPAR. DPO mund të përdoret për të përmirësuar rezultatin e afinitetit LPAR.
Më shumë lexon:
- SLES për fuqi dhe disa veçori bindëse.
- Filloni me Linux në Power Systems, Linux në serverat Power Systems
- Komuniteti Linux i ndërmarrjeve
- Sistemet IBM Power mbështesin adaptorë të ndryshëm rrjeti me shpejtësi dhe numër portash të ndryshëm.
- Nëse po përdorni të njëjtët përshtatës rrjeti si sistemi juaj i mëparshëm, fillimisht, i njëjti akordim duhet të përdoret në sistemin e ri.
- Shumica e përshtatësve Ethernet mbështesin radhë të shumëfishta pranimi dhe transmetimi, madhësia e buferit të të cilave mund të ndryshohet për të rritur numrin maksimal të paketave.
- Cilësimet e paracaktuara të radhës janë të ndryshme me përshtatës të ndryshëm dhe mund të mos jenë optimale për të arritur normat maksimale të mesazheve në një model klient-server.
- Përdorimi i radhëve shtesë do të rrisë përdorimin e CPU-së të sistemit; kështu që duhet të përdoret vendosja optimale e radhës për një ngarkesë specifike pune.
Konsiderata të përshtatësit me shpejtësi më të lartë
- Rrjetet me shpejtësi më të lartë me adaptorë rrjeti 25 GigE dhe 100 GigE kërkojnë fije të shumta paralele dhe akordim të atributeve të drejtuesit.
- Nëse është një përshtatës Gen4, sigurohuni që përshtatësi të jetë i vendosur në një fole Gen4.
- Funksionet shtesë si kompresimi, enkriptimi dhe dyfishimi mund të shtojnë vonesë
Ndryshimi i cilësimeve të radhës në AIX
Për të ndryshuar numrin e radhëve të pranimit/transmetimit në AIX
- ifconfig enX shkëputeni
- chdev -l entX -a radhë_rx= -a queues_tx=
- chdev -l enX -a gjendje=lart
Ndryshimi i cilësimeve të radhës në Linux
Për të ndryshuar numrin e radhëve në Linux ethtool -L ethX të kombinuara
Ndryshimi i madhësisë së radhës në AIX
- ifconfig enX shkëputeni
- chdev -l entX -a rx_max_pkts = -a tx_max_pkts =
- chdev -l enX -a gjendje=lart
Ndryshimi i madhësisë së radhës në LinuxP: ethtool -G ethX rx tx
Virtualizimi
- Rrjetet e virtualizuara mbështeten në formën e SRIOV, vNIC, VETH. Virtualizimi shton vonesën dhe mund të zvogëlojë xhiron në krahasim me I/O vendase.
- Përveç harduerit mbështetës, sigurohuni që memoria VIOS dhe sasitë e CPU-së të jenë të mjaftueshme për të siguruar shpejtësinë e kërkuar dhe kohën e përgjigjes
- Praktikat më të mira të IBM PowerVM mund të jenë shumë të dobishme për madhësinë e VIOS-it
- Nëse po përdorni të njëjtët përshtatës ruajtjeje si sistemi juaj i mëparshëm, fillimisht, i njëjti akordim duhet të përdoret në sistemin e ri. Nëse kërkohet performancë shtesë nga sistemi ekzistues, atëherë duhet të kryhet akordimi normal.
- Nëse nënsistemet e ruajtjes janë dukshëm të ndryshme në sistemin më të ri se sistemi i mëparshëm, lista e mëposhtme e konsideratave mund të ndikojë negativisht në shpejtësinë e perceptuar të aplikacioneve -
- Ndryshimi nga hapësira ruajtëse e bashkangjitur direkt (DAS ose e brendshme) në Rrjetin e zonës së ruajtjes (SAN) ose hapësirë ruajtëse e bashkangjitur në rrjet (NAS) (ose hapësirë ruajtëse e jashtme) mund të rrisë vonesën.
- Funksionet shtesë si kompresimi, enkriptimi dhe dedulikimi mund të shtojnë vonesë.
- Zvogëlimi i numrit të LUN-ve të ruajtjes mund të zvogëlojë burimet në server të nevojshëm për të mbështetur kapacitetet e kërkuara.
- Referojuni udhëzuesve të akordimit ose konfigurimit për pajisjet e reja për të kuptuar këto ndikime.'
- Virtualizimi shton vonesën dhe mund të zvogëlojë xhiron në krahasim me I/O vendase. Përveç harduerit backend, siguro memorie VIOS dhe CPU
- Kalimi te adaptorët e virtualizuar me shpejtësi më të lartë në VIOS do të kërkojë rregullimin e konfigurimit të VIOS në CPU dhe memorie. Praktikat më të mira të IBM PowerVM mund të jenë shumë të dobishme për madhësinë e VIOS-it.
Udhëzimet e akordimit – Ju lutemi referojuni IBM Knowledge Center për udhëzimet AIX dhe Linux.
PCIe3 12 GB Cache RAID + Përshtatës SAS me katër porta 6 Gb x8 Përshtatës Linux:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=availability-ha-asymmetricaccess-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=linux-common-sas-raidcontroller-tasks
AIX:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-multi-initiator-highavailability
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-common-controller-diskarray-management-tasks
IBM
- https://www.ibm.com/docs/en/power9/9223-42H?topic=configurations-dual-storageioa-access-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=i-common-controller-diskarray-management-tasks
Përshtatës i kanalit me fibra me 3 porte PCIe8 x2 (32 Gb/s).
- https://www.ibm.com/docs/en/aix/7.2?topic=iompio-device-attributes
- https://www.ibm.com/docs/en/power9?topic=channel-npiv-multiple-queue-support
Akordim shtesë AIX për performancën:
- SCSI mbi Kanalin Fiber (MPIO): vendos algoritmin me shumë rrugë në round_robin për çdo disk
- NVMe mbi Channel Fiber: grupi mund t'i atribuojë 7 për çdo kontrollues dinamik NVMe mbi Channel Fiber i krijuar gjatë fazës së zbulimit
Përshtatës NVMe AIX akordim për performancë
Seti mund t'i atribuojë 8 për çdo pajisje NVMe
Kompiluesit e gjeneratës së ardhshme të IBM-së C/C++/Fortran që kombinojnë optimizimet e avancuara të IBM me infrastrukturën LLVM me burim të hapur
![]() |
|
LLVM Monedha më e madhe për gjuhën C/C++ Shpejtësi më e shpejtë e ndërtimit Optimizimet e përbashkëta të komunitetit Shërbime të ndryshme të bazuara në LLVM |
Optimizimet e IBM Shfrytëzimi i plotë i arkitekturës Power Optimizimet e avancuara lider në industri Mbështetje dhe shërbim i klasit botëror |
Disponueshmëria
- Provë 60-ditore pa pagesë: shkarkoni nga faqja e produktit Open XL
- Merrni shërbim dhe mbështetje të klasit botëror të IBM përmes opsioneve fleksibël të licencimit, nga dual-pipe (AAS dhe PA)
- Licencë e përhershme (për përdorues të autorizuar ose për përdorues të njëkohshëm)
- Licenca mujore (për Bërthamë të Procesit Virtual): synoni rastet e përdorimit të cloud, p.sh., në shembullin PowerVR
Opsionet e rekomanduara të akordimit të performancës
Niveli i Optimizimit | Rekomandimet e përdorimit |
-O2 dhe -O3 | Pika tipike e fillimit |
Optimizimi i kohës së lidhjes: -flto (C/C++), -qlto (Fortran) | Për ngarkesat e punës me shumë thirrje funksionesh të vogla |
Profile optimizimi i drejtuar: -fprofile-gjeneroj, -fprofile-përdor (C/C++) -qprofile-gjeneroj, -qprofile-përdor (Fortran) |
Për ngarkesat e punës me shumë degëzime dhe thirrje funksionesh |
Për më shumë informacion ju lutem vizitoni: https://www.ibm.com/docs/en/openxl-c-and-cpp-aix/17.1.0
https://www.ibm.com/docs/en/openxl-fortran-aix/17.1.0
Shfrytëzimi i arkitekturës Full Power10 me Open XL 17.1.0
- Opsioni i ri i përpiluesit '–mcpu=pwr10' për të gjeneruar kodin duke shfrytëzuar udhëzimet Power10 dhe gjithashtu akorduar automatikisht optimizimet për Power10
- Funksione të reja të integruara për të zhbllokuar funksionalitete të reja Power10, p.sh., Përshpejtuesi i Shumëzimit të Matricës (MMA)
- Për Power10 u shtuan biblioteka të reja MASS SIMD dhe vektoriale. Të gjitha funksionet e bibliotekës MASS (SIMD, vektor, skalar) të akorduar për Power10 (gjithashtu Power9).
Shënim: Aplikacionet e përpiluara me versionet e mëparshme të përpiluesve XL (p.sh. XL 16.1.0) për të ekzekutuar në procesorët e mëparshëm të Power do të funksionojnë në mënyrë të përputhshme në Power10.
Pajtueshmëria binare në AIX
Shënim: XL C/C++ për AIX 16.1.0 prezantoi tashmë një thirrje të re xlclang++ e cila përdor pjesën e përparme Clang nga projekti LLVM ü objektet C++ të ndërtuara me xlC për
- AIX (bazuar në pjesën e përparme të IBM) nuk janë binare të pajtueshme me objektet C++ të ndërtuara me xlclang++ 16.1.0 për AIX
- Objektet C++ të ndërtuara me xlclang++ 16.1.0 për AIX do të jenë binare të pajtueshme me Open XL C/C++ të re për AIX 17.1.0
- Përputhshmëria C ruhet në të gjithë përpiluesit AIX (versionet e mëparshme XL për AIX, Open XL C/C++ për AIX 17.1.0)
- Përputhshmëria me Fortran ruhet midis versionit të mëparshëm XLF për AIX dhe Open XL Fortran për AIX 17.1.0
Disponueshmëria
Përpiluesit GCC janë të disponueshëm në të gjitha shpërndarjet Enterprise Linux dhe në të
AIX.
- Versioni i instaluar i GCC është 8.4 në RHEL 8 dhe 7.4 në SLES 15. RHEL 9 pritet të dërgojë GCC 11.2.
- Ka disa mënyra për të marrë një version mjaft të fundit të GCC kur përpiluesit e paracaktuar për shpërndarjen janë shumë të vjetër për të mbështetur Power10.
- Red Hat mbështet grupin e veglave të GCC [1] për këtë qëllim.
- SUSE ofron Modulin e Mjeteve të Zhvillimit. [2]
- IBM ofron përpiluesit dhe bibliotekat më të fundit nëpërmjet zinxhirit të mjeteve të avancuara. [3]
IBM Advance Toolchain
- Zinxhiri i mjeteve të avancuara ofron biblioteka të sistemit të optimizuar me energji së bashku me përpiluesit, korrigjuesit dhe mjete të tjera.
- Ndërtimi i kodit me zinxhirin e mjeteve të avancuara mund të prodhojë kodin më të optimizuar të mundshëm në procesorët më të fundit.
Gjuhët
- C (GCC), C++ (g++) dhe Fortran (gfortran), së bashku me të tjerë si Go (GCC), D (GDC) dhe Ada (gnat).
- Vetëm GCC, g++ dhe gfortran zakonisht instalohen si parazgjedhje.
- Përpiluesi golang [4] është alternativa e preferuar për ndërtimin e programeve Go në Power.
Pajtueshmëria dhe veçoritë e reja në Power10
- Aplikacionet e përpiluara me versionet e mëparshme të GCC për të ekzekutuar në procesorët POWER8 ose POWER9 do të funksionojnë në mënyrë të pajtueshme në procesorët Power10.
- GCC 11.2 ose versioni më i ri rekomandohet për të shfrytëzuar të gjitha veçoritë e reja të disponueshme në Power ISA 3.1 dhe të implementuara në procesorët Power10.
- GCC 11.2 ofron akses në veçorinë e Ndihmës së Shumëzimit të Matrix (MMA) të ofruar nga procesorët Power10. [5]
- Programet MMA mund të përpilohen duke përdorur cilindo nga përpiluesit GCC, LLVM dhe Open XL, me kusht që të përdorni versione mjaftueshëm të fundit.
Flamujt e përpiluesit të rekomanduar dhe të mbështetur të IBM [6]
-O3 ose -Lindje | Optimizimi agresiv. -Lindja është në thelb ekuivalente me -O3 -fast-math, e cila gjithashtu lehtëson kufizimet në aritmetikën me pikë lundruese IEEE. |
-mcpu=fuqi | Përpiloni duke përdorur udhëzime të mbështetura nga procesori i energjisë. Për shembullample, për të përdorur udhëzimet e disponueshme vetëm në Power10, zgjidhni -mcpu=power10. |
-të | Fakultative. Kryeni optimizimin "lidhje-kohë". Kjo optimizon kodin në thirrjet e funksioneve ku thirrësi dhe funksionet e thirrura ekzistojnë në njësi të ndryshme përpilimi dhe shpesh mund të sigurojë një rritje të konsiderueshme të performancës. |
-zbërthehet-laps | Fakultative. Kryeni dyfishim më agresiv të trupave të ciklit sesa zakonisht do të bënte përpiluesi. Në përgjithësi, duhet ta hiqni këtë, por në disa kode, kjo mund të sigurojë performancë më të mirë. |
Shënim:
Megjithëse -mcpu=power10 mbështetet që në GCC 10.3, GCC 11.2 preferohet sepse përpiluesit e mëparshëm nuk mbështesin çdo veçori të zbatuar në procesorët Power10. Gjithashtu, objektet e krijuara duke përdorur -mcpu=power10 nuk do të funksionojnë në POWER9 ose procesorë të mëparshëm! Megjithatë, ka mënyra për të krijuar kod që është i optimizuar për versione të ndryshme të procesorit. [7] [1] Red Hat: Përdorimi i grupit të veglave të GCC. https://access.redhat.com/documentation/enus/red_hat_enterprise_linux/8/html/developing_c_and_cpp_applications_in_rhel_8/gcc-toolset_toolsets.
[2] SUSE: Kuptimi i Modulit të Mjeteve të Zhvillimit. https://www.suse.com/c/suse-linux-essentialswhere-are-the-compilers-understanding-the-development-tools-module/.
[3] Zinxhiri i mjeteve të avancuara për Linux në Sistemet e Energjisë IBM. https://www.ibm.com/support/pages/advancetoolchain-linux-power.
[4] Shko Gjuha. https://golang.org. [5] Udhëzues i praktikave më të mira Matrix-Multiply Assist. http://www.redbooks.ibm.com/redpapers/pdfs/redp5612.pdf
[6] Përdorimi i Koleksionit të Përpiluesit GNU. https://gcc.gnu.org/onlinedocs/gcc.pdf
[7] Optimizimi specifik i objektivit me mekanizmin e funksionit indirekt GNUI. https://developer.ibm.com/tutorials/optimized-libraries-for-linux-on-power/#target-specific-optimization-
© 2021 IBM Corporation me-the-gnu-indirekt-function-mechanism.
Aplikacionet Java mund të përfitojnë pa problemetage nga veçoritë e reja të P10 ISA në sistemet operative që funksionojnë në modalitetin P10 duke përdorur versionet e kohës së ekzekutimit Java të listuara më poshtë ose më të reja:
Java 8
- IBM SDK 8 SR6 FP36
- IBM Semeru Runtime Edition Open 8u302: openj9-0.27.1
Java 11
- IBM Semeru Runtime Certified Edition 11.0.12.1: openj9-0.27.1
- IBM Semeru Runtime Edition Open 11.0.12.1: openj9-0.27.1
Java 17 (drejtuesit mund të mos jenë ende të disponueshëm)
- IBM Semeru Runtime Certified Edition 17: openj9-0.28
- IBM Semeru Runtime Edition Open 17: openj9-0.28
- OpenJDK 17
Referencat e akordimit të performancës:
IBM WebLibër gatimi i performancës së serverit të sferës
Madhësia e faqes
Rekomandimi i përgjithshëm për shumicën e bazave të të dhënave të Oracle në AIX është përdorimi i madhësisë së faqes 64 KB dhe jo madhësisë së faqes 16 MB për SGA. Në mënyrë tipike, faqet 64 KB japin pothuajse të njëjtën gjë
përfitimi i performancës si faqe 16 MB pa menaxhim të veçantë.
Dëgjues TNS
Baza e të dhënave Oracle 12.1 dhe lëshimet e mëvonshme si parazgjedhje do të përdorin 64k faqe për tekst, të dhëna dhe stek. Sidoqoftë, për TNSLISTENER ai ende përdor faqe 4k për tekst, të dhëna dhe stack. për të
aktivizoni 64k faqe për dëgjuesin që përdor komandën e eksportit përpara fillimit të procesit të dëgjuesit. Vini re se ekzekutimi në një mjedis të bazuar në ASM nga i cili mbaron dëgjuesi
GRID_HOME dhe jo ORACLE_HOME.
Dokumentacioni për komandën "rreptësisht setenv" ndryshoi në versionet 12.1 ose më vonë. -t ose -T u hoq në favor të -env ose -envs. Në mjedisin Oracle Degjues vendosni dhe eksportoni:
– LDR_CNTRL=DATAPSIZE=64K@TEXTPSIZE=64K@STACKPSIZE=64K - VMM_CNTRL=vmm_fork_policy=COR (shtoni komandën "Kopjo në lexim")
Sintaksë e përbashkët
Cilësimi LDR_CNTRL=SHARED_SYMTAB=Y nuk ka nevojë të vendoset në mënyrë specifike në versionet 11.2.0.4 ose versionet e mëvonshme. Opsionet e lidhësit të përpiluesit kujdesen për këtë cilësim dhe nuk kanë më nevojë të vendosen në mënyrë specifike. Nuk rekomandohet që LDR_CNTRL=SHARED_SYMTAB=Y të vendoset në mënyrë specifike në versionet 12c ose të mëvonshme.
Palosja e procesorit virtual
Ky është një cilësim kritik në një mjedis RAC kur përdorni LPAR me palosjen e procesorit të aktivizuar. Nëse ky cilësim nuk rregullohet, ekziston një rrezik i lartë i nxjerrjes së nyjeve RAC në kushte të lehta të ngarkesës së bazës së të dhënave. Scheda -p -o vpm_xvcpus=2
Ndërlidhja VIOS & RAC
Një lidhje e dedikuar 10G (dmth. Përshtatës Ethernet 10G) rekomandohet si minimum për të siguruar gjerësi të mjaftueshme bande për trafikun e ndjeshëm ndaj kohës së grupit. Trafiku i grupeve RAC – trafiku i ndërlidhjes duhet të jetë i dedikuar dhe jo i ndarë. Ndarja e ndërlidhjes mund të shkaktojë vonesa kohore që çojnë në probleme të varjes / dëbimit të nyjeve.
Performanca e rrjetit
Ky është një sugjerim i kahershëm i akordimit të rrjetit për Oracle në AIX, megjithëse parazgjedhja mbetet në 0. Vendosja e TCP e rfc1323=1
Informacion më gjithëpërfshirës
Referojuni lidhjes: Menaxhimi i Stabilitetit dhe Performancës së versioneve aktuale të bazës së të dhënave Oracle që ekzekutojnë AIX në Sistemet e Energjisë duke përfshirë POWER9
https://www.ibm.com/support/pages/node/6355543
Gjeneral
- Përdorni modalitetin SMT8
- Përdorni LPAR të dedikuar të CPU-së
Magazina Db2
- Sigurohuni që një rrjet privat me shpejtësi të lartë ekziston midis të gjitha nyjeve
- Kufizoni konfigurimin MLN në një nyje për fole
CP4D
- Përdorni PCIe4 për rrjetin e nyjeve OCP
- Përpara OCP 4.8, vendosni parametrin e kernelit slub_max_order=0
Praktikat më të mira të Db2
https://www.ibm.com/docs/en/db2/11.5?topic=overviews-db2-best-practices
Rrjeti
- Për rrjetin pod, përdorni rrjetin privat bazuar në SRIOV amtare nëse LPM nuk kërkohet, përndryshe përdorni VNIC
- Për aplikacionet që kërkojnë gjerësi të lartë brezi ose vonesë të ulët, merrni parasysh përdorimin e Operatorit të Rrjetit SR-IOV për të caktuar VF direkt në një pod
- Për shërbimet që kanë nevojë për një kohë të ulët, konfiguroni afatet e paracaktuara për një itinerar ekzistues
- Rregulloni madhësinë e dëshiruar MTU të rrjetit grupor të OCP
Sistemi operativ
- Merrni parasysh rritjen e kufijve u brenda ndryshimeve pas instalimit të CoreOS
- Referojuni kërkesave minimale të instalimit OCP për instalimin e platformës Power OCP4.8 në Power
Vendosja
- Gjatë vendosjes së aplikacioneve, kini parasysh se një vCPU është ekuivalente me një bërthamë fizike kur multithreading i njëkohshëm (SMT), ose hiperthreading, nuk është i aktivizuar. Kur SMT është i aktivizuar, një VCPU është ekuivalente me një fije harduerike.
- Referojuni udhëzimeve për madhësinë minimale për punëtorët dhe nyjet kryesore Kërkesat minimale të burimeve
- Alokoni një hapësirë ruajtëse të veçantë të dedikuar në regjistrin e imazheve të kontejnerit të integruar
- Përdorni udhëzimet e mëposhtme të madhësisë për drejtoritë kryesore të drejtorive kryesore të OCP-së në të cilat komponentët OpenShift Container Platform shkruajnë të dhëna.
Dokumentet / Burimet
![]() |
Performanca e IBM Power10 [pdfUdhëzuesi i përdoruesit Fuqia 10, Performanca, Performanca e Power10 |