Power10 Performance Quick Start Guides
(Power10 QSGs)
Nobyembre 2021
Minimum nga Memorya
- Alang sa matag socket sa processor, usa ka minimum nga 8 sa 16 ka DIMM ang gipuy-an
- Sa usa ka node, usa ka minimum nga 32 sa 64 alang sa mga DIMM ang gipuy-an
- Sa usa ka sistema nga 4-Node, labing gamay nga 128 sa 256 ka DIMM ang gipuy-an.
Mga Lagda sa DDIMM Plug
- Himamata ang minimum nga panumduman nga gitugot (matag processor socket labing menos 8 sa 16 ka DIMM ang gipuy-an)
- Ang tanang DIMM ubos sa matag processor kinahanglang parehas nga kapasidad
- Ang mga pag-upgrade sa bahin itanyag sa mga pagdugang sa 4 DDIMM, nga ang tanan adunay parehas nga kapasidad.
- Ang bugtong balido nga gidaghanon sa DDIMM nga gisaksak sa mga site nga konektado sa usa ka gihatag nga module sa processor mao ang 8 o 12 o 16.
Pagbuhat sa Memorya
- Ang pasundayag sa sistema mouswag samtang ang gidaghanon sa memorya mikaylap sa daghang mga slot sa DDIMM. Kay exampug, kung gikinahanglan ang 1TB sa usa ka Node, mas maayo nga adunay 64 x 32GB DIMMs kaysa adunay 32 x 64GB DIMMs.
- Ang pag-plug sa mga DIMM nga parehas ang gidak-on makahatag sa labing taas nga pasundayag
- Ang performance sa sistema molambo samtang mas daghang quads ang magkaparehas sa usag usa
- Ang performance sa sistema molambo samtang mas daghang processor DDIMM ang magkaparehas sa usag usa
- Ang performance sa sistema molambo sa multi-drawer system kung balanse ang memory capacity tali sa mga drawer.
Bandwidth sa Memorya
Kapasidad sa DDIMM | Teoretikal nga MaxBandwidth |
32GB, 64GB (DDR4 @ 3200 Mbps) | 409 GB/s |
128GB, 256GB (DDR4 @ 2933 Mbps) | 375 GB/s |
Summary
- Alang sa labing maayo nga posible nga pasundayag, kasagaran girekomenda nga ang memorya i-install nga parehas sa tanan nga mga drawer sa node sa sistema ug tanan nga mga socket sa processor sa sistema. Ang pagbalanse sa memorya sa mga naka-install nga planar card sa sistema makapahimo sa pag-access sa memorya sa makanunayon nga paagi ug kasagaran moresulta sa mas maayo nga performance alang sa imong configuration.
- Bisan kung ang labing kataas nga bandwidth sa memorya nakab-ot pinaagi sa pagpuno sa tanan nga mga puwang sa panumduman, ang mga plano alang sa umaabot nga mga pagdugang sa panumduman kinahanglan nga tagdon kung magdesisyon kung unsang gidak-on sa bahin sa panumduman ang gamiton sa panahon sa inisyal nga order sa sistema.
P10 Compute ug MMA Architecture
- 2x Bandwidth nga gipares sa SIMD*
- 8 independente nga Fixed & Float SIMD nga makina matag Core
- 4 – 32x Matrix Math Acceleration*
- 4 512 bit nga makina kada core = 2048b resulta / siklo
- Matrix math sa gawas nga mga produkto sa Single, Doble ug Gipamub-an nga katukma.
- Ang suporta sa MMA Architecture gipaila sa POWER ISA v3.1
- Nagsuporta sa SP, DP, BF16, HP, Int-16, Int-8 & Int-4 nga lebel sa katukma.
P10 MMAApplications & Workload Integration
- Ang mga aplikasyon sa ML ug HPC nga adunay siksik nga linear algebra computations, matrix multiplications, convolutions, FFT mahimong mapadali gamit ang MMA
- GCC version>= 10 & LLVM version>=12 nagsuporta sa MMA pinaagi sa built-in.
- Ang OpenBLAS, IBM ESSL & Eigen Libraries na-optimize na sa mga instruksiyon sa MMA sa P10.
- Sayon nga paghiusa sa MMA alang sa mga aplikasyon sa negosyo, ML frameworks, ug Open Community nga mga pakete pinaagi sa mga librarya sa BLAS sa ibabaw.
PowerPC Matrix-Multiply Assist Gitukod-sa Function https://gcc.gnu.org/onlinedocs/gcc/PowerPC-Matrix-Multiply-Assist-Built-in-Functions.html
Matrix-Multiply Assist Best Practices Guide https://www.redbooks.ibm.com/Redbooks.nsf/RedpieceAbstracts/redp5612.html?OpenMga Virtual nga Proseso
- Ang kadaghanon sa giulohan nga mga cores sa tanang shared partitions dili molapas sa gidaghanon sa cores sa shared pool
- Siguruha nga ang gidaghanon sa gi-configure nga virtual nga mga processor sa bisan unsang gipaambit nga partisyon sa usa ka frame dili labi pa sa gidaghanon sa mga cores sa gipaambit nga pool
- I-configure ang gidaghanon sa mga virtual processor alang sa usa ka shared partition aron mapadayon ang kinatas-ang panginahanglan sa kapasidad
- I-configure ang gidaghanon sa mga may katungod nga mga cores alang sa usa ka shared partition ngadto sa average nga paggamit sa maong partition para sa mas maayo nga performance
- Aron masiguro ang mas maayo nga memorya ug CPU affinity (likayan ang wala kinahanglana nga preemptions sa virtual processor), siguroha ang sumada sa mga may katungod nga mga cores sa tanan nga shared partitions duol sa gidaghanon sa mga cores sa shared pool
Mode sa Pagkaangay sa Processor
- Adunay 2 processor compatibility modes nga magamit alang sa AIX: POWER9 ug POWER9_base. Default mao ang POWER9_base mode.
- Adunay 2 processor compatibility modes nga magamit alang sa Linux: POWER9 ug POWER10 mode. Ang default mao ang POWER10 mode.
- Pagkahuman sa mga partisyon sa LPM, kinahanglan nga i-power cycle kung usbon ang mode sa pagpahiangay sa processor
Mga Konsiderasyon sa Pagpilo sa Processor
- Para sa share partition nga nagpadagan sa AIX sa Power9, ang default vpm_throughput_mode = 0, sa Power10, ang default vpm_throughput_mode = 2. Alang sa mga workloads nga adunay mga trabaho nga dugay na nga nagdagan, kini posibleng makatabang sa core nga pagkunhod sa paggamit.
- Alang sa dedikadong partisyon nga nagdagan sa AIX, ang default vpm_throughput_mode = 0 sa Power9 ug Power10.
LPAR Page Table Size Pagkonsiderar
• Ang lamesa sa panid sa Radix gisuportahan sugod sa Power10 nga nagpadagan sa Linux. Mahimo kini nga makapauswag sa performance sa workload.
Reperensya:
Mga pahiwatig ug tip para sa Pagbalhin sa Workload sa IBM POWER Systems: https://www.ibm.com/downloads/cas/39XWR7YM
IBM POWERVirtualizationGiya sa Pinakamaayong Practice: https://www.ibm.com/downloads/cas/JVGZA8RW
Siguruha nga ang lebel sa OS karon
Ang Fix Central naghatag sa pinakabag-o nga mga update para sa AIX, IBM i, VIOS, Linux, HMC ug F/W. Dugang pa niana, ang himan sa FLRT naghatag sa girekomendar nga lebel alang sa matag H/W nga modelo. Gamita kini nga mga himan aron mapadayon ang imong sistema hangtod karon. Kung dili ka makasaka sa girekomendar nga lebel, dayon tan-awa ang Nailhan nga Isyu nga seksyon sa Mga Pahibalo ug Mga Tip sa pagbalhin sa Workload sa IBM POWER10 Processor-Based Systems nga dokumento.
Paggamit sa AIX CPU
Sa POWER10, ang sistema sa AIX OS gi-optimize alang sa labing maayo nga hilaw nga throughput sa mas taas nga paggamit sa CPU kung nagdagan uban ang mga dedikado nga mga processor. Kung nagdagan sa gipaambit nga mga processor, ang sistema sa AIX OS gi-optimize aron makunhuran ang paggamit sa CPU (pc). Kung gikinahanglan sa kustomer nga paminusan pa ang paggamit sa CPU (pc), gamita ang iskedyul nga tunable nga pm_throughput_mode aron ma-tune ang workload ug susihon ang mga benepisyo sa hilaw nga throughput kumpara sa paggamit sa CPU.
NX GZIP
Sa pagkuha sa advantage sa NX GZIP acceleration sa POWER10 system ang LPAR kinahanglang anaa sa POWER9 compatibility mode (dili POWER9_base mode) o POWER10 compatibility mode.
IBM i
Siguruha nga ang lebel sa operating system sa IBM I karon. Ang Fix Central naghatag sa pinakabag-o nga mga update para sa IBM I, VIOS, HMC, ug firmware. https://www.ibm.com/support/fixcentral/
Firmware
Siguroha nga ang lebel sa firmware sa sistema mao ang kasamtangan. Ang Fix Central naghatag sa pinakabag-o nga mga update para sa IBM I, VIOS, HMC, ug firmware. https://www.ibm.com/support/fixcentral/
Mga DIMM sa memorya
Sunda ang husto nga memory plug-in nga mga lagda. Kung mahimo, hingpit nga pun-a ang mga slot sa DIMM sa memorya ug gamita ang parehas nga kadako nga DIMM sa memorya.
Ang lebel sa SMT sa processor
Sa pagkuha sa bug-os nga advantage sa pasundayag sa Power10 nga mga CPU, among girekomendar ang mga kliyente nga gamiton ang IBM i default processor multitasking settings, nga makapadako sa SMT
lebel para sa LPAR configuration.
Pagpahimutang sa Partisyon
Ang karon nga lebel sa FW nagsiguro nga labing maayo nga pagbutang sa mga partisyon. Bisan pa, kung ang kanunay nga operasyon sa DLPAR gihimo sa mga partisyon sa CEC, girekomenda nga gamiton ang DPO
aron ma-optimize ang pagbutang.
Mga Virtual nga Proseso - gipaambit kumpara sa gipahinungod nga mga processor
Gamita ang gipahinungod nga mga processor alang sa labing maayo nga partition level performance.
EnergyScale
Alang sa labing maayo nga katulin sa processor sa CPU, siguroha nga ang Maximum Performance gitakda (default alang sa IBM Power E1080). Kini nga setting ma-configure sa ASMI.
Pagtipig ug Networking I/O
Ang VIOS naghatag og flexible storage ug networking functionality. Para sa pinakamaayo nga performance, gamita ang lumad nga IBM i interface para sa I/O.
Mas komprehensibo nga impormasyon
Tan-awa ang link: IBM I on Power – Performance FAQ https://www.ibm.com/downloads/cas/QWXA9XKN
Ang enterprise Linux operating system (OS) usa ka lig-on nga pundasyon para sa imong hybrid cloud infrastructure ug para sa scale-up enterprise software solutions. Ang mga bag-o nga pagpagawas gi-optimize alang sa labing maayo nga klase nga mga sistema sa Power10 Enterprise
Gahum10
- Ang SLES15SP3, RHEL8.4 nagsuporta sa Power10 native mode
- Suporta sa Compass-mode aron tugotan ang mga kliyente nga molalin gikan sa mas karaan nga henerasyon nga Power system (P9 ug P8)
- Default nga suporta sa paghubad sa Radix sa Power10 mode
- Mahinungdanon nga pag-uswag sa performance sa pag-encrypt
Linux + PowerVM
- Suporta alang sa PowerVM enterprise features: LPM, Shared CPU Pools, DLPAR
- Bag-ong mga solusyon: SAP HANA umaabot nga pagtubo sa aplikasyon nga adunay 4PB virtual address space
- Bawasan ang oras sa pag-reload sa datos: Virtual PMEM nga suporta para sa SAP HANA
- Tibuok kalibutan nga Suporta ug Serbisyo
Gisuportahan nga mga distro:
- Sugod sa Power9 lang RedHat ug SUSE ang gisuportahan sa PowerVM partitions
- Detalyadong impormasyon sa distro support matrix nga naglangkob sa mas tigulang nga henerasyon nga HW
Suporta sa LPM:
- Ibalhin ang mga lohikal nga partisyon sa Linux gikan sa mas karaan nga henerasyon nga mga sistema sa Power nga adunay hapit-zero nga oras sa aplikasyon
- Reference: LPM Guide and related information
Mga Pakete nga Piho nga Gahum:
- PowerPC-utils package: Naglangkob sa mga utilities alang sa pagmentinar sa IBM PowerPC LPARs. Anaa isip bahin sa distro.
- Advance Toolchain for Linux on Power: Naglangkob sa pinakabag-o nga mga compiler, runtime nga mga librarya.
Labing maayo nga mga gawi:
- Naghatag ang RHEL nga gitakda nang daan nga mga tuning isip bahin sa gipunting nga serbisyo.
- Tan-awa ang pinakabag-o nga mga nota sa SAP alang sa girekomenda nga mga setting sa OS para sa mga aplikasyon sa SAP. Kasagaran nga gitono gigamit sa RHEL ug pagkuha o sapconf sa SLES
- Ang frequency gidumala sa PowerVM. Reperensya: Pagdumala sa Enerhiya
- Ang pagsugod sa Power8 Huge Dynamic DMA Window makatabang sa pagpalambo sa performance sa I/O.
- Ang pagsugod sa Power9 24 × 7-Monitoring gisagol sa perf tool. Gitugotan ang pagmonitor sa tibuuk nga sistema.
- Siguroha nga ang lebel sa firmware sa sistema mao ang kasamtangan.
- Ang lparnumascore gikan sa PowerPC-utils nagpakita sa kasamtangang marka sa affinity sa LPAR. Mahimong gamiton ang DPO aron mapauswag ang marka sa affinity sa LPAR.
Dugang nga mga pagbasa:
- SLES alang sa Gahum ug pipila ka makapadani nga mga bahin.
- Pagsugod sa Linux sa Power Systems, Linux sa Power Systems server
- Komunidad sa Enterprise Linux
- Gisuportahan sa mga sistema sa IBM Power ang lainlaing mga adapter sa network nga lainlain ang katulin ug gidaghanon sa mga pantalan.
- Kung gigamit nimo ang parehas nga mga adapter sa network sama sa imong miaging sistema, sa sinugdan, ang parehas nga pag-tune kinahanglan gamiton sa bag-ong sistema.
- Kadaghanan sa mga adapter sa Ethernet nagsuporta sa daghang pagdawat ug pagpadala sa mga pila nga ang gidak-on sa buffer mahimong lainlain aron madugangan ang ihap sa packet.
- Ang default nga mga setting sa pila lahi sa lain-laing mga adapter ug mahimong dili maayo nga makab-ot ang labing taas nga rate sa mensahe sa usa ka modelo sa client-server.
- Ang paggamit sa dugang nga mga pila makadugang sa paggamit sa CPU sa sistema; mao nga ang labing maayo nga set sa pila alang sa usa ka piho nga workload kinahanglan gamiton.
Mga konsiderasyon sa mas taas nga tulin nga adaptor
- Ang mas taas nga tulin nga mga network nga adunay 25 GigE ug 100 GigE nga mga adapter sa network nanginahanglan daghang parallel nga mga hilo ug pag-tune sa mga kinaiya sa drayber.
- Kung kini usa ka Gen4 adapter, siguruha nga ang gipahiangay gipalingkod sa usa ka slot sa Gen4.
- Ang dugang nga mga gimbuhaton sama sa compression, encryption, ug pagdoble mahimong makadugang sa latency
Pag-usab sa mga setting sa pila sa AIX
Aron usbon ang gidaghanon sa pagdawat/pagpadala sa mga pila sa AIX
- ifconfig enX buwag
- chdev -l entX -a queues_rx= -usa ka queues_tx=
- chdev -l enX -a state=up
Pag-usab sa mga setting sa pila sa Linux
Aron usbon ang gidaghanon sa mga pila sa Linux ethtool -L ethX gihiusa
Pag-usab sa gidak-on sa pila sa AIX
- ifconfig enX buwag
- chdev -l entX -a rx_max_pkts = -usa ka tx_max_pkts =
- chdev -l enX -a state=up
Pag-usab sa gidak-on sa pila sa LinuxP: ethtool -G ethX rx tx
Virtualization
- Gisuportahan ang virtualized networking sa porma sa SRIOV, vNIC, vETH. Ang virtualization makadugang sa latency ug makapakunhod sa throughput kumpara sa lumad nga I/O.
- Gawas sa backend hardware, siguruha nga ang memorya sa VIOS ug mga kantidad sa CPU igo na aron mahatagan ang gikinahanglan nga throughput ug mga oras sa pagtubag
- Ang IBM PowerVM Best Practices mahimong makatabang kaayo sa pagsukod sa VIOS
- Kung gigamit nimo ang parehas nga mga adapter sa pagtipig sama sa imong miaging sistema, sa sinugdan, ang parehas nga pag-tune kinahanglan gamiton sa bag-ong sistema. Kung gitinguha ang dugang nga pasundayag gikan sa naglungtad nga sistema, nan kinahanglan nga himuon ang normal nga pag-tune.
- Kung ang mga subsystem sa pagtipig lahi kaayo sa mas bag-ong sistema kaysa sa nauna nga sistema, ang mosunod nga lista sa mga konsiderasyon mahimong negatibo nga makaapekto sa gitan-aw nga katulin sa mga aplikasyon -
- Ang pag-ilis gikan sa Direct Attached Storage (DAS o internal) ngadto sa Storage Area Network (SAN) o Network Attached Storage (NAS) (o external storage) makadugang sa latency.
- Ang dugang nga mga gimbuhaton sama sa compression, encryption ug deduplication mahimong makadugang sa latency.
- Ang pagkunhod sa gidaghanon sa Storage LUNs makapakunhod sa mga kapanguhaan sa server nga gikinahanglan aron suportahan ang gikinahanglan nga mga throughput.
- Tan-awa ang tuning o setup guides para sa bag-ong mga device aron masabtan kini nga mga epekto.'
- Ang virtualization makadugang sa latency ug makapakunhod sa throughput kumpara sa lumad nga I/O. Gawas sa backend hardware, siguroha ang VIOS memory ug CPU
- Ang pagbalhin ngadto sa mas taas nga tulin nga virtualized nga mga adapter sa VIOS magkinahanglan og pag-adjust sa VIOS configuration sa mga CPU ug memorya. Ang IBM PowerVM Best Practices mahimong makatabang kaayo sa pagsukod sa VIOS.
Mga giya sa pag-tune – palihog tan-awa ang IBM Knowledge Center para sa AIX ug Linux nga mga giya.
PCIe3 12 GB Cache RAID + SAS Adapter Quad-port 6 Gb x8 Adapter Linux:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=availability-ha-asymmetricaccess-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=linux-common-sas-raidcontroller-tasks
AIX:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-multi-initiator-highavailability
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-common-controller-diskarray-management-tasks
IBM
- https://www.ibm.com/docs/en/power9/9223-42H?topic=configurations-dual-storageioa-access-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=i-common-controller-diskarray-management-tasks
PCIe3 x8 2-port Fiber Channel (32 Gb/s) Adapter
- https://www.ibm.com/docs/en/aix/7.2?topic=iompio-device-attributes
- https://www.ibm.com/docs/en/power9?topic=channel-npiv-multiple-queue-support
Dugang nga AIX tuning para sa performance:
- SCSI sa Fiber Channel (MPIO): itakda ang multipath algorithm sa round_robin alang sa matag disk
- NVMe sa Fiber Channel: ang set mahimong i-attribute sa 7 alang sa matag NVMe sa Fiber Channel Dynamic controller nga gihimo sa panahon sa pagkadiskobre
NVMe Adapter AIX tuning para sa performance
Ang set mahimong i-attribute sa 8 alang sa matag NVMe device
Ang sunod nga henerasyon nga C/C++/Fortran compiler sa IBM nga naghiusa sa mga advanced optimization sa IBM sa open-source nga imprastraktura sa LLVM
![]() |
|
LLVM Mas dako nga kwarta para sa C/C++ nga lengguwahe Mas paspas nga tulin sa pagtukod Mga komon nga pag-optimize sa komunidad Nagkalainlain nga mga gamit nga nakabase sa LLVM |
IBM optimizations Bug-os nga pagpahimulos sa arkitektura sa Power Mga advanced optimization nga nanguna sa industriya Tibuok kalibutan nga Suporta ug Serbisyo |
Anaa
- 60 ka adlaw nga walay bayad nga pagsulay: pag-download gikan sa panid sa produkto sa Open XL
- Pagbaton og IBM world-class nga Serbisyo & Suporta pinaagi sa flexible nga mga opsyon sa paglilisensya, gikan sa dual-pipe (AAS ug PA)
- Perpetual nga lisensya (matag Awtorisadong Gumagamit o matag Kadungan nga Gumagamit)
- Buwanang lisensya (matag Virtual Process Core): target nga cloud use cases, pananglitan, sa PowerVR instance
Girekomenda nga mga kapilian sa pag-tune sa pasundayag
Pag-optimize nga lebel | Mga rekomendasyon sa paggamit |
-O2 ug -O3 | Kasagaran nga punto sa pagsugod |
Pag-optimize sa oras sa link: -flto (C/C++), -qlto (Fortran) | Alang sa mga workload nga adunay daghang gagmay nga mga tawag sa function |
Profile giniyahan nga pag-optimize: -fprofile-pagmugna, -fprofile-gamit (C/C++) -qprofile-pagmugna, -qprofile-gamit (Fortran) |
Para sa mga workloads nga naay daghang branching ug function calls |
Para sa dugang impormasyon palihog bisitaha: https://www.ibm.com/docs/en/openxl-c-and-cpp-aix/17.1.0
https://www.ibm.com/docs/en/openxl-fortran-aix/17.1.0
Bug-os nga Power10 arkitektura pagpahimulos uban sa Open XL 17.1.0
- Bag-ong opsyon sa compiler '–mcpu=pwr10' aron makamugna og code nga nagpahimulos sa mga instruksiyon sa Power10 ug awtomatiko usab nga i-tune ang mga pag-optimize para sa Power10
- Bag-ong built-in nga mga function aron maablihan ang bag-ong Power10 functionalities, pananglitan, Matrix Multiply Accelerator (MMA)
- Bag-ong MASS SIMD ug vector librarya ang gidugang para sa Power10. Ang tanan nga mga function sa library sa MASS (SIMD, vector, scalar) gipunting alang sa Power10 (usab Power9).
Mubo nga sulat: Ang mga aplikasyon nga gihugpong sa mga naunang bersyon sa XL Compiler (pananglitan, XL 16.1.0) nga modagan sa nangaging mga Power processor modagan nga compatible sa Power10.
Binary Compatibility sa AIX
Mubo nga sulat: Ang XL C/C++ para sa AIX 16.1.0 nagpaila na ug bag-ong invocation xlclang++ nga naggamit sa Clang front-end gikan sa LLVM project ü C++ nga mga butang nga gitukod gamit ang xlC para
- Ang AIX (base sa kaugalingong front-end sa IBM) dili binary compatible sa C++ nga mga butang nga gitukod gamit ang xlclang++ 16.1.0 para sa AIX
- Ang mga butang nga C++ nga gitukod gamit ang xlclang++ 16.1.0 para sa AIX mahimong binary compatible sa bag-ong Open XL C/C++ para sa AIX 17.1.0
- Ang C compatibility gipadayon sa tanang AIX compiler (sa sayo nga XL nga mga bersyon para sa AIX, Open XL C/C++ para sa AIX 17.1.0)
- Ang pagkaangay sa Fortran gipadayon tali sa naunang bersyon sa XLF alang sa AIX ug Open XL Fortran alang sa AIX 17.1.0
Anaa
Ang GCC compiler anaa sa tanang Enterprise Linux distributions ug sa
AIX.
- Ang gi-install nga bersyon sa GCC mao ang 8.4 sa RHEL 8 ug 7.4 sa SLES 15. Ang RHEL 9 gilauman nga ipadala ang GCC 11.2.
- Adunay ubay-ubay nga mga paagi aron makakuha usa ka bag-o nga bersyon sa GCC kung ang mga default nga tigkompiler alang sa pag-apod-apod tigulang na kaayo aron suportahan ang Power10.
- Gisuportahan sa Red Hat ang GCC Toolset [1] alang niini nga katuyoan.
- Ang SUSE naghatag sa Development Tools Module. [2]
- Ang IBM naghatag sa pinakabag-o nga compiler ug library pinaagi sa Advance Toolchain. [3]
IBM Advance Toolchain
- Ang Advance Toolchain naghatag og Power-optimized system library uban sa mga compiler, debugger, ug uban pang mga himan.
- Ang kodigo sa pagtukod gamit ang Advance Toolchain makagama sa labing maayo nga code nga posible sa pinakabag-o nga mga processor.
Mga pinulongan
- C (GCC), C++ (g++), ug Fortran (gfortran), uban sa uban sama sa Go (GCC), D (GDC), ug Ada (gnat).
- Ang GCC, g++, ug gfortran lang ang kasagarang gi-install nga default.
- Ang golang compiler [4] mao ang gipalabi nga alternatibo sa pagtukod sa mga programa sa Go on Power.
Pagkaangay ug Bag-ong mga Feature sa Power10
- Ang mga aplikasyon nga gihugpong sa mga naunang bersyon sa GCC nga modagan sa POWER8 o POWER9 processors modagan nga compatible sa Power10 processors.
- Ang GCC 11.2 o sa ulahi girekomendar nga pahimuslan ang tanang bag-ong feature nga anaa sa Power ISA 3.1 ug ipatuman sa Power10 processors.
- Ang GCC 11.2 naghatag og access sa Matrix Multiply Assist (MMA) feature nga gihatag sa Power10 processors. [5]
- Ang mga programa sa MMA mahimong i-compile gamit ang bisan unsang GCC, LLVM, ug Open XL compiler, basta mogamit ka ug igo nga bag-ong mga pagpagawas.
Girekomenda ug Gisuportahan sa IBM Compiler Flags [6]
-O3 o -Silangan | Agresibo nga pag-optimize. -East mao ang esensya katumbas sa -O3 -fast-math, nga nagpahayahay usab sa mga pagdili sa IEEE floating-point arithmetic. |
-mcpu=gahum | Pag-compile gamit ang mga instruksyon nga gisuportahan sa Power processor. Kay example, aron magamit ang mga instruksyon nga magamit ra sa Power10, pilia ang -mcpu=power10. |
-sa | Kapilian. Buhata ang "link-time" nga pag-optimize. Kini nag-optimize sa code sa mga function call diin ang caller ug gitawag nga function anaa sa lain-laing mga compilation units, ug sa kasagaran makahatag og dakong performance boost. |
-unroll-loops | Kapilian. Paghimo og mas agresibong pagdoble sa mga loop body kay sa kasagarang buhaton sa compiler. Sa kinatibuk-an, kinahanglan nimong laktawan kini, apan sa pipila ka mga code, makahatag kini og mas maayo nga performance. |
Mubo nga sulat:
Bisan kung ang -mcpu=power10 gisuportahan sa sayo pa sa GCC 10.3, gipalabi ang GCC 11.2 tungod kay ang mga naunang compiler wala nagsuporta sa matag bahin nga gipatuman sa mga processor sa Power10. Usab, ang mga butang nga gihimo gamit ang -mcpu=power10 dili modagan sa POWER9 o sa naunang mga processor! Bisan pa, adunay mga paagi sa paghimo og code nga na-optimize alang sa lainlaing mga bersyon sa processor. [7] [1] Pula nga Hat: Gamit ang GCC Toolset. https://access.redhat.com/documentation/enus/red_hat_enterprise_linux/8/html/developing_c_and_cpp_applications_in_rhel_8/gcc-toolset_toolsets.
[2] SUSE: Pagsabot sa Development Tools Module. https://www.suse.com/c/suse-linux-essentialswhere-are-the-compilers-understanding-the-development-tools-module/.
[3] Advance Toolchain para sa Linux sa IBM Power Systems. https://www.ibm.com/support/pages/advancetoolchain-linux-power.
[4] Lakaw Pinulongan. https://golang.org. [5] Matrix-Multiply Assist Best Practices Guide. http://www.redbooks.ibm.com/redpapers/pdfs/redp5612.pdf
[6] Gamit ang GNU Compiler Collection. https://gcc.gnu.org/onlinedocs/gcc.pdf
[7] Target-Specific Optimization uban sa GNUIndirect Function Mechanism. https://developer.ibm.com/tutorials/optimized-libraries-for-linux-on-power/#target-specific-optimization-
© 2021 IBM Corporation nga adunay-the-gnu-indirect-function-mechanism.
Ang mga aplikasyon sa Java dali nga makakuha og advantage sa bag-ong P10 ISA nga mga feature sa operating system nga nagdagan sa P10 mode pinaagi sa paggamit sa Java runtime nga mga bersyon nga gilista sa ubos o mas bag-o pa:
Java 8
- IBM SDK 8 SR6 FP36
- IBM Semeru Runtime Open Edition 8u302: openj9-0.27.1
Java 11
- IBM Semeru Runtime Certified Edition 11.0.12.1: openj9-0.27.1
- IBM Semeru Runtime Open Edition 11.0.12.1: openj9-0.27.1
Java 17 (mahimo nga wala pa magamit ang mga drayber)
- IBM Semeru Runtime Certified Edition 17: openj9-0.28
- IBM Semeru Runtime Open Edition 17: openj9-0.28
- OpenJDK 17
Mga reperensiya sa pag-tune sa performance:
IBM WebSphere Application Server Performance Cookbook
Gidak-on sa Panid
Ang kinatibuk-ang rekomendasyon alang sa kadaghanan sa mga database sa Oracle sa AIX mao ang paggamit sa 64KB nga gidak-on sa panid ug dili 16MB nga gidak-on sa panid para sa SGA. Kasagaran, ang 64 KB nga mga panid naghatag halos parehas
benepisyo sa performance isip 16 MB nga mga pahina nga walay espesyal nga pagdumala.
Tigpaminaw sa TNS
Ang Oracle 12.1 nga database ug sa ulahi nga mga pagpagawas pinaagi sa default mogamit sa 64k nga mga panid alang sa teksto, datos, ug stack. Bisan pa, alang sa TNSLISTENER naggamit gihapon kini og 4k nga mga panid alang sa teksto, datos, ug stack. Sa
makahimo sa 64k nga mga panid alang sa tigpaminaw naggamit sa export command sa wala pa magsugod ang proseso sa tigpaminaw. Timan-i nga nagdagan sa usa ka palibot nga nakabase sa ASM nga nahutdan sa tigpaminaw
GRID_HOME ug dili ORACLE_HOME.
Ang dokumentasyon alang sa "estriktong setenv" nga sugo nausab sa 12.1 o sa ulahi nga pagpagawas. Ang -t o -T gikuha pabor sa -env o -envs. Sa Oracle Listener environment set ug export:
– LDR_CNTRL=DATAPSIZE=64K@TEXTPSIZE=64K@STACKPSIZE=64K - VMM_CNTRL=vmm_fork_policy=COR (idugang ang 'Copy on Read' command)
Gipaambit nga syntax
Ang LDR_CNTRL=SHARED_SYMTAB=Y setting dili kinahanglan nga espesipikong itakda sa 11.2.0.4 o sa ulahi nga pagpagawas. Ang compiler linker nga mga opsyon nag-atiman niini nga setting ug dili na kinahanglan nga espesipikong itakda. Dili girekomenda nga adunay LDR_CNTRL=SHARED_SYMTAB=Y nga espesipikong itakda sa 12c o sa ulahi nga mga pagpagawas.
Pagpilo sa Virtual Processor
Kini usa ka kritikal nga kahimtang sa usa ka palibot sa RAC kung gigamit ang mga LPAR nga adunay pagpaandar sa pagpilo sa processor. Kung kini nga setting dili i-adjust, adunay taas nga risgo sa RAC node evictions ubos sa light database workload nga kondisyon. Scheda -p -o vpm_xvcpus=2
VIOS ug RAC Interconnect
Ang usa ka dedikado nga 10G (ie, 10G Ethernet Adapter) nga koneksyon girekomendar isip minimum aron makahatag og igong bandwidth alang sa cluster timing-sensitive nga trapiko. RAC cluster traffic – interconnect nga trapiko kinahanglang ipahinungod ug dili ipaambit. Ang pagpaambit sa interconnect mahimong hinungdan sa mga paglangan sa oras nga mosangpot sa mga isyu sa pagbitay sa node/pagpalayas.
Pagganap sa Network
Kini usa ka dugay na nga sugyot sa pag-tune sa network alang sa Oracle sa AIX, bisan kung ang default nagpabilin sa 0. TCP Setting sa rfc1323=1
Mas komprehensibo nga impormasyon
Tan-awa ang link: Pagdumala sa Stability ug Performance sa kasamtangan nga Oracle Database nga mga bersyon nga nagpadagan sa AIX sa Power Systems lakip ang POWER9
https://www.ibm.com/support/pages/node/6355543
Heneral
- Gamita ang SMT8 mode
- Gamita ang gipahinungod nga CPU LPARs
Db2 Warehouse
- Siguruha nga adunay usa ka high-speed nga pribadong network taliwala sa tanan nga mga node
- Limitahi ang configuration sa MLN sa usa ka node kada socket
CP4D
- Gamita ang PCIe4 para sa OCP nodes network
- Sa wala pa ang OCP 4.8, itakda ang kernel parameter slub_max_order=0
Db2 Labing Maayo nga mga Praktis
https://www.ibm.com/docs/en/db2/11.5?topic=overviews-db2-best-practices
Network
- Para pod sa network, gamita ang pribadong network base sa lumad nga SRIOV kung dili kinahanglan ang LPM, kung dili, gamita ang VNIC
- Alang sa mga aplikasyon nga nanginahanglan taas nga bandwidth o ubos nga latency, ikonsiderar ang paggamit sa SR-IOV Network Operator aron i-assign ang VF direkta sa usa ka pod
- Para sa mga serbisyo nga nanginahanglan ug mubu nga timeout, i-configure ang default nga timeout para sa kasamtangan nga ruta
- I-adjust ang gitinguha nga gidak-on sa MTU sa cluster network sa OCP
Operating nga sistema
- Ikonsiderar ang pagdugang sa u-limits sulod sa mga kausaban sa CoreOS Post-install
- Tan-awa ang minimum nga mga kinahanglanon sa pag-instalar sa OCP para sa Power platform OCP4.8 nga instalasyon sa Power
Deployment
- Kung nag-deploy og mga aplikasyon, timan-i nga ang usa ka vCPU katumbas sa usa ka pisikal nga core kung ang dungan nga multithreading (SMT), o hyperthreading, wala ma-enable. Kung gipagana ang SMT, ang usa ka VCPU katumbas sa usa ka hilo sa hardware.
- Tan-awa ang minimum nga mga sumbanan sa pagsukod alang sa mga trabahante ug mga master node Minimum nga kinahanglanon sa kapanguhaan
- Paggahin ug lahi nga gipahinungod nga pagtipig sa built-in nga rehistro sa imahe sa sulud
- Gamita ang mosunod nga mga giya sa pagsukod alang sa mga nag-unang direktoryo sa OCP nga nag-unang mga direktoryo diin ang mga component sa OpenShift Container Platform magsulat sa datos.
Mga Dokumento / Mga Kapanguhaan
![]() |
Pagganap sa IBM Power10 [pdf] Giya sa Gumagamit Power10, Performance, Power10 Performance |