Power10 Performance Quick Start Gwidi
(QSGs Power10)
Novembru 2021
Memorja Minima
- Għal kull socket tal-proċessur, minimu ta '8 mis-16-il DIMM huma popolati
- F'node, minimu ta' 32 minn 64 għad-DIMMs huma popolati
- F'sistema b'4 Nodi, minimu ta' 128 mill-256 DIMM huma popolati
DDIMM Plug Regoli
- Ilħaq il-memorja minima permessa (kull socket tal-proċessur minimu ta '8 mis-16-il DIMMs huma popolati)
- Id-DIMMs kollha taħt kull proċessur iridu jkunu l-istess kapaċità
- It-titjib tal-karatteristiċi se jiġu offruti f'inkrementi ta' 4 DDIMM's, li kollha għandhom l-istess kapaċità.
- L-uniku numru validu ta 'DDIMM's imdaħħla f'siti konnessi ma' modulu tal-proċessur partikolari huwa 8 jew 12 jew 16.
Prestazzjoni tal-Memorja
- Il-prestazzjoni tas-sistema titjieb hekk kif l-ammont ta 'memorja jinfirex fuq aktar slots DDIMM. Per example, jekk 1TB huwa meħtieġ f'Node, huwa aħjar li jkollok 64 x 32GB DIMMs milli li jkollok 32 x 64GB DIMMs.
- It-twaħħil ta 'DIMMs li huma kollha tal-istess daqs se jipprovdi l-ogħla prestazzjoni
- Il-prestazzjoni tas-sistema titjieb hekk kif aktar quads jaqblu ma' xulxin
- Il-prestazzjoni tas-sistema titjieb hekk kif aktar DDIMMs tal-proċessuri jaqblu ma 'xulxin
- Il-prestazzjoni tas-sistema titjieb fuq sistema b'ħafna kxaxen jekk il-kapaċità tal-memorja bejn il-kxaxen tkun ibbilanċjata.
Faxxa tal-Memorja
Kapaċità DDIMM | MaxBandwidth Teoretiku |
32GB, 64 GB (DDR4 @ 3200 Mbps) | 409 GB/s |
128GB, 256 GB (DDR4 @ 2933 Mbps) | 375 GB/s |
Sommarju
- Għall-aħjar prestazzjoni possibbli, huwa ġeneralment rakkomandat li l-memorja tkun installata b'mod ugwali fil-kxaxen kollha tan-nodi tas-sistema u s-sokits kollha tal-proċessur fis-sistema. L-ibbilanċjar tal-memorja tul il-karti planari tas-sistema installata jippermetti aċċess għall-memorja b'mod konsistenti u tipikament jirriżulta f'prestazzjoni aħjar għall-konfigurazzjoni tiegħek.
- Għalkemm il-bandwidth massimu tal-memorja jinkiseb billi jimtlew is-slots tal-memorja kollha, pjanijiet għal żidiet futuri tal-memorja għandhom jiġu kkunsidrati meta jiġi deċiż liema daqs tal-karatteristika tal-memorja tuża fil-ħin tal-ordni inizjali tas-sistema.
P10 Kompjuter & MMA Arkitettura
- 2x Bandwidth imqabbla SIMD*
- 8 magni indipendenti Fiss & Float SIMD għal kull Core
- 4 – 32x Aċċelerazzjoni tal-Matematika tal-Matriċi*
- 4 512 bit magna għal kull qalba = 2048b riżultati / ċikli
- Prodotti ta 'barra tal-matematika tal-Matrix ta' preċiżjoni Uniku, Doppju u Mnaqqsa.
- Appoġġ għall-Arkitettura MMA introdott f'POWER ISA v3.1
- Jappoġġja livelli ta 'preċiżjoni SP, DP, BF16, HP, Int-16, Int-8 & Int-4.
P10 MMAApplicazzjonijiet u Integrazzjoni tal-Voġġu tax-Xogħol
- Applikazzjonijiet ML & HPC b'komputazzjonijiet ta' alġebra lineari densi, multiplikazzjoni tal-matriċi, konvoluzzjonijiet, FFT jistgħu jiġu aċċellerati bl-MMA
- Verżjoni GCC >= 10 & verżjoni LLVM >=12 tappoġġja l-MMA permezz ta 'built-ins.
- Il-Libreriji OpenBLAS, IBM ESSL u Eigen huma diġà ottimizzati bl-istruzzjonijiet tal-MMA għal P10.
- Integrazzjoni faċli ta 'MMA għal applikazzjonijiet ta' intrapriżi, oqfsa ML, u pakketti tal-Komunità Miftuħa permezz tal-libreriji BLAS ta 'hawn fuq.
PowerPC Matrix-Multiply Assist Funzjonijiet Inkorporati https://gcc.gnu.org/onlinedocs/gcc/PowerPC-Matrix-Multiply-Assist-Built-in-Functions.html
Gwida tal-Aħjar Prattiċi tal-Assisti tal-Matrix-Multiply https://www.redbooks.ibm.com/Redbooks.nsf/RedpieceAbstracts/redp5612.html?OpenProċessuri Virtwali
- Is-somma tal-qlub intitolati tal-ħitan kondiviżi kollha ma tistax taqbeż in-numru ta' qlub fil-ġabra kondiviża
- Żgura li n-numru ta' proċessuri virtwali kkonfigurati ta' kwalunkwe diviżorju kondiviż fuq qafas ma jkunx aktar min-numru ta' cores fil-pool kondiviż
- Ikkonfigura n-numru ta 'proċessuri virtwali għal partizzjoni kondiviża biex isostnu l-ogħla domanda tal-kapaċità
- Ikkonfigura n-numru ta 'cores intitolati għal partizzjoni kondiviża għall-użu medju ta' dik il-partizzjoni għal prestazzjoni aħjar
- Biex tiżgura memorja aħjar u affinità tas-CPU (tevita preemptions bla bżonn tal-proċessur virtwali), tiżgura s-somma tal-qlub intitolati tal-ħitan kondiviżi kollha qrib in-numru tal-qlub fil-ġabra kondiviża
Modalità ta' Kompatibbiltà tal-Proċessur
- Hemm 2 modi ta' kompatibilità tal-proċessuri disponibbli għall-AIX: POWER9 u POWER9_base. Default huwa POWER9_base mode.
- Hemm 2 modi ta 'kompatibilità tal-proċessuri disponibbli għal Linux: POWER9 u POWER10 mode. Default huwa l-mod POWER10.
- Wara diviżorji LPM, jeħtieġ li l-enerġija taċ-ċiklu meta tbiddel il-mod ta 'kompatibilità tal-proċessur
Konsiderazzjonijiet tat-Tiwi tal-Proċessur
- Għall-partizzjoni tal-ishma li taħdem AIX fuq Power9, il-vpm_throughput_mode default = 0, fuq Power10, il-vpm_throughput_mode default = 2. Għal xogħolijiet li għandhom impjiegi fit-tul, jista 'potenzjalment jgħin fit-tnaqqis tal-użu ewlieni.
- Għal partizzjoni ddedikata li taħdem AIX, il-vpm_throughput_mode default = 0 kemm fuq Power9 kif ukoll fuq Power10.
Konsiderazzjonijiet tad-Daqs tat-Tabella tal-Paġni LPAR
• It-tabella tal-paġna Radix hija appoġġjata li tibda fuq Power10 li qed taħdem Linux. Jista 'potenzjalment ittejjeb il-prestazzjoni tal-piż tax-xogħol.
Referenza:
Ħjiel u suġġerimenti għall-Migrazzjoni tat-Tagħbija tax-Xogħol għal IBM POWER Systems: https://www.ibm.com/downloads/cas/39XWR7YM
IBM POWERVirtualizationBest Practices Guide: https://www.ibm.com/downloads/cas/JVGZA8RW
Żgura li l-livell tal-OS huwa kurrenti
Fix Central jipprovdi l-aħħar aġġornamenti għal AIX, IBM i, VIOS, Linux, HMC u F/W. Barra minn hekk, l-għodda FLRT tipprovdi l-livelli rakkomandati għal kull mudell H/W. Uża dawn l-għodod biex iżżomm is-sistema tiegħek aġġornata. Jekk ma tistax timxi sal-livell rakkomandat, imbagħad irreferi għat-taqsima Kwistjoni Magħrufa tal-Ħjiel u Għajnuniet għall-migrazzjoni tal-Ħidma tax-Xogħol għad-dokument IBM POWER10 Processor-Based Systems.
L-użu tas-CPU AIX
Fuq POWER10, is-sistema AIX OS hija ottimizzata għall-aqwa throughput mhux maħdum b'użu ogħla tas-CPU meta taħdem bi proċessuri ddedikati. Meta taħdem bi proċessuri kondiviżi, is-sistema AIX OS hija ottimizzata biex tnaqqas l-użu tas-CPU (pc). Jekk il-klijent jeħtieġ li jnaqqas aktar l-użu tas-CPU (pc), uża l-iskeda tunable pm_throughput_mode biex tixgħel l-ammont tax-xogħol u tevalwa l-benefiċċji tal-produzzjoni mhux maħduma vs. l-użu tas-CPU.
NX GZIP
Biex tieħu vantaġġtage ta' l-aċċelerazzjoni NX GZIP fuq sistemi POWER10 l-LPAR irid ikun fil-mod ta' kompatibilità POWER9 (mhux mod POWER9_base) jew mod ta' kompatibilità POWER10.
IBM i
Żgura li l-livell tas-sistema operattiva IBM I huwa kurrenti. Fix Central jipprovdi l-aħħar aġġornamenti għal IBM I, VIOS, HMC, u firmware. https://www.ibm.com/support/fixcentral/
Firmware
Żgura li l-livell tal-firmware tas-sistema huwa kurrenti. Fix Central jipprovdi l-aħħar aġġornamenti għal IBM I, VIOS, HMC, u firmware. https://www.ibm.com/support/fixcentral/
DIMMs tal-memorja
Segwi regoli xierqa tal-plug-in tal-memorja. Jekk possibbli, imla bis-sħiħ slots DIMM tal-memorja u uża DIMMs tal-memorja ta' daqs simili.
Livell SMT tal-proċessur
Biex tieħu vantaġġ sħiħtage tal-prestazzjoni tas-CPUs Power10, nirrakkomandaw lill-klijenti jutilizzaw is-settings multitasking tal-proċessur default IBM i, li jimmassimizzaw l-SMT
livell għall-konfigurazzjoni LPAR.
Tqegħid ta' partizzjoni
Il-livelli attwali tal-FW jiżguraw it-tqegħid ottimali tal-ħitan. Madankollu, jekk isiru operazzjonijiet DLPAR frekwenti fuq diviżorji fuq is-CEC, huwa rakkomandat li tuża DPO
biex tottimizza t-tqegħid.
Proċessuri Virtwali – proċessuri kondiviżi vs dedikati
Uża proċessuri ddedikati għall-aħjar prestazzjoni fil-livell tal-partizzjoni.
EnergyScale
Għall-aħjar veloċità tal-proċessur tas-CPU, kun żgur li l-Prestazzjoni Massima hija ssettjata (default għal IBM Power E1080). Dan is-setting huwa konfigurabbli fl-ASMI.
Ħażna u Netwerking I/O
VIOS jipprovdi ħażna flessibbli u funzjonalità tan-netwerking. Għall-aħjar prestazzjoni possibbli, uża interfaces IBM i indiġeni għall-I/O.
Informazzjoni aktar komprensiva
Irreferi għall-link: IBM I on Power – Prestazzjoni FAQ https://www.ibm.com/downloads/cas/QWXA9XKN
Is-sistema operattiva Linux tal-intrapriża (OS) hija pedament sod għall-infrastruttura tal-cloud ibridu tiegħek u għal soluzzjonijiet ta' softwer tal-intrapriżi li jiżdiedu. Ir-rilaxxi riċenti huma ottimizzati għall-aqwa sistemi Power10 Enterprise tal-klassi
Qawwa10
- SLES15SP3, RHEL8.4 jappoġġjaw il-mod nattiv Power10
- Appoġġ tal-modalità Compass biex jippermetti lill-klijenti jemigraw minn sistemi tal-Enerġija ta' ġenerazzjoni eqdem (P9 u P8)
- Appoġġ għal traduzzjoni Radix default fil-modalità Power10
- Titjib sinifikanti fil-prestazzjoni tal-kriptaġġ
Linux + PowerVM
- Appoġġ għall-karatteristiċi tal-intrapriża PowerVM: LPM, Pools ta' CPU Kondiviżi, DLPAR
- Soluzzjonijiet innovattivi: Tkabbir futur ta 'applikazzjoni SAP HANA bi spazju ta' indirizz virtwali 4PB
- Naqqas il-ħin biex terġa 'tagħbija d-dejta: Appoġġ PMEM virtwali għal SAP HANA
- Appoġġ u Servizz ta 'klassi dinjija
Distribuzzjonijiet appoġġjati:
- Nibdew b'Power9 RedHat u SUSE biss huma appoġġjati fil-ħitan PowerVM
- Informazzjoni dettaljata dwar il-matriċi ta' appoġġ tad-distro li tkopri HW ta' ġenerazzjoni anzjana
Appoġġ LPM:
- Ċaqlaq diviżorji loġiċi tal-Linux minn sistemi tal-Enerġija ta 'ġenerazzjoni eqdem b'ħin ta' waqfien tal-applikazzjoni kważi żero
- Referenza: Gwida LPM u informazzjoni relatata
Pakketti Speċifiċi tal-Enerġija:
- Pakkett PowerPC-utils: Fih utilitajiet għall-manutenzjoni ta' IBM PowerPC LPARs. Disponibbli bħala parti mid-distro.
- Advance Toolchain għal Linux on Power: Fih l-aħħar kompilaturi, libreriji runtime.
L-aħjar prattiki:
- RHEL jipprovdi tunings predefiniti bħala parti mis-servizz sintonizzat.
- Irreferi għall-aħħar noti SAP għall-issettjar tal-OS rakkomandat għall-applikazzjonijiet SAP. Tipikament sintonizzat jintuża f'RHEL u qbid jew sapconf f'SLES
- Il-frekwenza hija ġestita mill-PowerVM. Referenza: Ġestjoni tal-Enerġija
- Il-bidu ta' Power8 Huge Dynamic DMA Window jgħin fit-titjib tal-prestazzjoni tal-I/O.
- Starting Power9 24 × 7-Monitoraġġ huwa integrat mal-għodda perf. Jippermetti l-monitoraġġ tas-sistema kollha.
- Żgura li l-livell tal-firmware tas-sistema huwa kurrenti.
- lparnumascore minn PowerPC-utils juri l-punteġġ ta' affinità attwali tal-LPAR. DPO jista' jintuża biex itejjeb il-punteġġ ta' affinità LPAR.
Aktar jaqra:
- SLES għall-Enerġija u xi karatteristiċi konvinċenti.
- Ibda b'Linux on Power Systems, Linux on Power Systems servers
- Komunità Enterprise Linux
- Is-sistemi IBM Power jappoġġaw diversi adapters tan-netwerk ta' veloċitajiet u numri differenti ta' portijiet.
- Jekk qed tuża l-istess adapters tan-netwerk bħas-sistema preċedenti tiegħek, inizjalment, l-istess irfinar għandu jintuża fuq is-sistema l-ġdida.
- Ħafna mill-adapters Ethernet jappoġġjaw kjuwijiet ta' riċeviment u trażmissjoni multipli li d-daqs tal-buffer tagħhom jista 'jiġi varjat biex iżid l-għadd massimu ta' pakketti.
- Is-settings default tal-kju huma differenti b'adapters differenti u jistgħu ma jkunux ottimali biex jinkisbu rati massimi ta' messaġġi f'mudell klijent-server.
- L-użu ta' kjuwijiet addizzjonali se jżid l-użu tas-CPU tas-sistema; għalhekk għandu jintuża l-aħjar issettjar tal-kju għal xogħol speċifiku.
Konsiderazzjonijiet ta 'adapter ta' veloċità ogħla
- Netwerks ta 'veloċità ogħla b'adapters tan-netwerk ta' 25 GigE u 100 GigE jeħtieġu ħajt paralleli multipli u rfinar tal-attributi tas-sewwieq.
- Jekk huwa adapter Gen4, kun żgur li l-adattat ikun bilqiegħda fuq slot Gen4.
- Funzjonijiet addizzjonali bħal kompressjoni, encryption, u duplikazzjoni jistgħu jżidu latency
Nibdlu l-issettjar tal-kju fl-AIX
Biex tibdel in-numru ta' kjuwijiet ta' riċeviment/trażmissjoni f'AIX
- ifconfig enX aqla 'l isfel
- chdev -l entX -a queues_rx= -a queues_tx=
- chdev -l enX -a stat=up
Nibdlu l-issettjar tal-kju fil-Linux
Biex tbiddel in-numru ta 'kjuwijiet fil-Linux ethtool -L ethX magħquda
Nibdlu d-daqs tal-kju fl-AIX
- ifconfig enX aqla 'l isfel
- chdev -l entX -a rx_max_pkts = -a tx_max_pkts =
- chdev -l enX -a stat=up
Nibdlu d-daqs tal-kju fil-LinuxP: ethtool -G ethX rx tx
Virtualization
- In-netwerking virtwalizzat huwa appoġġjat fil-forma ta 'SRIOV, vNIC, vETH. Il-virtwalizzazzjoni żżid il-latenza u tista 'tnaqqas il-fluss meta mqabbel ma' I/O nattiv.
- Minbarra l-ħardwer backend, kun żgur li l-ammonti tal-memorja VIOS u tas-CPU huma biżżejjed biex jipprovdu l-ħinijiet meħtieġa ta’ throughput u rispons
- L-Aħjar Prattiki tal-IBM PowerVM jistgħu jkunu ta' għajnuna kbira fid-daqs tal-VIOS
- Jekk qed tuża l-istess adapters tal-ħażna bħas-sistema preċedenti tiegħek, inizjalment, l-istess irfinar għandu jintuża fuq is-sistema l-ġdida. Jekk tkun mixtieqa prestazzjoni addizzjonali mis-sistema eżistenti, allura l-irfinar normali għandu jsir.
- Jekk is-sottosistemi tal-ħażna jkunu differenti b'mod apprezzabbli fis-sistema l-ġdida mis-sistema preċedenti, il-lista ta' kunsiderazzjonijiet li ġejja tista' tħalli impatt negattiv fuq il-veloċità perċepita tal-applikazzjonijiet -
- Il-bidla minn Ħażna Mehmuża Diretta (DAS jew interna) għal Netwerk ta 'Żona ta' Ħażna (SAN) jew Ħażna Mehmuża man-Netwerk (NAS) (jew ħażna esterna) tista 'żżid il-latenza.
- Funzjonijiet addizzjonali bħal kompressjoni, encryption u deduplication jistgħu jżidu latency.
- It-tnaqqis tan-numru ta' LUNs ta' Ħażna jista' jnaqqas ir-riżorsi fis-server meħtieġa biex isostni t-throughputs meħtieġa.
- Irreferi għall-gwidi tal-irfinar jew tas-setup għall-apparat il-ġdid biex tifhem dawn l-impatti.'
- Il-virtwalizzazzjoni żżid il-latenza u tista 'tnaqqas il-fluss meta mqabbel ma' I/O nattiv. Minbarra l-ħardwer backend, tiżgura memorja VIOS u CPU
- Nimxu għal adapters virtwalizzati b'veloċità ogħla fil-VIOS se jeħtieġu l-aġġustament tal-konfigurazzjoni tal-VIOS fis-CPUs u l-memorja. L-Aħjar Prattiki tal-IBM PowerVM jistgħu jkunu ta' għajnuna kbira fid-daqs tal-VIOS.
Linji gwida tal-irfinar – jekk jogħġbok irreferi għall-IBM Knowledge Centre għall-linji gwida AIX u Linux.
PCIe3 12 GB Cache RAID + Adapter SAS Quad-port 6 Gb x8 Adapter Linux:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=availability-ha-asymmetricaccess-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=linux-common-sas-raidcontroller-tasks
AIX:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-multi-initiator-highavailability
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-common-controller-diskarray-management-tasks
IBM
- https://www.ibm.com/docs/en/power9/9223-42H?topic=configurations-dual-storageioa-access-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=i-common-controller-diskarray-management-tasks
Adapter PCIe3 x8 2-port Fibre Channel (32 Gb/s).
- https://www.ibm.com/docs/en/aix/7.2?topic=iompio-device-attributes
- https://www.ibm.com/docs/en/power9?topic=channel-npiv-multiple-queue-support
Irfinar AIX addizzjonali għall-prestazzjoni:
- SCSI fuq Fibre Channel (MPIO): issettja l-algoritmu multipath għal round_robin għal kull disk
- NVMe fuq Fibre Channel: sett jista' jattribwixxi għal 7 għal kull kontrollur dinamiku NVMe fuq Fibre Channel maħluq matul il-fażi ta' skoperta
NVMe Adapter AIX irfinar għall-prestazzjoni
Is-sett jista' jattribwixxi għal 8 għal kull apparat NVMe
Il-kompilaturi C/C++/Fortran tal-ġenerazzjoni li jmiss tal-IBM li jgħaqqdu l-ottimizzazzjonijiet avvanzati tal-IBM mal-infrastruttura LLVM open-source
![]() |
|
LLVM Valuta akbar għal-lingwa C/C++ Veloċità tal-bini aktar mgħaġġla Ottimizzazzjonijiet komuni tal-Komunità Diversi utilitajiet ibbażati fuq LLVM |
ottimizzazzjonijiet IBM Sfruttament sħiħ tal-arkitettura tal-Enerġija Ottimizzazzjonijiet avvanzati li jwasslu fl-industrija Appoġġ u Servizz ta 'klassi dinjija |
Disponibbiltà
- Prova bla ħlas ta' 60 jum: niżżel mill-paġna tal-prodott Open XL
- Ikseb Servizz u Appoġġ ta' klassi dinjija IBM permezz ta' għażliet ta' liċenzjar flessibbli, minn dual-pipe (AAS u PA)
- Liċenzja perpetwa (għal kull Utent Awtorizzat jew għal kull Utent Konkorrenti)
- Liċenzja ta' kull xahar (għal kull Qoba tal-Proċess Virtwali): immira każijiet ta' użu ta' cloud, eż, fuq istanza PowerVR
Għażliet ta 'rfinar tal-prestazzjoni rakkomandati
Livell ta' Ottimizzazzjoni | Rakkomandazzjonijiet għall-użu |
-O2 u -O3 | Punt tat-tluq tipiku |
Ottimizzazzjoni tal-ħin tal-link: -flto (C/C++), -qlto (Fortran) | Għal ammonti ta' xogħol b'ħafna sejħiet ta' funzjonijiet żgħar |
Profile ottimizzazzjoni ggwidata: -fprofile-generate, -fprofile-uża (C/C++) -qprofile-generate, -qprofile-użu (Fortran) |
Għal xogħolijiet b'ħafna sejħiet ta' fergħat u funzjoni |
Għal aktar informazzjoni jekk jogħġbok żur: https://www.ibm.com/docs/en/openxl-c-and-cpp-aix/17.1.0
https://www.ibm.com/docs/en/openxl-fortran-aix/17.1.0
Sfruttament sħiħ tal-arkitettura Power10 b'Open XL 17.1.0
- Għażla ġdida tal-kompilatur '–mcpu=pwr10' biex tiġġenera kodiċi li tisfrutta l-istruzzjonijiet tal-Power10 u tirfina wkoll awtomatikament l-ottimizzazzjonijiet għal Power10
- Funzjonijiet integrati ġodda biex nisfruttaw funzjonalitajiet ġodda tal-Power10, eż. Matrix Multiply Accelerator (MMA)
- Ġew miżjuda libreriji ġodda MASS SIMD u vector għal Power10. Il-funzjonijiet kollha tal-librerija MASS (SIMD, vector, scalari) sintonizzati għal Power10 (wkoll Power9).
Nota: Applikazzjonijiet miġbura ma' verżjonijiet preċedenti ta' XL Compilers (eż., XL 16.1.0) biex jaħdmu fuq proċessuri Power preċedenti se jaħdmu b'mod kompatibbli fuq Power10.
Kompatibilità Binarja fuq AIX
Nota: XL C/C++ għal AIX 16.1.0 diġà introduċa invokazzjoni ġdida xlclang++ li tisfrutta l-front-end Clang mill-proġett LLVM ü C++ oġġetti mibnija b'xlC għal
- AIX (ibbażat fuq il-front-end ta' IBM stess) mhumiex binarji kompatibbli ma' oġġetti C++ mibnija b'xlclang++ 16.1.0 għal AIX
- Oġġetti C++ mibnija b'xlclang++ 16.1.0 għal AIX se jkunu kompatibbli binarji ma' Open XL C/C++ ġodda għal AIX 17.1.0
- Il-kompatibilità C tinżamm fil-kompilaturi AIX kollha (verżjonijiet XL preċedenti għal AIX, Open XL C/C++ għal AIX 17.1.0)
- Il-kompatibilità ta' Fortran tinżamm bejn il-verżjoni XLF preċedenti għal AIX u Open XL Fortran għal AIX 17.1.0
Disponibbiltà
Il-kompilaturi tal-GCC huma disponibbli fuq id-distribuzzjonijiet kollha Enterprise Linux u fuq
AIX.
- Il-verżjoni GCC installata hija 8.4 fuq RHEL 8 u 7.4 fuq SLES 15. RHEL 9 huwa mistenni li jibgħat GCC 11.2.
- Hemm diversi modi biex tinkiseb verżjoni riċenti biżżejjed tal-GCC meta l-kompilaturi default għad-distribuzzjoni jkunu qodma wisq biex jappoġġjaw Power10.
- Red Hat jappoġġja l-GCC Toolset [1] għal dan il-għan.
- SUSE tipprovdi l-Modulu tal-Għodod tal-Iżvilupp. [2]
- IBM jipprovdi l-aħħar kompilaturi u libreriji permezz tal-Advance Toolchain. [3]
IBM Advance Toolchain
- L-Advance Toolchain jipprovdi libreriji tas-sistema ottimizzati għall-Enerġija flimkien mal-kompilaturi, id-debuggers, u għodod oħra.
- Il-kodiċi tal-bini bl-Advance Toolchain jista 'jipproduċi l-aktar kodiċi ottimizzat ħafna possibbli fuq l-aħħar proċessuri.
Lingwi
- C (GCC), C++ (g++), u Fortran (gfortran), flimkien ma 'oħrajn bħal Go (GCC), D (GDC), u Ada (gnat).
- GCC, g++, u gfortran biss huma normalment installati awtomatikament.
- Il-kompilatur golang [4] huwa l-alternattiva ppreferuta għall-bini tal-programmi Go fuq il-Power.
Kompatibilità u Karatteristiċi Ġodda fuq Power10
- Applikazzjonijiet miġbura ma' verżjonijiet preċedenti ta' GCC biex jaħdmu fuq proċessuri POWER8 jew POWER9 se jaħdmu b'mod kompatibbli fuq proċessuri Power10.
- GCC 11.2 jew aktar tard huwa rakkomandat li jisfrutta l-karatteristiċi ġodda kollha disponibbli fil-Power ISA 3.1 u implimentati fil-proċessuri Power10.
- GCC 11.2 jipprovdi aċċess għall-karatteristika Matrix Multiply Assist (MMA) ipprovduta mill-proċessuri Power10. [5]
- Il-programmi tal-MMA jistgħu jiġu kkompilati bl-użu ta' kwalunkwe kompilatur GCC, LLVM, u Open XL, sakemm tuża rilaxxi riċenti biżżejjed.
Bnadar tal-Kompilatur Rakkomandati u Appoġġjati minn IBM [6]
-O3 jew -Lvant | Ottimizzazzjoni aggressiva. -Lvant huwa essenzjalment ekwivalenti għal -O3 -fast-matematika, li wkoll tirrilassa r-restrizzjonijiet fuq l-aritmetika tal-punt li jvarja IEEE. |
-mcpu=powern | Ikkompila billi tuża struzzjonijiet appoġġjati mill-proċessur Power. Per example, biex tuża struzzjonijiet disponibbli biss fuq Power10, agħżel -mcpu=power10. |
-to | Fakultattiv. Wettaq ottimizzazzjoni "link-time". Dan jottimizza l-kodiċi tul is-sejħiet ta' funzjoni fejn min iċempel u l-funzjonijiet imsejjaħ jeżistu f'unitajiet ta' kumpilazzjoni differenti, u spiss jista' jipprovdi spinta sinifikanti fil-prestazzjoni. |
-unroll-loops | Fakultattiv. Wettaq duplikazzjoni aktar aggressiva tal-korpi loop milli l-kompilatur normalment jagħmel. Ġeneralment, għandek tħalli barra dan, iżda fuq xi kodiċijiet, dan jista 'jipprovdi prestazzjoni aħjar. |
Nota:
Għalkemm -mcpu=power10 huwa appoġġjat kmieni kemm GCC 10.3, GCC 11.2 huwa preferut minħabba li kompilaturi preċedenti ma jappoġġjawx kull karatteristika implimentata fil-proċessuri Power10. Ukoll, oġġetti maħluqa bl-użu -mcpu=power10 mhux se jaħdmu fuq POWER9 jew proċessuri preċedenti! Madankollu, hemm modi kif toħloq kodiċi li huwa ottimizzat għal verżjonijiet differenti tal-proċessuri. [7] [1] Red Hat: Bl-użu ta' GCC Toolset. https://access.redhat.com/documentation/enus/red_hat_enterprise_linux/8/html/developing_c_and_cpp_applications_in_rhel_8/gcc-toolset_toolsets.
[2] SUSE: Nifhmu l-Modulu tal-Għodod tal-Iżvilupp. https://www.suse.com/c/suse-linux-essentialswhere-are-the-compilers-understanding-the-development-tools-module/.
[3] Advance Toolchain għal Linux fuq IBM Power Systems. https://www.ibm.com/support/pages/advancetoolchain-linux-power.
[4] Mur Lingwa. https://golang.org. [5] Gwida tal-Aħjar Prattiċi tal-Assisti tal-Matrix-Multiply. http://www.redbooks.ibm.com/redpapers/pdfs/redp5612.pdf
[6] L-użu tal-Ġbir tal-Kompilatur GNU. https://gcc.gnu.org/onlinedocs/gcc.pdf
[7] Ottimizzazzjoni Speċifika għall-Miri bil-Mekkaniżmu tal-Funzjoni Indiretta GNU. https://developer.ibm.com/tutorials/optimized-libraries-for-linux-on-power/#target-specific-optimization-
© 2021 IBM Corporation bil-mekkaniżmu-funzjoni-indiretta-gnu.
L-applikazzjonijiet Java jistgħu jieħdu vantaġġ bla xkieltage ta' karatteristiċi ġodda P10 ISA fuq sistemi operattivi li jaħdmu fil-mod P10 billi tuża l-verżjonijiet tar-runtime Java elenkati hawn taħt jew aktar ġodda:
Java 8
- IBM SDK 8 SR6 FP36
- IBM Semeru Runtime Open Edition 8u302: openj9-0.27.1
Java 11
- IBM Semeru Runtime Certified Edition 11.0.12.1: openj9-0.27.1
- IBM Semeru Runtime Open Edition 11.0.12.1: openj9-0.27.1
Java 17 (is-sewwieqa jistgħu għadhom ma jkunux disponibbli)
- IBM Semeru Runtime Certified Edition 17: openj9-0.28
- IBM Semeru Runtime Open Edition 17: openj9-0.28
- OpenJDK 17
Referenzi għall-irfinar tal-prestazzjoni:
IBM WebCookbook tal-Prestazzjoni tas-Server tal-Applikazzjoni tal-Isfera
Daqs tal-Paġna
Ir-rakkomandazzjoni ġenerali għall-biċċa l-kbira tad-databases Oracle fuq AIX hija li tuża daqs ta 'paġna ta' 64KB u mhux daqs ta 'paġna ta' 16MB għall-SGA. Tipikament, 64 KB paġni jagħtu kważi l-istess
benefiċċju tal-prestazzjoni bħala paġni ta '16 MB mingħajr ġestjoni speċjali.
Semmiegħ TNS
Id-database Oracle 12.1 u r-rilaxxi ta' wara awtomatikament se jużaw 64k paġni għat-test, id-dejta u l-munzell. Madankollu, għat-TNSLISTENER għadu juża 4k paġni għat-test, id-dejta u l-munzell. Biex
jippermetti 64k paġni għas-semmiegħ juża l-kmand tal-esportazzjoni qabel ma jibda l-proċess tas-semmiegħ. Innota li taħdem f'ambjent ibbażat fuq l-ASM li s-semmiegħ jispiċċa
GRID_HOME u mhux ORACLE_HOME.
Id-dokumentazzjoni għall-kmand "strettament setenv" inbidlet f'12.1 jew rilaxxi aktar tard. Il--t jew -T tneħħew favur -env jew -envs. Fl-ambjent Oracle Listener issettja u esporta:
– LDR_CNTRL=DATAPSIZE=64K@TEXTPSIZE=64K@STACKPSIZE=64K - VMM_CNTRL=vmm_fork_policy=COR (żid il-kmand 'Kopja fuq Aqra')
Sintassi kondiviża
L-issettjar LDR_CNTRL=SHARED_SYMTAB=Y m'għandux għalfejn jiġi ssettjat speċifikament f'11.2.0.4 jew rilaxxi aktar tard. L-għażliet tal-linker tal-kompilatur jieħdu ħsieb dan l-issettjar u m'għadx għandhom bżonn jiġu stabbiliti speċifikament. Mhux irrakkomandat li l-LDR_CNTRL=SHARED_SYMTAB=Y ssettjat speċifikament f'12c jew rilaxxi aktar tard.
Tiwi tal-Proċessur Virtwali
Dan huwa setting kritiku f'ambjent RAC meta tuża LPARs bit-tiwi tal-proċessur attivat. Jekk dan l-issettjar ma jiġix aġġustat, hemm riskju għoli ta 'żgumbramenti tan-nodi RAC taħt kundizzjonijiet ħfief ta' xogħol tad-database. Scheda -p -o vpm_xvcpus=2
Interkonnessjoni VIOS & RAC
Konnessjoni dedikata 10G (jiġifieri, 10G Ethernet Adapter) hija rrakkomandata bħala minimu biex tipprovdi bandwidth suffiċjenti għal traffiku sensittiv għall-ħin tal-cluster. Traffiku tal-clusters RAC – it-traffiku tal-interkonnessjoni għandu jkun iddedikat u mhux kondiviż. Il-kondiviżjoni tal-interkonnessjoni tista 'tikkawża dewmien fiż-żmien li jwassal għal kwistjonijiet ta' hang/żgumbrament tan-nodi.
Prestazzjoni tan-Netwerk
Dan huwa suġġeriment ta' rfinar tan-netwerk ilu għal Oracle fuq AIX, għalkemm il-default jibqa' f'0. TCP Setting ta' rfc1323=1
Informazzjoni aktar komprensiva
Irreferi għall-link: Ġestjoni tal-Istabbiltà u l-Prestazzjoni tal-verżjonijiet attwali tad-Database Oracle li jħaddmu AIX fuq Sistemi tal-Enerġija inkluż POWER9
https://www.ibm.com/support/pages/node/6355543
Ġenerali
- Uża l-mod SMT8
- Uża CPU LPARs dedikati
Db2 Maħżen
- Żgura li jeżisti netwerk privat ta 'veloċità għolja bejn in-nodi kollha
- Illimita l-konfigurazzjoni MLN għal nodu wieħed għal kull socket
CP4D
- Uża PCIe4 għan-netwerk tan-nodi OCP
- Qabel l-OCP 4.8, issettja l-parametru tal-qalba slub_max_order=0
Db2 L-Aħjar Prattiċi
https://www.ibm.com/docs/en/db2/11.5?topic=overviews-db2-best-practices
Netwerk
- Għan-netwerk tal-pods, uża netwerk privat ibbażat fuq SRIOV nattiv jekk LPM mhux meħtieġ, inkella, uża VNIC
- Għal applikazzjonijiet li jeħtieġu bandwidth għoli jew latency baxxa, ikkunsidra li tuża l-Operatur tan-Netwerk SR-IOV biex tassenja VF direttament lil pod
- Għal servizzi li jeħtieġu timeout baxx, ikkonfigura l-timeouts default għal rotta eżistenti
- Aġġusta d-daqs MTU mixtieq tan-netwerk tal-clusters tal-OCP
Sistema operattiva
- Ikkunsidra li żżid il-limiti u fi ħdan il-bidliet ta' wara l-installazzjoni tal-CoreOS
- Irreferi għar-rekwiżiti minimi tal-installazzjoni tal-OCP għall-installazzjoni tal-pjattaforma tal-Enerġija OCP4.8 fuq il-Power
Skjerament
- Meta tuża applikazzjonijiet, innota li vCPU waħda hija ekwivalenti għal qalba fiżika waħda meta simultaneous multithreading (SMT), jew hyperthreading, ma tkunx attivata. Meta l-SMT ikun attivat, VCPU huwa ekwivalenti għal ħajt tal-ħardwer.
- Irreferi għal-linji gwida ta' daqs minimu għal ħaddiema u nodi prinċipali Rekwiżiti minimi tar-riżorsi
- Alloka ħażna dedikata separata għar-reġistru tal-immaġni tal-kontejners inkorporat
- Uża l-linji gwida dwar id-daqs li ġejjin għad-direttorji prinċipali tad-direttorji ewlenin tal-OCP li l-komponenti tal-Pjattaforma tal-Kontenituri tal-OpenShift jiktbu d-dejta fihom.
Dokumenti / Riżorsi
![]() |
Prestazzjoni IBM Power10 [pdfGwida għall-Utent Power10, Prestazzjoni, Prestazzjoni Power10 |