Miongozo ya Kuanza Haraka ya Utendaji ya Power10
(Power10 QSGs)
Novemba 2021
Kumbukumbu ya chini
- Kwa kila soketi ya kichakataji, angalau DIMM 8 kati ya 16 zina watu
- Katika nodi, angalau 32 kati ya 64 kwa DIMM wanaishi
- Katika mfumo wa 4-Node, angalau DIMM 128 kati ya 256 zina watu.
Sheria za Plug ya DDIMM
- Kutana na kumbukumbu ya chini inayoruhusiwa (kila soketi ya kichakataji, angalau DIMM 8 kati ya 16 zimejaa)
- DIMM zote chini ya kila kichakataji lazima ziwe na uwezo sawa
- Maboresho ya vipengele yatatolewa kwa nyongeza ya DDIMM 4, ambazo zote zina uwezo sawa.
- Nambari halali pekee ya DDIMM zilizochomekwa kwenye tovuti zilizounganishwa kwa sehemu fulani ya kichakataji ni 8 au 12 au 16.
Utendaji wa Kumbukumbu
- Utendaji wa mfumo huboreka kadri kiasi cha kumbukumbu kinavyoenezwa kwenye nafasi nyingi za DDIMM. Kwa mfanoampna, ikiwa 1TB inahitajika kwenye Nodi, ni bora kuwa na DIMM 64 x 32GB kuliko kuwa na DIMM 32 x 64GB.
- Kuchomeka DIMM ambazo zote zina ukubwa sawa kutatoa utendakazi wa juu zaidi
- Utendaji wa mfumo huboreka kadiri quad zaidi zinavyolingana
- Utendaji wa mfumo huboreka kadiri DDIMM za kichakataji zaidi zinavyolingana
- Utendaji wa mfumo huboreshwa kwenye mfumo wa droo nyingi ikiwa uwezo wa kumbukumbu kati ya droo ni sawia.
Kipimo cha Kumbukumbu
Uwezo wa DDIMM | MaxBandwidth ya Kinadharia |
GB 32, GB 64 (DDR4 @ 3200 Mbps) | 409 GB/s |
GB 128, GB 256 (DDR4 @ 2933 Mbps) | 375 GB/s |
Muhtasari
- Kwa utendakazi bora zaidi, kwa ujumla inashauriwa kuwa kumbukumbu isanikishwe kwa usawa kwenye droo zote za nodi za mfumo na soketi zote za kichakataji kwenye mfumo. Kusawazisha kumbukumbu kwenye kadi zilizosakinishwa za mpango huwezesha ufikiaji wa kumbukumbu kwa njia thabiti na kwa kawaida husababisha utendakazi bora wa usanidi wako.
- Ingawa upeo wa upeo wa data unapatikana kwa kujaza nafasi zote za kumbukumbu, mipango ya nyongeza ya kumbukumbu ya siku zijazo inapaswa kuzingatiwa wakati wa kuamua ni saizi gani ya kipengele cha kumbukumbu itatumika wakati wa mpangilio wa awali wa mfumo.
P10 Compute & MMA Usanifu
- Kipimo cha 2x kinacholingana na SIMD*
- Injini 8 zisizohamishika na za kuelea za SIMD kwa kila Msingi
- 4 - 32x Kasi ya Hesabu ya Matrix*
- Injini 4 512 kwa kila msingi = matokeo 2048b / mizunguko
- Bidhaa za nje za hesabu za Matrix za Usahihi Mmoja, Mbili & Iliyopunguzwa.
- Usaidizi wa Usanifu wa MMA ulianzishwa katika POWER ISA v3.1
- Inaauni viwango vya usahihi vya SP, DP, BF16, HP, Int-16, Int-8 & Int-4.
P10 MMApplications & Muunganisho wa Mzigo wa Kazi
- Programu za ML & HPC zilizo na hesabu mnene za aljebra ya mstari, kuzidisha kwa matrix, mabadiliko, FFT inaweza kuharakishwa kwa MMA.
- Toleo la GCC >= 10 & toleo la LLVM >=12 linaauni MMA kupitia vijengewa ndani.
- Maktaba za OpenBLAS, IBM ESSL & Eigen tayari zimeboreshwa kwa maagizo ya MMA ya P10.
- Ujumuishaji rahisi wa MMA kwa programu za biashara, mifumo ya ML, na vifurushi vya Jumuiya Huria kupitia maktaba za BLAS zilizo hapo juu.
PowerPC Matrix-Kuzidisha Usaidizi wa Kazi Zilizojengwa ndani https://gcc.gnu.org/onlinedocs/gcc/PowerPC-Matrix-Multiply-Assist-Built-in-Functions.html
Mwongozo wa Mazoezi Bora ya Kuzidisha kwa Matrix https://www.redbooks.ibm.com/Redbooks.nsf/RedpieceAbstracts/redp5612.html?OpenVichakataji Mtandaoni
- Jumla ya chembe zinazostahiki za kizigeu zote zilizoshirikiwa haziwezi kuzidi idadi ya chembe kwenye bwawa la pamoja.
- Hakikisha kwamba idadi ya vichakataji dhahania vilivyosanidiwa vya sehemu zozote zilizoshirikiwa kwenye fremu haizidi idadi ya chembe kwenye bwawa la pamoja.
- Sanidi idadi ya vichakataji mtandaoni kwa kizigeu kilichoshirikiwa ili kudumisha mahitaji ya kilele cha uwezo
- Sanidi idadi ya chembe zinazostahili za kizigeu kilichoshirikiwa hadi wastani wa matumizi ya kizigeu hicho kwa utendakazi bora.
- Ili kuhakikisha kumbukumbu bora na mshikamano wa CPU (epuka vikwazo visivyo vya lazima vya kichakataji mtandaoni), hakikisha jumla ya chembechembe zinazostahikishwa za sehemu zote zilizoshirikiwa karibu na idadi ya chembe kwenye dimbwi la maji.
Hali ya Upatanifu wa Kichakataji
- Kuna njia 2 za uoanifu za kichakataji zinazopatikana kwa AIX: POWER9 na POWER9_base. Chaguo-msingi ni POWER9_base mode.
- Kuna njia 2 za uoanifu za kichakataji zinazopatikana kwa ajili ya Linux: POWER9 na POWER10 mode. Chaguo-msingi ni hali ya POWER10.
- Baada ya sehemu za LPM, unahitaji kuwasha mzunguko wakati wa kubadilisha modi ya uoanifu ya kichakataji
Mazingatio ya Kukunja Kichakato
- Kwa kizigeu cha kushiriki kinachoendesha AIX kwenye Power9, vpm_throughput_mode = 0, kwenye Power10, hali-msingi ya vpm_throughput_mode = 2. Kwa mzigo wa kazi una kazi za muda mrefu, inaweza kusaidia kupunguza matumizi ya msingi.
- Kwa kizigeu maalum kinachoendesha AIX, vpm_throughput_mode = 0 kwenye Power9 na Power10.
Mazingatio ya Ukubwa wa Jedwali la Ukurasa wa LPAR
• Jedwali la ukurasa wa Radix linaweza kutumika kuanzia Power10 inayoendesha Linux. Inaweza kuboresha utendakazi wa mzigo.
Rejeleo:
Vidokezo na vidokezo vya Kuhamisha Mzigo wa Kazi hadi Mifumo ya IBM POWER: https://www.ibm.com/downloads/cas/39XWR7YM
IBM POWERVirtualizationBest PracticesGuide: https://www.ibm.com/downloads/cas/JVGZA8RW
Hakikisha kiwango cha OS ni cha sasa
Fix Central hutoa masasisho mapya zaidi kwa AIX, IBM i, VIOS, Linux, HMC na F/W. Kando na hayo, zana ya FLRT hutoa viwango vinavyopendekezwa kwa kila modeli ya H/W. Tumia zana hizi kusasisha mfumo wako. Iwapo huwezi kusogea hadi kiwango kinachopendekezwa, basi rejelea sehemu ya Suala Linalojulikana la Vidokezo na Vidokezo vya kuhamisha Mzigo wa Kazi hadi kwenye hati ya Mifumo Inayotokana na Kichakataji cha IBM POWER10.
Matumizi ya CPU ya AIX
Kwenye POWER10, mfumo wa AIX OS umeboreshwa kwa utumiaji bora zaidi kwa matumizi ya juu zaidi ya CPU unapoendeshwa na vichakataji vilivyojitolea. Wakati wa kufanya kazi na vichakataji vilivyoshirikiwa, mfumo wa AIX OS umeboreshwa ili kupunguza matumizi ya CPU (pc). Iwapo mteja anahitaji kupunguza zaidi matumizi ya CPU (pc), tumia ratiba inayoweza kutumika pm_throughput_mode ili kurekebisha mzigo wa kazi na kutathmini manufaa ya matumizi ghafi dhidi ya matumizi ya CPU.
NX GZIP
Kuchukua advantage ya uongezaji kasi wa NX GZIP kwenye mifumo ya POWER10 LPAR lazima iwe katika modi uoanifu ya POWER9 (sio modi ya POWER9_base) au modi uoanifu ya POWER10.
IBM i
Hakikisha kiwango cha mfumo wa uendeshaji wa IBM I ni cha sasa. Fix Central hutoa masasisho ya hivi punde kwa IBM I, VIOS, HMC, na programu dhibiti. https://www.ibm.com/support/fixcentral/
Firmware
Hakikisha kiwango cha programu dhibiti ni cha sasa. Fix Central hutoa masasisho ya hivi punde kwa IBM I, VIOS, HMC, na programu dhibiti. https://www.ibm.com/support/fixcentral/
DIMM za kumbukumbu
Fuata sheria sahihi za programu-jalizi ya kumbukumbu. Ikiwezekana, jaza kikamilifu nafasi za DIMM za kumbukumbu na utumie DIMM za kumbukumbu za ukubwa sawa.
Kiwango cha SMT cha processor
Ili kuchukua advan kamilitage ya utendakazi wa Power10 CPU, tunapendekeza wateja watumie mipangilio chaguomsingi ya kichakataji cha IBM i, ambayo itaongeza SMT.
kiwango cha usanidi wa LPAR.
Uwekaji wa Sehemu
Viwango vya sasa vya FW vinahakikisha uwekaji bora wa kizigeu. Walakini, ikiwa shughuli za mara kwa mara za DLPAR zinatekelezwa kwenye sehemu kwenye CEC, inashauriwa kutumia DPO.
ili kuboresha uwekaji.
Vichakataji Mtandaoni - vichakataji vilivyoshirikiwa dhidi ya vilivyojitolea
Tumia vichakataji vilivyojitolea kwa utendaji bora wa kiwango cha kizigeu.
NishatiScale
Kwa kasi bora zaidi ya kichakataji cha CPU, hakikisha kwamba Utendaji wa Juu umewekwa (chaguo-msingi kwa IBM Power E1080). Mpangilio huu unaweza kusanidiwa katika ASMI.
Hifadhi na Mtandao I/O
VIOS hutoa uhifadhi rahisi na utendakazi wa mitandao. Kwa utendakazi bora zaidi, tumia violesura asili vya IBM i vya I/O.
Maelezo ya kina zaidi
Rejelea kiungo: IBM I kwenye Nguvu - Maswali Yanayoulizwa Mara kwa Mara ya Utendaji https://www.ibm.com/downloads/cas/QWXA9XKN
Mfumo wa uendeshaji wa Linux ya biashara (OS) ni msingi dhabiti wa miundombinu yako ya wingu mseto na kwa suluhisho za programu za biashara. Matoleo ya hivi majuzi yameboreshwa kwa mifumo bora zaidi ya Power10 Enterprise
Nguvu10
- SLES15SP3, RHEL8.4 inasaidia hali asilia ya Power10
- Usaidizi wa hali ya dira kuruhusu wateja kuhama kutoka kwa mifumo ya Nguvu ya kizazi cha zamani ( P9 na P8 )
- Usaidizi chaguo-msingi wa tafsiri ya Radix katika hali ya Power10
- Uboreshaji mkubwa katika utendakazi wa usimbaji fiche
Linux + PowerVM
- Usaidizi wa vipengele vya biashara vya PowerVM: LPM, Madimbwi ya CPU ya Pamoja, DLPAR
- Suluhu za kibunifu: Ukuaji wa programu ya SAP HANA katika siku zijazo na nafasi ya anwani pepe ya 4PB
- Punguza muda wa kupakia upya data: Usaidizi pepe wa PMEM kwa SAP HANA
- Usaidizi na Huduma za kiwango cha kimataifa
Distros zinazoungwa mkono:
- Kuanzia na Power9 RedHat na SUSE pekee ndizo zinazotumika katika sehemu za PowerVM
- Maelezo ya kina juu ya matrix ya usaidizi wa distro inayofunika kizazi cha zamani HW
Msaada wa LPM:
- Hamisha vizuizi vya mantiki vya Linux kutoka kwa mifumo ya Nguvu ya kizazi cha zamani iliyo na muda wa chini wa utumaji sifuri
- Rejea: Mwongozo wa LPM na habari inayohusiana
Vifurushi Maalum vya Nguvu:
- Kifurushi cha PowerPC-utils: Ina huduma za matengenezo ya IBM PowerPC LPARs. Inapatikana kama sehemu ya distro.
- Advance Toolchain kwa Linux on Power: Ina vikusanyaji vya hivi punde, maktaba za wakati wa utekelezaji.
Mbinu bora:
- RHEL hutoa urekebishaji uliobainishwa kama sehemu ya huduma iliyoratibiwa.
- Rejelea maelezo ya hivi punde ya SAP kwa mipangilio inayopendekezwa ya Mfumo wa Uendeshaji kwa ajili ya programu za SAP. Kwa kawaida tuned hutumiwa katika RHEL na kukamata au sapconf katika SLES
- Frequency inasimamiwa na PowerVM. Rejea: Usimamizi wa Nishati
- Kuanzisha Dirisha Kubwa la Power8 Dynamic DMA husaidia kuboresha utendaji wa I/O.
- Kuanzia Power9 24×7-Monitoring imeunganishwa na zana ya perf. Inaruhusu ufuatiliaji wa mfumo mzima.
- Hakikisha kiwango cha programu dhibiti ni cha sasa.
- lparnumascore kutoka PowerPC-utils inaonyesha alama ya mshikamano ya sasa ya LPAR. DPO inaweza kutumika kuboresha alama ya mshikamano ya LPAR.
Zaidi inasoma:
- SLES for Power na baadhi ya vipengele vya kuvutia.
- Anza na Linux kwenye Mifumo ya Nguvu, Linux kwenye seva za Mifumo ya Nguvu
- Jumuiya ya Linux ya Biashara
- Mifumo ya Nguvu ya IBM inasaidia adapta mbalimbali za mtandao za kasi na nambari tofauti za bandari.
- Ikiwa unatumia adapta za mtandao sawa na mfumo wako wa awali, mwanzoni, urekebishaji sawa unapaswa kutumika kwenye mfumo mpya.
- Adapta nyingi za Ethaneti zinaauni foleni nyingi za kupokea na kusambaza ambazo ukubwa wa bafa unaweza kubadilishwa ili kuongeza idadi ya juu zaidi ya pakiti.
- Mipangilio ya foleni chaguo-msingi ni tofauti na adapta tofauti na inaweza isiwe bora kufikia viwango vya juu vya ujumbe katika muundo wa seva ya mteja.
- Kutumia foleni za ziada kutaongeza matumizi ya CPU ya mfumo; kwa hivyo mpangilio bora wa foleni kwa mzigo maalum wa kazi unapaswa kutumika.
Mazingatio ya adapta ya kasi ya juu
- Mitandao ya kasi ya juu yenye adapta za mtandao za GigE 25 na 100 zinahitaji nyuzi nyingi sambamba na urekebishaji wa sifa za kiendeshi.
- Ikiwa ni adapta ya Gen4, hakikisha kuwa iliyorekebishwa imeketi kwenye sehemu ya Gen4.
- Vitendaji vya ziada kama vile mbano, usimbaji fiche na urudufishaji vinaweza kuongeza muda wa kusubiri
Kubadilisha mipangilio ya foleni katika AIX
Ili kubadilisha idadi ya foleni za kupokea/kusambaza katika AIX
- ifconfig enX ondoa chini
- chdev -l entX -a foleni_rx= -a foleni_tx=
- chdev -l enX -a state=up
Kubadilisha mipangilio ya foleni katika Linux
Ili kubadilisha idadi ya foleni katika Linux ethtool -L ethX pamoja
Kubadilisha saizi ya foleni katika AIX
- ifconfig enX ondoa chini
- chdev -l entX -a rx_max_pkts = -a tx_max_pkts =
- chdev -l enX -a state=up
Kubadilisha saizi ya foleni katika LinuxP: ethtool -G ethX rx tx
Usanifu
- Mitandao iliyoboreshwa inatumika kwa njia ya SRIOV, vNIC, vETH. Usanifu hauongezi muda na unaweza kupunguza matokeo ikilinganishwa na I/O asilia.
- Kando na maunzi ya nyuma, hakikisha kumbukumbu ya VIOS na viwango vya CPU vinatosha kutoa muda unaohitajika wa utumaji na majibu.
- Mbinu Bora za IBM PowerVM zinaweza kusaidia sana katika ukubwa wa VIOS
- Ikiwa unatumia adapta za uhifadhi sawa na mfumo wako wa awali, mwanzoni, urekebishaji sawa unapaswa kutumika kwenye mfumo mpya. Ikiwa utendaji wa ziada unahitajika kutoka kwa mfumo uliopo, basi tuning ya kawaida inapaswa kufanywa.
- Ikiwa mifumo ndogo ya uhifadhi ni tofauti sana kwenye mfumo mpya zaidi kuliko mfumo wa awali, orodha ifuatayo ya mambo ya kuzingatia inaweza kuathiri vibaya kasi inayotambulika ya programu -
- Kubadilisha kutoka Hifadhi Iliyoambatishwa Moja kwa Moja (DAS au ya ndani) hadi Mtandao wa Eneo la Hifadhi (SAN) au Hifadhi Inayoshikanishwa na Mtandao (NAS) (au hifadhi ya nje) kunaweza kuongeza muda wa kusubiri.
- Vitendaji vya ziada kama vile mbano, usimbaji fiche na upunguzaji wa nakala vinaweza kuongeza muda wa kusubiri.
- Kupunguza idadi ya LUN za Hifadhi kunaweza kupunguza rasilimali katika seva inayohitajika ili kusaidia upitishaji unaohitajika.
- Rejelea miongozo ya kurekebisha au kusanidi kwa vifaa vipya ili kuelewa athari hizi.'
- Uboreshaji mtandaoni huongeza muda wa kusubiri na unaweza kupunguza matokeo ikilinganishwa na I/O asilia. Kando na vifaa vya nyuma, hakikisha kumbukumbu ya VIOS na CPU
- Kuhamia kwenye adapta zilizoboreshwa za kasi ya juu katika VIOS kutahitaji kurekebisha usanidi wa VIOS katika CPU na kumbukumbu. Mbinu Bora za IBM PowerVM zinaweza kusaidia sana katika ukubwa wa VIOS.
Miongozo ya kurekebisha - tafadhali rejelea Kituo cha Maarifa cha IBM kwa miongozo ya AIX na Linux.
PCIe3 GB 12 Cache RAID + SAS Adapta Quad-port 6 Gb x8 Adapta Linux:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=availability-ha-asymmetricaccess-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=linux-common-sas-raidcontroller-tasks
AIX:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-multi-initiator-highavailability
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-common-controller-diskarray-management-tasks
IBM
- https://www.ibm.com/docs/en/power9/9223-42H?topic=configurations-dual-storageioa-access-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=i-common-controller-diskarray-management-tasks
Adapta ya PCIe3 x8 2-port Fiber Channel (32 Gb/s) Adapta
- https://www.ibm.com/docs/en/aix/7.2?topic=iompio-device-attributes
- https://www.ibm.com/docs/en/power9?topic=channel-npiv-multiple-queue-support
Urekebishaji wa ziada wa AIX kwa utendaji:
- SCSI juu ya Fiber Channel (MPIO): weka algorithm ya njia nyingi hadi round_robin kwa kila diski
- NVMe juu ya Fiber Channel: seti inaweza kuhusisha 7 kwa kila NVMe juu ya kidhibiti cha Fiber Channel Dynamic kilichoundwa wakati wa awamu ya ugunduzi.
NVMe Adapta AIX kurekebisha kwa ajili ya utendaji
Set inaweza kuhusisha 8 kwa kila kifaa cha NVMe
Wasanifu wa kizazi kijacho wa C/C++/Fortran wa IBM ambao unachanganya uboreshaji wa hali ya juu wa IBM na miundombinu ya chanzo huria ya LLVM.
![]() |
|
LLVM Sarafu kubwa zaidi ya lugha ya C/C++ Kasi ya kujenga haraka Uboreshaji wa pamoja wa jumuiya Huduma anuwai za msingi wa LLVM |
Uboreshaji wa IBM Unyonyaji kamili wa usanifu wa Nguvu Uboreshaji wa hali ya juu unaoongoza katika tasnia Usaidizi na Huduma za kiwango cha kimataifa |
Upatikanaji
- Jaribio la siku 60 bila malipo: pakua kutoka ukurasa wa bidhaa wa Open XL
- Pata Huduma na Usaidizi wa kiwango cha kimataifa wa IBM kupitia chaguo nyumbufu za leseni, kutoka kwa bomba-mbili (AAS na PA)
- Leseni ya kudumu (kwa Mtumiaji Aliyeidhinishwa au kwa Mtumiaji Mmoja)
- Leseni ya kila mwezi (kulingana na Msingi wa Mchakato Pekee): kesi zinazolengwa za matumizi ya wingu, kwa mfano, kwenye mfano wa PowerVR
Chaguo za kurekebisha utendaji zinazopendekezwa
Kiwango cha Uboreshaji | Mapendekezo ya matumizi |
-O2 na -O3 | Mahali pa kuanzia |
Uboreshaji wa wakati wa kuunganisha: -flto (C/C++), -qlto (Fortran) | Kwa mzigo wa kazi na simu nyingi za utendaji |
Profile uboreshaji unaoongozwa: -fprofile-zalisha, -fprofile-tumia (C/C++) -qprofile-zalisha, -qprofile-tumia (Fortran) |
Kwa mizigo ya kazi iliyo na matawi mengi na simu za kazi |
Kwa habari zaidi tafadhali tembelea: https://www.ibm.com/docs/en/openxl-c-and-cpp-aix/17.1.0
https://www.ibm.com/docs/en/openxl-fortran-aix/17.1.0
Unyonyaji kamili wa usanifu wa Power10 na Open XL 17.1.0
- Chaguo jipya la mkusanyaji '–mcpu=pwr10' ili kutoa msimbo kutumia maagizo ya Power10 na pia kurekebisha kiotomatiki uboreshaji wa Power10.
- Vitendaji vipya vilivyoundwa ili kufungua utendakazi mpya wa Power10, kwa mfano, Kiongeza kasi cha Matrix (MMA)
- MASS SIMD mpya na maktaba za vekta ziliongezwa kwa Power10. Vitendaji vyote vya maktaba ya MASS (SIMD, vekta, scalar) vilivyowekwa kwa Power10 (pia Power9).
Kumbuka: Programu zilizokusanywa pamoja na matoleo ya awali ya Vikusanyaji vya XL (km, XL 16.1.0) ili kuendeshwa kwenye vichakataji vya awali vya Power zitatumika kwa upatanifu kwenye Power10.
Utangamano wa binary kwenye AIX
Kumbuka: XL C/C++ ya AIX 16.1.0 tayari imeanzisha ombi mpya xlclang++ambayo inaboresha mwisho wa mbele wa Clang kutoka kwa mradi wa LLVM ü C++ vitu vilivyojengwa kwa xlC kwa
- AIX (kulingana na mwisho wa mbele wa IBM) haiendani na vitu vya C++ vilivyojengwa kwa xlclang++ 16.1.0 kwa AIX.
- Vitu vya C++ vilivyojengwa kwa xlclang++ 16.1.0 kwa AIX vitaendana na jozi na Open XL C/C++ mpya ya AIX 17.1.0
- Utangamano wa C hudumishwa kwenye viundaji vyote vya AIX (matoleo ya awali ya XL ya AIX, Fungua XL C/C++ kwa AIX 17.1.0)
- Utangamano wa Fortran hudumishwa kati ya toleo la awali la XLF la AIX na Open XL Fortran kwa AIX 17.1.0
Upatikanaji
Vikusanyaji vya GCC vinapatikana kwenye usambazaji wote wa Enterprise Linux na kuendelea
AIX.
- Toleo la GCC lililosakinishwa ni 8.4 kwenye RHEL 8 na 7.4 kwenye SLES 15. RHEL 9 inatarajiwa kusafirisha GCC 11.2.
- Kuna njia kadhaa za kupata toleo la hivi majuzi la kutosha la GCC wakati vikusanyaji chaguomsingi vya usambazaji ni vya zamani sana kuauni Power10.
- Red Hat inasaidia GCC Toolset [1] kwa madhumuni haya.
- SUSE hutoa Moduli ya Zana za Ukuzaji. [2]
- IBM hutoa wakusanyaji na maktaba za hivi punde zaidi kupitia Advance Toolchain. [3]
IBM Advance Toolchain
- Zana ya Advance hutoa maktaba za mfumo ulioboreshwa kwa Nguvu pamoja na wakusanyaji, visuluhishi na zana zingine.
- Msimbo wa ujenzi kwa kutumia Advance Toolchain unaweza kutoa msimbo ulioboreshwa zaidi iwezekanavyo kwenye vichakataji vipya zaidi.
Lugha
- C (GCC), C++ (g++), na Fortran (gfortran), pamoja na wengine kama vile Go (GCC), D (GDC), na Ada (gnat).
- GCC, g++, na gfortran pekee ndizo husakinishwa kwa chaguomsingi.
- Mkusanyaji wa golang [4] ndio njia mbadala inayopendekezwa ya kuunda programu za Go kwenye Nishati.
Utangamano na Vipengele Vipya kwenye Power10
- Programu zilizokusanywa pamoja na matoleo ya awali ya GCC ili kuendeshwa kwenye vichakataji vya POWER8 au POWER9 zitatumika kwa upatanifu kwenye vichakataji vya Power10.
- GCC 11.2 au matoleo mapya zaidi inapendekezwa kutumia vipengele vyote vipya vinavyopatikana katika Power ISA 3.1 na kutekelezwa katika vichakataji vya Power10.
- GCC 11.2 hutoa ufikiaji wa kipengele cha Matrix Multiply Assist (MMA) kinachotolewa na vichakataji vya Power10. [5]
- Programu za MMA zinaweza kukusanywa kwa kutumia vikusanyaji vyovyote vya GCC, LLVM, na Open XL, mradi utumie matoleo ya hivi majuzi vya kutosha.
Bendera za IBM Zinazopendekezwa na Zinazotumika [6]
-O3 au -Mashariki | Uboreshaji wa fujo. -Mashariki kimsingi ni sawa na -O3 -fast-math, ambayo pia hulegeza vikwazo vya hesabu za uhakika za IEEE. |
-mcpu=nguvu | Kusanya kwa kutumia maagizo yanayotumika na Kichakataji cha Nguvu. Kwa mfanoample, ili kutumia maagizo yanayopatikana kwenye Power10 pekee, chagua -mcpu=power10. |
-kwa | Hiari. Tekeleza uboreshaji wa "muda wa kiungo". Hii huboresha msimbo katika simu zote za utendakazi ambapo mpigaji simu na vitendakazi vinavyoitwa vinapatikana katika vitengo tofauti vya mkusanyo, na mara nyingi inaweza kutoa utendakazi mzuri zaidi. |
-kunjua-vitanzi | Hiari. Tekeleza urudufu mkali zaidi wa miili ya kitanzi kuliko mkusanyaji kawaida. Kwa ujumla, unapaswa kuacha hii, lakini kwa misimbo fulani, hii inaweza kutoa utendakazi bora. |
Kumbuka:
Ingawa -mcpu=power10 inatumika mapema kama GCC 10.3, GCC 11.2 inapendekezwa kwa sababu wakusanyaji wa awali hawaauni kila kipengele kinachotekelezwa katika vichakataji vya Power10. Pia, vitu vilivyoundwa kwa kutumia -mcpu=power10 havitaendeshwa kwenye POWER9 au vichakataji vya awali! Hata hivyo, kuna njia za kuunda msimbo ambao umeboreshwa kwa matoleo tofauti ya processor. [7] [1] Kofia Nyekundu: Kwa kutumia GCC Toolset. https://access.redhat.com/documentation/enus/red_hat_enterprise_linux/8/html/developing_c_and_cpp_applications_in_rhel_8/gcc-toolset_toolsets.
[2] SUSE: Kuelewa Moduli ya Zana za Ukuzaji. https://www.suse.com/c/suse-linux-essentialswhere-are-the-compilers-understanding-the-development-tools-module/.
[3] Advance Toolchain kwa ajili ya Linux kwenye IBM Power Systems. https://www.ibm.com/support/pages/advancetoolchain-linux-power.
[4] Lugha ya Go. https://golang.org. [5] Mwongozo wa Mazoezi Bora ya Usaidizi wa Matrix. http://www.redbooks.ibm.com/redpapers/pdfs/redp5612.pdf
[6] Kwa kutumia Mkusanyiko wa Mkusanyaji wa GNU. https://gcc.gnu.org/onlinedocs/gcc.pdf
[7] Uboreshaji Uliolengwa na Utaratibu wa Utendaji Usio wa Moja kwa Moja wa GNU. https://developer.ibm.com/tutorials/optimized-libraries-for-linux-on-power/#target-specific-optimization-
© 2021 IBM Corporation yenye-utaratibu-wa-kazi-zisizo za moja kwa moja.
Programu za Java zinaweza kuchukua advan bila mshonotage ya vipengele vipya vya P10 ISA kwenye mifumo ya uendeshaji inayoendeshwa katika hali ya P10 kwa kutumia matoleo ya wakati wa utekelezaji wa Java yaliyoorodheshwa hapa chini au mapya zaidi:
Java 8
- IBM SDK 8 SR6 FP36
- Toleo la Wazi la IBM Semeru 8u302: openj9-0.27.1
Java 11
- Toleo Lililoidhinishwa la IBM Semeru Runtime 11.0.12.1: openj9-0.27.1
- Toleo la Wazi la IBM Semeru 11.0.12.1: openj9-0.27.1
Java 17 (madereva huenda hayapatikani bado)
- Toleo Lililoidhinishwa la IBM Semeru Runtime 17: openj9-0.28
- Toleo la Wazi la IBM Semeru 17: openj9-0.28
- OpenJDK 17
Marejeleo ya kurekebisha utendaji:
IBM WebKitabu cha Kupika cha Utendaji wa Seva ya Maombi
Ukubwa wa Ukurasa
Pendekezo la jumla kwa hifadhidata nyingi za Oracle kwenye AIX ni kutumia ukubwa wa ukurasa wa 64KB na si ukubwa wa ukurasa wa 16MB kwa SGA. Kwa kawaida, kurasa 64 KB hutoa karibu sawa
manufaa ya utendaji kama kurasa za MB 16 bila usimamizi maalum.
Msikilizaji wa TNS
Hifadhidata ya Oracle 12.1 na matoleo ya baadaye kwa chaguomsingi yatatumia kurasa 64k kwa maandishi, data na rafu. Hata hivyo, kwa TNSLISTENER bado inatumia kurasa 4k kwa maandishi, data na stack. Kwa
wezesha kurasa 64k kwa msikilizaji hutumia amri ya kuuza nje kabla ya kuanza mchakato wa msikilizaji. Kumbuka kuwa kukimbia katika mazingira ya msingi ya ASM ambayo msikilizaji huishiwa nayo
GRID_HOME na si ORACLE_HOME.
Nyaraka za amri ya "strictly setenv" zilibadilika katika matoleo ya 12.1 au baadaye. The -t au -T iliondolewa kwa kupendelea -env au -envs. Katika mazingira ya Oracle Listener seti na usafirishaji nje:
– LDR_CNTRL=DATAPSIZE=64K@TEXTPSIZE=64K@STACKPSIZE=64K - VMM_CNTRL=vmm_fork_policy=COR (ongeza amri ya 'Copy on Read')
Sintaksia iliyoshirikiwa
Mpangilio wa LDR_CNTRL=SHARED_SYMTAB=Y hauhitaji kuwekwa mahususi katika matoleo 11.2.0.4 au matoleo mapya zaidi. Chaguo za kiunganishi cha mkusanyaji hutunza mpangilio huu na hazihitaji tena kuwekwa mahususi. Haipendekezwi kuwa na LDR_CNTRL=SHARED_SYMTAB=Y iliyowekwa mahususi katika 12c au matoleo ya baadaye.
Kukunja Kichakataji Mtandaoni
Huu ni mpangilio muhimu katika mazingira ya RAC unapotumia LPAR na ukunja wa kichakataji umewashwa. Ikiwa mpangilio huu hautarekebishwa, kuna hatari kubwa ya kufukuzwa kwa nodi za RAC chini ya masharti ya mzigo wa kazi wa hifadhidata nyepesi. Scheda -p -o vpm_xvcpus=2
Muunganisho wa VIOS na RAC
Muunganisho uliojitolea wa 10G (yaani, Adapta ya Ethernet ya 10G) unapendekezwa kama kiwango cha chini zaidi ili kutoa kipimo data cha kutosha kwa trafiki nyeti ya wakati wa nguzo. Trafiki ya nguzo ya RAC - trafiki ya muunganisho inapaswa kuwekwa wakfu na isishirikiwe. Kushiriki muunganisho kunaweza kusababisha ucheleweshaji wa muda na kusababisha maswala ya kuning'inia/kufukuzwa kwa nodi.
Utendaji wa Mtandao
Hili ni pendekezo la muda mrefu la urekebishaji mtandao kwa Oracle kwenye AIX, ingawa chaguomsingi inasalia kuwa 0. Mpangilio wa TCP wa rfc1323=1
Maelezo ya kina zaidi
Rejelea kiungo: Kusimamia Uthabiti na Utendaji wa matoleo ya sasa ya Hifadhidata ya Oracle inayoendesha AIX kwenye Mifumo ya Nguvu ikijumuisha POWER9.
https://www.ibm.com/support/pages/node/6355543
Mkuu
- Tumia hali ya SMT8
- Tumia CPU LPAR zilizojitolea
Ghala la Db2
- Hakikisha kuwa kuna mtandao wa kibinafsi wa kasi ya juu kati ya nodi zote
- Weka kikomo usanidi wa MLN kwa nodi moja kwa kila tundu
CP4D
- Tumia PCIe4 kwa mtandao wa nodi za OCP
- Kabla ya OCP 4.8, weka kigezo cha kernel slub_max_order=0
Mbinu Bora za Db2
https://www.ibm.com/docs/en/db2/11.5?topic=overviews-db2-best-practices
Mtandao
- Kwa mtandao wa pod, tumia mtandao wa kibinafsi kulingana na SRIOV asili ikiwa LPM haihitajiki, vinginevyo, tumia VNIC
- Kwa programu zinazohitaji kipimo data cha juu au muda wa kusubiri wa chini, zingatia kutumia Opereta ya Mtandao ya SR-IOV kugawa VF moja kwa moja kwenye ganda.
- Kwa huduma zinazohitaji muda mfupi wa kuisha, weka mipangilio ya muda chaguomsingi ya njia iliyopo
- Rekebisha ukubwa unaohitajika wa MTU wa mtandao wa nguzo wa OCP
Mfumo wa uendeshaji
- Zingatia kuongeza vikomo vya u ndani ya mabadiliko ya kusakinisha baada ya CoreOS
- Rejelea mahitaji ya chini ya usakinishaji wa OCP kwa usakinishaji wa jukwaa la Power OCP4.8 kwenye Nishati
Usambazaji
- Wakati wa kupeleka programu, kumbuka kuwa vCPU moja ni sawa na msingi mmoja wakati usomaji mwingi kwa wakati mmoja (SMT), au usomaji mwingilio, haujawashwa. Wakati SMT imewashwa, VCPU ni sawa na uzi wa maunzi.
- Rejelea miongozo ya kiwango cha chini cha ukubwa kwa wafanyikazi na nodi kuu Mahitaji ya chini ya rasilimali
- Tenga hifadhi tofauti iliyojitolea kwa sajili ya picha ya kontena iliyojengewa ndani
- Tumia miongozo ifuatayo ya saizi ya saraka kuu za OCP ambazo vipengele vya Mfumo wa Kontena wa OpenShift huandikia data.
Nyaraka / Rasilimali
![]() |
Utendaji wa IBM Power10 [pdf] Mwongozo wa Mtumiaji Power10, Utendaji, Power10 Utendaji |