Power10 പെർഫോമൻസ് ക്വിക്ക് സ്റ്റാർട്ട് ഗൈഡുകൾ
(പവർ10 ക്യുഎസ്ജികൾ)
നവംബർ 2021
മിനിമം മെമ്മറി
- ഓരോ പ്രോസസർ സോക്കറ്റിനും, 8 DIMM-കളിൽ കുറഞ്ഞത് 16 എണ്ണം പോപ്പുലേറ്റ് ചെയ്തിരിക്കുന്നു
- ഒരു നോഡിൽ, DIMM-കൾക്കുള്ള 32-ൽ കുറഞ്ഞത് 64 എണ്ണം പോപ്പുലേറ്റ് ചെയ്തിരിക്കുന്നു
- ഒരു 4-നോഡ് സിസ്റ്റത്തിൽ, 128 DIMM-കളിൽ കുറഞ്ഞത് 256 എണ്ണം പോപ്പുലേറ്റ് ചെയ്യപ്പെടുന്നു.
DDIMM പ്ലഗ് നിയമങ്ങൾ
- അനുവദനീയമായ ഏറ്റവും കുറഞ്ഞ മെമ്മറി പാലിക്കുക (ഓരോ പ്രോസസർ സോക്കറ്റിലും കുറഞ്ഞത് 8 എണ്ണം 16 DIMM-കളിൽ ഉണ്ട്)
- ഓരോ പ്രോസസറിനും കീഴിലുള്ള എല്ലാ DIMM-കളും ഒരേ ശേഷി ആയിരിക്കണം
- ഫീച്ചർ അപ്ഗ്രേഡുകൾ 4 DDIMM-കളുടെ ഇൻക്രിമെന്റിൽ ഓഫർ ചെയ്യും, അവയ്ക്കെല്ലാം ഒരേ ശേഷിയുണ്ട്.
- തന്നിരിക്കുന്ന പ്രൊസസർ മൊഡ്യൂളുമായി ബന്ധിപ്പിച്ചിട്ടുള്ള സൈറ്റുകളിലേക്ക് പ്ലഗ് ചെയ്തിരിക്കുന്ന DDIMM-ന്റെ ഏക സാധുതയുള്ള എണ്ണം 8 അല്ലെങ്കിൽ 12 അല്ലെങ്കിൽ 16 ആണ്.
മെമ്മറി പ്രകടനം
- മെമ്മറിയുടെ അളവ് കൂടുതൽ DDIMM സ്ലോട്ടുകളിൽ വ്യാപിക്കുന്നതിനാൽ സിസ്റ്റം പ്രകടനം മെച്ചപ്പെടുന്നു. ഉദാampഒരു നോഡിൽ 1TB ആവശ്യമാണെങ്കിൽ, 64 x 32GB DIMM-കൾ ഉള്ളതിനേക്കാൾ 32 x 64GB DIMM-കൾ ഉണ്ടായിരിക്കുന്നതാണ് നല്ലത്.
- ഒരേ വലുപ്പത്തിലുള്ള DIMM-കൾ പ്ലഗ് ചെയ്യുന്നത് ഉയർന്ന പ്രകടനം നൽകും
- കൂടുതൽ ക്വാഡുകൾ പരസ്പരം പൊരുത്തപ്പെടുന്നതിനാൽ സിസ്റ്റം പ്രകടനം മെച്ചപ്പെടുന്നു
- കൂടുതൽ പ്രോസസർ DDIMM-കൾ പരസ്പരം പൊരുത്തപ്പെടുന്നതിനാൽ സിസ്റ്റം പ്രകടനം മെച്ചപ്പെടുന്നു
- ഡ്രോയറുകൾ തമ്മിലുള്ള മെമ്മറി ശേഷി സന്തുലിതമാണെങ്കിൽ മൾട്ടി-ഡ്രോയർ സിസ്റ്റത്തിൽ സിസ്റ്റം പ്രകടനം മെച്ചപ്പെടുന്നു.
മെമ്മറി ബാൻഡ്വിഡ്ത്ത്
DDIMM ശേഷി | സൈദ്ധാന്തിക മാക്സ്ബാൻഡ്വിഡ്ത്ത് |
32GB, 64 GB (DDR4 @ 3200 Mbps) | 409 GB/s |
128GB, 256 GB (DDR4 @ 2933 Mbps) | 375 GB/s |
സംഗ്രഹം
- സാധ്യമായ ഏറ്റവും മികച്ച പ്രകടനത്തിനായി, എല്ലാ സിസ്റ്റം നോഡ് ഡ്രോയറുകളിലും സിസ്റ്റത്തിലെ എല്ലാ പ്രോസസർ സോക്കറ്റുകളിലും മെമ്മറി തുല്യമായി ഇൻസ്റ്റാൾ ചെയ്യാൻ സാധാരണയായി ശുപാർശ ചെയ്യുന്നു. ഇൻസ്റ്റാൾ ചെയ്ത സിസ്റ്റം പ്ലാനർ കാർഡുകളിലുടനീളം മെമ്മറി സന്തുലിതമാക്കുന്നത് സ്ഥിരമായ രീതിയിൽ മെമ്മറി ആക്സസ് പ്രാപ്തമാക്കുകയും സാധാരണയായി നിങ്ങളുടെ കോൺഫിഗറേഷന് മികച്ച പ്രകടനത്തിന് കാരണമാകുകയും ചെയ്യുന്നു.
- എല്ലാ മെമ്മറി സ്ലോട്ടുകളും പൂരിപ്പിച്ച് പരമാവധി മെമ്മറി ബാൻഡ്വിഡ്ത്ത് നേടാമെങ്കിലും, പ്രാരംഭ സിസ്റ്റം ഓർഡർ സമയത്ത് ഏത് മെമ്മറി ഫീച്ചർ സൈസ് ഉപയോഗിക്കണമെന്ന് തീരുമാനിക്കുമ്പോൾ ഭാവിയിൽ മെമ്മറി കൂട്ടിച്ചേർക്കലുകളുടെ പദ്ധതികൾ പരിഗണിക്കണം.
P10 കമ്പ്യൂട്ട് & എംഎംഎ ആർക്കിടെക്ചർ
- 2x ബാൻഡ്വിഡ്ത്ത് പൊരുത്തപ്പെടുന്ന SIMD*
- ഓരോ കോറിനും 8 സ്വതന്ത്ര ഫിക്സഡ് & ഫ്ലോട്ട് SIMD എഞ്ചിനുകൾ
- 4 - 32x മാട്രിക്സ് മാത്ത് ആക്സിലറേഷൻ*
- ഓരോ കോറിനും 4 512 ബിറ്റ് എഞ്ചിൻ = 2048b ഫലങ്ങൾ / സൈക്കിളുകൾ
- സിംഗിൾ, ഡബിൾ & റിഡ്യൂസ്ഡ് പ്രിസിഷൻ ഉള്ള മാട്രിക്സ് ഗണിത ബാഹ്യ ഉൽപ്പന്നങ്ങൾ.
- MMA ആർക്കിടെക്ചർ പിന്തുണ POWER ISA v3.1-ൽ അവതരിപ്പിച്ചു
- SP, DP, BF16, HP, Int-16, Int-8 & Int-4 പ്രിസിഷൻ ലെവലുകൾ പിന്തുണയ്ക്കുന്നു.
P10 MMAA ആപ്ലിക്കേഷനുകളും വർക്ക് ലോഡ് ഇന്റഗ്രേഷനും
- സാന്ദ്രമായ ലീനിയർ ബീജഗണിത കംപ്യൂട്ടേഷനുകൾ, മാട്രിക്സ് ഗുണനങ്ങൾ, വളവുകൾ, FFT എന്നിവയുള്ള ML & HPC ആപ്ലിക്കേഷനുകൾ MMA ഉപയോഗിച്ച് ത്വരിതപ്പെടുത്താവുന്നതാണ്.
- GCC പതിപ്പ് >= 10 & LLVM പതിപ്പ് >=12 അന്തർനിർമ്മിതങ്ങളിലൂടെ MMA-യെ പിന്തുണയ്ക്കുന്നു.
- OpenBLAS, IBM ESSL, Eigen ലൈബ്രറികൾ P10-നുള്ള MMA നിർദ്ദേശങ്ങൾ ഉപയോഗിച്ച് ഇതിനകം ഒപ്റ്റിമൈസ് ചെയ്തിട്ടുണ്ട്.
- മുകളിലെ BLAS ലൈബ്രറികൾ വഴി എന്റർപ്രൈസ് ആപ്ലിക്കേഷനുകൾ, ML ചട്ടക്കൂടുകൾ, ഓപ്പൺ കമ്മ്യൂണിറ്റി പാക്കേജുകൾ എന്നിവയ്ക്കായി MMA-യുടെ എളുപ്പത്തിലുള്ള ഏകീകരണം.
പവർപിസി മാട്രിക്സ്-മൾട്ടിപ്ലൈ അസിസ്റ്റ് ബിൽറ്റ്-ഇൻ ഫംഗ്ഷനുകൾ https://gcc.gnu.org/onlinedocs/gcc/PowerPC-Matrix-Multiply-Assist-Built-in-Functions.html
മാട്രിക്സ്-മൾട്ടിപ്ലൈ അസിസ്റ്റ് ബെസ്റ്റ് പ്രാക്ടീസ് ഗൈഡ് https://www.redbooks.ibm.com/Redbooks.nsf/RedpieceAbstracts/redp5612.html?Openവെർച്വൽ പ്രോസസ്സറുകൾ
- എല്ലാ പങ്കിട്ട പാർട്ടീഷനുകളുടെയും അവകാശപ്പെട്ട കോറുകളുടെ ആകെത്തുക, പങ്കിട്ട പൂളിലെ കോറുകളുടെ എണ്ണത്തിൽ കവിയരുത്
- ഒരു ഫ്രെയിമിലെ ഏതെങ്കിലും പങ്കിട്ട പാർട്ടീഷനുകളുടെ കോൺഫിഗർ ചെയ്ത വെർച്വൽ പ്രോസസ്സറുകളുടെ എണ്ണം പങ്കിട്ട പൂളിലെ കോറുകളുടെ എണ്ണത്തേക്കാൾ കൂടുതലല്ലെന്ന് ഉറപ്പാക്കുക.
- പീക്ക് കപ്പാസിറ്റി ഡിമാൻഡ് നിലനിർത്താൻ പങ്കിട്ട പാർട്ടീഷനുള്ള വെർച്വൽ പ്രോസസ്സറുകളുടെ എണ്ണം കോൺഫിഗർ ചെയ്യുക
- മെച്ചപ്പെട്ട പ്രകടനത്തിനായി ആ പാർട്ടീഷന്റെ ശരാശരി ഉപയോഗത്തിനായി പങ്കിട്ട പാർട്ടീഷനുള്ള അർഹതയുള്ള കോറുകളുടെ എണ്ണം കോൺഫിഗർ ചെയ്യുക
- മികച്ച മെമ്മറിയും സിപിയു അഫിനിറ്റിയും ഉറപ്പാക്കാൻ (വെർച്വൽ പ്രോസസറിന്റെ അനാവശ്യ മുൻകരുതലുകൾ ഒഴിവാക്കുക), പങ്കിട്ട പൂളിലെ കോറുകളുടെ എണ്ണത്തിന് സമീപമുള്ള എല്ലാ പങ്കിട്ട പാർട്ടീഷനുകളുടെയും അവകാശപ്പെട്ട കോറുകളുടെ ആകെത്തുക ഉറപ്പാക്കുക.
പ്രോസസ്സർ അനുയോജ്യത മോഡ്
- AIX-ന് 2 പ്രോസസർ അനുയോജ്യത മോഡുകൾ ലഭ്യമാണ്: POWER9, POWER9_base. സ്ഥിരസ്ഥിതി POWER9_base മോഡ് ആണ്.
- Linux-ന് 2 പ്രോസസർ അനുയോജ്യത മോഡുകൾ ലഭ്യമാണ്: POWER9, POWER10 മോഡുകൾ. സ്ഥിരസ്ഥിതി POWER10 മോഡ് ആണ്.
- LPM പാർട്ടീഷനുകൾക്ക് ശേഷം, പ്രോസസർ കോംപാറ്റിബിലിറ്റി മോഡ് മാറ്റുമ്പോൾ പവർ സൈക്കിൾ ആവശ്യമാണ്
പ്രോസസ്സർ ഫോൾഡിംഗ് പരിഗണനകൾ
- Power9-ൽ AIX-ൽ പ്രവർത്തിക്കുന്ന ഷെയർ പാർട്ടീഷൻ, ഡിഫോൾട്ട് vpm_throughput_mode = 0, Power10-ൽ, ഡിഫോൾട്ട് vpm_throughput_mode = 2. വർക്ക് ലോഡുകൾക്ക് ദീർഘകാല ജോലികൾ ഉള്ളതിനാൽ, പ്രധാന ഉപയോഗം കുറയ്ക്കുന്നതിന് ഇത് സഹായിച്ചേക്കാം.
- AIX-ൽ പ്രവർത്തിക്കുന്ന സമർപ്പിത പാർട്ടീഷനായി, Power0, Power9 എന്നിവയിൽ സ്ഥിരസ്ഥിതി vpm_throughput_mode = 10.
LPAR പേജ് ടേബിൾ വലുപ്പം പരിഗണനകൾ
• Linux പ്രവർത്തിക്കുന്ന Power10-ൽ ആരംഭിക്കുന്നത് Radix പേജ് പട്ടിക പിന്തുണയ്ക്കുന്നു. ഇത് വർക്ക് ലോഡ് പ്രകടനം മെച്ചപ്പെടുത്താൻ സാധ്യതയുണ്ട്.
റഫറൻസ്:
IBM POWER സിസ്റ്റങ്ങളിലേക്ക് ജോലിഭാരം മാറ്റുന്നതിനുള്ള സൂചനകളും നുറുങ്ങുകളും: https://www.ibm.com/downloads/cas/39XWR7YM
IBM POWERVirtualization മികച്ച പ്രാക്ടീസ് ഗൈഡ്: https://www.ibm.com/downloads/cas/JVGZA8RW
OS ലെവൽ നിലവിലുള്ളതാണെന്ന് ഉറപ്പാക്കുക
AIX, IBM i, VIOS, Linux, HMC, F/W എന്നിവയ്ക്കായുള്ള ഏറ്റവും പുതിയ അപ്ഡേറ്റുകൾ Fix Central നൽകുന്നു. അതിനുപുറമെ, FLRT ടൂൾ ഓരോ H/W മോഡലിനും ശുപാർശ ചെയ്യുന്ന ലെവലുകൾ നൽകുന്നു. നിങ്ങളുടെ സിസ്റ്റം അപ് ടു ഡേറ്റ് ആയി നിലനിർത്താൻ ഈ ടൂളുകൾ ഉപയോഗിക്കുക. നിങ്ങൾക്ക് ശുപാർശ ചെയ്യുന്ന തലത്തിലേക്ക് നീങ്ങാൻ കഴിയുന്നില്ലെങ്കിൽ, IBM POWER10 പ്രോസസർ-അധിഷ്ഠിത സിസ്റ്റംസ് ഡോക്യുമെന്റിലേക്ക് വർക്ക് ലോഡ് മൈഗ്രേറ്റ് ചെയ്യുന്നതിനുള്ള സൂചനകളുടെയും നുറുങ്ങുകളുടെയും അറിയപ്പെടുന്ന പ്രശ്ന വിഭാഗം പരിശോധിക്കുക.
AIX CPU ഉപയോഗം
POWER10-ൽ, സമർപ്പിത പ്രോസസ്സറുകൾ ഉപയോഗിച്ച് പ്രവർത്തിക്കുമ്പോൾ ഉയർന്ന CPU ഉപയോഗത്തിൽ മികച്ച റോ ത്രൂപുട്ടിനായി AIX OS സിസ്റ്റം ഒപ്റ്റിമൈസ് ചെയ്തിരിക്കുന്നു. പങ്കിട്ട പ്രോസസ്സറുകൾ ഉപയോഗിച്ച് പ്രവർത്തിക്കുമ്പോൾ, സിപിയു ഉപയോഗം (പിസി) കുറയ്ക്കുന്നതിന് AIX OS സിസ്റ്റം ഒപ്റ്റിമൈസ് ചെയ്യുന്നു. ഉപഭോക്താവിന് സിപിയു ഉപയോഗം (പിസി) കൂടുതൽ കുറയ്ക്കണമെങ്കിൽ, ജോലിഭാരം ട്യൂൺ ചെയ്യാനും റോ ത്രൂപുട്ടും സിപിയു ഉപയോഗവും തമ്മിലുള്ള നേട്ടങ്ങൾ വിലയിരുത്താനും ഷെഡ്യൂൾ ട്യൂണബിൾ pm_throughput_mode ഉപയോഗിക്കുക.
NX GZIP
അഡ്വാൻ എടുക്കാൻtagPOWER10 സിസ്റ്റങ്ങളിലെ NX GZIP ത്വരിതപ്പെടുത്തലിന്റെ e LPAR POWER9 കോംപാറ്റിബിലിറ്റി മോഡിൽ (POWER9_base മോഡിൽ അല്ല) അല്ലെങ്കിൽ POWER10 കോംപാറ്റിബിലിറ്റി മോഡിൽ ആയിരിക്കണം.
ഐബിഎം ഐ
IBM I ഓപ്പറേറ്റിംഗ് സിസ്റ്റം നില നിലവിലുള്ളതാണെന്ന് ഉറപ്പാക്കുക. IBM I, VIOS, HMC, ഫേംവെയർ എന്നിവയുടെ ഏറ്റവും പുതിയ അപ്ഡേറ്റുകൾ ഫിക്സ് സെൻട്രൽ നൽകുന്നു. https://www.ibm.com/support/fixcentral/
ഫേംവെയർ
സിസ്റ്റം ഫേംവെയർ നില നിലവിലുള്ളതാണെന്ന് ഉറപ്പാക്കുക. IBM I, VIOS, HMC, ഫേംവെയർ എന്നിവയുടെ ഏറ്റവും പുതിയ അപ്ഡേറ്റുകൾ ഫിക്സ് സെൻട്രൽ നൽകുന്നു. https://www.ibm.com/support/fixcentral/
മെമ്മറി DIMM-കൾ
ശരിയായ മെമ്മറി പ്ലഗ്-ഇൻ നിയമങ്ങൾ പാലിക്കുക. സാധ്യമെങ്കിൽ, മെമ്മറി DIMM സ്ലോട്ടുകൾ പൂർണ്ണമായി പോപ്പുലേറ്റ് ചെയ്യുകയും സമാന വലിപ്പത്തിലുള്ള മെമ്മറി DIMM-കൾ ഉപയോഗിക്കുകയും ചെയ്യുക.
പ്രോസസ്സർ SMT ലെവൽ
ഫുൾ അഡ്വാൻ എടുക്കാൻtagPower10 CPU-കളുടെ പ്രകടനത്തിന്റെ ഇ, SMT പരമാവധി വർദ്ധിപ്പിക്കുന്ന IBM i ഡിഫോൾട്ട് പ്രൊസസർ മൾട്ടിടാസ്കിംഗ് ക്രമീകരണങ്ങൾ ക്ലയന്റുകൾ ഉപയോഗിക്കണമെന്ന് ഞങ്ങൾ ശുപാർശ ചെയ്യുന്നു.
LPAR കോൺഫിഗറേഷനുള്ള ലെവൽ.
പാർട്ടീഷൻ പ്ലേസ്മെന്റ്
നിലവിലെ FW ലെവലുകൾ പാർട്ടീഷനുകളുടെ ഒപ്റ്റിമൽ പ്ലേസ്മെന്റ് ഉറപ്പാക്കുന്നു. എന്നിരുന്നാലും, CEC-യിലെ പാർട്ടീഷനുകളിൽ പതിവായി DLPAR പ്രവർത്തനങ്ങൾ നടത്തുകയാണെങ്കിൽ, DPO ഉപയോഗിക്കാൻ ശുപാർശ ചെയ്യുന്നു.
പ്ലേസ്മെന്റ് ഒപ്റ്റിമൈസ് ചെയ്യാൻ.
വെർച്വൽ പ്രോസസറുകൾ - പങ്കിട്ടതും സമർപ്പിത പ്രോസസ്സറുകളും
ഒപ്റ്റിമൽ പാർട്ടീഷൻ ലെവൽ പ്രകടനത്തിനായി സമർപ്പിത പ്രോസസ്സറുകൾ ഉപയോഗിക്കുക.
എനർജിസ്കെയിൽ
മികച്ച സിപിയു പ്രോസസർ വേഗതയ്ക്കായി, പരമാവധി പ്രകടനം സജ്ജീകരിച്ചിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക (IBM Power E1080-ന് സ്ഥിരസ്ഥിതി). ഈ ക്രമീകരണം ASMI-യിൽ കോൺഫിഗർ ചെയ്യാവുന്നതാണ്.
സംഭരണവും നെറ്റ്വർക്കിംഗും I/O
VIOS ഫ്ലെക്സിബിൾ സ്റ്റോറേജും നെറ്റ്വർക്കിംഗ് പ്രവർത്തനവും നൽകുന്നു. സാധ്യമായ ഏറ്റവും മികച്ച പ്രകടനത്തിന്, I/O-യ്ക്ക് നേറ്റീവ് IBM i ഇന്റർഫേസുകൾ ഉപയോഗിക്കുക.
കൂടുതൽ സമഗ്രമായ വിവരങ്ങൾ
ലിങ്ക് റഫർ ചെയ്യുക: IBM I on Power – Performance FAQ https://www.ibm.com/downloads/cas/QWXA9XKN
എന്റർപ്രൈസ് ലിനക്സ് ഓപ്പറേറ്റിംഗ് സിസ്റ്റം (OS) നിങ്ങളുടെ ഹൈബ്രിഡ് ക്ലൗഡ് ഇൻഫ്രാസ്ട്രക്ചറിനും സ്കെയിൽ-അപ്പ് എന്റർപ്രൈസ് സോഫ്റ്റ്വെയർ സൊല്യൂഷനുകൾക്കുമുള്ള ശക്തമായ അടിത്തറയാണ്. മികച്ച ഇൻ-ക്ലാസ് Power10 എന്റർപ്രൈസ് സിസ്റ്റങ്ങൾക്കായി സമീപകാല റിലീസുകൾ ഒപ്റ്റിമൈസ് ചെയ്തിരിക്കുന്നു
ശക്തി10
- SLES15SP3, RHEL8.4 Power10 നേറ്റീവ് മോഡിനെ പിന്തുണയ്ക്കുന്നു
- പഴയ തലമുറ പവർ സിസ്റ്റങ്ങളിൽ നിന്ന് (P9, P8) മൈഗ്രേറ്റ് ചെയ്യാൻ ക്ലയന്റുകളെ അനുവദിക്കുന്നതിനുള്ള കോമ്പസ് മോഡ് പിന്തുണ
- Power10 മോഡിൽ ഡിഫോൾട്ട് Radix വിവർത്തന പിന്തുണ
- എൻക്രിപ്ഷൻ പ്രകടനത്തിൽ കാര്യമായ പുരോഗതി
Linux + PowerVM
- PowerVM എന്റർപ്രൈസ് സവിശേഷതകൾക്കുള്ള പിന്തുണ: LPM, പങ്കിട്ട CPU പൂളുകൾ, DLPAR
- നൂതനമായ പരിഹാരങ്ങൾ: 4PB വെർച്വൽ അഡ്രസ് സ്പേസ് ഉള്ള SAP HANA ഭാവി ആപ്ലിക്കേഷൻ വളർച്ച
- ഡാറ്റ റീലോഡ് ചെയ്യാനുള്ള സമയം കുറയ്ക്കുക: SAP HANA-നുള്ള വെർച്വൽ PMEM പിന്തുണ
- ലോകോത്തര പിന്തുണയും സേവനവും
പിന്തുണയ്ക്കുന്ന വിതരണങ്ങൾ:
- Power9 മുതൽ RedHat, SUSE എന്നിവ മാത്രമേ PowerVM പാർട്ടീഷനുകളിൽ പിന്തുണയ്ക്കൂ
- പഴയ തലമുറ എച്ച്ഡബ്ല്യു ഉൾക്കൊള്ളുന്ന ഡിസ്ട്രോ സപ്പോർട്ട് മാട്രിക്സിനെക്കുറിച്ചുള്ള വിശദമായ വിവരങ്ങൾ
LPM പിന്തുണ:
- ലിനക്സ് ലോജിക്കൽ പാർട്ടീഷനുകൾ പഴയ തലമുറ പവർ സിസ്റ്റങ്ങളിൽ നിന്ന് പൂജ്യത്തിനടുത്തുള്ള ആപ്ലിക്കേഷൻ ഡൌൺടൈം ഉപയോഗിച്ച് നീക്കുക
- റഫറൻസ്: LPM ഗൈഡും അനുബന്ധ വിവരങ്ങളും
പവർ സ്പെസിഫിക് പാക്കേജുകൾ:
- PowerPC-utils പാക്കേജ്: IBM PowerPC LPAR-കളുടെ പരിപാലനത്തിനുള്ള യൂട്ടിലിറ്റികൾ അടങ്ങിയിരിക്കുന്നു. ഡിസ്ട്രോയുടെ ഭാഗമായി ലഭ്യമാണ്.
- ലിനക്സിനുള്ള അഡ്വാൻസ് ടൂൾചെയിൻ ഓൺ പവർ: ഏറ്റവും പുതിയ കംപൈലറുകൾ, റൺടൈം ലൈബ്രറികൾ എന്നിവ അടങ്ങിയിരിക്കുന്നു.
മികച്ച രീതികൾ :
- ട്യൂൺ ചെയ്ത സേവനത്തിന്റെ ഭാഗമായി RHEL മുൻകൂട്ടി നിശ്ചയിച്ച ട്യൂണിംഗുകൾ നൽകുന്നു.
- SAP ആപ്ലിക്കേഷനുകൾക്കായി ശുപാർശ ചെയ്യുന്ന OS ക്രമീകരണങ്ങൾക്കായി ഏറ്റവും പുതിയ SAP കുറിപ്പുകൾ കാണുക. സാധാരണയായി ട്യൂൺ ചെയ്യുന്നത് RHEL-ലും ക്യാപ്ചർ അല്ലെങ്കിൽ sapconf-ൽ SLES-ലും ഉപയോഗിക്കുന്നു
- പവർവിഎം ആണ് ഫ്രീക്വൻസി നിയന്ത്രിക്കുന്നത്. റഫറൻസ്: എനർജി മാനേജ്മെന്റ്
- Power8 ഹ്യൂജ് ഡൈനാമിക് DMA വിൻഡോ ആരംഭിക്കുന്നത് I/O പ്രകടനം മെച്ചപ്പെടുത്താൻ സഹായിക്കുന്നു.
- Power9 ആരംഭിക്കുന്നു 24×7-മോണിറ്ററിംഗ് പെർഫ് ടൂളുമായി സംയോജിപ്പിച്ചിരിക്കുന്നു. മുഴുവൻ സിസ്റ്റവും നിരീക്ഷിക്കാൻ അനുവദിക്കുന്നു.
- സിസ്റ്റം ഫേംവെയർ നില നിലവിലുള്ളതാണെന്ന് ഉറപ്പാക്കുക.
- PowerPC-utils-ൽ നിന്നുള്ള lparnumascore LPAR-ന്റെ നിലവിലെ അഫിനിറ്റി സ്കോർ കാണിക്കുന്നു. LPAR അഫിനിറ്റി സ്കോർ മെച്ചപ്പെടുത്താൻ DPO ഉപയോഗിക്കാം.
കൂടുതൽ വായിക്കുന്നു:
- ശക്തിക്കും ചില ശ്രദ്ധേയമായ ഫീച്ചറുകൾക്കുമുള്ള SLES.
- പവർ സിസ്റ്റങ്ങളിൽ ലിനക്സ്, പവർ സിസ്റ്റം സെർവറുകളിൽ ലിനക്സ് എന്നിവ ഉപയോഗിച്ച് ആരംഭിക്കുക
- എന്റർപ്രൈസ് ലിനക്സ് കമ്മ്യൂണിറ്റി
- ഐബിഎം പവർ സിസ്റ്റങ്ങൾ വ്യത്യസ്ത സ്പീഡുകളുടെയും പോർട്ടുകളുടെ എണ്ണത്തിന്റെയും വിവിധ നെറ്റ്വർക്ക് അഡാപ്റ്ററുകൾ പിന്തുണയ്ക്കുന്നു.
- നിങ്ങളുടെ മുമ്പത്തെ സിസ്റ്റത്തിന്റെ അതേ നെറ്റ്വർക്ക് അഡാപ്റ്ററുകളാണ് നിങ്ങൾ ഉപയോഗിക്കുന്നതെങ്കിൽ, തുടക്കത്തിൽ, അതേ ട്യൂണിംഗ് പുതിയ സിസ്റ്റത്തിലും ഉപയോഗിക്കണം.
- മിക്ക ഇഥർനെറ്റ് അഡാപ്റ്ററുകളും ഒന്നിലധികം റിസീവുകളും ട്രാൻസ്മിറ്റ് ക്യൂകളും പിന്തുണയ്ക്കുന്നു, അവയുടെ ബഫർ വലുപ്പം പരമാവധി പാക്കറ്റ് എണ്ണം വർദ്ധിപ്പിക്കാൻ വ്യത്യാസപ്പെടാം.
- വ്യത്യസ്ത അഡാപ്റ്ററുകൾക്കൊപ്പം ഡിഫോൾട്ട് ക്യൂ സജ്ജീകരണങ്ങൾ വ്യത്യസ്തമാണ്, കൂടാതെ ഒരു ക്ലയന്റ്-സെർവർ മോഡലിൽ പരമാവധി സന്ദേശ നിരക്കുകൾ നേടുന്നതിന് അനുയോജ്യമാകണമെന്നില്ല.
- അധിക ക്യൂകൾ ഉപയോഗിക്കുന്നത് സിസ്റ്റത്തിന്റെ സിപിയു ഉപയോഗം വർദ്ധിപ്പിക്കും; അതിനാൽ ഒരു പ്രത്യേക ജോലിഭാരത്തിന് അനുയോജ്യമായ ക്യൂ ക്രമീകരണം ഉപയോഗിക്കണം.
ഉയർന്ന വേഗതയുള്ള അഡാപ്റ്റർ പരിഗണനകൾ
- 25 GigE, 100 GigE നെറ്റ്വർക്ക് അഡാപ്റ്ററുകൾ ഉള്ള ഉയർന്ന വേഗതയുള്ള നെറ്റ്വർക്കുകൾക്ക് ഒന്നിലധികം പാരലൽ ത്രെഡുകളും ഡ്രൈവർ ആട്രിബ്യൂട്ടുകളുടെ ട്യൂണിംഗും ആവശ്യമാണ്.
- ഇതൊരു Gen4 അഡാപ്റ്ററാണെങ്കിൽ, അഡാപ്റ്റഡ് ഒരു Gen4 സ്ലോട്ടിൽ ഇരിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കുക.
- കംപ്രഷൻ, എൻക്രിപ്ഷൻ, ഡ്യൂപ്ലിക്കേഷൻ തുടങ്ങിയ അധിക ഫംഗ്ഷനുകൾക്ക് ലേറ്റൻസി ചേർക്കാൻ കഴിയും
AIX-ൽ ക്യൂ ക്രമീകരണം മാറ്റുന്നു
AIX-ൽ സ്വീകരിക്കുന്ന/പ്രക്ഷേപണം ചെയ്യുന്ന ക്യൂകളുടെ എണ്ണം മാറ്റാൻ
- ifconfig enX വേർപെടുത്തുക
- chdev -l entX -a queues_rx= -a queues_tx=
- chdev -l enX -a state=up
Linux-ൽ ക്യൂ സെറ്റിംഗ്സ് മാറ്റുന്നു
Linux ലെ ക്യൂകളുടെ എണ്ണം മാറ്റാൻ ethtool -L ethX സംയുക്തമായി
AIX-ൽ ക്യൂ വലുപ്പം മാറ്റുന്നു
- ifconfig enX വേർപെടുത്തുക
- chdev -l entX -a rx_max_pkts = -a tx_max_pkts =
- chdev -l enX -a state=up
LinuxP-യിൽ ക്യൂ വലുപ്പം മാറ്റുന്നു: ethtool -G ethX rx tx
വെർച്വലൈസേഷൻ
- SRIOV, vNIC, vETH രൂപത്തിൽ വെർച്വലൈസ്ഡ് നെറ്റ്വർക്കിംഗ് പിന്തുണയ്ക്കുന്നു. വിർച്ച്വലൈസേഷൻ ലേറ്റൻസി കൂട്ടുകയും നേറ്റീവ് I/O യുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ ത്രൂപുട്ട് കുറയ്ക്കുകയും ചെയ്യും.
- ബാക്കെൻഡ് ഹാർഡ്വെയറിന് പുറമെ, ആവശ്യമായ ത്രൂപുട്ടും പ്രതികരണ സമയവും നൽകാൻ VIOS മെമ്മറിയും CPU അളവുകളും മതിയെന്ന് ഉറപ്പാക്കുക.
- VIOS വലുപ്പത്തിൽ IBM PowerVM മികച്ച സമ്പ്രദായങ്ങൾ വളരെ സഹായകമാകും
- നിങ്ങളുടെ മുമ്പത്തെ സിസ്റ്റത്തിന്റെ അതേ സ്റ്റോറേജ് അഡാപ്റ്ററുകളാണ് നിങ്ങൾ ഉപയോഗിക്കുന്നതെങ്കിൽ, തുടക്കത്തിൽ, അതേ ട്യൂണിംഗ് പുതിയ സിസ്റ്റത്തിലും ഉപയോഗിക്കണം. നിലവിലുള്ള സിസ്റ്റത്തിൽ നിന്ന് അധിക പ്രകടനം ആവശ്യമാണെങ്കിൽ, സാധാരണ ട്യൂണിംഗ് നടത്തണം.
- മുമ്പത്തെ സിസ്റ്റത്തേക്കാൾ പുതിയ സിസ്റ്റത്തിൽ സ്റ്റോറേജ് സബ്സിസ്റ്റങ്ങൾ വളരെ വ്യത്യസ്തമാണെങ്കിൽ, ഇനിപ്പറയുന്ന പരിഗണനകളുടെ ലിസ്റ്റ് ആപ്ലിക്കേഷനുകളുടെ വേഗതയെ പ്രതികൂലമായി ബാധിക്കും -
- ഡയറക്ട് അറ്റാച്ച്ഡ് സ്റ്റോറേജിൽ നിന്ന് (DAS അല്ലെങ്കിൽ ഇന്റേണൽ) സ്റ്റോറേജ് ഏരിയ നെറ്റ്വർക്കിലേക്കോ (SAN) നെറ്റ്വർക്ക് അറ്റാച്ച്ഡ് സ്റ്റോറേജിലേക്കോ (അല്ലെങ്കിൽ ബാഹ്യ സംഭരണം) മാറുന്നത് ലേറ്റൻസി വർദ്ധിപ്പിക്കും.
- കംപ്രഷൻ, എൻക്രിപ്ഷൻ, ഡ്യൂപ്ലിക്കേഷൻ എന്നിവ പോലുള്ള അധിക ഫംഗ്ഷനുകൾക്ക് ലേറ്റൻസി ചേർക്കാൻ കഴിയും.
- സ്റ്റോറേജ് LUN-കളുടെ എണ്ണം കുറയ്ക്കുന്നത് ആവശ്യമായ ത്രൂപുട്ടുകളെ പിന്തുണയ്ക്കുന്നതിന് ആവശ്യമായ സെർവറിലെ ഉറവിടങ്ങൾ കുറയ്ക്കും.
- ഈ ആഘാതങ്ങൾ മനസ്സിലാക്കാൻ പുതിയ ഉപകരണങ്ങൾക്കായി ട്യൂണിംഗ് അല്ലെങ്കിൽ സജ്ജീകരണ ഗൈഡുകൾ കാണുക.'
- വിർച്ച്വലൈസേഷൻ ലേറ്റൻസി കൂട്ടുകയും നേറ്റീവ് I/O യുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ ത്രൂപുട്ട് കുറയ്ക്കുകയും ചെയ്യും. ബാക്കെൻഡ് ഹാർഡ്വെയറിന് പുറമെ, VIOS മെമ്മറിയും സിപിയുവും ഉറപ്പാക്കുക
- VIOS-ൽ ഉയർന്ന വേഗതയുള്ള വെർച്വലൈസ്ഡ് അഡാപ്റ്ററുകളിലേക്ക് നീങ്ങുന്നതിന് CPU-കളിലും മെമ്മറിയിലും VIOS കോൺഫിഗറേഷൻ ക്രമീകരിക്കേണ്ടതുണ്ട്. VIOS വലുപ്പത്തിൽ IBM PowerVM മികച്ച സമ്പ്രദായങ്ങൾ വളരെ സഹായകമാകും.
ട്യൂണിംഗ് മാർഗ്ഗനിർദ്ദേശങ്ങൾ - AIX, Linux മാർഗ്ഗനിർദ്ദേശങ്ങൾക്കായി ദയവായി IBM നോളജ് സെന്റർ പരിശോധിക്കുക.
PCIe3 12 GB കാഷെ RAID + SAS അഡാപ്റ്റർ ക്വാഡ്-പോർട്ട് 6 Gb x8 അഡാപ്റ്റർ ലിനക്സ്:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=availability-ha-asymmetricaccess-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=linux-common-sas-raidcontroller-tasks
AIX:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-multi-initiator-highavailability
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-common-controller-diskarray-management-tasks
ഐ.ബി.എം
- https://www.ibm.com/docs/en/power9/9223-42H?topic=configurations-dual-storageioa-access-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=i-common-controller-diskarray-management-tasks
PCIe3 x8 2-പോർട്ട് ഫൈബർ ചാനൽ (32 Gb/s) അഡാപ്റ്റർ
- https://www.ibm.com/docs/en/aix/7.2?topic=iompio-device-attributes
- https://www.ibm.com/docs/en/power9?topic=channel-npiv-multiple-queue-support
പ്രകടനത്തിനായി അധിക AIX ട്യൂണിംഗ്:
- SCSI ഓവർ ഫൈബർ ചാനൽ (MPIO): എല്ലാ ഡിസ്കിനും മൾട്ടിപാത്ത് അൽഗോരിതം round_robin ആയി സജ്ജമാക്കുക
- ഫൈബർ ചാനലിലൂടെയുള്ള NVMe: കണ്ടെത്തൽ ഘട്ടത്തിൽ സൃഷ്ടിച്ച ഫൈബർ ചാനൽ ഡൈനാമിക് കൺട്രോളറിലൂടെയുള്ള ഓരോ NVMe-നും സെറ്റിന് 7 ആട്രിബ്യൂട്ട് ചെയ്യാൻ കഴിയും
പ്രകടനത്തിനായി NVMe അഡാപ്റ്റർ AIX ട്യൂണിംഗ്
ഓരോ NVMe ഉപകരണത്തിനും സെറ്റിന് 8 ആട്രിബ്യൂട്ട് ചെയ്യാൻ കഴിയും
IBM-ന്റെ അടുത്ത തലമുറ C/C++/Fortran കമ്പൈലറുകൾ, IBM-ന്റെ വിപുലമായ ഒപ്റ്റിമൈസേഷനുകൾ ഓപ്പൺ സോഴ്സ് LLVM ഇൻഫ്രാസ്ട്രക്ചറുമായി സംയോജിപ്പിക്കുന്നു
![]() |
|
എൽ.എൽ.വി.എം C/C++ ഭാഷയ്ക്കുള്ള വലിയ കറൻസി വേഗത്തിലുള്ള നിർമ്മാണ വേഗത കമ്മ്യൂണിറ്റി പൊതുവായ ഒപ്റ്റിമൈസേഷനുകൾ വിവിധ LLVM അടിസ്ഥാനമാക്കിയുള്ള യൂട്ടിലിറ്റികൾ |
IBM ഒപ്റ്റിമൈസേഷനുകൾ പവർ ആർക്കിടെക്ചറിന്റെ പൂർണ്ണമായ ചൂഷണം വ്യവസായ-പ്രമുഖ വിപുലമായ ഒപ്റ്റിമൈസേഷനുകൾ ലോകോത്തര പിന്തുണയും സേവനവും |
ലഭ്യത
- 60 ദിവസത്തെ നോ-ചാർജ് ട്രയൽ: ഓപ്പൺ XL ഉൽപ്പന്ന പേജിൽ നിന്ന് ഡൗൺലോഡ് ചെയ്യുക
- ഡ്യുവൽ പൈപ്പിൽ നിന്ന് (AAS, PA) ഫ്ലെക്സിബിൾ ലൈസൻസിംഗ് ഓപ്ഷനുകളിലൂടെ IBM ലോകോത്തര സേവനവും പിന്തുണയും നേടുക
- ശാശ്വത ലൈസൻസ് (അംഗീകൃത ഉപയോക്താവിന് അല്ലെങ്കിൽ ഒരേസമയം ഉപയോഗിക്കുന്ന ഓരോ വ്യക്തിക്കും)
- പ്രതിമാസ ലൈസൻസ് (വെർച്വൽ പ്രോസസ് കോറിന്): ടാർഗെറ്റ് ക്ലൗഡ് ഉപയോഗ കേസുകൾ, ഉദാ, PowerVR സന്ദർഭത്തിൽ
ശുപാർശ ചെയ്യുന്ന പെർഫോമൻസ് ട്യൂണിംഗ് ഓപ്ഷനുകൾ
ഒപ്റ്റിമൈസേഷൻ ലെവൽ | ഉപയോഗ ശുപാർശകൾ |
-O2, -O3 | സാധാരണ ആരംഭ പോയിന്റ് |
ലിങ്ക് സമയം ഒപ്റ്റിമൈസേഷൻ: -flto (C/C++), -qlto (Fortran) | ധാരാളം ചെറിയ ഫംഗ്ഷൻ കോളുകളുള്ള ജോലിഭാരത്തിന് |
പ്രൊഫfile ഗൈഡഡ് ഒപ്റ്റിമൈസേഷൻ: -fprofile-ജനറേറ്റ്, -fprofile-ഉപയോഗം (C/C++) -qprofile-ജനറേറ്റ്, -qprofile-ഉപയോഗം (ഫോർട്രാൻ) |
ധാരാളം ബ്രാഞ്ചിംഗും ഫംഗ്ഷൻ കോളുകളും ഉള്ള ജോലിഭാരത്തിന് |
കൂടുതൽ വിവരങ്ങൾക്ക് ദയവായി സന്ദർശിക്കുക: https://www.ibm.com/docs/en/openxl-c-and-cpp-aix/17.1.0
https://www.ibm.com/docs/en/openxl-fortran-aix/17.1.0
ഓപ്പൺ XL 10 ഉപയോഗിച്ചുള്ള പൂർണ്ണ പവർ17.1.0 ആർക്കിടെക്ചർ ചൂഷണം
- Power10 നിർദ്ദേശങ്ങൾ ചൂഷണം ചെയ്യുന്ന കോഡ് സൃഷ്ടിക്കുന്നതിനും Power10-നുള്ള ഒപ്റ്റിമൈസേഷനുകൾ സ്വയമേവ ട്യൂൺ ചെയ്യുന്നതിനുമുള്ള പുതിയ കംപൈലർ ഓപ്ഷൻ '–mcpu=pwr10'
- പുതിയ Power10 ഫങ്ഷണാലിറ്റികൾ അൺലോക്ക് ചെയ്യുന്നതിനുള്ള പുതിയ ബിൽറ്റിൻ ഫംഗ്ഷനുകൾ, ഉദാ, Matrix മൾട്ടിപ്ലൈ ആക്സിലറേറ്റർ (MMA)
- Power10-ന് വേണ്ടി പുതിയ MASS SIMD, വെക്റ്റർ ലൈബ്രറികൾ എന്നിവ ചേർത്തു. എല്ലാ മാസ്സ് ലൈബ്രറി ഫംഗ്ഷനുകളും (SIMD, വെക്റ്റർ, സ്കെലാർ) Power10-ന് വേണ്ടി ട്യൂൺ ചെയ്തിരിക്കുന്നു (പവർ9 കൂടി).
കുറിപ്പ്: മുമ്പത്തെ പവർ പ്രോസസറുകളിൽ പ്രവർത്തിപ്പിക്കുന്നതിനായി XL കംപൈലറുകളുടെ (ഉദാ, XL 16.1.0) മുമ്പത്തെ പതിപ്പുകൾ ഉപയോഗിച്ച് സമാഹരിച്ച ആപ്ലിക്കേഷനുകൾ Power10-ൽ അനുയോജ്യമായി പ്രവർത്തിക്കും.
AIX-ലെ ബൈനറി അനുയോജ്യത
കുറിപ്പ്: AIX 16.1.0 നായുള്ള XL C/C++ ഇതിനകം ഒരു പുതിയ ഇൻവോക്കേഷൻ xlclang++ അവതരിപ്പിച്ചു, ഇത് LLVM പ്രോജക്റ്റിൽ നിന്ന് Clang ഫ്രണ്ട്-എൻഡ് പ്രയോജനപ്പെടുത്തുന്നു ü C++ ഒബ്ജക്റ്റുകൾ ഇതിനായി
- AIX (IBM-ന്റെ സ്വന്തം ഫ്രണ്ട്-എൻഡ് അടിസ്ഥാനമാക്കിയുള്ളത്) AIX-നായി xlclang++ 16.1.0 ഉപയോഗിച്ച് നിർമ്മിച്ച C++ ഒബ്ജക്റ്റുകളുമായി ബൈനറി അനുയോജ്യമല്ല.
- AIX-നുള്ള xlclang++ 16.1.0 ഉപയോഗിച്ച് നിർമ്മിച്ച C++ ഒബ്ജക്റ്റുകൾ AIX 17.1.0-നുള്ള പുതിയ ഓപ്പൺ XL C/C++ ന് ബൈനറി അനുയോജ്യമാകും.
- എല്ലാ AIX കംപൈലറുകളിലും C അനുയോജ്യത നിലനിർത്തുന്നു (AIX-നുള്ള മുൻ XL പതിപ്പുകൾ, AIX 17.1.0-ന് XL C/C++ തുറക്കുക)
- AIX-നുള്ള മുൻ XLF പതിപ്പും AIX 17.1.0-നുള്ള ഓപ്പൺ XL ഫോർട്രാനും തമ്മിൽ ഫോർട്രാൻ അനുയോജ്യത നിലനിർത്തുന്നു.
ലഭ്യത
ജിസിസി കംപൈലറുകൾ എല്ലാ എന്റർപ്രൈസ് ലിനക്സ് വിതരണങ്ങളിലും ലഭ്യമാണ്
AIX.
- ഇൻസ്റ്റാൾ ചെയ്ത GCC പതിപ്പ് RHEL 8.4-ൽ 8 ഉം SLES 7.4-ൽ 15 ഉം ആണ്. RHEL 9 GCC 11.2 ഷിപ്പ് ചെയ്യുമെന്ന് പ്രതീക്ഷിക്കുന്നു.
- വിതരണത്തിനായുള്ള ഡിഫോൾട്ട് കംപൈലറുകൾ Power10-നെ പിന്തുണയ്ക്കാനാവാത്തവിധം പഴയതാണെങ്കിൽ, ജിസിസിയുടെ മതിയായ സമീപകാല പതിപ്പ് ലഭിക്കുന്നതിന് നിരവധി മാർഗങ്ങളുണ്ട്.
- ഈ ആവശ്യത്തിനായി Red Hat GCC ടൂൾസെറ്റിനെ [1] പിന്തുണയ്ക്കുന്നു.
- SUSE ഡെവലപ്മെന്റ് ടൂൾസ് മൊഡ്യൂൾ നൽകുന്നു. [2]
- അഡ്വാൻസ് ടൂൾചെയിൻ വഴി ഏറ്റവും പുതിയ കംപൈലറുകളും ലൈബ്രറികളും IBM നൽകുന്നു. [3]
IBM അഡ്വാൻസ് ടൂൾചെയിൻ
- അഡ്വാൻസ് ടൂൾചെയിൻ കംപൈലറുകൾ, ഡീബഗ്ഗറുകൾ, മറ്റ് ടൂളുകൾ എന്നിവയ്ക്കൊപ്പം പവർ-ഒപ്റ്റിമൈസ് ചെയ്ത സിസ്റ്റം ലൈബ്രറികൾ നൽകുന്നു.
- അഡ്വാൻസ് ടൂൾചെയിൻ ഉപയോഗിച്ചുള്ള ബിൽഡിംഗ് കോഡ് ഏറ്റവും പുതിയ പ്രോസസ്സറുകളിൽ സാധ്യമായ ഏറ്റവും ഒപ്റ്റിമൈസ് ചെയ്ത കോഡ് നിർമ്മിക്കാൻ കഴിയും.
ഭാഷകൾ
- C (GCC), C++ (g++), Fortran (gfortran), Go (GCC), D (GDC), Ada (gnat) എന്നിവയ്ക്കൊപ്പം.
- GCC, g++, gfortran എന്നിവ മാത്രമേ സ്ഥിരസ്ഥിതിയായി ഇൻസ്റ്റാൾ ചെയ്യുകയുള്ളൂ.
- പവറിൽ ഗോ പ്രോഗ്രാമുകൾ നിർമ്മിക്കുന്നതിനുള്ള തിരഞ്ഞെടുക്കപ്പെട്ട ബദലാണ് ഗോലാങ് കംപൈലർ [4].
Power10-ലെ അനുയോജ്യതയും പുതിയ ഫീച്ചറുകളും
- POWER8 അല്ലെങ്കിൽ POWER9 പ്രോസസറുകളിൽ പ്രവർത്തിപ്പിക്കുന്നതിനായി GCC-യുടെ മുൻ പതിപ്പുകൾ ഉപയോഗിച്ച് സമാഹരിച്ച ആപ്ലിക്കേഷനുകൾ Power10 പ്രോസസറുകളിൽ പ്രവർത്തിക്കും.
- പവർ ഐഎസ്എ 11.2-ൽ ലഭ്യമായതും പവർ3.1 പ്രോസസറുകളിൽ നടപ്പിലാക്കിയതുമായ എല്ലാ പുതിയ സവിശേഷതകളും പ്രയോജനപ്പെടുത്താൻ ജിസിസി 10 അല്ലെങ്കിൽ അതിനുശേഷമുള്ളത് ശുപാർശ ചെയ്യുന്നു.
- Power11.2 പ്രൊസസറുകൾ നൽകുന്ന Matrix Multiply Assist (MMA) ഫീച്ചറിലേക്ക് GCC 10 ആക്സസ് നൽകുന്നു. [5]
- ജിസിസി, എൽഎൽവിഎം, ഓപ്പൺ എക്സ്എൽ കമ്പൈലറുകൾ എന്നിവ ഉപയോഗിച്ച് എംഎംഎ പ്രോഗ്രാമുകൾ കംപൈൽ ചെയ്യാൻ കഴിയും, നിങ്ങൾ വേണ്ടത്ര സമീപകാല റിലീസുകൾ ഉപയോഗിക്കുകയാണെങ്കിൽ.
IBM ശുപാർശ ചെയ്യുന്നതും പിന്തുണയ്ക്കുന്നതുമായ കംപൈലർ ഫ്ലാഗുകൾ [6]
-O3 അല്ലെങ്കിൽ -ഈസ്റ്റ് | അഗ്രസീവ് ഒപ്റ്റിമൈസേഷൻ. -ഈസ്റ്റ് അടിസ്ഥാനപരമായി -O3 -ഫാസ്റ്റ്-ഗണിതത്തിന് തുല്യമാണ്, ഇത് IEEE ഫ്ലോട്ടിംഗ് പോയിന്റ് ഗണിതത്തിലെ നിയന്ത്രണങ്ങളിൽ ഇളവ് വരുത്തുന്നു. |
-mcpu=powern | പവർ പ്രോസസർ പിന്തുണയ്ക്കുന്ന നിർദ്ദേശങ്ങൾ ഉപയോഗിച്ച് കംപൈൽ ചെയ്യുക. ഉദാample, Power10-ൽ മാത്രം ലഭ്യമായ നിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുന്നതിന്, -mcpu=power10 തിരഞ്ഞെടുക്കുക. |
-ലേക്ക് | ഓപ്ഷണൽ. "ലിങ്ക്-ടൈം" ഒപ്റ്റിമൈസേഷൻ നടത്തുക. വ്യത്യസ്ത കംപൈലേഷൻ യൂണിറ്റുകളിൽ കോളറും വിളിക്കുന്ന ഫംഗ്ഷനുകളും നിലനിൽക്കുന്ന ഫംഗ്ഷൻ കോളുകളിലുടനീളം ഇത് കോഡ് ഒപ്റ്റിമൈസ് ചെയ്യുന്നു, മാത്രമല്ല പലപ്പോഴും കാര്യമായ പ്രകടന ബൂസ്റ്റ് നൽകാനും കഴിയും. |
-അൺറോൾ-ലൂപ്പുകൾ | ഓപ്ഷണൽ. കംപൈലർ സാധാരണ ചെയ്യുന്നതിനേക്കാൾ കൂടുതൽ ആക്രമണാത്മക ഡ്യൂപ്ലിക്കേഷൻ ലൂപ്പ് ബോഡികൾ നടത്തുക. സാധാരണയായി, നിങ്ങൾ ഇത് ഒഴിവാക്കണം, എന്നാൽ ചില കോഡുകളിൽ, ഇത് മികച്ച പ്രകടനം നൽകാൻ കഴിയും. |
കുറിപ്പ്:
GCC 10-ൽ തന്നെ -mcpu=power10.3 പിന്തുണയ്ക്കുന്നുണ്ടെങ്കിലും, Power11.2 പ്രോസസറുകളിൽ നടപ്പിലാക്കിയിട്ടുള്ള എല്ലാ ഫീച്ചറുകളേയും മുൻ കംപൈലറുകൾ പിന്തുണയ്ക്കാത്തതിനാൽ GCC 10 ആണ് തിരഞ്ഞെടുക്കുന്നത്. കൂടാതെ, -mcpu=power10 ഉപയോഗിച്ച് സൃഷ്ടിച്ച ഒബ്ജക്റ്റുകൾ POWER9 അല്ലെങ്കിൽ മുമ്പത്തെ പ്രോസസ്സറുകളിൽ പ്രവർത്തിക്കില്ല! എന്നിരുന്നാലും, വ്യത്യസ്ത പ്രോസസ്സർ പതിപ്പുകൾക്കായി ഒപ്റ്റിമൈസ് ചെയ്ത കോഡ് സൃഷ്ടിക്കുന്നതിനുള്ള വഴികളുണ്ട്. [7] [1] Red Hat: GCC ടൂൾസെറ്റ് ഉപയോഗിക്കുന്നു. https://access.redhat.com/documentation/enus/red_hat_enterprise_linux/8/html/developing_c_and_cpp_applications_in_rhel_8/gcc-toolset_toolsets.
[2] SUSE: ഡെവലപ്മെന്റ് ടൂൾസ് മൊഡ്യൂൾ മനസ്സിലാക്കുന്നു. https://www.suse.com/c/suse-linux-essentialswhere-are-the-compilers-understanding-the-development-tools-module/.
[3] ഐബിഎം പവർ സിസ്റ്റങ്ങളിൽ ലിനക്സിനുള്ള അഡ്വാൻസ് ടൂൾചെയിൻ. https://www.ibm.com/support/pages/advancetoolchain-linux-power.
[4] ഗോ ഭാഷ. https://golang.org. [5] മാട്രിക്സ്-മൾട്ടിപ്ലൈ അസിസ്റ്റ് ബെസ്റ്റ് പ്രാക്ടീസ് ഗൈഡ്. http://www.redbooks.ibm.com/redpapers/pdfs/redp5612.pdf
[6] ഗ്നു കമ്പൈലർ ശേഖരം ഉപയോഗിക്കുന്നു. https://gcc.gnu.org/onlinedocs/gcc.pdf
[7] GNU-ഇൻഡയറക്ട് ഫംഗ്ഷൻ മെക്കാനിസത്തോടുകൂടിയ ടാർഗെറ്റ്-സ്പെസിഫിക് ഒപ്റ്റിമൈസേഷൻ. https://developer.ibm.com/tutorials/optimized-libraries-for-linux-on-power/#target-specific-optimization-
© 2021 Gnu-indirect-function-mechanism-നൊപ്പം IBM കോർപ്പറേഷൻ.
ജാവ ആപ്ലിക്കേഷനുകൾക്ക് തടസ്സമില്ലാതെ അഡ്വാൻ എടുക്കാംtagതാഴെ ലിസ്റ്റ് ചെയ്തിരിക്കുന്നതോ പുതിയതോ ആയ Java റൺടൈം പതിപ്പുകൾ ഉപയോഗിച്ച് P10 മോഡിൽ പ്രവർത്തിക്കുന്ന ഓപ്പറേറ്റിംഗ് സിസ്റ്റങ്ങളിലെ പുതിയ P10 ISA ഫീച്ചറുകളുടെ e:
ജാവ 8
- IBM SDK 8 SR6 FP36
- IBM സെമെരു റൺടൈം ഓപ്പൺ എഡിഷൻ 8u302: openj9-0.27.1
ജാവ 11
- IBM സെമെരു റൺടൈം സർട്ടിഫൈഡ് എഡിഷൻ 11.0.12.1: openj9-0.27.1
- IBM സെമെരു റൺടൈം ഓപ്പൺ എഡിഷൻ 11.0.12.1: openj9-0.27.1
ജാവ 17 (ഡ്രൈവറുകൾ ഇതുവരെ ലഭ്യമായേക്കില്ല)
- IBM സെമെരു റൺടൈം സർട്ടിഫൈഡ് എഡിഷൻ 17: openj9-0.28
- IBM സെമെരു റൺടൈം ഓപ്പൺ എഡിഷൻ 17: openj9-0.28
- OpenJDK 17
പ്രകടന ട്യൂണിംഗ് റഫറൻസുകൾ:
ഐ.ബി.എം Webസ്ഫിയർ ആപ്ലിക്കേഷൻ സെർവർ പെർഫോമൻസ് കുക്ക്ബുക്ക്
പേജ് വലിപ്പം
AIX-ലെ ഒട്ടുമിക്ക Oracle ഡാറ്റാബേസുകളുടെയും പൊതുവായ നിർദ്ദേശം SGA-യ്ക്ക് 64MB പേജ് വലുപ്പമല്ല, 16KB പേജ് സൈസ് ഉപയോഗിക്കുക എന്നതാണ്. സാധാരണഗതിയിൽ, 64 KB പേജുകൾ ഏതാണ്ട് സമാനമാണ്
പ്രത്യേക മാനേജ്മെന്റ് ഇല്ലാതെ 16 MB പേജുകളായി പ്രകടന ആനുകൂല്യം.
ടിഎൻഎസ് ശ്രോതാവ്
Oracle 12.1 ഡാറ്റാബേസും പിന്നീടുള്ള റിലീസുകളും ടെക്സ്റ്റ്, ഡാറ്റ, സ്റ്റാക്ക് എന്നിവയ്ക്കായി 64k പേജുകൾ ഉപയോഗിക്കും. എന്നിരുന്നാലും, TNSLISTENER-ന് അത് ഇപ്പോഴും ടെക്സ്റ്റ്, ഡാറ്റ, സ്റ്റാക്ക് എന്നിവയ്ക്കായി 4k പേജുകൾ ഉപയോഗിക്കുന്നു. ലേക്ക്
ശ്രോതാക്കൾക്കായി 64k പേജുകൾ പ്രവർത്തനക്ഷമമാക്കുക, ലിസണർ പ്രോസസ്സ് ആരംഭിക്കുന്നതിന് മുമ്പ് എക്സ്പോർട്ട് കമാൻഡ് ഉപയോഗിക്കുന്നു. ശ്രോതാവ് തീർന്നുപോയ ഒരു ASM അധിഷ്ഠിത പരിതസ്ഥിതിയിൽ പ്രവർത്തിക്കുന്നത് ശ്രദ്ധിക്കുക
GRID_HOME, ORACLE_HOME അല്ല.
12.1 അല്ലെങ്കിൽ പിന്നീടുള്ള റിലീസുകളിൽ "കണിശമായി setenv" കമാൻഡിന്റെ ഡോക്യുമെന്റേഷൻ മാറി. -env അല്ലെങ്കിൽ -envs എന്നതിന് അനുകൂലമായി -t അല്ലെങ്കിൽ -T നീക്കം ചെയ്തു. Oracle Lisener എൻവയോൺമെന്റ് സെറ്റിലും കയറ്റുമതിയിലും:
– LDR_CNTRL=DATAPSIZE=64K@TEXTPSIZE=64K@STACKPSIZE=64K - VMM_CNTRL=vmm_fork_policy=COR ('കോപ്പി ഓൺ റീഡ്' കമാൻഡ് ചേർക്കുക)
പങ്കിട്ട വാക്യഘടന
LDR_CNTRL=SHARED_SYMTAB=Y ക്രമീകരണം 11.2.0.4 അല്ലെങ്കിൽ പിന്നീടുള്ള റിലീസുകളിൽ പ്രത്യേകമായി സജ്ജീകരിക്കേണ്ടതില്ല. കംപൈലർ ലിങ്കർ ഓപ്ഷനുകൾ ഈ ക്രമീകരണം ശ്രദ്ധിക്കുന്നു, ഇനി പ്രത്യേകമായി സജ്ജീകരിക്കേണ്ടതില്ല. LDR_CNTRL=SHARED_SYMTAB=Y പ്രത്യേകമായി 12c അല്ലെങ്കിൽ പിന്നീടുള്ള റിലീസുകളിൽ സജ്ജീകരിക്കുന്നത് ശുപാർശ ചെയ്യുന്നില്ല.
വെർച്വൽ പ്രോസസർ ഫോൾഡിംഗ്
പ്രോസസർ ഫോൾഡിംഗ് പ്രവർത്തനക്ഷമമാക്കിയ LPAR-കൾ ഉപയോഗിക്കുമ്പോൾ ഇത് ഒരു RAC പരിതസ്ഥിതിയിൽ ഒരു നിർണായക ക്രമീകരണമാണ്. ഈ ക്രമീകരണം ക്രമീകരിച്ചില്ലെങ്കിൽ, ലൈറ്റ് ഡാറ്റാബേസ് വർക്ക്ലോഡ് സാഹചര്യങ്ങളിൽ RAC നോഡ് എവിക്ഷനുകൾക്ക് ഉയർന്ന അപകടസാധ്യതയുണ്ട്. Scheda -p -o vpm_xvcpus=2
VIOS & RAC ഇന്റർകണക്ട്
ക്ലസ്റ്റർ ടൈമിംഗ് സെൻസിറ്റീവ് ട്രാഫിക്കിന് മതിയായ ബാൻഡ്വിഡ്ത്ത് നൽകുന്നതിന് ഒരു സമർപ്പിത 10G (അതായത്, 10G ഇഥർനെറ്റ് അഡാപ്റ്റർ) കണക്ഷൻ ശുപാർശ ചെയ്യുന്നു. RAC ക്ലസ്റ്റർ ട്രാഫിക് - പരസ്പരബന്ധിതമായ ട്രാഫിക് സമർപ്പിതമായിരിക്കണം, പങ്കിടരുത്. പരസ്പരബന്ധം പങ്കിടുന്നത് നോഡ് ഹാംഗ്/പുറന്തള്ളൽ പ്രശ്നങ്ങളിലേക്ക് നയിക്കുന്ന സമയ കാലതാമസത്തിന് കാരണമാകും.
നെറ്റ്വർക്ക് പ്രകടനം
AIX-ലെ Oracle-നുള്ള ദീർഘകാല നെറ്റ്വർക്ക് ട്യൂണിംഗ് നിർദ്ദേശമാണിത്, എന്നിരുന്നാലും സ്ഥിരസ്ഥിതി 0-ൽ തുടരുന്നു. rfc1323=1-ന്റെ TCP ക്രമീകരണം
കൂടുതൽ സമഗ്രമായ വിവരങ്ങൾ
ലിങ്ക് കാണുക: പവർ 9 ഉൾപ്പെടെയുള്ള പവർ സിസ്റ്റങ്ങളിൽ AIX പ്രവർത്തിക്കുന്ന നിലവിലെ ഒറാക്കിൾ ഡാറ്റാബേസ് പതിപ്പുകളുടെ സ്ഥിരതയും പ്രകടനവും നിയന്ത്രിക്കുക
https://www.ibm.com/support/pages/node/6355543
ജനറൽ
- SMT8 മോഡ് ഉപയോഗിക്കുക
- സമർപ്പിത CPU LPAR-കൾ ഉപയോഗിക്കുക
Db2 വെയർഹൗസ്
- എല്ലാ നോഡുകൾക്കുമിടയിൽ ഒരു ഹൈ-സ്പീഡ് പ്രൈവറ്റ് നെറ്റ്വർക്ക് നിലവിലുണ്ടെന്ന് ഉറപ്പാക്കുക
- MLN കോൺഫിഗറേഷൻ ഒരു സോക്കറ്റിന് ഒരു നോഡായി പരിമിതപ്പെടുത്തുക
CP4D
- OCP നോഡുകൾ നെറ്റ്വർക്കിനായി PCIe4 ഉപയോഗിക്കുക
- OCP 4.8-ന് മുമ്പ്, കേർണൽ പാരാമീറ്റർ slub_max_order=0 സജ്ജമാക്കുക
Db2 മികച്ച സമ്പ്രദായങ്ങൾ
https://www.ibm.com/docs/en/db2/11.5?topic=overviews-db2-best-practices
നെറ്റ്വർക്ക്
- പോഡ് നെറ്റ്വർക്കിനായി, LPM ആവശ്യമില്ലെങ്കിൽ നേറ്റീവ് SRIOV അടിസ്ഥാനമാക്കിയുള്ള സ്വകാര്യ നെറ്റ്വർക്ക് ഉപയോഗിക്കുക, അല്ലെങ്കിൽ, VNIC ഉപയോഗിക്കുക
- ഉയർന്ന ബാൻഡ്വിഡ്ത്ത് അല്ലെങ്കിൽ കുറഞ്ഞ ലേറ്റൻസി ആവശ്യമുള്ള ആപ്ലിക്കേഷനുകൾക്ക്, ഒരു പോഡിലേക്ക് നേരിട്ട് VF അസൈൻ ചെയ്യാൻ SR-IOV നെറ്റ്വർക്ക് ഓപ്പറേറ്റർ ഉപയോഗിക്കുന്നത് പരിഗണിക്കുക.
- കുറഞ്ഞ സമയപരിധി ആവശ്യമുള്ള സേവനങ്ങൾക്ക്, നിലവിലുള്ള ഒരു റൂട്ടിനായി ഡിഫോൾട്ട് ടൈംഔട്ടുകൾ കോൺഫിഗർ ചെയ്യുക
- OCP-യുടെ ക്ലസ്റ്റർ നെറ്റ്വർക്കിന്റെ ആവശ്യമുള്ള MTU വലുപ്പം ക്രമീകരിക്കുക
ഓപ്പറേറ്റിംഗ് സിസ്റ്റം
- CoreOS പോസ്റ്റ്-ഇൻസ്റ്റാൾ മാറ്റങ്ങളിൽ യു-പരിധി വർദ്ധിപ്പിക്കുന്നത് പരിഗണിക്കുക
- പവർ പ്ലാറ്റ്ഫോമായ OCP4.8 ഇൻസ്റ്റാളേഷനുള്ള ഏറ്റവും കുറഞ്ഞ OCP ഇൻസ്റ്റാളേഷൻ ആവശ്യകതകൾ പരിശോധിക്കുക
വിന്യാസം
- ആപ്ലിക്കേഷനുകൾ വിന്യസിക്കുമ്പോൾ, ഒരേസമയം മൾട്ടിത്രെഡിംഗ് (SMT), അല്ലെങ്കിൽ ഹൈപ്പർ ത്രെഡിംഗ് പ്രവർത്തനക്ഷമമാക്കാത്തപ്പോൾ ഒരു vCPU ഒരു ഫിസിക്കൽ കോറിന് തുല്യമാണെന്ന് ശ്രദ്ധിക്കുക. SMT പ്രവർത്തനക്ഷമമാക്കുമ്പോൾ, ഒരു VCPU ഒരു ഹാർഡ്വെയർ ത്രെഡിന് തുല്യമാണ്.
- തൊഴിലാളികൾക്കും മാസ്റ്റർ നോഡുകൾക്കുമുള്ള ഏറ്റവും കുറഞ്ഞ അളവിലുള്ള മാർഗ്ഗനിർദ്ദേശങ്ങൾ കാണുക, ഏറ്റവും കുറഞ്ഞ വിഭവ ആവശ്യകതകൾ
- ബിൽറ്റ്-ഇൻ കണ്ടെയ്നർ ഇമേജ് രജിസ്ട്രിയിലേക്ക് ഒരു പ്രത്യേക സമർപ്പിത സംഭരണം അനുവദിക്കുക
- OpenShift കണ്ടെയ്നർ പ്ലാറ്റ്ഫോം ഘടകങ്ങൾ ഡാറ്റ എഴുതുന്ന OCP-യുടെ പ്രധാന ഡയറക്ടറികളുടെ പ്രധാന ഡയറക്ടറികൾക്കായി ഇനിപ്പറയുന്ന സൈസിംഗ് മാർഗ്ഗനിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുക.
പ്രമാണങ്ങൾ / വിഭവങ്ങൾ
![]() |
IBM Power10 പ്രകടനം [pdf] ഉപയോക്തൃ ഗൈഡ് പവർ10, പെർഫോമൻസ്, പവർ10 പെർഫോമൻസ് |