Rychlý průvodce výkonem Power10
(Power10 QSG)
listopadu 2021

Minimální paměť

  • Pro každou patici procesoru je osazeno minimálně 8 ze 16 modulů DIMM
  • V uzlu je obsazeno minimálně 32 ze 64 modulů DIMM
  • Ve 4uzlovém systému je osazeno minimálně 128 z 256 modulů DIMM.

Pravidla pro zásuvku DDIMM

  •  Dodržujte minimální povolenou paměť (každá patice procesoru je osazena minimálně 8 ze 16 modulů DIMM)
  • Všechny moduly DIMM pod každým procesorem musí mít stejnou kapacitu
  • Upgrady funkcí budou nabízeny v přírůstcích po 4 DDIMM, z nichž všechny mají stejnou kapacitu.
  • Jediný platný počet DDIMM připojených k místům připojeným k danému procesorovému modulu je 8 nebo 12 nebo 16.

Výkon paměti

  • Výkon systému se zvyšuje s tím, jak je množství paměti rozloženo do více slotů DDIMM. NapřampPokud je v uzlu potřeba 1 TB, je lepší mít 64 x 32 GB DIMM než mít 32 x 64 GB DIMM.
  • Zapojení modulů DIMM, které mají všechny stejnou velikost, zajistí nejvyšší výkon
  • Výkon systému se zlepšuje s tím, jak se k sobě hodí více čtveřic
  • Výkon systému se zlepšuje, protože více procesorových modulů DDIMM si vzájemně odpovídá
  • Výkon systému se u systému s více zásuvkami zlepší, pokud je kapacita paměti mezi zásuvkami vyvážená.

Šířka pásma paměti

Kapacita DDIMM Teoretická MaxBandwidth
32 GB, 64 GB (DDR4 @ 3200 Mbps) 409 GB/s
128 GB, 256 GB (DDR4 @ 2933 Mbps) 375 GB/s

Shrnutí

  • Pro dosažení nejlepšího možného výkonu se obecně doporučuje, aby byla paměť instalována rovnoměrně do všech zásuvek systémových uzlů a všech soketů procesorů v systému. Vyvážení paměti mezi nainstalovanými systémovými planárními kartami umožňuje přístup k paměti konzistentním způsobem a obvykle vede k lepšímu výkonu vaší konfigurace.
  • Ačkoli maximální šířky pásma paměti je dosaženo zaplněním všech paměťových slotů, při rozhodování o tom, jakou velikost paměti použít v době počáteční objednávky systému, je třeba vzít v úvahu plány budoucího rozšíření paměti.

P10 Compute & MMA architektura

  • 2x SIMD s přizpůsobenou šířkou pásma*
  • 8 nezávislých Fixed & Float SIMD motorů na jádro
  • 4 – 32x zrychlení Matrix Math*
  • 4 512bitový engine na jádro = 2048b výsledků / cyklů
  • Matrix matematické vnější produkty s jednoduchou, dvojitou a sníženou přesností.
  • Podpora architektury MMA představená v POWER ISA v3.1
  • Podporuje úrovně přesnosti SP, DP, BF16, HP, Int-16, Int-8 a Int-4.

P10 MMAA aplikace a integrace pracovní zátěže

  • Aplikace ML a HPC s výpočty husté lineární algebry, násobení matic, konvoluce, FFT mohou být urychleny pomocí MMA
  • Verze GCC >= 10 a verze LLVM >=12 podporuje MMA prostřednictvím vestavěných modulů.
  • OpenBLAS, IBM ESSL & Eigen Libraries jsou již optimalizovány s instrukcemi MMA pro P10.
  • Snadná integrace MMA pro podnikové aplikace, rámce ML a balíčky Open Community prostřednictvím výše uvedených knihoven BLAS.

Vestavěné funkce PowerPC Matrix-Multiply Assist https://gcc.gnu.org/onlinedocs/gcc/PowerPC-Matrix-Multiply-Assist-Built-in-Functions.html
Průvodce doporučenými postupy Matrix-Multiply Assist  https://www.redbooks.ibm.com/Redbooks.nsf/RedpieceAbstracts/redp5612.html?OpenVirtuální procesory

  • Součet oprávněných jader všech sdílených oddílů nesmí překročit počet jader ve sdíleném fondu
  • Ujistěte se, že počet nakonfigurovaných virtuálních procesorů všech sdílených oblastí v rámci není větší než počet jader ve sdíleném fondu.
  • Nakonfigurujte počet virtuálních procesorů pro sdílenou logickou část, abyste udrželi špičkovou kapacitu
  • Nakonfigurujte počet oprávněných jader pro sdílený oddíl tak, aby bylo průměrné využití tohoto oddílu pro lepší výkon
  • Chcete-li zajistit lepší afinitu paměti a CPU (vyhnout se zbytečným preempcím virtuálního procesoru), zajistěte, aby se součet oprávněných jader všech sdílených oddílů blížil počtu jader ve sdíleném fondu.

Režim kompatibility procesoru

  • Pro AIX jsou k dispozici 2 režimy kompatibility procesorů: POWER9 a POWER9_base. Výchozí je režim POWER9_base.
  • Pro Linux jsou k dispozici 2 režimy kompatibility procesorů: režim POWER9 a POWER10. Výchozí je režim POWER10.
  • Po oddílech LPM je třeba při změně režimu kompatibility procesoru vypnout a zapnout napájení

Úvahy o skládání procesoru

  • Pro sdílenou oblast se systémem AIX na Power9 je výchozí vpm_throughput_mode = 0, na Power10 je výchozí vpm_throughput_mode = 2. U úloh s dlouhotrvajícími úlohami může potenciálně pomoci snížit využití jádra.
  • Pro vyhrazený oddíl se systémem AIX je výchozí vpm_throughput_mode = 0 na Power9 i Power10.

Úvahy o velikosti tabulky stránek LPAR

• Tabulka stránek Radix je podporována počínaje Power10 se systémem Linux. Může potenciálně zlepšit výkon při pracovní zátěži.

Odkaz:
Rady a tipy pro migraci pracovní zátěže na IBM POWER Systems: https://www.ibm.com/downloads/cas/39XWR7YM
IBM POWERVirtualizationBest Practices Guide:  https://www.ibm.com/downloads/cas/JVGZA8RW

Ujistěte se, že úroveň OS je aktuální
Fix Central poskytuje nejnovější aktualizace pro AIX, IBM i, VIOS, Linux, HMC a F/W. Kromě toho nástroj FLRT poskytuje doporučené úrovně pro každý H/W model. Pomocí těchto nástrojů udržujte svůj systém v aktuálním stavu. Pokud se nemůžete posunout na doporučenou úroveň, přečtěte si část Známý problém v dokumentu Rady a tipy pro migraci pracovní zátěže do dokumentu IBM POWER10 Processor-Based Systems.
Využití CPU AIX
Na POWER10 je systém AIX OS optimalizován pro nejlepší nezpracovanou propustnost při vyšším využití CPU při provozu s vyhrazenými procesory. Při běhu se sdílenými procesory je systém AIX OS optimalizován tak, aby se snížilo využití CPU (pc). Pokud zákazník požaduje další snížení využití CPU (pc), použijte plánovací laditelný pm_throughput_mode k vyladění pracovní zátěže a vyhodnocení výhod nezpracované propustnosti vs. využití CPU.
NX GZIP
Chcete-li získat zálohutagV případě akcelerace NX GZIP na systémech POWER10 musí být LPAR v režimu kompatibility POWER9 (nikoli v režimu POWER9_base) nebo v režimu kompatibility POWER10.
IBM i
Ujistěte se, že úroveň operačního systému IBM I je aktuální. Fix Central poskytuje nejnovější aktualizace pro IBM I, VIOS, HMC a firmware. https://www.ibm.com/support/fixcentral/
Firmware
Ujistěte se, že úroveň firmwaru systému je aktuální. Fix Central poskytuje nejnovější aktualizace pro IBM I, VIOS, HMC a firmware. https://www.ibm.com/support/fixcentral/
Paměťové moduly DIMM
Dodržujte správná pravidla paměťových zásuvných modulů. Je-li to možné, plně osaďte paměťové sloty DIMM a použijte paměťové moduly DIMM podobné velikosti.
Úroveň SMT procesoru
Chcete-li plně využíttagVzhledem k výkonu procesorů Power10 doporučujeme klientům využívat výchozí nastavení multitaskingu procesoru IBM i, které maximalizuje SMT
úroveň pro konfiguraci LPAR.
Umístění oddílu
Aktuální úrovně FW zajišťují optimální umístění oddílů. Pokud jsou však na oddílech na CEC prováděny časté operace DLPAR, doporučuje se použít DPO
pro optimalizaci umístění.
Virtuální procesory – sdílené vs vyhrazené procesory
Pro optimální výkon na úrovni oddílu využijte vyhrazené procesory.
Energetická škála
Chcete-li dosáhnout nejlepší rychlosti procesoru CPU, ujistěte se, že je nastaven Maximální výkon (výchozí pro IBM Power E1080). Toto nastavení lze konfigurovat v rozhraní ASMI.
I/O úložiště a sítě
VIOS poskytuje flexibilní úložiště a síťové funkce. Pro dosažení nejlepšího možného výkonu používejte pro I/O nativní rozhraní IBM i.
Obsáhlejší informace
Viz odkaz: IBM I on Power – Nejčastější dotazy k výkonu https://www.ibm.com/downloads/cas/QWXA9XKN

Podnikový operační systém Linux (OS) je pevným základem pro vaši hybridní cloudovou infrastrukturu a pro škálovatelná podniková softwarová řešení. Nejnovější verze jsou optimalizovány pro nejlepší systémy Power10 Enterprise ve své třídě
Výkon 10

  • SLES15SP3, RHEL8.4 podporují nativní režim Power10
  • Podpora režimu kompasu, která klientům umožňuje migraci ze starší generace systémů Power (P9 a P8)
  • Výchozí podpora překladu Radix v režimu Power10
  • Výrazné zlepšení výkonu šifrování

Linux + PowerVM

  • Podpora podnikových funkcí PowerVM: LPM, sdílené fondy CPU, DLPAR
  • Inovativní řešení: budoucí růst aplikací SAP HANA s virtuálním adresním prostorem 4PB
  • Zkraťte čas na opětovné načtení dat: Podpora virtuálního PMEM pro SAP HANA
  • Podpora a servis světové třídy

Podporované distribuce:

  • Počínaje Power9 jsou v oddílech PowerVM podporovány pouze RedHat a SUSE
  • Podrobné informace o matici podpory distribuce pokrývající starší generaci HW

Podpora LPM:

  • Přesuňte logické oddíly Linuxu ze starší generace systémů Power s téměř nulovými výpadky aplikací
  • Odkaz: Průvodce LPM a související informace

Balíčky specifické pro napájení:

  • Balíček PowerPC-utils: Obsahuje nástroje pro údržbu LPARů IBM PowerPC. K dispozici jako součást distra.
  • Advance Toolchain pro Linux on Power: Obsahuje nejnovější kompilátory, runtime knihovny.

Osvědčené postupy :

  • RHEL poskytuje předdefinované ladění jako součást laděné služby.
  • Doporučená nastavení OS pro aplikace SAP naleznete v nejnovějších poznámkách SAP. Typicky laděný se používá v RHEL a capture nebo sapconf v SLES
  • Frekvenci spravuje PowerVM. Reference: Energetický management
  • Starting Power8 Obrovské dynamické okno DMA pomáhá zlepšit výkon I/O.
  • Starting Power9 24×7-Monitoring je integrován s nástrojem perf. Umožňuje sledování celého systému.
  • Ujistěte se, že úroveň firmwaru systému je aktuální.
  • lparnumascore z PowerPC-utils ukazuje aktuální skóre afinity LPAR. DPO lze použít ke zlepšení skóre afinity LPAR.

Více čtení:

  • SLES for Power a některé přesvědčivé funkce.
  • Začněte s Linuxem na Power Systems, Linuxem na serverech Power Systems
  • Enterprise Linux komunita
  • Systémy IBM Power podporují různé síťové adaptéry s různou rychlostí a počtem portů.
  • Pokud používáte stejné síťové adaptéry jako váš předchozí systém, zpočátku by se na novém systému mělo použít stejné ladění.
  • Většina ethernetových adaptérů podporuje více přijímacích a vysílacích front, jejichž velikost vyrovnávací paměti lze měnit, aby se zvýšil maximální počet paketů.
  • Výchozí nastavení fronty se u různých adaptérů liší a nemusí být optimální pro dosažení maximální rychlosti zpráv v modelu klient-server.
  • Použití dalších front zvýší využití procesoru systému; proto by mělo být použito optimální nastavení fronty pro konkrétní zátěž.

Zvažte vyšší rychlost adaptéru

  • Vysokorychlostní sítě se síťovými adaptéry 25 GigE a 100 GigE vyžadují více paralelních vláken a ladění atributů ovladače.
  • Pokud se jedná o adaptér Gen4, ujistěte se, že je adaptér usazen ve slotu Gen4.
  • Další funkce, jako je komprese, šifrování a duplikace, mohou přidat latenci

Změna nastavení fronty v AIX
Chcete-li změnit počet front příjmu/odesílání v systému AIX

  •  ifconfig enX odpojit
  • chdev -l entX -a queues_rx= -a queues_tx=
  • chdev -l enX -a stav=up

Změna nastavení fronty v Linuxu
Chcete-li změnit počet front v Linuxu, ethtool -L ethX dohromady

Změna velikosti fronty v AIX

  • ifconfig enX odpojit
  • chdev -l entX -a rx_max_pkts = -a tx_max_pkts =
  • chdev -l enX -a stav=up

Změna velikosti fronty v LinuxP: ethtool -G ethX rx TX

Virtualizace

  • Virtualizované sítě jsou podporovány ve formě SRIOV, vNIC, vETH. Virtualizace zvyšuje latenci a může snížit propustnost ve srovnání s nativními I/O.
  • Kromě backendového hardwaru zajistěte dostatečné množství paměti VIOS a CPU k zajištění požadované propustnosti a doby odezvy
  • Doporučené postupy IBM PowerVM mohou být velmi užitečné při dimenzování VIOS
  • Pokud používáte stejné adaptéry úložiště jako váš předchozí systém, zpočátku by se na novém systému mělo použít stejné ladění. Pokud je požadován další výkon ze stávajícího systému, pak by mělo být provedeno normální ladění.
  • Pokud se úložné subsystémy na novějším systému výrazně liší od předchozího systému, může následující seznam úvah negativně ovlivnit vnímanou rychlost aplikací –
  • Změna z úložiště s přímým připojením (DAS nebo interní) na síť SAN (Storage Area Network) nebo úložiště připojené k síti (NAS) (nebo externí úložiště) může zvýšit latenci.
  • Další funkce, jako je komprese, šifrování a deduplikace, mohou přidat latenci.
  • Snížení počtu jednotek Storage LUN může snížit zdroje na serveru potřebné k podpoře požadované propustnosti.
  • Informace o těchto dopadech naleznete v průvodcích laděním nebo nastavením pro nová zařízení.'
  • Virtualizace zvyšuje latenci a může snížit propustnost ve srovnání s nativními I/O. Kromě backendového hardwaru zajistěte paměť VIOS a CPU
  • Přechod na vysokorychlostní virtualizované adaptéry ve VIOS bude vyžadovat úpravu konfigurace VIOS v CPU a paměti. Doporučené postupy IBM PowerVM mohou být velmi užitečné při dimenzování VIOS.

Pokyny pro ladění – viz pokyny IBM Knowledge Center pro AIX a Linux.

Adaptér PCIe3 12 GB Cache RAID + SAS Adaptér se čtyřmi porty 6 Gb x8 Adaptér Linux:

AIX:

IBM

PCIe3 x8 2portový Fibre Channel (32 Gb/s) adaptér

Další ladění AIX pro výkon:

  • SCSI over Fibre Channel (MPIO): Nastavte vícecestný algoritmus na round_robin pro každý disk
  • NVMe over Fibre Channel: sada může přiřadit hodnotu 7 pro každý dynamický řadič NVMe over Fibre Channel vytvořený během fáze zjišťování

Adaptér NVMe Vyladění AIX pro výkon
Sada může přiřadit 8 pro každé zařízení NVMe
Kompilátory C/C++/Fortran nové generace od IBM, které kombinují pokročilé optimalizace IBM s open-source infrastrukturou LLVM

LLVM
Větší měna pro jazyk C/C++
Vyšší rychlost výstavby
Společné optimalizace komunity
Různé nástroje založené na LLVM
IBM optimalizace
Plné využití architektury Power
Špičkové pokročilé optimalizace
Podpora a servis světové třídy

Dostupnost

  • 60denní bezplatná zkušební verze: stáhněte si z produktové stránky Open XL
  • Získejte prvotřídní servis a podporu IBM prostřednictvím flexibilních možností licencování, od dual-pipe (AAS a PA)
  • Trvalá licence (na oprávněného uživatele nebo na souběžného uživatele)
  • Měsíční licence (na jádro virtuálního procesu): cílové případy použití cloudu, např. na instanci PowerVR

Doporučené možnosti ladění výkonu

Úroveň optimalizace Doporučení k použití
-O2 a -O3 Typický výchozí bod
Optimalizace doby propojení: -flto (C/C++), -qlto (Fortran) Pro pracovní zátěže se spoustou volání malých funkcí
Profile řízená optimalizace: -fprofile-generovat, -fprofile-použít (C/C++)
-qprofile-generovat, -qprofile- použít (Fortran)
Pro pracovní zátěže se spoustou větvení a volání funkcí

Pro více informací navštivte: https://www.ibm.com/docs/en/openxl-c-and-cpp-aix/17.1.0
https://www.ibm.com/docs/en/openxl-fortran-aix/17.1.0

Plné využití architektury Power10 s Open XL 17.1.0

  • Nová možnost kompilátoru '–mcpu=pwr10' pro generování kódu využívajícího instrukce Power10 a také automatické ladění optimalizací pro Power10
  • Nové vestavěné funkce pro odemknutí nových funkcí Power10, např. Matrix Multiply Accelerator (MMA)
  • Pro Power10 byly přidány nové MASS SIMD a vektorové knihovny. Všechny funkce knihovny MASS (SIMD, vektor, skalární) vyladěné pro Power10 (také Power9).

Poznámka: Aplikace zkompilované s dřívějšími verzemi XL kompilátorů (např. XL 16.1.0) pro běh na předchozích Power procesorech poběží kompatibilně na Power10.
Binární kompatibilita na AIX
Poznámka: XL C/C++ pro AIX 16.1.0 již představilo nové vyvolání xlclang++, které využívá front-end Clang z projektu LLVM ü C++ objekty vytvořené pomocí xlC pro

  • AIX (založené na vlastním front-endu IBM) nejsou binárně kompatibilní s objekty C++ vytvořenými s xlclang++ 16.1.0 pro AIX
  • Objekty C++ vytvořené pomocí xlclang++ 16.1.0 pro AIX budou binárně kompatibilní s novým Open XL C/C++ pro AIX 17.1.0
  • Kompatibilita C je zachována napříč všemi kompilátory AIX (starší verze XL pro AIX, Open XL C/C++ pro AIX 17.1.0)
  • Kompatibilita Fortran je zachována mezi starší verzí XLF pro AIX a Open XL Fortran pro AIX 17.1.0

Dostupnost
Kompilátory GCC jsou dostupné ve všech distribucích Enterprise Linux a dále
AIX.

  • Nainstalovaná verze GCC je 8.4 na RHEL 8 a 7.4 na SLES 15. Očekává se, že RHEL 9 bude dodávat GCC 11.2.
  • Existuje několik způsobů, jak získat dostatečně aktuální verzi GCC, když jsou výchozí kompilátory pro distribuci příliš staré na to, aby podporovaly Power10.
  • Red Hat pro tento účel podporuje sadu nástrojů GCC [1].
  • SUSE poskytuje modul vývojových nástrojů. [2]
  • IBM poskytuje nejnovější kompilátory a knihovny prostřednictvím Advance Toolchain. [3]

IBM Advance Toolchain

  • Advance Toolchain poskytuje Power-optimalizované systémové knihovny spolu s kompilátory, debuggery a dalšími nástroji.
  • Stavební kód s Advance Toolchain může vytvořit maximálně optimalizovaný kód na nejnovějších procesorech.

Jazyky

  • C (GCC), C++ (g++) a Fortran (gfortran), spolu s dalšími, jako jsou Go (GCC), D (GDC) a Ada (gnat).
  • Ve výchozím nastavení jsou obvykle nainstalovány pouze GCC, g++ a gfortran.
  • Kompilátor golang [4] je preferovanou alternativou pro vytváření programů Go na Power.

Kompatibilita a nové funkce na Power10

  •  Aplikace kompilované s dřívějšími verzemi GCC pro běh na procesorech POWER8 nebo POWER9 poběží kompatibilně na procesorech Power10.
  •  Pro využití všech nových funkcí dostupných v Power ISA 11.2 a implementovaných v procesorech Power3.1 se doporučuje GCC 10 nebo novější.
  • GCC 11.2 poskytuje přístup k funkci Matrix Multiply Assist (MMA), kterou poskytují procesory Power10. [5]
  • Programy MMA lze zkompilovat pomocí libovolného kompilátoru GCC, LLVM a Open XL za předpokladu, že používáte dostatečně poslední verze.

IBM doporučené a podporované příznaky kompilátoru [6]

-O3 nebo -Východ Agresivní optimalizace. -East je v podstatě ekvivalentní -O3 -fast-math, což také uvolňuje omezení IEEE aritmetiky s plovoucí desetinnou čárkou.
-mcpu=powern Kompilace pomocí instrukcí podporovaných procesorem Power. Napřample, chcete-li použít pokyny dostupné pouze na Power10, vyberte -mcpu=power10.
-na Volitelný. Proveďte optimalizaci „doba propojení“. To optimalizuje kód mezi voláními funkcí, kde volající a volané funkce existují v různých kompilačních jednotkách, a často může poskytnout významné zvýšení výkonu.
-rozvinout smyčky Volitelný. Provádějte agresivnější duplikaci těl smyček, než by normálně dělal kompilátor. Obecně byste to měli vynechat, ale u některých kódů to může poskytnout lepší výkon.

Poznámka:
Ačkoli -mcpu=power10 je podporováno již v GCC 10.3, GCC 11.2 je preferován, protože dřívější kompilátory nepodporují všechny funkce implementované v procesorech Power10. Také objekty vytvořené pomocí -mcpu=power10 nepoběží na procesorech POWER9 nebo starších! Existují však způsoby, jak vytvořit kód, který je optimalizován pro různé verze procesoru. [7] [1] Red Hat: Používání sady nástrojů GCC. https://access.redhat.com/documentation/enus/red_hat_enterprise_linux/8/html/developing_c_and_cpp_applications_in_rhel_8/gcc-toolset_toolsets.
[2] SUSE: Porozumění modulu vývojových nástrojů. https://www.suse.com/c/suse-linux-essentialswhere-are-the-compilers-understanding-the-development-tools-module/.
[3] Advance Toolchain pro Linux na IBM Power Systems. https://www.ibm.com/support/pages/advancetoolchain-linux-power.
[4] Přejít na jazyk. https://golang.org. [5] Průvodce osvědčenými postupy Matrix-Multiply Assist. http://www.redbooks.ibm.com/redpapers/pdfs/redp5612.pdf
[6] Použití GNU Compiler Collection. https://gcc.gnu.org/onlinedocs/gcc.pdf
[7] Cílově specifická optimalizace s mechanismem GNUIndirect Function. https://developer.ibm.com/tutorials/optimized-libraries-for-linux-on-power/#target-specific-optimization-
© 2021 IBM Corporation s mechanismem nepřímé funkce-gnu.
Java aplikace mohou bez problémů nabírat pokrokytage z nových funkcí P10 ISA na operačních systémech běžících v režimu P10 pomocí verzí Java runtime uvedených níže nebo novějších:
Java 8

  •  IBM SDK 8 SR6 FP36
  • IBM Semeru Runtime Open Edition 8u302: openj9-0.27.1

Java 11

  • IBM Semeru Runtime Certified Edition 11.0.12.1: openj9-0.27.1
  • IBM Semeru Runtime Open Edition 11.0.12.1: openj9-0.27.1

Java 17 (ovladače zatím nemusí být k dispozici)

  •  IBM Semeru Runtime Certified Edition 17: openj9-0.28
  • IBM Semeru Runtime Open Edition 17: openj9-0.28
  • OpenJDK 17

Reference ladění výkonu:
IBM WebSphere Application Server Performance Cookbook
Velikost stránky
Obecným doporučením pro většinu databází Oracle na AIX je použití velikosti stránky 64 kB a nikoli velikosti stránky 16 MB pro SGA. Stránky o velikosti 64 kB obvykle poskytují téměř stejnou výtěžnost
výkonnostní přínos jako 16 MB stránek bez zvláštní správy.
Posluchač TNS
Databáze Oracle 12.1 a novější verze budou ve výchozím nastavení používat 64 tisíc stránek pro text, data a zásobník. Pro TNSLISTENER však stále používá 4k stránek pro text, data a zásobník. Na
Povolit 64k stránek pro posluchače použije před spuštěním procesu naslouchání příkaz export. Všimněte si, že běží v prostředí založeném na ASM, které posluchači dojde
GRID_HOME a ne ORACLE_HOME.
Dokumentace pro příkaz „strictly setenv“ se změnila ve verzích 12.1 nebo novějších. -t nebo -T bylo odstraněno ve prospěch -env nebo -envs. V prostředí Oracle Listener nastavte a exportujte:
– LDR_CNTRL=DATAPSIZE=64K@TEXTPSIZE=64K@STACKPSIZE=64K - VMM_CNTRL=vmm_fork_policy=COR (přidat příkaz 'Kopírovat při čtení')
Sdílená syntaxe
Nastavení LDR_CNTRL=SHARED_SYMTAB=Y nemusí být konkrétně nastaveno v 11.2.0.4 nebo novějších vydáních. O toto nastavení se postarají možnosti linkeru kompilátoru a již není třeba je konkrétně nastavovat. Nedoporučuje se mít LDR_CNTRL=SHARED_SYMTAB=Y specificky nastaveno ve verzích 12c nebo novějších.
Skládání virtuálního procesoru
Toto je kritické nastavení v prostředí RAC při použití LPAR s povoleným skládáním procesoru. Pokud toto nastavení neupravíte, existuje vysoké riziko vyřazení uzlu RAC za podmínek nízké zátěže databáze. Scheda -p -o vpm_xvcpus=2
Propojení VIOS a RAC
Jako minimum se doporučuje vyhrazené připojení 10G (tj. 10G Ethernetový adaptér), aby byla zajištěna dostatečná šířka pásma pro provoz citlivý na časování clusteru. Clusterový provoz RAC – propojovací provoz by měl být vyhrazený a nikoli sdílený. Sdílení propojení může způsobit zpoždění v načasování vedoucí k problémům se zablokováním/vyklizením uzlu.
Výkon sítě
Toto je dlouhodobý návrh ladění sítě pro Oracle na AIX, ačkoli výchozí hodnota zůstává na 0. Nastavení TCP rfc1323=1
Obsáhlejší informace
Viz odkaz: Správa stability a výkonu aktuálních verzí databáze Oracle se systémem AIX na systémech Power včetně POWER9
https://www.ibm.com/support/pages/node/6355543

Generál

  • Použijte režim SMT8
  • Použijte vyhrazené CPU LPAR

Db2 Warehouse

  • Ujistěte se, že mezi všemi uzly existuje vysokorychlostní privátní síť
  • Omezte konfiguraci MLN na jeden uzel na soket

CP4D

  • Použijte PCIe4 pro síť uzlů OCP
  • Před OCP 4.8 nastavte parametr jádra slub_max_order=0

Doporučené postupy Db2
https://www.ibm.com/docs/en/db2/11.5?topic=overviews-db2-best-practices

Síť

  • Pro síť pod použijte privátní síť založenou na nativním SRIOV, pokud není vyžadováno LPM, jinak použijte VNIC
  • U aplikací, které vyžadují velkou šířku pásma nebo nízkou latenci, zvažte použití operátora sítě SR-IOV k přiřazení VF přímo k modulu
  • U služeb, které potřebují nízký časový limit, nakonfigurujte výchozí časové limity pro existující trasu
  • Upravte požadovanou velikost MTU sítě clusteru OCP

Operační systém

  • Zvažte zvýšení u-limitů v rámci změn po instalaci CoreOS
  • Prostudujte si minimální požadavky na instalaci OCP pro instalaci Power platform OCP4.8 na Power

Nasazení

  • Při nasazování aplikací si uvědomte, že jeden vCPU je ekvivalentní jednomu fyzickému jádru, když není povoleno současné multithreading (SMT) nebo hyperthreading. Když je povoleno SMT, VCPU je ekvivalentní hardwarovému vláknu.
  • Viz pokyny pro minimální velikost pro pracovníky a hlavní uzly Minimální požadavky na zdroje
  • Přidělte samostatné vyhrazené úložiště vestavěnému registru bitových kopií kontejneru
  • Použijte následující pokyny pro velikost hlavních adresářů OCP, do kterých komponenty OpenShift Container Platform zapisují data.

Dokumenty / zdroje

Výkon IBM Power10 [pdfUživatelská příručka
Výkon 10, výkon, výkon 10 výkon

Reference

Zanechte komentář

Vaše emailová adresa nebude zveřejněna. Povinná pole jsou označena *