Power10 гүйцэтгэлийн хурдан эхлүүлэх гарын авлага
(Power10 QSGs)
2021 оны арваннэгдүгээр сар

Хамгийн бага санах ой

  • Процессорын залгуур тус бүрийн хувьд 8 DIMM-ээс хамгийн багадаа 16-ыг нь суулгасан байна
  • Зангилаанд DIMM-ийн хамгийн багадаа 32-ийн 64-ыг суулгасан байна
  • 4 зангилаатай системд 128 DIMM-ийн хамгийн багадаа 256-ыг нь суулгасан байдаг.

DDIMM залгуурын дүрэм

  •  Зөвшөөрөгдсөн хамгийн бага санах ойтой таарах (процессорын залгуур тус бүрд 8 DIMM-ийн дор хаяж 16 нь суурилагдсан)
  • Процессор бүрийн доор байгаа бүх DIMM нь ижил хүчин чадалтай байх ёстой
  • Онцлогын шинэчлэлтүүд бүгд ижил хүчин чадалтай 4 DDIMM-ийн өсөлтөөр санал болгоно.
  • Өгөгдсөн процессорын модульд холбогдсон сайтуудад холбогдсон DDIMM-ийн цорын ганц хүчинтэй тоо нь 8 эсвэл 12 эсвэл 16 байна.

Санах ойн гүйцэтгэл

  • Санах ойн хэмжээ нь илүү олон DDIMM үүрэнд тархах тусам системийн гүйцэтгэл сайжирдаг. Жишээ ньampХэрэв Node-д 1TB шаардлагатай бол 64 x 32GB DIMM-тэй байснаас 32 x 64 ГБ DIMM-тэй байх нь дээр.
  • Бүгд ижил хэмжээтэй DIMM-уудыг залгавал хамгийн өндөр гүйцэтгэлийг хангана
  • Илүү олон дөрвөлжин бие биетэйгээ таарах тусам системийн гүйцэтгэл сайжирна
  • Илүү олон DDIMM процессорууд хоорондоо таарч байгаа тул системийн гүйцэтгэл сайжирдаг
  • Шүүгээ хоорондын санах ойн багтаамж тэнцвэртэй байвал олон шүүгээтэй систем дээр системийн гүйцэтгэл сайжирна.

Санах ойн зурвасын өргөн

DDIMM хүчин чадал Онолын хамгийн их зурвасын өргөн
32 ГБ, 64 ГБ (DDR4 @ 3200 Mbps) 409 ГБ/с
128 ГБ, 256 ГБ (DDR4 @ 2933 Mbps) 375 ГБ/с

Дүгнэлт

  • Хамгийн сайн гүйцэтгэлтэй байхын тулд санах ойг системийн бүх зангилааны шургуулга болон системийн бүх процессорын залгууруудад жигд суулгахыг зөвлөж байна. Суулгасан системийн хавтгай картуудын санах ойг тэнцвэржүүлэх нь санах ойд тогтмол хандах боломжийг олгодог бөгөөд таны тохиргоог илүү сайн гүйцэтгэлд хүргэдэг.
  • Санах ойн бүх үүрийг дүүргэх замаар санах ойн хамгийн дээд зурвасын өргөнийг олж авдаг ч системийн анхны захиалгыг хийх үед санах ойн функцийн хэмжээг сонгохдоо ирээдүйн санах ойн нэмэлтүүдийн төлөвлөгөөг анхаарч үзэх хэрэгтэй.

P10 Compute & MMA Architecture

  • 2x зурвасын өргөнтэй таарсан SIMD*
  • Нэг цөм бүрт 8 бие даасан Fixed & Float SIMD хөдөлгүүр
  • 4 – 32x матрицын математикийн хурдатгал*
  • Нэг цөмд 4 512 бит хөдөлгүүр = 2048б үр дүн / цикл
  • Ганц, давхар, багассан нарийвчлалын матрицын математикийн гадаад бүтээгдэхүүн.
  • MMA Архитектурын дэмжлэгийг POWER ISA v3.1-д нэвтрүүлсэн
  • SP, DP, BF16, HP, Int-16, Int-8 & Int-4 нарийвчлалын түвшинг дэмждэг.

P10 MMAApplications & Workload Integration

  • Өтгөн шугаман алгебр тооцоолол, матрицын үржвэр, эргэлт, FFT бүхий ML & HPC програмуудыг MMA ашиглан хурдасгах боломжтой.
  • GCC хувилбар >= 10 ба LLVM хувилбар >=12 нь суулгацын тусламжтайгаар MMA-г дэмждэг.
  • OpenBLAS, IBM ESSL & Eigen Libraries нь P10-д зориулсан MMA зааварчилгаагаар аль хэдийн оновчтой болсон.
  • Дээрх BLAS номын сангуудаар дамжуулан байгууллагын программууд, ML хүрээ, Нээлттэй нийгэмлэгийн багцуудад зориулсан MMA-г хялбархан нэгтгэх.

PowerPC матриц-Үржүүлэх туслах суурилагдсан функцууд https://gcc.gnu.org/onlinedocs/gcc/PowerPC-Matrix-Multiply-Assist-Built-in-Functions.html
Матриц-Үржүүлэх туслах шилдэг туршлагын гарын авлага  https://www.redbooks.ibm.com/Redbooks.nsf/RedpieceAbstracts/redp5612.html?OpenВиртуал процессорууд

  • Бүх хуваалцсан хуваалтуудын эрхтэй цөмийн нийлбэр нь хуваалцсан сан дахь цөмүүдийн тооноос хэтрэхгүй байх ёстой
  • Хүрээ дээрх хуваалцсан хуваалтуудын тохируулсан виртуал процессорын тоо нь хуваалцсан сан дахь цөмүүдийн тооноос ихгүй байгаа эсэхийг шалгаарай.
  • Оргил хүчин чадлын эрэлтийг хангахын тулд хуваалцсан хуваалтын виртуал процессорын тоог тохируулна уу
  • Хуваалцсан хуваалтын эрх бүхий цөмийн тоог илүү сайн ажиллахын тулд тухайн хуваалтын дундаж ашиглалтыг тохируулна уу.
  • Санах ой болон CPU-ийн илүү сайн нийцтэй байдлыг хангахын тулд (виртуал процессорын шаардлагагүй давуу эрхээс зайлсхийх) бүх хуваалцсан хуваалтын эрхтэй цөмүүдийн нийлбэр нь хуваалцсан сан дахь цөмүүдийн тоотой ойролцоо байх ёстой.

Процессорын нийцтэй байдлын горим

  • AIX-д процессорын нийцтэй байдлын 2 горим байдаг: POWER9 болон POWER9_base. Өгөгдмөл нь POWER9_base горим юм.
  • Linux-д процессорын нийцтэй байдлын 2 горим байдаг: POWER9 ба POWER10 горим. Өгөгдмөл нь POWER10 горим юм.
  • LPM хуваалтуудын дараа процессорын нийцтэй байдлын горимыг өөрчлөх үед асаах хэрэгтэй

Процессорыг нугалахад анхаарах зүйлс

  • Power9 дээр AIX ажиллаж байгаа хуваалтын хуваалтын хувьд өгөгдмөл vpm_throughput_mode = 0, Power10 дээр өгөгдмөл vpm_throughput_mode = 2. Ажлын ачаалал удаан үргэлжилдэг ажлын хувьд энэ нь үндсэн хэрэглээг бууруулахад тусалж чадна.
  • AIX дээр ажиллаж байгаа зориулалтын хуваалтын хувьд Power0 болон Power9 дээрх өгөгдмөл vpm_throughput_mode = 10.

LPAR хуудасны хүснэгтийн хэмжээг харгалзан үзэх зүйлс

• Radix хуудасны хүснэгтийг Linux дээр ажилладаг Power10-аас эхлэн дэмждэг. Энэ нь ажлын ачааллын гүйцэтгэлийг сайжруулах боломжтой.

Лавлагаа:
Ажлын ачааллыг IBM POWER Systems руу шилжүүлэх зөвлөмж, зөвлөмжүүд: https://www.ibm.com/downloads/cas/39XWR7YM
IBM POWERVirtualizationBest Practices Guide:  https://www.ibm.com/downloads/cas/JVGZA8RW

OS түвшин одоогийн байгаа эсэхийг шалгаарай
Fix Central нь AIX, IBM i, VIOS, Linux, HMC болон F/W-ийн хамгийн сүүлийн үеийн шинэчлэлтүүдийг өгдөг. Нэмж дурдахад FLRT хэрэгсэл нь H/W загвар бүрт санал болгож буй түвшинг өгдөг. Системээ шинэчилж байлгахын тулд эдгээр хэрэгслийг ашиглана уу. Хэрэв та санал болгож буй түвшинд хүрч чадахгүй бол ажлын ачааллыг IBM POWER10 процессорт суурилсан систем баримт бичигт шилжүүлэх зөвлөмж, зөвлөмжийн Мэдэгдэж буй асуудал хэсгийг үзнэ үү.
AIX CPU-ийн хэрэглээ
POWER10 дээр AIX OS систем нь тусгай процессортой ажиллах үед CPU-ийн өндөр хэрэглээтэй байх үед хамгийн сайн түүхий нэвтрүүлэх чадварыг оновчтой болгосон. Хуваалцсан процессортой ажиллах үед CPU-ийн хэрэглээг (компьютер) багасгахын тулд AIX OS системийг оновчтой болгосон. Үйлчлүүлэгч CPU-ийн хэрэглээг (компьютер) цаашид багасгахыг хүсвэл ажлын ачааллыг тааруулахын тулд pm_throughput_mode тохируулж болох хуваарийг ашиглана уу, CPU-ийн ашиглалт ба түүхий дамжуулах чадварын ашиг тусыг үнэлнэ үү.
NX GZIP
Урьдчилгаа авахtagPOWER10 систем дээрх NX GZIP хурдатгалын e LPAR нь POWER9 нийцтэй горимд (POWER9_base горим биш) эсвэл POWER10 нийцтэй горимд байх ёстой.
IBM i
IBM I үйлдлийн системийн түвшин одоогийн байгаа эсэхийг шалгаарай. Fix Central нь IBM I, VIOS, HMC, програм хангамжийн хамгийн сүүлийн үеийн шинэчлэлтүүдийг өгдөг. https://www.ibm.com/support/fixcentral/
Програм хангамж
Системийн програм хангамжийн түвшин одоогийн байгаа эсэхийг шалгаарай. Fix Central нь IBM I, VIOS, HMC, програм хангамжийн хамгийн сүүлийн үеийн шинэчлэлтүүдийг өгдөг. https://www.ibm.com/support/fixcentral/
Санах ойн DIMM
Санах ойн залгаасын зохих дүрмийг дагаж мөрдөөрэй. Боломжтой бол санах ойн DIMM слотуудыг бүрэн дүүргэж, ижил хэмжээтэй санах ойн DIMM-уудыг ашиглана уу.
Процессорын SMT түвшин
Бүрэн урьдчилан авахын тулдtagPower10 CPU-ийн гүйцэтгэлийн хувьд бид үйлчлүүлэгчдэд IBM i анхдагч процессорын олон үйлдэлт тохиргоог ашиглахыг зөвлөж байна, энэ нь SMT-ийг нэмэгдүүлэх болно.
LPAR тохиргооны түвшин.
Хуваалтын байршил
Одоогийн FW түвшин нь хуваалтыг оновчтой байрлуулах боломжийг олгодог. Гэсэн хэдий ч хэрэв CEC дээрх хуваалтууд дээр байнга DLPAR үйлдлүүд хийгддэг бол DPO ашиглахыг зөвлөж байна.
байршлыг оновчтой болгох.
Виртуал процессорууд – хуваалцсан болон тусгай зориулалтын процессорууд
Хуваалтын түвшний оновчтой гүйцэтгэлийг хангахын тулд тусгай процессоруудыг ашигла.
Эрчим хүчний хэмжүүр
CPU процессорын хамгийн сайн хурдыг авахын тулд хамгийн их гүйцэтгэлийг тохируулсан эсэхийг шалгаарай (IBM Power E1080-ийн өгөгдмөл). Энэ тохиргоог ASMI-д тохируулах боломжтой.
Хадгалах ба сүлжээний I/O
VIOS нь уян хатан хадгалах, сүлжээний функцээр хангадаг. Хамгийн сайн гүйцэтгэлтэй байхын тулд I/O-д зориулсан IBM i интерфейсийг ашиглана уу.
Илүү дэлгэрэнгүй мэдээлэл
Холбоосыг үзнэ үү: IBM I on Power – Performance FAQ https://www.ibm.com/downloads/cas/QWXA9XKN

Enterprise Linux үйлдлийн систем (OS) нь таны эрлийз үүлэн дэд бүтэц болон байгууллагын программ хангамжийн шийдлүүдийг өргөжүүлэх бат бөх суурь юм. Сүүлийн үеийн хувилбарууд нь хамгийн шилдэг Power10 Enterprise системд зориулагдсан
Хүч 10

  • SLES15SP3, RHEL8.4 нь Power10 үндсэн горимыг дэмждэг
  • Хуучин үеийн цахилгаан системээс (P9 ба P8) шилжих боломжийг үйлчлүүлэгчдэд олгох луужин горимын дэмжлэг
  • Power10 горимд Radix орчуулгын өгөгдмөл дэмжлэг
  • Шифрлэлтийн гүйцэтгэл мэдэгдэхүйц сайжирсан

Linux + PowerVM

  • PowerVM байгууллагын функцүүдийн дэмжлэг: LPM, Shared CPU Pools, DLPAR
  • Шинэлэг шийдлүүд: 4PB виртуал хаягийн зайтай SAP HANA програмын ирээдүйн өсөлт
  • Өгөгдлийг дахин ачаалах хугацааг багасгах: SAP HANA-д зориулсан виртуал PMEM дэмжлэг
  • Дэлхийн түвшний дэмжлэг, үйлчилгээ

Дэмжигдсэн түгээлтүүд:

  • Power9-ээс эхлэн PowerVM хуваалтуудад зөвхөн RedHat болон SUSE-г дэмждэг
  • Хуучин үеийн HW-г хамарсан дистро дэмжлэгийн матрицын талаарх дэлгэрэнгүй мэдээлэл

LPM дэмжлэг:

  • Линуксийн логик хуваалтыг хуучин үеийн цахилгаан системээс бараг тэгтэй програмын зогсолттой шилжүүлээрэй
  • Лавлагаа: LPM гарын авлага болон холбогдох мэдээлэл

Эрчим хүчний тусгай багцууд:

  • PowerPC-utils багц: IBM PowerPC LPAR-ийн засвар үйлчилгээнд зориулсан хэрэгслүүдийг агуулсан. Дистрогийн нэг хэсэг болгон ашиглах боломжтой.
  • Power on Linux-д зориулсан Advance Toolchain: Хамгийн сүүлийн үеийн хөрвүүлэгч, ажиллах үеийн номын сангуудыг агуулсан.

Шилдэг туршлага:

  • RHEL нь тааруулсан үйлчилгээний нэг хэсэг болгон урьдчилан тодорхойлсон тааруулах үйлчилгээ үзүүлдэг.
  • SAP програмуудад зориулсан үйлдлийн системийн тохиргоог хамгийн сүүлийн үеийн SAP тэмдэглэлээс харна уу. Ихэвчлэн тааруулсан нь RHEL-д, SLES-д capture эсвэл sapconf-д ашиглагддаг
  • Давтамжийг PowerVM удирддаг. Лавлагаа: Эрчим хүчний менежмент
  • Power8 Huge Dynamic DMA цонхыг эхлүүлэх нь оролт гаралтын гүйцэтгэлийг сайжруулахад тусалдаг.
  • Эхлэх Power9 24×7-Monitoring нь perf хэрэгсэлтэй нэгдсэн. Системийг бүхэлд нь хянах боломжийг олгодог.
  • Системийн програм хангамжийн түвшин одоогийн байгаа эсэхийг шалгаарай.
  • PowerPC-utils-ийн lparnumascore нь LPAR-ийн одоогийн хамаарлын оноог харуулж байна. DPO нь LPAR ойрын оноог сайжруулахад ашиглаж болно.

Илүү их уншсан:

  • Power for SLES болон зарим гайхалтай боломжууд.
  • Power Systems дээр Linux, Power Systems серверүүд дээр Линукс ашиглаж эхлээрэй
  • Enterprise Linux нийгэмлэг
  • IBM Power системүүд нь өөр өөр хурд, портын тоо бүхий төрөл бүрийн сүлжээний адаптеруудыг дэмждэг.
  • Хэрэв та өмнөх системтэйгээ ижил сүлжээний адаптер ашиглаж байгаа бол эхлээд шинэ систем дээр ижил тохируулгыг ашиглах ёстой.
  • Ихэнх Ethernet адаптерууд нь хамгийн их пакетийн тоог нэмэгдүүлэхийн тулд буферийн хэмжээг өөрчлөх боломжтой олон хүлээн авах болон дамжуулах дарааллыг дэмждэг.
  • Өгөгдмөл дарааллын тохиргоо нь өөр өөр адаптертай өөр бөгөөд үйлчлүүлэгч-серверийн загварт хамгийн их мессежийн хурдад хүрэхэд оновчтой биш байж магадгүй юм.
  • Нэмэлт дараалал ашиглах нь системийн CPU-ийн хэрэглээг нэмэгдүүлэх болно; тиймээс тодорхой ажлын ачаалалд тохирсон дарааллын тохиргоог ашиглах хэрэгтэй.

Өндөр хурдны адаптерийн анхаарах зүйлс

  • 25 GigE ба 100 GigE сүлжээний адаптер бүхий өндөр хурдны сүлжээнүүд нь олон тооны зэрэгцээ утаснууд болон драйверын шинж чанаруудыг тааруулахыг шаарддаг.
  • Хэрэв энэ нь Gen4 адаптер бол тохируулагчийг Gen4 үүрэнд суулгасан эсэхийг шалгаарай.
  • Шахах, шифрлэх, хуулбарлах зэрэг нэмэлт функцууд нь хоцролтыг нэмэгдүүлдэг

AIX дээрх дарааллын тохиргоог өөрчлөх
AIX дахь хүлээн авах/дамжуулах дарааллын тоог өөрчлөх

  •  ifconfig enX салга
  • chdev -l entX -a queues_rx= -a queues_tx=
  • chdev -l enX -a төлөв = дээш

Линукс дээрх дарааллын тохиргоог өөрчлөх
Линукс дахь дарааллын тоог өөрчлөхийн тулд ethtool -L ethX-ийг нэгтгэсэн

AIX дээр дарааллын хэмжээг өөрчлөх

  • ifconfig enX салга
  • chdev -l entX -a rx_max_pkts = -a tx_max_pkts =
  • chdev -l enX -a төлөв = дээш

LinuxP дээр дарааллын хэмжээг өөрчлөх: ethtool -G ethX rx tx

Виртуалчлал

  • Виртуалжуулсан сүлжээг SRIOV, vNIC, vETH хэлбэрээр дэмждэг. Виртуалчлал нь хоцрогдол нэмдэг бөгөөд уугуул I/O-той харьцуулахад дамжуулах чадварыг бууруулдаг.
  • Арын тоног төхөөрөмжөөс гадна VIOS санах ой болон CPU-ийн хэмжээ нь шаардлагатай дамжуулах чадвар болон хариу өгөх хугацааг хангахад хангалттай эсэхийг шалгаарай.
  • IBM PowerVM шилдэг туршлагууд нь VIOS-ийн хэмжээг тогтооход маш тустай
  • Хэрэв та өмнөх системтэйгээ ижил хадгалалтын адаптер ашиглаж байгаа бол эхлээд шинэ систем дээр ижил тохируулгыг ашиглах ёстой. Хэрэв одоо байгаа системээс нэмэлт гүйцэтгэлийг хүсч байвал ердийн тохируулга хийх хэрэгтэй.
  • Хадгалах дэд системүүд нь өмнөх системээс шинэ системд мэдэгдэхүйц ялгаатай бол дараах жагсаалт нь хэрэглээний хурдад сөргөөр нөлөөлж болзошгүй.
  • Шууд хавсаргасан хадгалах сангаас (DAS эсвэл дотоод) Хадгалах бүсийн сүлжээ (SAN) эсвэл Сүлжээнд хавсаргасан хадгалалт (NAS) (эсвэл гадаад санах ой) болгон өөрчлөх нь хоцролтыг нэмэгдүүлэх боломжтой.
  • Шахах, шифрлэх, хуулбарлах зэрэг нэмэлт функцууд нь хоцролтыг нэмэгдүүлэх боломжтой.
  • Хадгалах LUN-ийн тоог багасгах нь шаардлагатай дамжуулалтыг дэмжихэд шаардлагатай серверийн нөөцийг бууруулж чадна.
  • Эдгээр нөлөөллийг ойлгохын тулд шинэ төхөөрөмжүүдийг тааруулах эсвэл тохируулах зааварчилгааг үзнэ үү.'
  • Виртуалчлал нь хоцрогдол нэмдэг бөгөөд уугуул I/O-той харьцуулахад дамжуулах чадварыг бууруулдаг. Арын тоног төхөөрөмжөөс гадна VIOS санах ой болон CPU-г баталгаажуулна уу
  • VIOS дахь өндөр хурдны виртуалчлагдсан адаптер руу шилжихийн тулд CPU болон санах ойн VIOS тохиргоог тохируулах шаардлагатай болно. IBM PowerVM шилдэг туршлагууд нь VIOS-ийн хэмжээг тогтооход маш тустай.

Тохируулах заавар – AIX болон Linux-ийн IBM Мэдлэгийн Төвөөс лавлана уу.

PCIe3 12 ГБ кэш RAID + SAS адаптер Дөрвөн порт 6 Гб x8 адаптер Linux:

AIX:

IBM

PCIe3 x8 2 порт Fiber суваг (32 Гб/с) адаптер

Гүйцэтгэлийн нэмэлт AIX тохируулга:

  • Шилэн сувгаар SCSI (MPIO): олон замт алгоритмыг диск болгонд round_robin болгон тохируулна.
  • Fiber суваг дээрх NVMe: илрүүлэх үе шатанд үүсгэсэн NVMe гаруй Fiber сувгийн динамик хянагч бүрд 7-г хамааруулж болно.

Гүйцэтгэлийн хувьд NVMe адаптер AIX тааруулах
Set нь NVMe төхөөрөмж бүрийн хувьд 8-д хамааруулж болно
IBM-ийн дэвшилтэт оновчлолыг нээлттэй эхийн LLVM дэд бүтэцтэй хослуулсан IBM-ийн дараагийн үеийн C/C++/Fortran хөрвүүлэгчид.

LLVM
C/C++ хэлний илүү их мөнгөн тэмдэгт
Илүү хурдан бүтээх хурд
Олон нийтийн нийтлэг оновчлол
LLVM дээр суурилсан төрөл бүрийн хэрэгслүүд
IBM оновчлол
Power архитектурыг бүрэн ашиглах
Салбартаа тэргүүлэгч дэвшилтэт оновчлолууд
Дэлхийн түвшний дэмжлэг, үйлчилгээ

Бэлэн байдал

  • 60 хоногийн төлбөргүй туршилт: Open XL бүтээгдэхүүний хуудаснаас татаж авна уу
  • Хоёр хоолойт (AAS ба PA) лицензийн уян хатан сонголтоор дамжуулан IBM-ийн дэлхийн түвшний үйлчилгээ & дэмжлэгийг аваарай.
  • Байнгын лиценз (эрх бүхий хэрэглэгч эсвэл нэгэн зэрэг хэрэглэгч бүрт)
  • Сарын лиценз (Виртуал Процессын Цөм тус бүрээр): зорилтот үүл ашиглах тохиолдол, жишээ нь PowerVR жишээн дээр

Санал болгож буй гүйцэтгэлийн тааруулах сонголтууд

Оновчлолын түвшин Хэрэглээний зөвлөмжүүд
-O2 ба -O3 Ердийн эхлэлийн цэг
Холболтын цагийг оновчтой болгох: -flto (C/C++), -qlto (Fortran) Маш олон жижиг функцийн дуудлага бүхий ажлын ачаалалд зориулагдсан
Profile удирдамжтай оновчлол: -fprofile-үүсгэх, -fprofile- ашиглах (C/C++)
-qprofile-үүсгэх, -qprofile- ашиглах (Фортран)
Салбар болон функцийн дуудлага ихтэй ажлын ачаалалд зориулагдсан

Дэлгэрэнгүй мэдээлэл авахыг хүсвэл зочилно уу: https://www.ibm.com/docs/en/openxl-c-and-cpp-aix/17.1.0
https://www.ibm.com/docs/en/openxl-fortran-aix/17.1.0

Open XL 10 бүхий Power17.1.0 архитектурын бүрэн ашиглалт

  • Power10 зааварчилгааг ашиглан код үүсгэх, мөн Power10-ийн оновчлолыг автоматаар тааруулах шинэ хөрвүүлэгчийн сонголт '–mcpu=pwr10'
  • Power10-ийн шинэ функцүүдийн түгжээг тайлах шинэ суурилуулсан функцууд, тухайлбал матрицын үржүүлэх хурдасгуур (MMA)
  • Power10-д шинэ MASS SIMD болон вектор сангууд нэмэгдсэн. MASS номын сангийн бүх функцууд (SIMD, вектор, скаляр) Power10-д тохируулагдсан (мөн Power9).

Жич: Өмнөх Power процессорууд дээр ажиллахаар XL Compilers-ийн өмнөх хувилбаруудыг (жишээ нь, XL 16.1.0) эмхэтгэсэн программууд Power10 дээр нийцтэй ажиллах болно.
AIX дээр хоёртын нийцтэй байдал
Жич: AIX 16.1.0-д зориулсан XL C/C++ нь xlC-ээр бүтээгдсэн C++ объектуудын LLVM төслийн Clang урд хэсгийг ашигладаг xlclang++ шинэ дуудлагыг аль хэдийн нэвтрүүлсэн.

  • AIX (IBM-ийн өөрийн нүүрэн тал дээр суурилсан) нь AIX-д зориулсан xlclang++ 16.1.0-ээр бүтээгдсэн C++ объектуудтай хоёртын хувилбарт нийцдэггүй.
  • AIX-д зориулсан xlclang++ 16.1.0-ээр бүтээгдсэн C++ объектууд нь AIX 17.1.0-д зориулсан шинэ Open XL C/C++-д хоёртын хувилбарт нийцтэй байх болно.
  • C-ийн нийцтэй байдал нь бүх AIX хөрвүүлэгчид хадгалагддаг (AIX-ийн өмнөх XL хувилбарууд, AIX 17.1.0-д зориулсан Open XL C/C++)
  • Fortran-ийн нийцтэй байдал нь AIX-ийн өмнөх XLF хувилбар ба AIX 17.1.0-д зориулсан Open XL Fortran-ийн хооронд хадгалагдана.

Бэлэн байдал
GCC хөрвүүлэгчийг Enterprise Linux-ийн бүх түгээлт болон бусад хувилбарууд дээр ашиглах боломжтой
AIX.

  • Суурилуулсан GCC хувилбар нь RHEL 8.4 дээр 8, SLES 7.4 дээр 15 байна. RHEL 9 нь GCC 11.2-г хүргэх төлөвтэй байна.
  • Түгээлтийн өгөгдмөл хөрвүүлэгчид Power10-ийг дэмжихэд хэтэрхий хуучирсан үед GCC-ийн сүүлийн үеийн хувилбарыг олж авах хэд хэдэн арга бий.
  • Red Hat нь энэ зорилгоор GCC Toolset [1]-ийг дэмждэг.
  • SUSE нь Хөгжлийн хэрэгслүүдийн модулийг хангадаг. [2]
  • IBM нь Advance Toolchain-ээр дамжуулан хамгийн сүүлийн үеийн хөрвүүлэгч болон номын сангуудыг хангадаг. [3]

IBM Advance Toolchain

  • Advance Toolchain нь хөрвүүлэгч, дибаг хийгч болон бусад хэрэгслүүдийн хамт Power-optimized системийн сангуудыг хангадаг.
  • Advance Toolchain ашиглан барилгын код нь хамгийн сүүлийн үеийн процессорууд дээр хамгийн оновчтой кодыг гаргаж чадна.

Хэлнүүд

  • C (GCC), C++ (g++), Fortran (gfortran) зэрэг Go (GCC), D (GDC), Ada (gnat) зэрэг бусад.
  • Зөвхөн GCC, g++ болон gfortran-г ихэвчлэн анхдагчаар суулгадаг.
  • Golang хөрвүүлэгч [4] нь Power дээр Go програмуудыг бүтээхэд илүүд үздэг хувилбар юм.

Power10 дээрх нийцтэй байдал ба шинэ боломжууд

  •  POWER8 эсвэл POWER9 процессорууд дээр ажиллахаар GCC-ийн өмнөх хувилбаруудыг нэгтгэсэн програмууд нь Power10 процессорууд дээр нийцтэй ажиллах болно.
  •  Power ISA 11.2 болон Power3.1 процессоруудад хэрэгжсэн бүх шинэ боломжуудыг ашиглахын тулд GCC 10 буюу түүнээс хойшхи хувилбарыг ашиглахыг зөвлөж байна.
  • GCC 11.2 нь Power10 процессороор хангагдсан матрицыг үржүүлэхэд туслах (MMA) функцэд хандах боломжийг олгодог. [5]
  • MMA програмуудыг GCC, LLVM болон Open XL хөрвүүлэгчийн аль нэгийг ашиглан эмхэтгэх боломжтой бөгөөд хэрэв та хангалттай сүүлийн үеийн хувилбаруудыг ашигласан бол.

IBM-ийн санал болгож буй болон дэмжигдсэн хөрвүүлэгчийн тугууд [6]

-O3 эсвэл -Зүүн Түрэмгий оновчлол. -East нь үндсэндээ -O3 -fast-math-тай дүйцэхүйц бөгөөд энэ нь мөн IEEE хөвөгч цэгийн арифметикийн хязгаарлалтыг зөөлрүүлдэг.
-mcpu=powern Power процессорын дэмждэг зааварчилгааг ашиглан эмхэтгэ. Жишээ ньampЗөвхөн Power10 дээр байгаа зааврыг ашиглахын тулд -mcpu=power10-г сонгоно уу.
Нэмэлт. "Холбоос цаг" оновчтой болгох. Энэ нь дуудагч болон дуудагдсан функцүүд өөр өөр эмхэтгэлийн нэгжид байдаг функцийн дуудлагын кодыг оновчтой болгож, гүйцэтгэлийг ихээхэн нэмэгдүүлэх боломжтой.
- гогцоонуудыг задлах Нэмэлт. Хөрвүүлэгчийн ердийнхөөс илүү түрэмгий давталтын давхаргыг гүйцэтгэнэ. Ерөнхийдөө та үүнийг орхих хэрэгтэй, гэхдээ зарим код дээр энэ нь илүү сайн гүйцэтгэлийг хангаж чадна.

Жич:
Хэдийгээр -mcpu=power10 нь GCC 10.3-т дэмжигдсэн боловч өмнөх хөрвүүлэгчид Power11.2 процессоруудад хэрэгжсэн функц бүрийг дэмждэггүй тул GCC 10-г илүүд үздэг. Мөн -mcpu=power10 ашиглан үүсгэсэн объектууд POWER9 болон өмнөх процессорууд дээр ажиллахгүй! Гэсэн хэдий ч процессорын янз бүрийн хувилбаруудад оновчтой код үүсгэх арга замууд байдаг. [7] [1] Red Hat: GCC Toolset ашиглах. https://access.redhat.com/documentation/enus/red_hat_enterprise_linux/8/html/developing_c_and_cpp_applications_in_rhel_8/gcc-toolset_toolsets.
[2] SUSE: Хөгжлийн хэрэгслийн модулийг ойлгох. https://www.suse.com/c/suse-linux-essentialswhere-are-the-compilers-understanding-the-development-tools-module/.
[3] IBM Power Systems дээрх Linux-д зориулсан Advance Toolchain. https://www.ibm.com/support/pages/advancetoolchain-linux-power.
[4] Go Language. https://golang.org. [5] Матриц-Үржүүлэх туслах шилдэг туршлагын гарын авлага. http://www.redbooks.ibm.com/redpapers/pdfs/redp5612.pdf
[6] GNU хөрвүүлэгчийн цуглуулгыг ашиглах. https://gcc.gnu.org/onlinedocs/gcc.pdf
[7] GNUIndirect Function Mechanism ашиглан зорилтот оновчлол. https://developer.ibm.com/tutorials/optimized-libraries-for-linux-on-power/#target-specific-optimization-
© 2021 gnu-шууд бус функцийн механизмтай IBM корпораци.
Java програмууд нь ямар ч саадгүй дэвшилттэй байх боломжтойtagP10 горимд ажиллаж байгаа үйлдлийн системүүд дээрх шинэ P10 ISA функцүүдийн e нь доор жагсаасан буюу түүнээс дээшхи Java үйлдлийн үеийн хувилбаруудыг ашиглан:
Java 8

  •  IBM SDK 8 SR6 FP36
  • IBM Semeru Runtime Open Edition 8u302: openj9-0.27.1

Java 11

  • IBM Semeru Runtime Certified Edition 11.0.12.1: openj9-0.27.1
  • IBM Semeru Runtime Open Edition 11.0.12.1: openj9-0.27.1

Java 17 (драйверууд хараахан байхгүй байж магадгүй)

  •  IBM Semeru Runtime Certified Edition 17: openj9-0.28
  • IBM Semeru Runtime Open Edition 17: openj9-0.28
  • OpenJDK 17

Гүйцэтгэлийн тааруулах лавлагаа:
IBM WebSphere Application Server Performance Cookbook
Хуудасны хэмжээ
AIX дээрх ихэнх Oracle мэдээллийн сангийн ерөнхий зөвлөмж нь SGA-д 64MB хуудасны хэмжээг биш харин 16KB хуудасны хэмжээг ашиглах явдал юм. Ихэвчлэн 64 KB хуудас бараг ижил хэмжээтэй байдаг
тусгай удирдлагагүйгээр 16 MB хуудас зэрэг гүйцэтгэлийн ашиг тус.
TNS сонсогч
Oracle 12.1 өгөгдлийн сан болон түүнээс хойшхи хувилбарууд нь текст, өгөгдөл, стекийн хувьд 64к хуудас ашиглах болно. Гэсэн хэдий ч TNSLISTENER-ийн хувьд энэ нь текст, өгөгдөл, стекийн хувьд 4к хуудсыг ашигладаг хэвээр байна. руу
сонсогчдод зориулж 64к хуудсыг идэвхжүүлэх нь сонсогч процессыг эхлүүлэхийн өмнө экспортын командыг ашигладаг. Сонсогч дуусдаг ASM-д суурилсан орчинд ажиллаж байгааг анхаарна уу
ORACLE_HOME биш GRID_HOME.
"Stricly setenv" командын бичиг баримтыг 12.1 буюу түүнээс хойшхи хувилбаруудад өөрчилсөн. -t эсвэл -T нь -env эсвэл -env-ийн оронд хасагдсан. Oracle Listener орчинд тохируулж экспортлох:
– LDR_CNTRL=DATAPSIZE=64K@TEXTPSIZE=64K@STACKPSIZE=64K - VMM_CNTRL=vmm_fork_policy=COR ('Унших дээр хуулах' командыг нэмнэ)
Хуваалцсан синтакс
LDR_CNTRL=SHARED_SYMTAB=Y тохиргоог 11.2.0.4 болон түүнээс хойшхи хувилбаруудад тусгайлан тохируулах шаардлагагүй. Хөрвүүлэгчийн холбоосын сонголтууд нь энэ тохиргоонд анхаарал хандуулдаг бөгөөд тусгайлан тохируулах шаардлагагүй болно. LDR_CNTRL=SHARED_SYMTAB=Y-г 12c болон түүнээс хойшхи хувилбаруудад тусгайлан тохируулахыг зөвлөдөггүй.
Виртуал процессорыг нугалах
Энэ нь процессорыг нугалах идэвхжсэн LPAR ашиглах үед RAC орчинд чухал тохиргоо юм. Хэрэв энэ тохиргоог тохируулахгүй бол мэдээллийн сангийн ажлын ачаалал багатай нөхцөлд RAC зангилааг нүүлгэх эрсдэл өндөр байна. Scheda -p -o vpm_xvcpus=2
VIOS & RAC харилцан холболт
Кластерын цаг хугацааны мэдрэмжтэй урсгалыг хангалттай зурвасын өргөнөөр хангахын тулд хамгийн багадаа тусгай зориулалтын 10G (өөрөөр хэлбэл 10G Ethernet адаптер) холболтыг санал болгож байна. RAC кластерын траффик – харилцан холболтын траффик нь зориулагдан хуваагдах ёсгүй. Харилцан холболтыг хуваалцах нь цаг хугацааны хоцрогдол үүсгэж, зангилаа гацах/нүүлгэх асуудалд хүргэдэг.
Сүлжээний гүйцэтгэл
Энэ нь өгөгдмөл нь 0 хэвээр байгаа хэдий ч AIX дээрх Oracle-д зориулсан сүлжээний тохиргооны урт хугацааны санал юм. rfc1323=1-ийн TCP тохиргоо
Илүү дэлгэрэнгүй мэдээлэл
Холбоосыг үзнэ үү: POWER9 зэрэг Power Systems дээр AIX ажиллаж байгаа одоогийн Oracle Database хувилбаруудын тогтвортой байдал, гүйцэтгэлийг удирдах нь
https://www.ibm.com/support/pages/node/6355543

Генерал

  • SMT8 горимыг ашиглах
  • Зориулалтын CPU LPAR ашиглах

Db2 агуулах

  • Бүх зангилааны хооронд өндөр хурдны хувийн сүлжээ байгаа эсэхийг шалгаарай
  • MLN тохиргоог сокет бүрт нэг зангилаагаар хязгаарлах

CP4D

  • OCP зангилааны сүлжээнд PCIe4-г ашиглаарай
  • OCP 4.8-аас өмнө цөмийн параметрийг slub_max_order=0 гэж тохируулна уу

Db2 шилдэг туршлага
https://www.ibm.com/docs/en/db2/11.5?topic=overviews-db2-best-practices

Сүлжээ

  • Под сүлжээний хувьд, хэрэв LPM шаардлагагүй бол эх SRIOV дээр суурилсан хувийн сүлжээг, үгүй ​​бол VNIC ашиглана уу.
  • Өндөр зурвасын өргөн эсвэл бага хоцролт шаарддаг програмуудын хувьд VF-ийг шууд pod-д хуваарилахын тулд SR-IOV сүлжээний операторыг ашиглана уу.
  • Бага хугацаа шаардагдах үйлчилгээний хувьд одоо байгаа маршрутын өгөгдмөл завсарлагыг тохируулна уу
  • OCP-ийн кластер сүлжээний хүссэн MTU хэмжээг тохируулна уу

Үйлдлийн систем

  • CoreOS-ийн суулгацын дараах өөрчлөлтүүдийн доторх u-хязгаарыг нэмэгдүүлэх талаар бодож үзээрэй
  • Power платформын OCP4.8-ийг Power дээр суулгахад тавигдах хамгийн бага OCP суулгах шаардлагыг үзнэ үү

Байрлуулалт

  • Аппликейшнүүдийг байршуулахдаа нэгэн зэрэг олон урсгалт (SMT) эсвэл гипер урсгалыг идэвхжүүлээгүй үед нэг vCPU нь нэг физик цөмтэй тэнцэнэ гэдгийг анхаарна уу. SMT идэвхжсэн үед VCPU нь техник хангамжийн хэлхээтэй тэнцэнэ.
  • Ажилчид болон мастер зангилааны хамгийн бага хэмжээг тогтоох зааварчилгааг үзнэ үү
  • Баригдсан контейнер зургийн бүртгэлд тусдаа зориулалтын хадгалах санг хуваарилах
  • OpenShift Контейнер Платформын бүрэлдэхүүн хэсгүүдэд өгөгдөл бичдэг OCP-ийн үндсэн лавлах сангуудын хэмжээг тогтоох дараах удирдамжийг ашиглана уу.

Баримт бичиг / нөөц

IBM Power10 гүйцэтгэл [pdf] Хэрэглэгчийн гарын авлага
Power10, Performance, Power10 Performance

Лавлагаа

Сэтгэгдэл үлдээгээрэй

Таны имэйл хаягийг нийтлэхгүй. Шаардлагатай талбаруудыг тэмдэглэсэн *