Power10 कार्यसम्पादन द्रुत सुरुवात गाइडहरू
(Power10 QSGs)
नोभेम्बर २०२३

न्यूनतम मेमोरी

  • प्रत्येक प्रोसेसर सकेटको लागि, 8 DIMM मध्ये न्यूनतम 16 भरिएको छ।
  • नोडमा, DIMM हरूका लागि 32 मध्ये न्यूनतम 64 भरिएको छ।
  • 4-नोड प्रणालीमा, 128 DIMM हरू मध्ये न्यूनतम 256 भरिएको छ।

DDIMM प्लग नियमहरू

  •  अनुमति दिइएको न्यूनतम मेमोरी पूरा गर्नुहोस् (प्रत्येक प्रोसेसर सकेटमा 8 DIMM हरू मध्ये न्यूनतम 16 भरिएको छ)
  • प्रत्येक प्रोसेसर अन्तर्गत सबै DIMM हरू समान क्षमता हुनुपर्छ
  • सुविधा अपग्रेडहरू 4 DDIMM को वृद्धिमा प्रस्ताव गरिनेछ, जसमा सबैको समान क्षमता छ।
  • दिइएको प्रोसेसर मोड्युलमा जडान गरिएका साइटहरूमा DDIMM को प्लगइनहरूको मात्र मान्य संख्या 8 वा 12 वा 16 हो।

मेमोरी प्रदर्शन

  • मेमोरीको मात्रा थप DDIMM स्लटहरूमा फैलिएकोले प्रणालीको कार्यसम्पादनमा सुधार हुन्छ। पूर्वका लागिampले, यदि नोडमा 1TB आवश्यक छ भने, 64 x 32GB DIMM हरू हुनुभन्दा 32 x 64GB DIMM हुनु राम्रो हुन्छ।
  • सबै एउटै साइजका DIMM हरू प्लग गर्नाले उच्चतम प्रदर्शन प्रदान गर्नेछ
  • अधिक क्वाडहरू एकअर्कासँग मेल खाँदा प्रणाली प्रदर्शनमा सुधार हुन्छ
  • अधिक प्रोसेसर DDIMM हरू एकअर्कासँग मेल खाँदा प्रणाली कार्यसम्पादनमा सुधार हुन्छ
  • प्रणाली कार्यसम्पादन बहु-दराज प्रणालीमा सुधार हुन्छ यदि दराजहरू बीचको मेमोरी क्षमता सन्तुलित छ।

मेमोरी ब्यान्डविथ

DDIMM क्षमता सैद्धान्तिक अधिकतम ब्यान्डविथ
32GB, 64 GB (DDR4 @ 3200 Mbps) २५ GB/s
128GB, 256 GB (DDR4 @ 2933 Mbps) २५ GB/s

सारांश

  • सबै भन्दा राम्रो सम्भावित कार्यसम्पादनको लागि, यो सामान्यतया सिफारिस गरिन्छ कि मेमोरी सबै प्रणाली नोड ड्रअरहरू र प्रणालीमा सबै प्रोसेसर सकेटहरूमा समान रूपमा स्थापना गर्नुहोस्। स्थापित प्रणाली प्लानर कार्डहरूमा मेमोरी सन्तुलनले मेमोरी पहुँचलाई निरन्तर रूपमा सक्षम बनाउँछ र सामान्यतया तपाईंको कन्फिगरेसनको लागि राम्रो प्रदर्शनमा परिणाम दिन्छ।
  • यद्यपि सबै मेमोरी स्लटहरू भरेर अधिकतम मेमोरी ब्यान्डविथ हासिल गरिन्छ, प्रारम्भिक प्रणाली अर्डरको समयमा कुन मेमोरी फिचर साइज प्रयोग गर्ने भन्ने निर्णय गर्दा भविष्यमा मेमोरी थप्ने योजनाहरू विचार गर्नुपर्छ।

P10 कम्प्युट र MMA वास्तुकला

  • 2x ब्यान्डविथ मिल्दो SIMD*
  • 8 स्वतन्त्र स्थिर र फ्लोट SIMD इन्जिन प्रति कोर
  • 4 - 32x म्याट्रिक्स गणित एक्सेलेरेशन*
  • 4 512 बिट इन्जिन प्रति कोर = 2048b परिणाम / चक्र
  • एकल, दोहोरो र घटाइएको परिशुद्धताको म्याट्रिक्स गणित बाह्य उत्पादनहरू।
  • MMA वास्तुकला समर्थन POWER ISA v3.1 मा प्रस्तुत गरियो
  • SP, DP, BF16, HP, Int-16, Int-8 र Int-4 परिशुद्धता स्तरहरू समर्थन गर्दछ।

P10 MMAA अनुप्रयोगहरू र कार्यभार एकीकरण

  • घना रेखीय बीजगणित गणनाहरू, म्याट्रिक्स गुणनहरू, कन्भोलुसनहरू, FFT सँग ML र HPC अनुप्रयोगहरू MMA मार्फत द्रुत गर्न सकिन्छ।
  • GCC संस्करण >= 10 र LLVM संस्करण >=12 ले MMA लाई बिल्ट-इनहरू मार्फत समर्थन गर्दछ।
  • OpenBLAS, IBM ESSL र Eigen पुस्तकालयहरू पहिले नै P10 को लागि MMA निर्देशनहरूसँग अनुकूलित छन्।
  • माथिको BLAS पुस्तकालयहरू मार्फत उद्यम अनुप्रयोगहरू, ML फ्रेमवर्कहरू, र खुला समुदाय प्याकेजहरूको लागि MMA को सजिलो एकीकरण।

PowerPC म्याट्रिक्स-मल्टिपली असिस्ट बिल्ट-इन कार्यहरू https://gcc.gnu.org/onlinedocs/gcc/PowerPC-Matrix-Multiply-Assist-Built-in-Functions.html
Matrix-Multiply Assist Best Practices Guide  https://www.redbooks.ibm.com/Redbooks.nsf/RedpieceAbstracts/redp5612.html?Openभर्चुअल प्रोसेसरहरू

  • सबै साझा विभाजनहरूको हकदार कोरहरूको योग साझा पूलमा कोरहरूको संख्या भन्दा बढी हुन सक्दैन।
  • सुनिश्चित गर्नुहोस् कि फ्रेममा कुनै पनि साझा विभाजनहरूको कन्फिगर गरिएको भर्चुअल प्रोसेसरहरूको संख्या साझा पूलमा कोरहरूको संख्या भन्दा बढी छैन।
  • शिखर क्षमता माग कायम राख्न साझा विभाजनको लागि भर्चुअल प्रोसेसरहरूको संख्या कन्फिगर गर्नुहोस्
  • राम्रो प्रदर्शनको लागि त्यो विभाजनको औसत उपयोग गर्न साझा विभाजनको लागि हकदार कोरहरूको संख्या कन्फिगर गर्नुहोस्।
  • राम्रो मेमोरी र CPU आत्मीयता सुनिश्चित गर्न (भर्चुअल प्रोसेसरको अनावश्यक पूर्वाग्रहहरू बेवास्ता गर्नुहोस्), साझा पूलमा कोरहरूको संख्याको नजिक सबै साझा विभाजनहरूको हकदार कोरहरूको योग सुनिश्चित गर्नुहोस्।

प्रोसेसर अनुकूलता मोड

  • AIX का लागि २ प्रोसेसर अनुकूलता मोडहरू उपलब्ध छन्: POWER2 र POWER9_base। पूर्वनिर्धारित POWER9_base मोड हो।
  • लिनक्सका लागि २ प्रोसेसर अनुकूलता मोडहरू उपलब्ध छन्: POWER2 र POWER9 मोड। पूर्वनिर्धारित POWER10 मोड हो।
  • LPM विभाजन पछि, प्रोसेसर अनुकूलता मोड परिवर्तन गर्दा पावर चक्र आवश्यक छ

प्रोसेसर तह विचारहरू

  • Power9 मा AIX चलिरहेको साझा विभाजनको लागि, पूर्वनिर्धारित vpm_throughput_mode = 0, Power10 मा, पूर्वनिर्धारित vpm_throughput_mode = 2। कार्यभारहरूका लागि लामो-समय चलिरहेको कार्यहरू छन्, यसले सम्भावित रूपमा मुख्य उपयोग घटाउन मद्दत गर्न सक्छ।
  • AIX चलिरहेको समर्पित विभाजनको लागि, Power0 र Power9 दुवैमा पूर्वनिर्धारित vpm_throughput_mode = 10।

LPAR पृष्ठ तालिका आकार विचारहरू

• Radix पृष्ठ तालिका Power10 चलिरहेको Linux मा सुरु गर्न समर्थित छ। यसले सम्भावित रूपमा कार्यभार प्रदर्शन सुधार गर्न सक्छ।

सन्दर्भ:
IBM POWER प्रणालीहरूमा कार्यभार माइग्रेट गर्नका लागि संकेत र सुझावहरू: https://www.ibm.com/downloads/cas/39XWR7YM
IBM POWERVirtualizationBest PracticesGuide:  https://www.ibm.com/downloads/cas/JVGZA8RW

OS स्तर हालको छ भनी सुनिश्चित गर्नुहोस्
फिक्स सेन्ट्रलले AIX, IBM i, VIOS, Linux, HMC र F/W को लागि नवीनतम अद्यावधिकहरू प्रदान गर्दछ। यसका अतिरिक्त, FLRT उपकरणले प्रत्येक H/W मोडेलको लागि सिफारिस गरिएका स्तरहरू प्रदान गर्दछ। तपाइँको प्रणाली अप टु डेट कायम राख्न यी उपकरणहरू प्रयोग गर्नुहोस्। यदि तपाइँ सिफारिस गरिएको स्तरमा जान सक्नुहुन्न भने, IBM POWER10 प्रोसेसर-आधारित प्रणाली कागजातमा वर्कलोड माइग्रेट गर्नका लागि संकेत र सुझावहरूको ज्ञात मुद्दा खण्डलाई सन्दर्भ गर्नुहोस्।
AIX CPU उपयोगिता
POWER10 मा, AIX OS प्रणाली समर्पित प्रोसेसरहरूसँग चल्दा उच्च CPU प्रयोगमा उत्कृष्ट कच्चा थ्रुपुटको लागि अनुकूलित हुन्छ। साझा प्रोसेसरहरूसँग चल्दा, AIX OS प्रणाली CPU प्रयोग (pc) कम गर्न अनुकूलित हुन्छ। यदि ग्राहकले CPU उपयोग (pc) लाई थप घटाउन आवश्यक छ भने, कार्यभार ट्युन गर्न र कच्चा थ्रुपुट बनाम CPU उपयोगको फाइदाहरूको मूल्याङ्कन गर्न तालिका ट्यून गर्न मिल्ने pm_throughput_mode प्रयोग गर्नुहोस्।
NX GZIP
एडभान लिनtagPOWER10 प्रणालीहरूमा NX GZIP प्रवेगको e LPAR POWER9 अनुकूलता मोड (POWER9_base मोड होइन) वा POWER10 अनुकूलता मोडमा हुनुपर्छ।
आईबीएम आई
सुनिश्चित गर्नुहोस् कि IBM I अपरेटिङ सिस्टम स्तर हालको छ। फिक्स सेन्ट्रलले IBM I, VIOS, HMC, र फर्मवेयरका लागि नवीनतम अद्यावधिकहरू प्रदान गर्दछ। https://www.ibm.com/support/fixcentral/
फर्मवेयर
सुनिश्चित गर्नुहोस् कि प्रणाली फर्मवेयर स्तर हालको छ। फिक्स सेन्ट्रलले IBM I, VIOS, HMC, र फर्मवेयरका लागि नवीनतम अद्यावधिकहरू प्रदान गर्दछ। https://www.ibm.com/support/fixcentral/
मेमोरी DIMM हरू
उचित मेमोरी प्लग-इन नियमहरू पालना गर्नुहोस्। यदि सम्भव छ भने, मेमोरी DIMM स्लटहरू पूर्ण रूपमा भर्नुहोस् र समान आकारको मेमोरी DIMM हरू प्रयोग गर्नुहोस्।
प्रोसेसर SMT स्तर
पूरा एडभान लिनtagPower10 CPU को कार्यसम्पादनमा, हामी ग्राहकहरूलाई IBM i पूर्वनिर्धारित प्रोसेसर मल्टिटास्किङ सेटिङहरू प्रयोग गर्न सिफारिस गर्छौं, जसले SMT लाई अधिकतम बनाउँछ।
LPAR कन्फिगरेसनको लागि स्तर।
विभाजन नियुक्ति
हालको FW स्तरहरूले विभाजनहरूको इष्टतम प्लेसमेन्ट सुनिश्चित गर्दछ। यद्यपि, CEC मा विभाजनहरूमा बारम्बार DLPAR सञ्चालनहरू कार्यान्वयन गरिन्छ भने, यो DPO प्रयोग गर्न सिफारिस गरिन्छ।
नियुक्ति अनुकूलन गर्न।
भर्चुअल प्रोसेसर - साझा बनाम समर्पित प्रोसेसर
इष्टतम विभाजन स्तर प्रदर्शनको लागि समर्पित प्रोसेसरहरू प्रयोग गर्नुहोस्।
ऊर्जा स्केल
उत्कृष्ट CPU प्रोसेसर गतिको लागि, सुनिश्चित गर्नुहोस् कि अधिकतम प्रदर्शन सेट गरिएको छ (IBM Power E1080 को लागि पूर्वनिर्धारित)। यो सेटिङ ASMI मा कन्फिगर योग्य छ।
भण्डारण र नेटवर्किङ I/O
VIOS ले लचिलो भण्डारण र नेटवर्किङ कार्यक्षमता प्रदान गर्दछ। उत्कृष्ट सम्भावित कार्यसम्पादनको लागि, I/O को लागि नेटिभ IBM i इन्टरफेसहरू प्रयोग गर्नुहोस्।
थप व्यापक जानकारी
लिङ्कलाई सन्दर्भ गर्नुहोस्: IBM I on Power - Performance FAQ https://www.ibm.com/downloads/cas/QWXA9XKN

इन्टरप्राइज लिनक्स अपरेटिङ सिस्टम (OS) तपाईंको हाइब्रिड क्लाउड इन्फ्रास्ट्रक्चर र स्केल-अप इन्टरप्राइज सफ्टवेयर समाधानहरूको लागि ठोस आधार हो। भर्खरका रिलीजहरू उत्कृष्ट-इन-क्लास Power10 इन्टरप्राइज प्रणालीहरूको लागि अनुकूलित छन्
शक्ति १

  • SLES15SP3, RHEL8.4 समर्थन Power10 नेटिभ मोड
  • पुरानो पुस्ता पावर प्रणाली (P9 र P8) बाट ग्राहकहरूलाई माइग्रेट गर्न अनुमति दिन कम्पास-मोड समर्थन।
  • Power10 मोडमा पूर्वनिर्धारित रेडिक्स अनुवाद समर्थन
  • गुप्तिकरण कार्यसम्पादनमा उल्लेखनीय सुधार

लिनक्स + PowerVM

  • PowerVM इन्टरप्राइज सुविधाहरूको लागि समर्थन: LPM, साझा CPU पूलहरू, DLPAR
  • नवीन समाधानहरू: 4PB भर्चुअल ठेगाना स्पेसको साथ SAP HANA भविष्यको अनुप्रयोग वृद्धि
  • डेटा पुन: लोड गर्न समय घटाउनुहोस्: SAP HANA को लागि भर्चुअल PMEM समर्थन
  • विश्व-स्तरीय समर्थन र सेवा

समर्थित distros:

  • Power9 बाट मात्र RedHat र SUSE लाई PowerVM विभाजनहरूमा समर्थन गरिन्छ
  • पुरानो पुस्ता HW कभर गर्ने डिस्ट्रो समर्थन म्याट्रिक्समा विस्तृत जानकारी

LPM समर्थन:

  • पुरानो जेनरेशन पावर प्रणालीहरूबाट लगभग शून्य एप्लिकेसन डाउनटाइमको साथ लिनक्स तार्किक विभाजनहरू सार्नुहोस्
  • सन्दर्भ: LPM गाइड र सम्बन्धित जानकारी

पावर विशिष्ट प्याकेजहरू:

  • PowerPC-utils प्याकेज: IBM PowerPC LPARs को मर्मतका लागि उपयोगिताहरू समावेश गर्दछ। डिस्ट्रो को भाग को रूप मा उपलब्ध।
  • पावरमा लिनक्सका लागि अग्रिम टूलचेन: नवीनतम कम्पाइलरहरू, रनटाइम पुस्तकालयहरू समावेश गर्दछ।

उत्तम अभ्यासहरू:

  • RHEL ले ट्युन गरिएको सेवाको भागको रूपमा पूर्वनिर्धारित ट्युनिङहरू प्रदान गर्दछ।
  • SAP अनुप्रयोगहरूका लागि सिफारिस गरिएका OS सेटिङहरूको लागि नवीनतम SAP नोटहरू हेर्नुहोस्। सामान्यतया ट्युन गरिएको RHEL मा प्रयोग गरिन्छ र SLES मा क्याप्चर वा sapconf
  • आवृत्ति PowerVM द्वारा व्यवस्थित गरिएको छ। सन्दर्भ: ऊर्जा व्यवस्थापन
  • Power8 विशाल गतिशील DMA विन्डो सुरु गर्दा I/O कार्यसम्पादन सुधार गर्न मद्दत गर्दछ।
  • Starting Power9 24×7-Monitoring perf उपकरणसँग एकीकृत छ। सम्पूर्ण प्रणाली निगरानी गर्न अनुमति दिन्छ।
  • सुनिश्चित गर्नुहोस् कि प्रणाली फर्मवेयर स्तर हालको छ।
  • PowerPC-utils बाट lparnumascore ले LPAR को हालको सम्बद्धता स्कोर देखाउँछ। DPO लाई LPAR आत्मीयता स्कोर सुधार गर्न प्रयोग गर्न सकिन्छ।

थप पढ्नुहोस्:

  • पावर र केही आकर्षक सुविधाहरूको लागि SLES।
  • पावर प्रणालीहरूमा लिनक्स, पावर प्रणाली सर्भरहरूमा लिनक्सको साथ सुरु गर्नुहोस्
  • इन्टरप्राइज लिनक्स समुदाय
  • IBM पावर प्रणालीहरूले विभिन्न गति र पोर्टहरूको संख्याहरूको विभिन्न नेटवर्क एडेप्टरहरूलाई समर्थन गर्दछ।
  • यदि तपाइँ तपाइँको अघिल्लो प्रणाली जस्तै नेटवर्क एडेप्टरहरू प्रयोग गर्दै हुनुहुन्छ भने, सुरुमा, नयाँ प्रणालीमा उही ट्युनिङ प्रयोग गर्नुपर्छ।
  • धेरै जसो इथरनेट एडेप्टरहरूले बहु प्राप्त र प्रसारण लाइनहरूलाई समर्थन गर्दछ जसको बफर साइज अधिकतम प्याकेट गणना बढाउन भिन्न हुन सक्छ।
  • पूर्वनिर्धारित लाम सेटिङहरू विभिन्न एडेप्टरहरूसँग फरक हुन्छन् र ग्राहक-सर्भर मोडेलमा अधिकतम सन्देश दरहरू प्राप्त गर्न इष्टतम नहुन सक्छ।
  • थप लामहरू प्रयोग गर्दा प्रणालीको CPU प्रयोग बढ्नेछ; त्यसैले एक विशिष्ट कार्यभारको लागि इष्टतम लाम सेटिङ प्रयोग गर्नुपर्छ।

उच्च गति एडाप्टर विचारहरू

  • 25 GigE र 100 GigE नेटवर्क एडेप्टरहरू भएका उच्च गति नेटवर्कहरूलाई धेरै समानान्तर थ्रेडहरू र ड्राइभर विशेषताहरूको ट्युनिङ चाहिन्छ।
  • यदि यो Gen4 एडाप्टर हो भने, निश्चित गर्नुहोस् कि अनुकूलन Gen4 स्लटमा बसेको छ।
  • कम्प्रेसन, एन्क्रिप्शन, र नक्कल जस्ता थप कार्यहरूले विलम्बता थप्न सक्छ

AIX मा लाम सेटिङहरू परिवर्तन गर्दै
AIX मा प्राप्त/प्रसारण लाइनहरूको संख्या परिवर्तन गर्न

  •  ifconfig enX तल अलग गर्नुहोस्
  • chdev -l entX -a queues_rx= -a quees_tx=
  • chdev -l enX -a state=up

लिनक्समा लाम सेटिङहरू परिवर्तन गर्दै
लिनक्स ethtool मा लाम संख्या परिवर्तन गर्न -L ethX संयुक्त

AIX मा लाम आकार परिवर्तन गर्दै

  • ifconfig enX तल अलग गर्नुहोस्
  • chdev -l entX -a rx_max_pkts = -a tx_max_pkts =
  • chdev -l enX -a state=up

LinuxP मा लाम आकार परिवर्तन गर्दै: ethtool -G ethX rx tx

भर्चुअलाइजेशन

  • भर्चुअलाइज्ड नेटवर्किङ SRIOV, vNIC, vETH को रूपमा समर्थित छ। भर्चुअलाइजेशनले विलम्बता थप्छ र नेटिभ I/O को तुलनामा थ्रुपुट कम गर्न सक्छ।
  • ब्याकएन्ड हार्डवेयर बाहेक, आवश्यक थ्रुपुट र प्रतिक्रिया समयहरू प्रदान गर्न VIOS मेमोरी र CPU मात्राहरू पर्याप्त छन् भनी सुनिश्चित गर्नुहोस्।
  • IBM PowerVM उत्तम अभ्यासहरू VIOS साइजिङमा धेरै उपयोगी हुन सक्छ
  • यदि तपाइँ तपाइँको अघिल्लो प्रणाली जस्तै भण्डारण एडेप्टरहरू प्रयोग गर्दै हुनुहुन्छ भने, सुरुमा, नयाँ प्रणालीमा उही ट्युनिङ प्रयोग गरिनु पर्छ। यदि अवस्थित प्रणालीबाट अतिरिक्त प्रदर्शन चाहिन्छ भने, त्यसपछि सामान्य ट्युनिङ प्रदर्शन गर्नुपर्छ।
  • यदि भण्डारण उपप्रणालीहरू पहिलेको प्रणाली भन्दा नयाँ प्रणालीमा प्रशंसनीय रूपमा फरक छन् भने, निम्न विचारहरूको सूचीले अनुप्रयोगहरूको कथित गतिलाई नकारात्मक असर पार्न सक्छ -
  • प्रत्यक्ष संलग्न भण्डारण (DAS वा आन्तरिक) बाट भण्डारण क्षेत्र नेटवर्क (SAN) वा नेटवर्क संलग्न भण्डारण (NAS) (वा बाह्य भण्डारण) मा परिवर्तन गर्दा विलम्बता बढाउन सक्छ।
  • थप कार्यहरू जस्तै कम्प्रेसन, एन्क्रिप्शन र डुप्लिकेशनले विलम्बता थप्न सक्छ।
  • भण्डारण LUN को संख्या कम गर्नाले आवश्यक थ्रुपुट समर्थन गर्न आवश्यक सर्भरमा स्रोतहरू कम गर्न सक्छ।
  • यी प्रभावहरू बुझ्नको लागि नयाँ उपकरणहरूको लागि ट्युनिङ वा सेटअप गाइडहरू हेर्नुहोस्।'
  • भर्चुअलाइजेशनले विलम्बता थप्छ र नेटिभ I/O को तुलनामा थ्रुपुट कम गर्न सक्छ। ब्याकएन्ड हार्डवेयर बाहेक, VIOS मेमोरी र CPU सुनिश्चित गर्नुहोस्
  • VIOS मा उच्च-गति भर्चुअलाइज्ड एडेप्टरहरूमा सार्दा CPU र मेमोरीमा VIOS कन्फिगरेसन समायोजन गर्न आवश्यक पर्दछ। IBM PowerVM उत्तम अभ्यासहरू VIOS साइजिङमा धेरै उपयोगी हुन सक्छ।

ट्युनिङ दिशानिर्देशहरू - कृपया AIX र Linux दिशानिर्देशहरूको लागि IBM ज्ञान केन्द्रलाई सन्दर्भ गर्नुहोस्।

PCIe3 12 GB क्यास RAID + SAS एडाप्टर क्वाड-पोर्ट 6 Gb x8 एडाप्टर लिनक्स:

एआईएक्स:

IBM

PCIe3 x8 2-पोर्ट फाइबर च्यानल (32 Gb/s) एडाप्टर

प्रदर्शनको लागि अतिरिक्त AIX ट्युनिङ:

  • SCSI ओभर फाइबर च्यानल (MPIO): प्रत्येक डिस्कको लागि राउन्ड_रोबिनमा मल्टिपाथ एल्गोरिथ्म सेट गर्नुहोस्
  • NVMe ओभर फाइबर च्यानल: सेटले प्रत्येक NVMe को लागि 7 लाई श्रेय दिन सक्छ फाइबर च्यानल डायनामिक कन्ट्रोलर खोजी चरणको समयमा सिर्जना गरियो।

प्रदर्शनको लागि NVMe एडाप्टर AIX ट्युनिङ
सेटले प्रत्येक NVMe उपकरणको लागि 8 मा एट्रिब्यूट गर्न सक्छ
IBM को अर्को पुस्ता C/C++/Fortran कम्पाइलरहरू जसले IBM को उन्नत अप्टिमाइजेसनहरूलाई खुला स्रोत LLVM पूर्वाधारसँग जोड्दछ।

LLVM
C/C++ भाषाको लागि ठूलो मुद्रा
छिटो निर्माण गति
सामुदायिक साझा अनुकूलन
विभिन्न LLVM-आधारित उपयोगिताहरू
IBM अनुकूलन
शक्ति वास्तुकला को पूर्ण शोषण
उद्योग-अग्रणी उन्नत अनुकूलन
विश्व-स्तरीय समर्थन र सेवा

उपलब्धता

  • ६०-दिनको शुल्क नलाग्ने परीक्षण: खुला XL उत्पादन पृष्ठबाट डाउनलोड गर्नुहोस्
  • डुअल-पाइप (AAS र PA) बाट लचिलो इजाजतपत्र विकल्पहरू मार्फत IBM विश्व-स्तरीय सेवा र समर्थन प्राप्त गर्नुहोस्।
  • स्थायी इजाजतपत्र (प्रति अधिकृत प्रयोगकर्ता वा प्रति समवर्ती प्रयोगकर्ता)
  • मासिक इजाजतपत्र (प्रति भर्चुअल प्रक्रिया कोर): लक्षित क्लाउड प्रयोग केसहरू, जस्तै, PowerVR उदाहरणमा

सिफारिस गरिएको प्रदर्शन ट्युनिङ विकल्पहरू

अनुकूलन स्तर प्रयोग सिफारिसहरू
-O2 र -O3 सामान्य सुरूवात बिन्दु
लिङ्क समय अनुकूलन: -flto (C/C++), -qlto (Fortran) धेरै साना प्रकार्य कलहरूको साथ कार्यभारको लागि
प्रोfile निर्देशित अनुकूलन: -fprofile-उत्पन्न, -fprofile-प्रयोग (C/C++)
-qprofile-उत्पन्न, -qprofile-प्रयोग (फोरट्रान)
धेरै शाखा र प्रकार्य कलहरूको साथ कार्यभारको लागि

थप जानकारीको लागि कृपया यहाँ जानुहोस्: https://www.ibm.com/docs/en/openxl-c-and-cpp-aix/17.1.0
https://www.ibm.com/docs/en/openxl-fortran-aix/17.1.0

ओपन XL 10 को साथ पूर्ण Power17.1.0 वास्तुकला शोषण

  • नयाँ कम्पाइलर विकल्प '–mcpu=pwr10' कोडको शोषण गर्ने Power10 निर्देशनहरू उत्पन्न गर्न र Power10 को लागि अनुकूलनहरू स्वचालित रूपमा ट्युन गर्न।
  • नयाँ Power10 कार्यक्षमताहरू अनलक गर्न नयाँ बिल्टइन प्रकार्यहरू, जस्तै, म्याट्रिक्स मल्टिप्लाइ एक्सेलेरेटर (MMA)
  • Power10 को लागि नयाँ MASS SIMD र भेक्टर पुस्तकालयहरू थपिएका थिए। सबै MASS पुस्तकालय प्रकार्यहरू (SIMD, भेक्टर, स्केलर) Power10 (Power9 पनि) को लागि ट्युन गरियो।

नोट: अघिल्लो पावर प्रोसेसरहरूमा चलाउनको लागि XL कम्पाइलरहरू (जस्तै, XL 16.1.0) को पुरानो संस्करणहरूसँग कम्पाइल गरिएका एप्लिकेसनहरू Power10 मा उपयुक्त रूपमा चल्नेछन्।
AIX मा बाइनरी अनुकूलता
नोट: AIX 16.1.0 को लागि XL C/C++ ले पहिले नै नयाँ invocation xlclang++ प्रस्तुत गरेको छ जसले LLVM प्रोजेक्ट ü C++ वस्तुहरूको लागि xlC सँग निर्मित Clang फ्रन्ट-एन्डको लाभ उठाउँछ।

  • AIX (IBM को आफ्नै फ्रन्ट-एन्डमा आधारित) AIX को लागि xlclang++ 16.1.0 सँग निर्मित C++ वस्तुहरूसँग बाइनरी उपयुक्त छैन।
  • AIX का लागि xlclang++ 16.1.0 सँग निर्मित C++ वस्तुहरू AIX 17.1.0 को लागि नयाँ Open XL C/C++ सँग बाइनरी उपयुक्त हुनेछ।
  • C अनुकूलता सबै AIX कम्पाइलरहरूमा कायम राखिएको छ (AIX को लागि पहिलेको XL संस्करणहरू, AIX 17.1.0 को लागि XL C/C++ खोल्नुहोस्)
  • फोरट्रान अनुकूलता AIX को लागि पहिलेको XLF संस्करण र AIX 17.1.0 को लागि खुला XL फोरट्रान बीच कायम राखिएको छ।

उपलब्धता
GCC कम्पाइलरहरू सबै इन्टरप्राइज लिनक्स वितरणहरूमा उपलब्ध छन्
एआईएक्स।

  • स्थापित GCC संस्करण RHEL 8.4 मा 8 र SLES 7.4 मा 15 छ। RHEL 9 ले GCC 11.2 पठाउने अपेक्षा गरिएको छ।
  • वितरणका लागि पूर्वनिर्धारित कम्पाइलरहरू Power10 लाई समर्थन गर्न धेरै पुरानो हुँदा GCC को पर्याप्त भर्खरको संस्करण प्राप्त गर्ने थुप्रै तरिकाहरू छन्।
  • Red Hat ले यस उद्देश्यका लागि GCC Toolset [1] लाई समर्थन गर्दछ।
  • SUSE ले विकास उपकरण मोड्युल प्रदान गर्दछ। [२]
  • IBM ले Advance Toolchain मार्फत नवीनतम कम्पाइलर र पुस्तकालयहरू प्रदान गर्दछ। [३]

IBM Advance Toolchain

  • Advance Toolchain ले कम्पाइलरहरू, डिबगरहरू, र अन्य उपकरणहरूसँग पावर-अनुकूलित प्रणाली पुस्तकालयहरू प्रदान गर्दछ।
  • Advance Toolchain सँगको बिल्डिङ कोडले नवीनतम प्रोसेसरहरूमा सम्भव भएसम्म सबैभन्दा उच्च अनुकूलित कोड उत्पादन गर्न सक्छ।

भाषाहरू

  • C (GCC), C++ (g++), र Fortran (gfortran), अन्यहरू जस्तै Go (GCC), D (GDC), र Ada (gnat)।
  • केवल GCC, g++, र gfortran सामान्यतया पूर्वनिर्धारित रूपमा स्थापित हुन्छन्।
  • Golang कम्पाइलर [४] पावरमा गो प्रोग्रामहरू निर्माण गर्नको लागि रुचाइएको विकल्प हो।

Power10 मा अनुकूलता र नयाँ सुविधाहरू

  •  POWER8 वा POWER9 प्रोसेसरहरूमा चलाउनको लागि GCC को पुरानो संस्करणहरूसँग कम्पाइल गरिएका अनुप्रयोगहरू Power10 प्रोसेसरहरूमा उपयुक्त रूपमा चल्नेछन्।
  •  GCC 11.2 वा पछिको Power ISA 3.1 मा उपलब्ध र Power10 प्रोसेसरहरूमा लागू गरिएका सबै नयाँ सुविधाहरू प्रयोग गर्न सिफारिस गरिन्छ।
  • GCC 11.2 ले Power10 प्रोसेसरहरूद्वारा प्रदान गरिएको म्याट्रिक्स मल्टिप्लाई असिस्ट (MMA) सुविधामा पहुँच प्रदान गर्दछ। [५]
  • MMA कार्यक्रमहरू कुनै पनि GCC, LLVM, र Open XL कम्पाइलरहरू प्रयोग गरेर कम्पाइल गर्न सकिन्छ, यदि तपाईंले पर्याप्त भर्खरका रिलीजहरू प्रयोग गर्नुभयो भने।

IBM सिफारिस गरिएको र समर्थित कम्पाइलर झण्डा [6]

-O3 वा -पूर्व आक्रामक अनुकूलन। -पूर्व अनिवार्य रूपमा -O3 -फास्ट-गणितको बराबर हो, जसले IEEE फ्लोटिंग-पोइन्ट अंकगणितमा प्रतिबन्धहरू पनि आराम गर्छ।
-mcpu = powern पावर प्रोसेसर द्वारा समर्थित निर्देशनहरू प्रयोग गरेर कम्पाइल गर्नुहोस्। पूर्वका लागिample, केवल Power10 मा उपलब्ध निर्देशनहरू प्रयोग गर्न, -mcpu=power10 चयन गर्नुहोस्।
-लाई ऐच्छिक। "लिङ्क-समय" अनुकूलन प्रदर्शन गर्नुहोस्। यसले फंक्शन कलहरूमा कोडलाई अप्टिमाइज गर्दछ जहाँ कलर र कल फंक्शनहरू विभिन्न कम्पाइलेशन एकाइहरूमा अवस्थित हुन्छन्, र प्रायः महत्त्वपूर्ण कार्यसम्पादन वृद्धि प्रदान गर्न सक्छन्।
- अनरोल-लूपहरू ऐच्छिक। कम्पाइलरले सामान्यतया हुने भन्दा लूप बडीहरूको अधिक आक्रामक नक्कल प्रदर्शन गर्नुहोस्। सामान्यतया, तपाईंले यसलाई छोड्नुपर्छ, तर केही कोडहरूमा, यसले राम्रो प्रदर्शन प्रदान गर्न सक्छ।

नोट:
यद्यपि -mcpu=power10 लाई GCC 10.3 को रूपमा समर्थन गरिएको छ, GCC 11.2 लाई प्राथमिकता दिइन्छ किनभने पहिलेको कम्पाइलरहरूले Power10 प्रोसेसरहरूमा लागू गरिएका प्रत्येक सुविधाहरूलाई समर्थन गर्दैन। साथै, -mcpu=power10 प्रयोग गरेर सिर्जना गरिएका वस्तुहरू POWER9 वा पहिलेका प्रोसेसरहरूमा चल्ने छैनन्! यद्यपि, त्यहाँ विभिन्न प्रोसेसर संस्करणहरूको लागि अनुकूलित कोड सिर्जना गर्ने तरिकाहरू छन्। [७] [१] Red Hat: GCC Toolset प्रयोग गर्दै। https://access.redhat.com/documentation/enus/red_hat_enterprise_linux/8/html/developing_c_and_cpp_applications_in_rhel_8/gcc-toolset_toolsets.
[२] SUSE: विकास उपकरण मोड्युल बुझ्दै। https://www.suse.com/c/suse-linux-essentialswhere-are-the-compilers-understanding-the-development-tools-module/.
[३] IBM पावर प्रणालीहरूमा लिनक्सको लागि अग्रिम टूलचेन। https://www.ibm.com/support/pages/advancetoolchain-linux-power.
[४] भाषा जानुहोस्। https://golang.org। [५] Matrix-Multiply Assist Best Practices Guide। http://www.redbooks.ibm.com/redpapers/pdfs/redp5612.pdf
[६] GNU कम्पाइलर सङ्कलन प्रयोग गर्दै। https://gcc.gnu.org/onlinedocs/gcc.pdf
[७] GNUI अप्रत्यक्ष प्रकार्य संयन्त्रको साथ लक्ष्य-विशिष्ट अनुकूलन। https://developer.ibm.com/tutorials/optimized-libraries-for-linux-on-power/#target-specific-optimization-
© 2021 IBM Corporation with-the-gnu-Indirect-function-mechanism।
जाभा अनुप्रयोगहरूले निर्बाध रूपमा एडभान लिन सक्छन्tagतल सूचीबद्ध वा नयाँ जाभा रनटाइम संस्करणहरू प्रयोग गरेर P10 मोडमा चलिरहेको अपरेटिङ सिस्टमहरूमा नयाँ P10 ISA सुविधाहरूको e:
जाभा 8

  •  IBM SDK 8 SR6 FP36
  • IBM Semeru रनटाइम ओपन संस्करण 8u302: openj9-0.27.1

जाभा 11

  • IBM Semeru रनटाइम प्रमाणित संस्करण 11.0.12.1: openj9-0.27.1
  • IBM Semeru रनटाइम खुला संस्करण 11.0.12.1: openj9-0.27.1

Java 17 (ड्राइभरहरू अझै उपलब्ध नहुन सक्छन्)

  •  IBM Semeru रनटाइम प्रमाणित संस्करण 17: openj9-0.28
  • IBM Semeru रनटाइम खुला संस्करण 17: openj9-0.28
  • ओपनजेडीके १७.०.९

प्रदर्शन ट्युनिङ सन्दर्भहरू:
IBM Webक्षेत्र अनुप्रयोग सर्भर प्रदर्शन कुकबुक
पृष्ठ आकार
AIX मा धेरै Oracle डाटाबेसहरूको लागि सामान्य सिफारिस 64KB पृष्ठ आकार प्रयोग गर्नु हो र SGA का लागि 16MB पृष्ठ आकार होइन। सामान्यतया, 64 KB पृष्ठहरू लगभग उस्तै उत्पादन गर्छन्
विशेष व्यवस्थापन बिना 16 MB पृष्ठहरूको रूपमा प्रदर्शन लाभ।
TNS श्रोता
Oracle 12.1 डाटाबेस र पूर्वनिर्धारित रूपमा पछि रिलीजहरूले पाठ, डेटा, र स्ट्याकको लागि 64k पृष्ठहरू प्रयोग गर्नेछ। यद्यपि, TNSLISTENER को लागि यसले अझै पनि पाठ, डेटा, र स्ट्याकको लागि 4k पृष्ठहरू प्रयोग गर्दछ। को
श्रोताको लागि 64k पृष्ठहरू सक्षम गर्नुहोस् श्रोता प्रक्रिया सुरु गर्नु अघि निर्यात आदेश प्रयोग गर्दछ। ध्यान दिनुहोस् कि ASM आधारित वातावरणमा चलिरहेको छ जुन श्रोता बाहिर चल्छ
GRID_HOME र ORACLE_HOME होइन।
12.1 वा पछि रिलीजहरूमा "कडा रूपमा setenv" आदेशको लागि कागजात परिवर्तन भयो। -t वा -T -env वा -envs को पक्षमा हटाइयो। ओरेकल लिसनर वातावरण सेट र निर्यात मा:
– LDR_CNTRL=DATAPSIZE=64K@TEXTPSIZE=64K@STACKPSIZE=64K - VMM_CNTRL=vmm_fork_policy=COR ('प्रतिलिपि पढ्नुहोस्' आदेश थप्नुहोस्)
साझा वाक्य रचना
LDR_CNTRL=SHARED_SYMTAB=Y सेटिङ विशेष रूपमा 11.2.0.4 वा पछि रिलीजहरूमा सेट गर्न आवश्यक छैन। कम्पाइलर लिङ्कर विकल्पहरूले यो सेटिङको ख्याल राख्छ र अब विशेष रूपमा सेट गर्न आवश्यक छैन। यो LDR_CNTRL=SHARED_SYMTAB=Y विशेष रूपमा 12c वा पछि रिलीजहरूमा सेट गर्न सिफारिस गरिएको छैन।
भर्चुअल प्रोसेसर फोल्डिंग
प्रोसेसर फोल्डिङ सक्षम भएको LPARs प्रयोग गर्दा RAC वातावरणमा यो महत्त्वपूर्ण सेटिङ हो। यदि यो सेटिङ समायोजन गरिएन भने, हल्का डाटाबेस वर्कलोड अवस्थाहरूमा RAC नोड निष्कासनको उच्च जोखिम हुन्छ। Scheda -p -o vpm_xvcpus=2
VIOS र RAC इन्टरकनेक्ट
एक समर्पित 10G (अर्थात्, 10G इथरनेट एडाप्टर) जडानलाई क्लस्टर समय-संवेदनशील ट्राफिकको लागि पर्याप्त ब्यान्डविथ प्रदान गर्न न्यूनतम रूपमा सिफारिस गरिन्छ। RAC क्लस्टर ट्राफिक - इन्टरकनेक्ट ट्राफिक समर्पित हुनुपर्छ र साझा गर्नु हुँदैन। इन्टरकनेक्टको साझेदारीले समय ढिलाइ हुन सक्छ जसले नोड ह्याङ्ग/इभिकसन समस्याहरू निम्त्याउन सक्छ।
नेटवर्क कार्यसम्पादन
यो AIX मा Oracle को लागि लामो समयदेखि रहेको नेटवर्क ट्युनिङ सुझाव हो, यद्यपि पूर्वनिर्धारित 0 मा रहन्छ। rfc1323=1 को TCP सेटिङ
थप व्यापक जानकारी
लिङ्कलाई सन्दर्भ गर्नुहोस्: POWER9 सहित पावर प्रणालीहरूमा AIX चलिरहेको हालको ओरेकल डाटाबेस संस्करणहरूको स्थिरता र प्रदर्शन व्यवस्थापन
https://www.ibm.com/support/pages/node/6355543

सामान्य

  • SMT8 मोड प्रयोग गर्नुहोस्
  • समर्पित CPU LPARs प्रयोग गर्नुहोस्

Db2 गोदाम

  • सुनिश्चित गर्नुहोस् कि उच्च-गति निजी नेटवर्क सबै नोडहरू बीच अवस्थित छ
  • MLN कन्फिगरेसन प्रति सकेट एक नोडमा सीमित गर्नुहोस्

CP4D

  • OCP नोड्स नेटवर्कको लागि PCIe4 प्रयोग गर्नुहोस्
  • OCP 4.8 भन्दा पहिले, कर्नेल प्यारामिटर slub_max_order=0 सेट गर्नुहोस्

Db2 उत्कृष्ट अभ्यासहरू
https://www.ibm.com/docs/en/db2/11.5?topic=overviews-db2-best-practices

नेटवर्क

  • पोड नेटवर्कको लागि, LPM आवश्यक छैन भने नेटिभ SRIOV मा आधारित निजी नेटवर्क प्रयोग गर्नुहोस्, अन्यथा, VNIC प्रयोग गर्नुहोस्।
  • उच्च ब्यान्डविथ वा कम विलम्बता चाहिने एप्लिकेसनहरूको लागि, SR-IOV नेटवर्क अपरेटर प्रयोग गरी VF सिधै पोडमा तोक्न विचार गर्नुहोस्।
  • कम टाइमआउटको आवश्यकतामा सेवाहरूको लागि, अवस्थित मार्गको लागि पूर्वनिर्धारित टाइमआउटहरू कन्फिगर गर्नुहोस्
  • OCP को क्लस्टर नेटवर्कको इच्छित MTU साइज समायोजन गर्नुहोस्

अपरेटिङ सिस्टम

  • CoreOS पोस्ट-स्थापना परिवर्तनहरू भित्र u-सीमाहरू बढाउन विचार गर्नुहोस्
  • पावरमा पावर प्लेटफर्म OCP4.8 स्थापनाको लागि न्यूनतम OCP स्थापना आवश्यकताहरू हेर्नुहोस्

परिनियोजन

  • एप्लिकेसनहरू डिप्लोइ गर्दा, ध्यान दिनुहोस् कि एक vCPU एक भौतिक कोरको बराबर हुन्छ जब एकसाथ मल्टिथ्रेडिङ (SMT), वा हाइपरथ्रेडिङ, सक्षम छैन। जब SMT सक्षम हुन्छ, VCPU हार्डवेयर थ्रेडको बराबर हुन्छ।
  • कार्यकर्ता र मास्टर नोडहरू न्यूनतम स्रोत आवश्यकताहरूका लागि न्यूनतम साइजिङ दिशानिर्देशहरू हेर्नुहोस्
  • निर्मित कन्टेनर छवि रजिस्ट्रीमा छुट्टै समर्पित भण्डारण आवंटित गर्नुहोस्
  • OpenShift कन्टेनर प्लेटफर्म कम्पोनेन्टहरूले डाटा लेख्ने OCP को मुख्य डाइरेक्टरीहरूका लागि निम्न साइजिङ दिशानिर्देशहरू प्रयोग गर्नुहोस्।

कागजातहरू / स्रोतहरू

IBM Power10 प्रदर्शन [pdf] प्रयोगकर्ता गाइड
Power10, प्रदर्शन, Power10 प्रदर्शन

सन्दर्भहरू

एक टिप्पणी छोड्नुहोस्

तपाईंको इमेल ठेगाना प्रकाशित गरिने छैन। आवश्यक क्षेत्रहरू चिन्ह लगाइएका छन् *