இன்டெல் லோகோஇன்டெல் ® ஈதர்நெட் 700 தொடர்
லினக்ஸ் செயல்திறன் சரிப்படுத்தும் வழிகாட்டி
NEX கிளவுட் நெட்வொர்க்கிங் குழு (NCNG)
ரெவ். 1.2
டிசம்பர் 2024

மீள்பார்வை வரலாறு

திருத்தம் தேதி கருத்துகள்
1.2 டிசம்பர் 2024 · கூடுதல் மின் மேலாண்மை வழிகாட்டுதல் சேர்க்கப்பட்டது.
· இன்டெல்* டர்போ பூஸ்ட் சேர்க்கப்பட்டது.
· பிணைய சாதன பின்னிணைப்பு சேர்க்கப்பட்டது.
· தளம் சார்ந்த கட்டமைப்புகள் மற்றும் டியூனிங் சேர்க்கப்பட்டது.
· 4வது தலைமுறை இன்டெல்* %eon* அளவிடக்கூடிய செயலிகள் சேர்க்கப்பட்டன.
· AMD EPYC சேர்க்கப்பட்டது.
· புதுப்பிக்கப்பட்ட கணினி வன்பொருள் திறன்களைச் சரிபார்க்கவும்.
· iPerf2 புதுப்பிக்கப்பட்டது.
· iPerf3 புதுப்பிக்கப்பட்டது.
· புதுப்பிக்கப்பட்ட Tx/Rx வரிசைகள்.
· புதுப்பிக்கப்பட்ட குறுக்கீடு மிதமான தன்மை.
· புதுப்பிக்கப்பட்ட மோதிர அளவு.
· புதுப்பிக்கப்பட்ட பிளாட்ஃபார்ம் ட்யூனிங் (i40e குறிப்பிட்டதல்ல).
· புதுப்பிக்கப்பட்ட பயாஸ் அமைப்புகள்.
· புதுப்பிக்கப்பட்ட சி-ஸ்டேட் கட்டுப்பாடு.
· புதுப்பிக்கப்பட்ட CPU அதிர்வெண் அளவிடுதல்.
· புதுப்பிக்கப்பட்ட பயன்பாட்டு அமைப்புகள்.
· புதுப்பிக்கப்பட்ட இயக்க முறைமை/கர்னல் அமைப்புகள்.
· புதுப்பிக்கப்பட்ட ஐபி பகிர்தல்.
· புதுப்பிக்கப்பட்ட குறைந்த தாமதம்.
ஆகஸ்ட் 2023 இந்த ஆவணத்தில் செய்யப்பட்ட மாற்றங்கள்:
· தொடர்புடைய குறிப்புகள் சேர்க்கப்பட்டன.
· DDP தொகுப்பு சரியாக ஏற்றப்படுவதை உறுதிசெய்யவும்.
· iPerf2 சேர்க்கப்பட்டது.
· iPerf3 சேர்க்கப்பட்டது.
· நெட்பர்ஃப் சேர்க்கப்பட்டது.
· புதுப்பிக்கப்பட்ட IRQ இணைப்பு.
· Tx/Rx வரிசைகள் சேர்க்கப்பட்டன.
· புதுப்பிக்கப்பட்ட மோதிர அளவு.
· ஜம்போ பிரேம்கள் சேர்க்கப்பட்டன.
· அடாப்டர் பிணைப்பு சேர்க்கப்பட்டது.
· இன்டெல் எஸ்விஆர்-தகவல் கருவி சேர்க்கப்பட்டது.
1.0 மார்ச் 2016 ஆரம்ப வெளியீடு (இன்டெல் பப்ளிக்).

அறிமுகம்

இந்த வழிகாட்டி, Linux சூழல்களில் Intel® Ethernet 700 Series NICகளைப் பயன்படுத்தி உகந்த நெட்வொர்க்கிங் செயல்திறனுக்கான சூழல்களைச் சரிசெய்வதற்கான வழிகாட்டுதலை வழங்குவதை நோக்கமாகக் கொண்டுள்ளது. இது வன்பொருள், இயக்கி மற்றும் இயக்க முறைமை நிலைமைகள் மற்றும் நெட்வொர்க் செயல்திறனை மேம்படுத்தக்கூடிய அமைப்புகளில் கவனம் செலுத்துகிறது. நெட்வொர்க்கிங் செயல்திறன் எந்தவொரு வெளிப்புற தாக்கங்களாலும் பாதிக்கப்படலாம் என்பதைக் கவனத்தில் கொள்ள வேண்டும், இவற்றில் மிகவும் பொதுவான மற்றும் வியத்தகு தன்மை மட்டுமே இந்த வழிகாட்டியில் உள்ளடக்கப்பட்டுள்ளது.
1.1 தொடர்புடைய குறிப்புகள்

ஆரம்ப சரிபார்ப்பு பட்டியல்

2.1 இயக்கி/ நிலைபொருள் பதிப்புகளைப் புதுப்பிக்கவும்
ethtool -i ethx ஐப் பயன்படுத்தி இயக்கி/நிலைபொருள் பதிப்புகளைச் சரிபார்க்கவும்.
தேவைக்கேற்ப பின்வருவனவற்றைப் புதுப்பிக்கவும்:

2.2 README-ஐப் படியுங்கள்
தெரிந்த சிக்கல்களைச் சரிபார்த்து, README இலிருந்து சமீபத்திய உள்ளமைவு வழிமுறைகளைப் பெறுங்கள். file i40e மூல தொகுப்பில் சேர்க்கப்பட்டுள்ளது.
2.3 உங்கள் PCI எக்ஸ்பிரஸ் (PCIe) ஸ்லாட் x8 ஆக உள்ளதா என சரிபார்க்கவும்.
சில PCIe x8 ஸ்லாட்டுகள் உண்மையில் x4 ஸ்லாட்டுகளாக உள்ளமைக்கப்பட்டுள்ளன. இரட்டை போர்ட் மற்றும் குவாட் போர்ட் சாதனங்களுடன் முழு வரி வீதத்திற்கும் இந்த ஸ்லாட்டுகள் போதுமான அலைவரிசையைக் கொண்டிருக்கவில்லை. கூடுதலாக, நீங்கள் PCIe v3.0-திறன் கொண்ட அடாப்டரை PCIe v2.x ஸ்லாட்டில் வைத்தால், நீங்கள் முழு அலைவரிசையைப் பெற முடியாது. மென்பொருள் சாதன இயக்கி இந்த சூழ்நிலையைக் கண்டறிந்து கணினி பதிவில் பின்வரும் செய்தியை எழுதுகிறது:
இந்த அட்டைக்குக் கிடைக்கும் PCI-Express அலைவரிசை உகந்த செயல்திறனுக்குப் போதுமானதாக இல்லை. உகந்த செயல்திறனுக்கு x8 PCI-Express ஸ்லாட் தேவை.
இந்தப் பிழை ஏற்பட்டால், சிக்கலைத் தீர்க்க உங்கள் அடாப்டரை உண்மையான PCIe v3.0 x8 ஸ்லாட்டுக்கு நகர்த்தவும்.
2.4 கணினி வன்பொருள் திறன்களைச் சரிபார்க்கவும்
10 Gbps, 25 Gbps மற்றும் 40 Gbps ஈதர்நெட்டில், சில குறைந்தபட்ச CPU மற்றும் கணினி தேவைகள் உள்ளன. பொதுவாக, ஒரு நவீன சர்வர் வகுப்பு செயலி மற்றும் உங்கள் தளத்திற்கான உகந்த நினைவக உள்ளமைவு போதுமானதாக இருக்க வேண்டும், ஆனால் தேவைகள் உங்கள் பணிச்சுமையைப் பொறுத்து மாறுபடும். அனைத்து நினைவக சேனல்களும் நிரப்பப்பட வேண்டும் மற்றும் BIOS இல் நினைவக செயல்திறன் பயன்முறை இயக்கப்பட வேண்டும். உங்கள் பணிச்சுமைக்குத் தேவையான நெட்வொர்க் செயல்திறனின் அளவை உங்கள் CPU மற்றும் நினைவக உள்ளமைவு ஆதரிக்கும் திறன் கொண்டதா என்பதைச் சரிபார்க்கவும்.
குறிப்பு
XL710 என்பது 40 GbE கட்டுப்படுத்தி. இந்தக் கட்டுப்படுத்தியைப் பயன்படுத்தும் 2 x 40 GbE அடாப்டர் 2 x 40 GbE ஆக இருக்க வேண்டும் என்று கருதப்படவில்லை, ஆனால் செயலில் உள்ள காப்புப் பிரதி போர்ட்டுடன் கூடிய 1 x 40 GbE ஆக இருக்க வேண்டும். இரண்டு போர்ட்களையும் உள்ளடக்கிய லைன்-ரேட் டிராஃபிக்கைப் பயன்படுத்த முயற்சிக்கும்போது, ​​உள் சுவிட்ச் நிறைவுற்றது மற்றும் இரண்டு போர்ட்களுக்கு இடையிலான ஒருங்கிணைந்த அலைவரிசை மொத்த SO Gbps ஆக வரையறுக்கப்பட்டுள்ளது.
2.4.1 கர்னல் துவக்க அளவுருக்கள்
BIOS இல் Intel® Virtualization Technology for Directed I/O (Intel® VT-d) இயக்கப்பட்டிருந்தால், உகந்த ஹோஸ்ட் நெட்வொர்க் செயல்திறனுக்காக IOMMU பாஸ்-த்ரூ பயன்முறையில் இருக்க வேண்டும் என்று Intel பரிந்துரைக்கிறது. இது ஹோஸ்ட் டிராஃபிக்கில் DMA ஓவர்ஹெடை நீக்குகிறது, அதே நேரத்தில் மெய்நிகர் இயந்திரங்கள் (VMகள்) Intel® VT-d இன் நன்மைகளைப் பெற உதவுகிறது. கர்னல் துவக்க அளவுருக்களில் பின்வரும் வரியைச் சேர்ப்பதன் மூலம் இது நிறைவேற்றப்படுகிறது: fommu-pt.
2.5 DDP தொகுப்பு சரியாக ஏற்றப்படுவதை உறுதிசெய்யவும்.
140ea மற்றும் 140eb அடிப்படை இயக்கிகள் டைனமிக் சாதன தனிப்பயனாக்கத்திற்கு (DDP) நேரடி ஆதரவைக் கொண்டிருக்கவில்லை. 700 தொடர் சாதனங்களுடன் DDP ஐப் பயன்படுத்த, ஒரு DDP புரோfile testpmd விண்ணப்பத்துடன் விண்ணப்பிக்கலாம்.
DDP pro பற்றிய விவரங்களுக்குfiles, மற்றும் DDP ப்ரோவை எவ்வாறு பயன்படுத்துவதுfile 700 தொடர் சாதனங்களில் testpmd உடன், Intel® Ethernet 700 தொடர் டைனமிக் சாதன தனிப்பயனாக்கம் (DDP) தொழில்நுட்ப வழிகாட்டியைப் பார்க்கவும்.
ஒரு DDP நிபுணரா என்பதைச் சரிபார்க்கfile வெற்றிகரமாக ஏற்றப்பட்டது:
testpmd> ddp பட்டியல் 0 ப்ரோவைப் பெறுங்கள்file எண்: 1
குறிப்பு
சார்பு என்றால்file எண் 0, எந்த DDP தொகுப்பும் ஏற்றப்படவில்லை. DDP தொகுப்பு ஏற்றுதல் பிழை ஏற்பட்டால், சாதனம் இயல்புநிலையாக பாதுகாப்பான பயன்முறைக்கு மாறும், மேலும் பல செயல்திறன் அம்சங்கள் கிடைக்காது. DDP தொகுப்பை ஏற்றுவது தொடர்பான பிழைகள் இருந்தால், அது செயல்திறன் சிக்கல்களை ஏற்படுத்தும். சரிசெய்தல் படிகளுக்கு, Inte/* Ethernet 700 Series Dynamic Device Personalization (DDP) தொழில்நுட்ப வழிகாட்டியைப் பார்க்கவும்.

அடிப்படை செயல்திறன் அளவீடுகள் மற்றும் சரிப்படுத்தும் முறைகள்

3.1 நெட்வொர்க் செயல்திறன் அளவுகோல்கள்
சரிப்படுத்தும் பயிற்சியைத் தொடங்குவதற்கு முன், உங்கள் நெட்வொர்க் செயல்திறனைப் பற்றிய நல்ல அடிப்படை அளவீட்டைக் கொண்டிருப்பது முக்கியம். பொதுவாக உங்கள் குறிப்பிட்ட பயன்பாடு/பணிச்சுமையின் செயல்திறனின் ஆரம்ப அளவீட்டைப் பெறுவதோடு கூடுதலாக, உங்கள் நெட்வொர்க் சாதனம் நல்ல நிலையில் உள்ளதா என்பதைச் சரிபார்க்க ஒரு நிலையான நெட்வொர்க் செயல்திறன் அளவுகோலைப் பயன்படுத்துவதும் நல்லது.
ஒற்றை அமைப்பு உகப்பாக்கத்திற்கு, netperf அல்லது iperf மற்றும் NetPIPE அனைத்தும் திடமான திறந்த மூல இலவச கருவிகளாகும், அவை இணைப்பை வலியுறுத்தவும் செயல்திறன் சிக்கல்களைக் கண்டறியவும் உங்களை அனுமதிக்கின்றன.
Netperf என்பது செயல்திறன் மற்றும் தாமத சோதனை இரண்டிற்கும் வலுவானது. NetPIPE என்பது ஒரு தாமத-குறிப்பிட்ட கருவியாகும், ஆனால் எந்த வகையான சூழலுக்கும் தொகுக்க முடியும்.
குறிப்பு
netperf இல் உள்ள TCP_RR சோதனை, பரிவர்த்தனைகள்/வினாடி மதிப்பில் தாமதத்தை வழங்குகிறது. இது ஒரு சுற்று-பயண எண். ஒரு வழி தாமதத்தை பின்வரும் சமன்பாட்டைப் பயன்படுத்தி கணக்கிடலாம்:
தாமதம்(usec) = (1/2) / [பரிவர்த்தனை/வினாடி] * 1,000,000
3.1.1 ஐபெர்ஃப்2
ஒரே பயன்பாட்டு நிகழ்வில் பல த்ரெட்களின் பயன்பாடு மற்றும் ஆதரவு எளிமையாக இருப்பதால், பெரும்பாலான தரப்படுத்தல் சூழ்நிலைகளுக்கு இன்டெல் iperf2 ஐ விட iperf3 ஐ பரிந்துரைக்கிறது. 2G இணைப்புகளுக்கு 4-25 த்ரெட்களும் 4G இணைப்புகளுக்கு சுமார் 6-40 த்ரெட்களும் கொண்ட -P விருப்பத்துடன் இயக்க இன்டெல் பரிந்துரைக்கிறது.

  • கிளையண்டிலிருந்து சர்வருக்கு ஒரே திசை போக்குவரத்தை இயக்க: சர்வர் கட்டளை example: iperf2 -s
    கிளையன்ட் கட்டளை example: iperf2 -c -பி
  • கிளையண்டிலிருந்து சர்வருக்கு இரு திசை போக்குவரத்தை இயக்க (மற்றும் நேர்மாறாகவும்): சர்வர் கட்டளை example: iperf2 –s –p
    கிளையன்ட் கட்டளை exampலெ:
    ஐபர்ஃப்2 -சி -ப -பி -–முழு-இரட்டை OR
    ஐபர்ஃப்2 -சி -ப -பி –டி

குறிப்பு
iperf2 இல் உள்ள –full-duplex மற்றும் -d விருப்பங்கள் இரண்டும் பயனரை இருதரப்பு சோதனையைச் செய்ய அனுமதிக்கின்றன. இருப்பினும், –full-duplex விருப்பம் குறிப்பாக முழு duplex சோதனையில் கவனம் செலுத்துகிறது.
குறிப்பு
பல சர்வர் போர்ட்களில் iperf2 ஐ சோதிக்கும்போது, ​​ஒரே டெர்மினல் சாளரத்திலிருந்து பின்னணியில் அனைத்து சர்வர் அமர்வுகளையும் இயக்க -d கொடியை சர்வர் கட்டளையில் சேர்க்கலாம். ஒரு ஸ்கிரிப்டில் ஒரு for-loop க்குள் சர்வர் கட்டளை உட்பொதிக்கப்பட்டிருக்கும்போது -d கொடியையும் பயன்படுத்தலாம்.
குறிப்பு
ஒற்றை ஸ்ட்ரீம்/த்ரெட்டுடன் நெட்வொர்க் த்ரோபுட் சோதனையை இயக்கும் போது (எ.கா.ample: P1), AMD செயலிகள் எதிர்பார்த்த செயல்திறனை வழங்காமல் போகலாம், குறிப்பாக அதிக அலைவரிசை NICகள் (வேகம் >= 25G அலைவரிசையாக இருந்தால்). இதன் விளைவாக, அதிக செயல்திறனை அடைய குறிப்பிட்ட கோர்களுக்கு பயன்பாட்டைப் பின்னிங் செய்ய வேண்டும். பக்கம் 22 இல் உள்ள பயன்பாட்டு அமைப்புகளைப் பார்க்கவும்.
3.1.2 ஐபெர்ஃப்3
iperf3 பயன்படுத்தப்பட்டால், அட்வான் பெற பயன்பாட்டின் பல நிகழ்வுகள் தேவைப்படுகின்றன.tagபல-நூல்கள், RSS மற்றும் வன்பொருள் வரிசைகளின் e. 2G இணைப்புகளுக்கு 4-25 பயன்பாட்டு அமர்வுகளையும் 4G இணைப்புகளுக்கு சுமார் 6-40 அமர்வுகளையும் இயக்க இன்டெல் பரிந்துரைக்கிறது. ஒவ்வொரு அமர்வும் -p விருப்பத்தைப் பயன்படுத்தி ஒரு தனித்துவமான TCP போர்ட் மதிப்பைக் குறிப்பிட வேண்டும்.

  • கிளையண்டிலிருந்து சேவையகத்திற்கு ஒற்றை திசை போக்குவரத்தை இயக்க:
    சர்வர் கட்டளை exampலெ:
    iperf3 -s -p -ஐ
    கிளையன்ட் கட்டளை exampலெ:
    ஐபர்ஃப்3 -சி -ப
  • கிளையண்டிலிருந்து சேவையகத்திற்கு இரு திசை போக்குவரத்தை இயக்க (மற்றும் நேர்மாறாகவும்):
    சர்வர் கட்டளை exampலெ:
    iperf3 –s –p
    கிளையன்ட் கட்டளை example: iperf3 -c -ப -பி –-பிதிர்
  • iperf3 இன் பல நிகழ்வுகளை (த்ரெட்கள்) தொடங்க, TCP போர்ட்களுக்கு த்ரெட்களை மேப் செய்ய for-loop ஐப் பயன்படுத்துவதும், இணையாக பல செயல்முறைகளை உருவாக்க & ஐப் பயன்படுத்தி பின்னணியில் iperf3 ஐ இயக்குவதும் பரிந்துரை.
    சர்வர் கட்டளை example, 4 த்ரெட்களைத் தொடங்கவும்: port=””; {0..3} இல் i க்கு; do port=520$i; bash -c “iperf3 -s -p $port &”; முடிந்தது; கிளையன்ட் கட்டளை example, start 4 threads – Transmit test port=””; for i in {0..3}; do port=520$i; bash -c “iperf3 -c $serverIP -p $port &”; done; Client கட்டளை example, 4 த்ரெட்களைத் தொடங்குங்கள் – சோதனை போர்ட்=””; {0..3} இல் i க்கு; do port=520$i; bash -c “iperf3 -R -c $serverIP -p $port &”; முடிந்தது; 40G இணைப்புகளுக்கு, 6 ​​நிகழ்வுகள்/த்ரெட்களை உருவாக்க for-loop ஐ அதிகரிக்கவும்.

குறிப்பு
ஒற்றை ஸ்ட்ரீம்/த்ரெட்டுடன் நெட்வொர்க் த்ரோபுட் சோதனையை இயக்கும் போது (எ.கா.ample: P1), AMD செயலிகள் எதிர்பார்க்கப்படும் செயல்திறனை வழங்காமல் போகலாம், குறிப்பாக அதிக அலைவரிசை
NICகள் (வேகம் >= 25G அலைவரிசையாக இருந்தால்). இதன் விளைவாக, அதிக செயல்திறனை அடைய குறிப்பிட்ட கோர்களுக்கு பயன்பாட்டு பின்னிங் தேவைப்படுகிறது. பக்கம் 22 இல் பயன்பாட்டு அமைப்புகளையும் பக்கம் 26 இல் AMD EPYC ஐயும் பார்க்கவும்.
3.1.3 நெட்பர்ஃப்
செயல்திறன் மற்றும் தாமத சோதனை இரண்டிற்கும் netperf கருவி ஒரு வலுவான தேர்வாகும்.

  • netperf இல் உள்ள TCP_STREAM சோதனை, சாதனத்தின் செயல்திறன் திறன்களை அளவிடுகிறது. சர்வர் கட்டளை example: netserver Client கட்டளை example: netperf -t TCP_STREAM -l 30 -H
  • netperf இல் உள்ள TCP_RR சோதனை, பரிவர்த்தனைகள்/வினாடியின் மதிப்பில் தாமதத்தை வழங்குகிறது. இது ஒரு சுற்று-பயண எண். x என்பது சாதனத்திற்கு CPU உள்ளூர் என்றால், -T x,x விருப்பத்தைப் பயன்படுத்துவது பரிந்துரைக்கப்படுகிறது. ஒரு வழி தாமதத்தை இதைப் பயன்படுத்தி கணக்கிடலாம்: Latency(usec)=(1⁄2)/ [பரிவர்த்தனைகள்/வினாடி]*1,000,\ சர்வர் கட்டளை exampலெ: நெட்சர்வர்
    கிளையன்ட் கட்டளை example: netperf -t TCP_RR -l 30 -H -டி x,x
  • netperf இன் பல நிகழ்வுகளை (த்ரெட்கள்) தொடங்க, TCP போர்ட்களுக்கு த்ரெட்களை மேப் செய்ய for-loop ஐப் பயன்படுத்துவதும், இணையாக பல செயல்முறைகளை உருவாக்க & ஐப் பயன்படுத்தி பின்னணியில் netperf ஐ இயக்குவதும் பரிந்துரைக்கப்படுகிறது.
    சர்வர் கட்டளை example, 8 த்ரெட்களைத் தொடங்கு:
    port=””; {0..7} இல் i க்கு; do port=520$i; bash -c “netserver -L $serverIP -p $port &”; முடிந்தது;
    கிளையன்ட் கட்டளை example, 8 த்ரெட்களைத் தொடங்குங்கள்: port=””; for i in {0..7}; do port=520$i; bash -c “netperf -H $serverIP -p $port -t TCP_STREAM -l 30 &”; முடிந்தது;

3.2 டியூனிங் முறை
ஒவ்வொரு மாற்றமும் உங்கள் தேர்வில் என்ன தாக்கத்தை ஏற்படுத்துகிறது என்பதை அறிய, ஒரு நேரத்தில் ஒரு டியூனிங் மாற்றத்தில் கவனம் செலுத்துங்கள். டியூனிங் செயல்பாட்டில் நீங்கள் எவ்வளவு முறையாக இருக்கிறீர்களோ, அவ்வளவு எளிதாக செயல்திறன் தடைகளுக்கான காரணங்களைக் கண்டறிந்து அவற்றை நிவர்த்தி செய்யலாம்.

i40e இயக்கி அமைப்புகளை சரிசெய்கிறது

4.1 IRQ இணைப்பு
வெவ்வேறு நெட்வொர்க் வரிசைகளுக்கான குறுக்கீடுகள் வெவ்வேறு CPU கோர்களுடன் இணைக்கப்படும் வகையில் IRQ இணைப்பை உள்ளமைப்பது செயல்திறனில், குறிப்பாக மல்டித்ரெட் த்ரோபுட் சோதனைகளில் பெரும் தாக்கத்தை ஏற்படுத்தும்.
IRQ அஃபினிட்டியை உள்ளமைக்க, irqbalance-ஐ நிறுத்திவிட்டு, i40e மூல தொகுப்பிலிருந்து set_irq_affinity ஸ்கிரிப்டைப் பயன்படுத்தவும் அல்லது வரிசைகளை கைமுறையாகப் பின் செய்யவும். வரிசை பின்னிங்கை இயக்க பயனர்-இட IRQ பேலன்சரை முடக்கவும்:

  • systemctl ஐ முடக்கு சமநிலை
  • systemctl நிறுத்த irqbalance
    i40e மூல தொகுப்பிலிருந்து set_irq_affinity ஸ்கிரிப்டைப் பயன்படுத்துதல் (பரிந்துரைக்கப்படுகிறது):
  • அனைத்து கோர்களையும் பயன்படுத்த:
    [பாதை-க்கு-i40epackage]/scripts/set_irq_affinity -X அனைத்தும் ethX
  • உள்ளூர் NUMA சாக்கெட்டில் கோர்களை மட்டும் பயன்படுத்த: [path-to-i40epackage]/scripts/set_irq_affinity -X உள்ளூர் ethX
  • நீங்கள் பல்வேறு கோர்களையும் தேர்ந்தெடுக்கலாம். cpu0 டைமர் பணிகளை இயக்குவதால் அதைப் பயன்படுத்துவதைத் தவிர்க்கவும். [path-to-i40epackage]/scripts/set_irq_affinity 1-2 ethX

குறிப்பு
-x விருப்பம் குறிப்பிடப்படும்போது, ​​பின்னிங் செயல்முறையின் ஒரு பகுதியாக, அஃபினிட்டி ஸ்கிரிப்ட் டிரான்ஸ்மிட் பாக்கெட் ஸ்டீயரிங் (XPS) ஐ செயல்படுத்துகிறது. XPS இயக்கப்பட்டிருக்கும்போது, ​​XPS உடன் கர்னல் பேலன்சர் கணிக்க முடியாத செயல்திறனை ஏற்படுத்தக்கூடும் என்பதால், irqbalance ஐ முடக்க இன்டெல் பரிந்துரைக்கிறது. -X விருப்பம் குறிப்பிடப்படும்போது அஃபினிட்டி ஸ்கிரிப்ட் XPS ஐ முடக்குகிறது. Tx மற்றும் Rx போக்குவரத்து ஒரே வரிசை ஜோடி(களில்) சேவை செய்யப்படும்போது சிறந்த செயல்திறன் அடையப்படும் பணிச்சுமைகளுக்கு XPS ஐ முடக்குவதும் சமச்சீர் வரிசைகளை இயக்குவதும் நன்மை பயக்கும்.
லினக்ஸில் சமச்சீர் வரிசைகளை உள்ளமைப்பது, ஆதரிக்கப்படும் பிணைய அடாப்டர்களுக்கு சமச்சீர் பெறுதல் வரிசைகள் (Rx) மற்றும் சமச்சீர் பரிமாற்ற வரிசைகள் (Tx) ஆகியவற்றை இயக்க பிணைய இடைமுக இயக்கி அளவுருக்களை சரிசெய்வதை உள்ளடக்குகிறது.
குறிப்பு

  • சமச்சீர் வரிசைகள் ஒரு மேம்பட்ட நெட்வொர்க்கிங் அம்சமாகும், மேலும் அனைத்து 700 தொடர் நெட்வொர்க் அடாப்டர்கள் அல்லது இயக்கிகளும் அவற்றை ஆதரிக்காது.
  • சமச்சீர் வரிசைகளை உள்ளமைக்க முயற்சிக்கும் முன், தேவையான இயக்கி மற்றும் வன்பொருள் ஆதரவு உங்களிடம் உள்ளதா என்பதை உறுதிப்படுத்திக் கொள்ளுங்கள்.

சமச்சீர் வரிசைகளை உள்ளமைக்க, இந்த பொதுவான படிகளைப் பின்பற்றவும்:

  1. பிணைய இடைமுக உள்ளமைவைத் திருத்து File: உரை திருத்தியைப் பயன்படுத்தவும் (எ.கா.ampபிணைய இடைமுக உள்ளமைவைத் திருத்த le, vi, nano, அல்லது gedit) file. தி file பொதுவாக /etc/sysconfig/network-scripts/ கோப்பகத்தின் கீழ் அமைந்துள்ளது மற்றும் ifcfg-ethX போன்ற பெயரைக் கொண்டுள்ளது, இங்கு ethX என்பது உங்கள் பிணைய இடைமுகத்தின் பெயராகும்.
  2. சமச்சீர் வரிசை அளவுருக்களைச் சேர்க்கவும். பிணைய இடைமுக உள்ளமைவில் பின்வரும் வரிகளைச் சேர்க்கவும். file: ETHTOOL_OPTS=”rx-வரிசைகள் 8 tx-வரிசைகள் 8″
  3. நெட்வொர்க் சேவையை மறுதொடக்கம் செய்யுங்கள்.
    மாற்றங்களைச் செய்த பிறகு, புதிய உள்ளமைவைப் பயன்படுத்த பிணைய சேவையை மறுதொடக்கம் செய்யுங்கள். sudo systemctl பிணையத்தை மறுதொடக்கம் செய்யுங்கள்.

கைமுறையாக:

  • numactl –hardware lscpu ஐப் பயன்படுத்தி ஒவ்வொரு முனையிலும் இணைக்கப்பட்டுள்ள செயலிகளைக் கண்டறியவும்.
  • ஒவ்வொரு செயலிக்கும் பிட் முகமூடிகளைக் கண்டறியவும்:
  • முனை 0 க்கு 11-0 கோர்களைக் கருதினால்: [1,2,4,8,10,20,40,80,100,200,400,800]
  • ஒதுக்கப்படும் போர்ட்டுக்கு ஒதுக்கப்பட்ட IRQகளைக் கண்டறியவும்: grep ethX /proc/interrupts மற்றும் IRQ மதிப்புகளைக் கவனியுங்கள். exampஏற்றப்பட்ட 181 திசையன்களுக்கு le, 192-12.
  • தொடர்புடைய IRQ உள்ளீட்டில் SMP இணைப்பு மதிப்பை எதிரொலிக்கவும். ஒவ்வொரு IRQ உள்ளீட்டிற்கும் இதைச் செய்ய வேண்டும் என்பதை நினைவில் கொள்ளவும்: echo 1 > /proc/irq/181/smp_affinity echo 2 > /proc/irq/182/smp_affinity echo 4 > /proc/irq/183/smp_affinity IRQ இணைப்பு மதிப்பைக் காட்டு:
  • அனைத்து கோர்களுக்கும் IRQ உறவைக் காட்ட: /scripts/set_irq_affinity -s ethX
  • உள்ளூர் NUMA சாக்கெட்டில் உள்ள கோர்களை மட்டும் காட்ட: /scripts/set_irq_affinity -s உள்ளூர் ethX
  • நீங்கள் பல்வேறு கோர்களையும் தேர்ந்தெடுக்கலாம்: /scripts/set_irq_affinity -s 40-0-8,16 ethX

குறிப்பு
set_irq_affinity ஸ்கிரிப்ட் i40e இயக்கி பதிப்பு 2.16.11 மற்றும் அதற்குப் பிந்தைய பதிப்புகளில் -s கொடியை ஆதரிக்கிறது.
4.2 Tx/Rx வரிசைகள்
துவக்கத்தின் போது இயக்கியால் ஒவ்வொரு ஈதர்நெட் போர்ட்டிற்கும் இயக்கப்பட்ட முன்னிருப்பு வரிசைகளின் எண்ணிக்கை, தளத்தில் கிடைக்கும் மொத்த CPUகளின் எண்ணிக்கைக்கு சமம். இது பல தளங்கள் மற்றும் பணிச்சுமை உள்ளமைவுகளுக்கு நன்றாக வேலை செய்கிறது. இருப்பினும், அதிக மைய எண்ணிக்கைகள் மற்றும்/அல்லது அதிக ஈதர்நெட் போர்ட் அடர்த்தி கொண்ட தளங்களில், இந்த உள்ளமைவு வள சர்ச்சையை ஏற்படுத்தக்கூடும். எனவே, சில சந்தர்ப்பங்களில் கணினியில் உள்ள ஒவ்வொரு போர்ட்டிற்கும் முன்னிருப்பை மாற்றுவது அவசியமாக இருக்கலாம்.
குறிப்பிட்ட மாதிரி மற்றும் இயக்கி பதிப்பைப் பொறுத்து Tx/Rx வரிசைகளின் முன்னிருப்பு எண்ணிக்கை மாறுபடும். கீழே பட்டியலிடப்பட்டுள்ள ethtool -L கட்டளையைப் பயன்படுத்தி வரிசைகளின் எண்ணிக்கையை சரிசெய்யலாம்.
குறிப்பு
இந்த சந்தர்ப்பங்களில், ஒவ்வொரு போர்ட்டிற்கும் இயல்புநிலை வரிசை எண்ணிக்கையை அடாப்டர் போர்ட்டிற்கு உள்ளூர் NUMA முனையில் கிடைக்கும் CPUகளின் எண்ணிக்கையை விட அதிகமாகக் குறைக்க இன்டெல் பரிந்துரைக்கிறது. சில சந்தர்ப்பங்களில், அதிக போர்ட் எண்ணிக்கை செயல்படுத்தல்களில் வளங்களை சமநிலைப்படுத்த முயற்சிக்கும்போது, ​​இந்த எண்ணிக்கையை மேலும் குறைக்க வேண்டியிருக்கலாம்.
வரிசை உள்ளமைவை மாற்ற:
பின்வரும் முன்னாள்ample போர்ட்டை 32 Tx/Rx வரிசைகளாக அமைக்கிறது: ethtool -L ethX இணைந்தது 32
Example வெளியீடு:
ethtool -l ethX
ethX க்கான சேனல் அளவுருக்கள்: முன்னரே அமைக்கப்பட்ட அதிகபட்சங்கள்:
RX: 96
TX: 96
மற்றவை: 1
ஒருங்கிணைந்தது: 96
தற்போதைய வன்பொருள் அமைப்புகள்:
RX: 0
TX: 0
மற்றவை: 1
ஒருங்கிணைந்தது: 32
4.3 குறுக்கீடு மிதமான தன்மை
தகவமைப்பு குறுக்கீடு மிதமான தன்மை இயல்பாகவே இயக்கத்தில் இருக்கும், மேலும் குறைந்த CPU பயன்பாடு மற்றும் அதிக செயல்திறன் இடையே சமநிலையான அணுகுமுறையை வழங்க வடிவமைக்கப்பட்டுள்ளது. இருப்பினும், உங்கள் பயன்பாட்டு சூழ்நிலைக்கு ஏற்றவாறு குறுக்கீடு அமைப்புகளை கைமுறையாக சரிசெய்ய முயற்சி செய்யலாம்.
0-235 மைக்ரோ விநாடிகள் வரம்பு ஒரு வினாடிக்கு 4,310 முதல் 250,000 வரையிலான குறுக்கீடுகளின் பயனுள்ள வரம்பை வழங்குகிறது. rx-μsecs-high இன் மதிப்பை அதே ethtool கட்டளையில் rx-μsecs மற்றும் tx-μsecs இலிருந்து சுயாதீனமாக அமைக்கலாம், மேலும் இது தகவமைப்பு குறுக்கீடு மிதமான வழிமுறையிலிருந்தும் சுயாதீனமாக உள்ளது. அடிப்படை வன்பொருள் 2 மைக்ரோ விநாடி இடைவெளிகளில் கிரானுலாரிட்டியை ஆதரிக்கிறது, எனவே அருகிலுள்ள மதிப்புகள் அதே குறுக்கீடு விகிதத்தை ஏற்படுத்தக்கூடும்.

  • தகவமைப்பு குறுக்கீடு மிதமான தன்மையை அணைக்க: ethtool -C ethX adaptive-rx off adaptive-tx off
  • தகவமைப்பு குறுக்கீடு மிதமான தன்மையை இயக்க: ethtool -C ethX adaptive-rx on adaptive-tx on

பொதுவான டியூனிங்கிற்கு தொடங்குவதற்கு ஒரு நல்ல இடம் 84 μs அல்லது ~12000 குறுக்கீடுகள்/வினாடி. rx_dropped கவுண்டர்கள் போக்குவரத்தின் போது (ethtool -S ethX ஐப் பயன்படுத்தி) இயங்குவதை நீங்கள் கண்டால், உங்களிடம் CPU மிகவும் மெதுவாக இருக்கலாம், அடாப்டரின் வளைய அளவிலிருந்து (ethtool -G) போதுமான இடையகங்கள் இல்லை, 84 μs அல்லது குறைந்த குறுக்கீடு வீதத்திற்கு பாக்கெட்டுகளை வைத்திருக்க முடியாது.

  • குறுக்கீடுகளுக்கு இடையில் (84 குறுக்கீடுகள்/வினாடி) 12000 μs நிலையான குறுக்கீடு வீதத்திற்கு குறுக்கீடு மிதமான தன்மையை அமைக்க: ethtool -C ethX adaptive-rx off adaptive-tx off rx-usecs 84 tx-usecs 84 CPU பயன்பாட்டில் அதிகபட்சம் இல்லாத நிலையில், முயற்சிக்க வேண்டிய அடுத்த மதிப்பு 62 μs ஆகும். இது அதிக CPU ஐப் பயன்படுத்துகிறது, ஆனால் இது வேகமாக இடையகங்களை வழங்குகிறது, மேலும் குறைவான விளக்கங்கள் (வளைய அளவு, ethtool -G) தேவைப்படுகின்றன.
  • குறுக்கீடுகளுக்கு இடையில் 62 யூஸ்க்களுக்கு நிலையான குறுக்கீடு வீதமாக (16000 குறுக்கீடுகள்/வி) குறுக்கீடு மிதமான தன்மையை அமைக்க. ethtool -C ethX adaptive-rx off adaptive-tx off rx-usecs 62 tx-usecs 62
    rx_dropped கவுண்டர்கள் போக்குவரத்தின் போது அதிகரித்தால் (ethtool -S ethX ஐப் பயன்படுத்தி), உங்களிடம் CPU மிகவும் மெதுவாக இருக்கலாம், அடாப்டரின் வளைய அளவிலிருந்து போதுமான இடையகங்கள் இல்லை (ethtool -G), அல்லது குறுக்கீடு விகிதம் மிகக் குறைவாக இருக்கலாம். CPU பயன்பாட்டில் நீங்கள் அதிகபட்சமாக இல்லாவிட்டால், ITR மதிப்பைக் குறைப்பதன் மூலம் குறுக்கீடு விகிதத்தை அதிகரிக்கலாம். இது அதிக CPU ஐப் பயன்படுத்துகிறது, ஆனால் சேவைகள் வேகமாக இடையகப்படுத்துகின்றன, மேலும் குறைவான விளக்கங்கள் (வளைய அளவு, ethtool -G) தேவைப்படும்.
    உங்கள் CPU 100% இல் இருந்தால், குறுக்கீடு விகிதத்தை அதிகரிப்பது பரிந்துரைக்கப்படவில்லை. CPU பிணைக்கப்பட்ட பணிச்சுமை போன்ற சில சூழ்நிலைகளில், பிற பயன்பாடுகளுக்கு அதிக CPU நேரத்தை இயக்க μs மதிப்பை அதிகரிக்க நீங்கள் விரும்பலாம்.
    உங்களுக்கு குறைந்த தாமத செயல்திறன் தேவைப்பட்டால் மற்றும்/அல்லது நெட்வொர்க் செயலாக்கத்திற்கு அர்ப்பணிக்க ஏராளமான CPU இருந்தால், நீங்கள் குறுக்கீடு மிதமான தன்மையை முழுவதுமாக முடக்கலாம், இது குறுக்கீடுகளை முடிந்தவரை விரைவாகச் செயல்படுத்த உதவுகிறது.
  • குறுக்கீடு மிதமான தன்மையை முடக்க ethtool -C ethX adaptive-rx off adaptive-tx off rx-usecs 0 tx-usecs 0

குறிப்பு
குறுக்கீடு மிதமான தன்மை முடக்கப்பட்ட நிலையில் இயங்கும் போது, ​​ஒவ்வொரு வரிசையிலும் குறுக்கீடு விகிதம் மிக அதிகமாக இருக்கலாம். குறுக்கீடு விகிதத்தில் மேல் வரம்பை அமைக்க rx-usec-high அளவுருவைச் சேர்ப்பதைக் கருத்தில் கொள்ளுங்கள். பின்வரும் கட்டளை தகவமைப்பு குறுக்கீடு மிதமான தன்மையை முடக்குகிறது மற்றும் பெறுதல் அல்லது அனுப்புதல் முடிந்தது என்பதைக் குறிக்கும் முன் அதிகபட்சம் 5 மைக்ரோ விநாடிகளை அனுமதிக்கிறது. வினாடிக்கு 200,000 குறுக்கீடுகளை விளைவிப்பதற்குப் பதிலாக, இது rx-usec-high அளவுரு வழியாக வினாடிக்கு மொத்த குறுக்கீடுகளை 50,000 ஆகக் கட்டுப்படுத்துகிறது. # ethtool -C ethX adaptive-rx off adaptive-tx off rx-usecs-high 20 rx-usecs 5 txusecs 5 பணிச்சுமைக்கு உகந்த மதிப்பைக் கண்டறிய, பரிமாற்றம்/பெறுதல்/உயர்-முன்னுரிமை ஒருங்கிணைப்பு டைமரை அதிகமாக (80/100/150/200) அல்லது குறைவாக (25/20/10/5) சரிசெய்ய முயற்சிக்கவும்.
4.4 மோதிர அளவு
ethtool -S ethX (rx_dropped, rx_dropped.nic) இல் rx_dropped கவுண்டர்களைப் பார்த்தால், அல்லது பல வரிசைகள் செயலில் உள்ள கேச் அழுத்தத்தை சந்தேகித்தால், நீங்கள் வளைய அளவை இயல்புநிலை மதிப்பிலிருந்து சரிசெய்ய முயற்சி செய்யலாம். இயல்புநிலை மதிப்பு 512, அதிகபட்சம் 4096.

  • தற்போதைய மதிப்புகளைச் சரிபார்க்க: ethtool -g ethX
    தற்போதைய குறுக்கீடு விகிதத்தில் இடையகமின்மை வீழ்ச்சியை ஏற்படுத்துவதாக சந்தேகிக்கப்பட்டால், முதலில் அதிகபட்சத்தையும், பின்னர் குறைந்தபட்சத்தையும் முயற்சி செய்து, உகந்த செயல்திறனைக் காணும் வரை பைனரி தேடலில் தொடரவும்.
    கேச் அழுத்தம் சந்தேகிக்கப்பட்டால் (பல வரிசைகள் செயலில் உள்ளன), இயல்புநிலையிலிருந்து இடையகங்களைக் குறைப்பது இன்டெல் ® டேட்டா டைரக்ட் I/O (இன்டெல் ® DDIO) சிறப்பாகச் செயல்பட உதவும். rx_dropped அதிகரிப்பைத் தவிர்க்க ethtool -C வழியாக குறுக்கீடு விகிதத்தை அதிகரிப்பது அவசியமாக இருக்கலாம் என்பதை அறிந்து, இன்டெல் ஒரு வரிசைக்கு 128 அல்லது 256 ஐ முயற்சிக்க பரிந்துரைக்கிறது.
  • வளைய அளவை நிலையான மதிப்புக்கு அமைக்க: ethtool -G eth12 rx 256 tx 256

குறிப்பு
ethtool -S ethX|grep டிராப்பில் காணப்படும் Rx பாக்கெட் டிராப்களை சரிசெய்ய, வளைய அளவை 4096 ஆக அதிகரிப்பதைக் கருத்தில் கொள்ளுங்கள். பணிச்சுமைக்கு ஏற்ற சிறந்த அமைப்பைக் கண்டறிய பரிசோதனை செய்யுங்கள், ஆனால் அதிக மதிப்புகளுடன் அதிகப்படியான நினைவக பயன்பாட்டைக் கவனியுங்கள்.
4.5 ஓட்டக் கட்டுப்பாடு
அடுக்கு 2 ஓட்டக் கட்டுப்பாடு TCP செயல்திறனைக் கணிசமாகப் பாதிக்கலாம், மேலும் பெரும்பாலான பணிச்சுமைகளுக்கு இதை முடக்க பரிந்துரைக்கப்படுகிறது. வெடிப்புகள் நீண்ட காலம் நீடிக்காத வெடிப்பு போக்குவரத்து ஒரு சாத்தியமான விதிவிலக்காகும்.
ஓட்டக் கட்டுப்பாடு இயல்பாகவே முடக்கப்பட்டுள்ளது.

  • ஓட்டக் கட்டுப்பாட்டை இயக்க: ethtool -A ethX rx on tx on
  • ஓட்டக் கட்டுப்பாட்டை முடக்க: ethtool -A ethX rx off tx off

குறிப்பு
ஓட்டக் கட்டுப்பாட்டை வெற்றிகரமாக இயக்க, உங்களிடம் ஓட்டக் கட்டுப்பாட்டு திறன் கொண்ட இணைப்பு கூட்டாளர் இருக்க வேண்டும்.
4.6 ஜம்போ பிரேம்கள்
எதிர்பார்க்கப்படும் போக்குவரத்து சூழலில் பெரிய அளவிலான தரவு பரிமாற்றம் செய்யப்படும்போது, ​​ஜம்போ பிரேம் அம்சத்தை இயக்குவது நன்மை பயக்கும். ஜம்போ பிரேம்கள் ஆதரவு அதிகபட்ச பரிமாற்ற அலகு (MTU) ஐ இயல்புநிலை மதிப்பான 1500 ஐ விட பெரிய மதிப்பிற்கு மாற்றுவதன் மூலம் செயல்படுத்தப்படுகிறது. இது சாதனம் நெட்வொர்க் சூழலுக்குள் பெரிய பாக்கெட்டுகளில் தரவை மாற்ற அனுமதிக்கிறது. இந்த அமைப்பு செயல்திறனை மேம்படுத்தலாம் மற்றும் பெரிய I/O பணிச்சுமைகளுக்கு CPU பயன்பாட்டைக் குறைக்கலாம். இருப்பினும், இது சிறிய பாக்கெட் அல்லது தாமத-உணர்திறன் பணிச்சுமைகளை பாதிக்கலாம்.
குறிப்பு
ஜம்போ பிரேம்கள் அல்லது பெரிய MTU அமைப்பு உங்கள் நெட்வொர்க் சூழலில் சரியாக உள்ளமைக்கப்பட வேண்டும்.
MTU அளவை அதிகரிக்க ifconfig கட்டளையைப் பயன்படுத்தவும்.ample, பின்வருவனவற்றை உள்ளிடவும், எங்கே இடைமுக எண்: ifconfig mtu 9000 வரை
மாற்றாக, நீங்கள் ip கட்டளையை பின்வருமாறு பயன்படுத்தலாம்: ip link set mtu 9000 dev ஐபி இணைப்பு அமைவு டெவலப்பர்

பிளாட்ஃபார்ம் ட்யூனிங் (i40e குறிப்பிட்டதல்ல)

5.1 பயாஸ் அமைப்புகள்

  • மெய்நிகராக்க பணிச்சுமைகளுக்கு Intel® VT-d ஐ இயக்கவும்.
  • ஹைப்பர்-த்ரெடிங் (தருக்க செயலிகள்) செயல்திறனைப் பாதிக்கலாம். உங்கள் பணிச்சுமைக்கு அதை இயக்கவோ அல்லது முடக்கவோ முயற்சிக்கவும்.
  • Intel® Turbo Boost ஆனது CPU கோர்களை CPUவின் அடிப்படை அதிர்வெண்ணை விட அதிக அதிர்வெண்ணில் இயக்க அனுமதிக்கிறது. Intel® Turbo Boost ஐ இயக்குவது பல பணிச்சுமைகளுக்கு செயல்திறனை மேம்படுத்தலாம், ஆனால் கோர்களை அதிக அதிர்வெண்ணில் வைத்திருக்க அதிக சக்தியைப் பயன்படுத்துகிறது. உங்கள் பணிச்சுமைக்கு Turbo Boost ஐ ஆஃப்/ஆன் மூலம் பரிசோதிக்கவும்.

குறிப்பு
தளம் அதிக ஒட்டுமொத்த CPU பயன்பாட்டை அனுபவித்தால் டர்போ அதிர்வெண்கள் உத்தரவாதம் அளிக்கப்படாது. ஒட்டுமொத்த CPU பயன்பாடு அதிகரிக்கும் போது அதிக கோர் டர்போ அதிர்வெண்கள் குறைக்கப்படும்.
5.2 சக்தி மேலாண்மை
மின் மேலாண்மை செயல்திறனை பாதிக்கலாம், குறிப்பாக குறைந்த தாமத பணிச்சுமைகளில். மின் நுகர்வைக் குறைப்பதை விட செயல்திறன் அதிக முன்னுரிமையாக இருந்தால், மின் நிர்வாகத்தின் விளைவுகளை கட்டுப்படுத்துவதில் நீங்கள் பரிசோதனை செய்ய இன்டெல் பரிந்துரைக்கிறது. இயக்க முறைமை கருவிகள், பயாஸ் அமைப்புகள் மற்றும் கர்னல் துவக்க அளவுருக்கள் மூலம் மின் நிர்வாகத்தை கட்டுப்படுத்த பல வழிகள் உள்ளன. உங்கள் சூழலுக்கு ஏற்ற சிறந்த முறை மற்றும் நிலையைத் தேர்வுசெய்யவும்.
5.2.1 சி-நிலை கட்டுப்பாடு
C-நிலை நுழைவை CO அல்லது C1 க்கு வரம்பிடுவது செயல்திறனை மேம்படுத்துகிறது மற்றும் மின் பயன்பாட்டை அதிகரிக்கிறது.
CPU தொகுப்பு C6 நிலை உள்ளீட்டை முடக்குவது பிணைய செயல்திறனை மேம்படுத்தலாம். இருப்பினும், இது மின் பயன்பாட்டை அதிகரிக்கிறது.
பின்வரும் விருப்பங்கள் உள்ளன:

  • C-நிலை உள்ளீட்டை மாறும் வகையில் கட்டுப்படுத்தவும்:
    திற
    /dev/cpu_dma_latency ஐ உள்ளிட்டு, அதற்கு அனுமதிக்கக்கூடிய அதிகபட்ச தாமதத்தை எழுதவும்.

குறிப்பு
cpudmalatancy.c என்ற ஒரு சிறிய நிரல் உள்ளது, அதை திறந்த மூல சமூகத்திலிருந்து பதிவிறக்கம் செய்து, தொகுத்து, கட்டளை வரியிலிருந்து இயக்கலாம், இதனால் அது சரியாகச் செயல்படும்.
பின்வரும் முன்னாள்ample ஐந்து μs விழித்தெழுந்த நேரத்தை அனுமதிக்கிறது, இதனால் C1 உள்ளீட்டை அனுமதிக்கிறது: cpudmalatency 5 &

  • கர்னல் துவக்க அமைப்புகளில் அதிகபட்ச C-நிலையை வரம்பிடவும்:
    இன்டெல் CPUகளுக்கு: intel_idle.max_cstates=1
    இன்டெல் அல்லாத CPUகளுக்கு: processor.max_cstates=1
  • CPU C6 நிலையைச் சரிபார்த்து முடக்க cpupower கட்டளையைப் பயன்படுத்தவும்: சரிபார்க்கவும்: cpupower மானிட்டர் அல்லது cpupower idle-info
    C6 ஐ முடக்கு: cpupower idle-set -d3 அல்லது
    C-States ஐ முடக்கு: cpupower idle-set -D0

குறிப்புகள்:

  1. சர்வரில் Intel® 4வது Gen Intel® Xeon® அளவிடக்கூடிய செயலி(கள்) இருந்தால் CPU-வில் C-நிலைகளை முடக்கு. ஹைப்பர் த்ரெடிங் இயக்கப்பட்டிருக்கும்போது அல்லது முடக்கப்பட்டிருக்கும்போது, ​​செயலற்ற நிலைகளை (-D0) முடக்குவது செயலற்ற காலங்களின் போது கோர்கள் குறைந்த-சக்தி நிலைகளுக்குள் நுழைவதைத் தடுக்கிறது மற்றும் செயலற்ற மற்றும் செயலில் உள்ள நிலைகளுக்கு இடையில் மாறுவதற்கான CPUக்கான தாமதத்தைக் குறைக்கிறது.
  2. இன்டெல்® 4வது ஜெனரல் இன்டெல்® ஜியோன்® அளவிடக்கூடிய செயலியின் சக்தி மேலாண்மை மிகவும் தீவிரமானது. குறைந்த சக்தி நிலைகளுக்குள் கோர்கள் நுழைவதைத் தவிர்க்க, பயன்பாட்டில் உள்ள கோர்களின் எண்ணிக்கையைக் குறைத்து அவற்றை நீண்ட நேரம் விழித்திருக்க முயற்சிக்கவும் (ethtool -L) இணைந்தது ). மேலும், irq affinity set (பெரும்பாலும் -x local அல்லது CPU core list உடன்) பயன்படுத்தி குறிப்பிட்ட கோர்களுடன் குறுக்கீடுகளை பிணைக்கவும், மேலும் பணிச்சுமை taskset அல்லது numactl உடன் அதே கோர்களில் இயங்குவதை உறுதி செய்யவும். இது கோர்களை செயலில் வைத்திருப்பதன் மூலமும் குறுக்கீடு கையாளுதலை மேம்படுத்துவதன் மூலமும் செயல்திறனை மேம்படுத்துகிறது.

C6 ஐ இயக்கு:
cpupower ஐடில்-செட் -d3
C-ஸ்டேட்ஸை இயக்கு:
cpupower ஐடில்-செட் -E

  • மற்றொரு முறை, செயல்திறன் சார்பு நிரலை அமைக்க டியூன் செய்யப்பட்ட கருவியை (பல லினக்ஸ் விநியோகங்களுடன் சேர்த்து) பயன்படுத்துவது ஆகும்.file. இந்த சார்புfileபல பயன்பாடுகளில் செயல்திறனைப் பாதிக்கக்கூடிய பல OS அமைப்புகளை கள் மாற்றியமைக்கின்றன. நெட்வொர்க்-த்ரூபுட் ப்ரோ என்று கண்டறியப்பட்டுள்ளது.file பெரும்பாலான பணிச்சுமைகளுக்கு முன்னேற்றத்தை வழங்குகிறது.
    சரிபார்க்கவும்:
    டியூன் செய்யப்பட்டது-adm செயலில் உள்ளது
    அமை:
    டியூன் செய்யப்பட்ட-அட்மி புரோfile நெட்வொர்க்-செயல்திறன்
    குறிப்பு
    மேலே உள்ள கட்டளைகளுக்கு Tuned சேவை இயங்க வேண்டும். சரிபார்க்க/மறுதொடக்கம் செய்ய, tuned: systemctl status tuned systemctl restart tuned
    கர்னல் துவக்க வரியில் பின்வருவனவற்றைச் சேர்ப்பதன் மூலம் நீங்கள் எந்த C-நிலை உள்ளீட்டையும் அனுமதிக்க முடியாது:
    ஐடில்=வாக்கெடுப்பு
  • கணினியின் BIOS மின் மேலாண்மை அமைப்புகள் மூலம் C-நிலையை வரம்பிடவும், இது ஒரு செயல்திறன் நிபுணரைக் கொண்டிருக்கலாம்.file கிடைக்கும்.
    டர்போஸ்டாட் அல்லது x86_energy_perf_policy போன்ற கருவிகளைப் பயன்படுத்தி மின் மேலாண்மை அமைப்புகளைச் சரிபார்க்கவோ அல்லது அமைக்கவோ முடியும்.

5.2.2 PCIe மின் மேலாண்மை
ஆக்டிவ்-ஸ்டேட் பவர் மேனேஜ்மென்ட் (ASPM) PCIe இணைப்புகள் செயலில் இல்லாதபோது குறைந்த பவர் நிலையை செயல்படுத்துகிறது. இது PCIe நெட்வொர்க் சாதனங்களில் அதிக தாமதத்தை ஏற்படுத்தக்கூடும், எனவே தாமத உணர்திறன் பணிச்சுமைகளுக்கு ASPM ஐ முடக்க இன்டெல் பரிந்துரைக்கிறது. கர்னல் துவக்க வரியில் பின்வருவனவற்றைச் சேர்ப்பதன் மூலம் ASPM ஐ முடக்கவும்: pcie_aspm=off
5.2.3 CPU அதிர்வெண் அளவிடுதல்
CPU அதிர்வெண் அளவிடுதல் (அல்லது CPU வேக அளவிடுதல்) என்பது ஒரு லினக்ஸ் சக்தி மேலாண்மை நுட்பமாகும், இதில் மின்சாரம் மற்றும் வெப்பத்தை சேமிக்க கணினி கடிகார வேகம் உடனடியாக சரிசெய்யப்படுகிறது. C-நிலைகளைப் போலவே, இது பிணைய இணைப்புகளில் தேவையற்ற தாமதத்தை ஏற்படுத்தும்.
CPU செயல்திறன் இயல்புநிலைகள் மற்றும் வரம்புகளைச் சரிபார்த்து மாற்றியமைக்க cpupower கருவியைப் பயன்படுத்தலாம்:

  • சரிபார்க்கவும்: cpupower மானிட்டர் அல்லது
  • CPU களை செயல்திறன் பயன்முறைக்கு அமைக்கவும்: cpupower frequency-set -g செயல்திறன்

குறிப்பு
CPU அதிர்வெண் வரம்புகளில் ஏற்படும் மாற்றங்கள் பல பணிச்சுமைகளில் தாக்கத்தை ஏற்படுத்தக்கூடும், மேலும் CPU டர்போ பயன்முறை போன்ற பிற அம்சங்களை முடக்கக்கூடும்.
CPU அதிர்வெண் அளவிடுதலை முடக்க, பின்வரும் கட்டளைகளைப் பயன்படுத்தி CPU சக்தி சேவையை முடக்கவும்:
systemctl cpupower.service ஐ நிறுத்து
systemctl cpupower.service ஐ முடக்கு
5.2.4 கூடுதல் மின் மேலாண்மை வழிகாட்டுதல்
இந்த உயர் மட்ட விவாதத்தில் கூடுதல் விவரங்கள் வழங்கப்பட்டுள்ளன.view 3வது தலைமுறை இன்டெல்® ஜியோன்® அளவிடக்கூடிய செயலிகளில் உள்ள பல மின் மேலாண்மை அம்சங்கள், அத்துடன் இந்த அம்சங்களை ஒரு தள மட்டத்தில் எவ்வாறு ஒருங்கிணைக்க முடியும் என்பதற்கான வழிகாட்டுதல்: https://networkbuilders.intel.com/solutionslibrary/power-management-technologyoverview-technology-guide
5.3 இன்டெல்® டர்போ பூஸ்ட்
தேவைப்படும்போது இன்டெல்® டர்போ பூஸ்ட் செயலியை வேகமாக்குகிறது, ஆனால் கூடுதல் சக்தியை நுகரும். டர்போ பூஸ்டை அணைப்பது செயலியை நிலையான வேகத்தில் வைத்திருக்கிறது, குறிப்பிட்ட பணிச்சுமைகளுக்கு நிலையான செயல்திறன் அளவை உங்களுக்கு வழங்குகிறது.
5.4 ஃபயர்வால்கள்
ஃபயர்வால்கள் செயல்திறனை, குறிப்பாக தாமத செயல்திறனை பாதிக்கலாம்.
தேவையில்லை என்றால் iptables/firewalld ஐ முடக்கு.
5.5 பயன்பாட்டு அமைப்புகள்
அதிகபட்ச அலைவரிசையை அடைய பெரும்பாலும் ஒரு ஒற்றை நூல் (இது ஒரு நெட்வொர்க் வரிசைக்கு ஒத்திருக்கிறது) போதுமானதாக இருக்காது. AMD போன்ற சில இயங்குதள கட்டமைப்புகள், இன்டெல்-அடிப்படையிலான செயலிகளைக் கொண்ட தளங்களுடன் ஒப்பிடும்போது, ​​ஒற்றை நூலுடன் அதிக Rx பாக்கெட்டுகளை கைவிட முனைகின்றன.
TASCET அல்லது numactl போன்ற கருவிகளைப் பயன்படுத்தி பயன்பாடுகளை NUMA முனை அல்லது CPU கோர்களை நெட்வொர்க் சாதனத்திற்கு உள்ளூர் முறையில் பின் செய்ய பரிசீலிக்கவும். சேமிப்பக I/O போன்ற சில பணிச்சுமைகளுக்கு, பயன்பாட்டை உள்ளூர் அல்லாத முனைக்கு நகர்த்துவது நன்மை பயக்கும்.
முடிந்தால் உங்கள் பயன்பாட்டில் பயன்படுத்தப்படும் நூல்களின் எண்ணிக்கையை அதிகரிப்பதில் பரிசோதனை செய்யுங்கள்.
5.6 கர்னல் பதிப்பு
பெரும்பாலான நவீன இன்-பாக்ஸ் கர்னல்கள் செயல்திறனுக்காக நியாயமான முறையில் மேம்படுத்தப்பட்டுள்ளன, ஆனால், உங்கள் பயன்பாட்டு சூழ்நிலையைப் பொறுத்து, கர்னலைப் புதுப்பிப்பது மேம்பட்ட செயல்திறனை வழங்கக்கூடும். மூலத்தைப் பதிவிறக்குவது கர்னலை உருவாக்குவதற்கு முன்பு சில அம்சங்களை இயக்க/முடக்க உங்களை அனுமதிக்கிறது.
5.7 இயக்க முறைமை/கர்னல் அமைப்புகள்
பொதுவான இயக்க முறைமை சரிப்படுத்தும் முறை பற்றிய கூடுதல் நுண்ணறிவுக்கு Red Hat Enterprise Linux நெட்வொர்க் செயல்திறன் சரிப்படுத்தும் வழிகாட்டி போன்ற இயக்க முறைமை சரிப்படுத்தும் வழிகாட்டிகளைப் பார்க்கவும்.
சரிசெய்ய சில பொதுவான அளவுருக்கள் பின்வரும் அட்டவணையில் பட்டியலிடப்பட்டுள்ளன. இவை பரிந்துரைக்கப்பட்ட தொடக்கப் புள்ளிகள் மட்டுமே என்பதை நினைவில் கொள்ளவும், மேலும் அவற்றை இயல்புநிலைகளிலிருந்து மாற்றுவது கணினியில் பயன்படுத்தப்படும் வளங்களை அதிகரிக்கக்கூடும். மதிப்புகளை அதிகரிப்பது செயல்திறனை மேம்படுத்த உதவும் என்றாலும், கொடுக்கப்பட்ட அமைப்பு, பணிச்சுமை மற்றும் போக்குவரத்து வகைக்கு எது சிறப்பாகச் செயல்படுகிறது என்பதைத் தீர்மானிக்க வெவ்வேறு மதிப்புகளுடன் பரிசோதனை செய்வது அவசியம்.
கீழே குறிப்பிடப்பட்டுள்ளபடி லினக்ஸில் sysctl பயன்பாட்டைப் பயன்படுத்தி கர்னல் அளவுருக்களை உள்ளமைக்க முடியும்.
செய்ய view கணினியில் rmem மற்றும் wmem க்கான முன்னிருப்பு மதிப்புகள்:
sysctl net.core.rmem_default (இயல்புநிலை)
sysctl net.core.wmem_default
மதிப்புகளை அதிகபட்சமாக (16 MB) அமைக்கவும்:
sysctl -w net.core.rmem_max=16777216
sysctl -w net.core.wmem_max=16777216
சாக்கெட் பஃபர் அளவுகள், ரிசீவ் பஃபர் (rmem) மற்றும் டிரான்ஸ்மிட் பஃபர் (wmem) என்றும் அழைக்கப்படுகின்றன, அவை உள்வரும் மற்றும் வெளிச்செல்லும் நெட்வொர்க் போக்குவரத்திற்காக ஒதுக்கப்பட்ட நினைவகத்தின் அளவைக் குறிப்பிடும் கணினி அளவுருக்கள் ஆகும்.
-w வாதம் இல்லாமல் sysctl ஐ இயக்குவது, அளவுருவை அதன் தற்போதைய அமைப்பைக் கொண்டு பட்டியலிடுகிறது.

அடுக்கு அமைப்பு விளக்கம்
net.core.rmem_default (இயல்புநிலை) இயல்புநிலை பெறுதல் சாளர அளவு
net.core.wmem_default (இயல்புநிலை) இயல்புநிலை டிரான்ஸ்மிட் சாளர அளவு
net.core.rmem_max பற்றி அதிகபட்ச ரிசீவ் சாளர அளவு
நெட்.கோர்.டபிள்யூஎம்இஎம்_மேக்ஸ் அதிகபட்ச டிரான்ஸ்மிட் சாளர அளவு
நெட்.கோர்.ஆப்ட்மெம்_மேக்ஸ் அதிகபட்ச விருப்ப நினைவக இடையகங்கள்
net.core.netdev_max_backlog (பின்பதிவு) கர்னல் கைவிடத் தொடங்குவதற்கு முன் பதப்படுத்தப்படாத பாக்கெட்டுகளின் பின்னிணைப்பு
net.ipv4.tcp_rmem TCP ரீட் பஃபர்களுக்கான மெமரி ரிசர்வர்
net.ipv4.tcp_wmem TCP அனுப்பு இடையகங்களுக்கான நினைவக இருப்பு

கர்னல், நெட்வொர்க் ஸ்டேக், நினைவக கையாளுபவர், CPU வேகம் மற்றும் சக்தி மேலாண்மை அளவுருக்கள் நெட்வொர்க் செயல்திறனில் பெரிய தாக்கத்தை ஏற்படுத்தும். நெட்வொர்க் த்ரோபுட் ப்ரோவுக்குப் பயன்படுத்துவது ஒரு பொதுவான பரிந்துரை.file ட்யூன் செய்யப்பட்ட கட்டளையைப் பயன்படுத்தி. நெட்வொர்க்கிங் பயன்பாடுகளுக்கு முன்னுரிமை அளிக்க இது சில OS அமைப்புகளை மாற்றியமைக்கிறது.
சரிபார்க்கவும்:
டியூன் செய்யப்பட்டது-adm செயலில் உள்ளது
அமை:
டியூன் செய்யப்பட்ட-அட்மி புரோfile நெட்வொர்க்-செயல்திறன்
5.8 பிணைய சாதன பின்னிணைப்பு
இந்த அம்சம் உள்வரும் போக்குவரத்தை திறம்பட நிர்வகிப்பதன் மூலமும், பாக்கெட் இழப்பைக் குறைப்பதன் மூலமும், தாமதத்தைக் குறைப்பதன் மூலமும், செயல்திறனை அதிகரிப்பதன் மூலமும் நெட்வொர்க் செயல்திறனை மேம்படுத்த உதவுகிறது. இது சிறந்த பயனர் அனுபவத்திற்கும் வேகமான கணினி பதிலுக்கும் வழிவகுக்கிறது.
இயல்பாக, இது பெரும்பாலான லினக்ஸ் இயக்க முறைமைகளில் இயக்கப்பட்டிருக்கும். இயல்புநிலை மதிப்பைச் சரிபார்க்க:
sysctl net.core.netdev_max_backlog
கர்னல் பதிப்பு, வன்பொருள், நினைவகம் மற்றும் பணிச்சுமை போன்ற காரணிகளைப் பொறுத்து netdev_max_backlog க்கான அதிகபட்ச மதிப்பு மாறுபடும். பல சந்தர்ப்பங்களில், 8192 ஒரு நல்ல மதிப்பாகக் காணப்படுகிறது. sysctl -w net.core.netdev_max_backlog=8192
5.9 இயங்குதளம் சார்ந்த உள்ளமைவுகள் மற்றும் டியூனிங்
5.9.1 4வது தலைமுறை இன்டெல்® ஜியோன்® அளவிடக்கூடிய செயலிகள்

4வது தலைமுறை இன்டெல்® ஜியோன்® அளவிடக்கூடிய செயலிகளுடன் ஒப்பிடும்போது இன்டெல்® 3வது தலைமுறை இன்டெல்® ஜியோன்® அளவிடக்கூடிய செயலியின் சக்தி மேலாண்மை மிகவும் தீவிரமானது. குறைந்த சக்தி நிலைகளுக்குள் கோர்கள் நுழைவதைத் தவிர்க்க, அவற்றை நீண்ட நேரம் விழித்திருக்க வைக்க பயன்பாட்டில் உள்ள கோர்களின் எண்ணிக்கையைக் குறைக்க முயற்சிக்கவும்.
அதிகபட்ச செயல்திறனுக்கான பரிந்துரைக்கப்பட்ட பயோஸ் அமைப்புகள்

  1. CPU-வில் ஹைப்பர்-த்ரெடிங்கை இயக்கு/முடக்கு (பணிச்சுமை தேவை மற்றும் செயல்திறன் இலக்குகளின் அடிப்படையில்).
  2. சிஸ்டம் ப்ரோவை அமைக்கவும்file அதிகபட்ச செயல்திறனுக்கான செயல்திறனுக்கு.
    குறிப்பு
    இதனால் அதிக மின் நுகர்வு ஏற்படுகிறது.
  3. மின்சக்தி செயல்திறனை விட அதிகபட்ச CPU செயல்திறனை முன்னுரிமைப்படுத்த CPU மின் நிர்வாகத்தை அதிகபட்ச செயல்திறனுக்கு அமைக்கவும்.
  4. டர்போ பூஸ்டை இயக்கு. கணினி பயாஸ் அமைப்புகளில் டர்போ பூஸ்டை முடக்குவது பொதுவாக CPU அதன் அடிப்படை அதிர்வெண்ணைத் தாண்டி அதன் கடிகார வேகத்தை மாறும் வகையில் அதிகரிப்பதைத் தடுக்கிறது.
  5. குறிப்பு
    அதிகபட்ச செயல்திறனை விட நிலையான செயல்திறன், மின் திறன் அல்லது வெப்ப மேலாண்மை முன்னுரிமை அளிக்கப்படும் சில பயன்பாட்டு நிகழ்வுகளுக்கு டர்போ பூஸ்டை முடக்குவது பொருத்தமானதாக இருக்கலாம்.
  6. கணினி மெய்நிகராக்க தொழில்நுட்பங்களைப் பயன்படுத்தவில்லை என்றால், ஒற்றை ரூட் I/O மெய்நிகராக்கம் (SR-IOV) அம்சத்தை முடக்கவும்.
  7. CPU செயலில் இருக்கவும், ஆழமான செயலற்ற நிலைகளுக்குள் நுழைவதைத் தடுக்கவும் C-ஸ்டேட்களை முடக்கு.
  8. CPU செயலில் இருப்பதையும் C1E செயலற்ற நிலைக்குச் செல்லாமல் இருப்பதையும் உறுதிசெய்ய, C1E ஐ முடக்கவும்.
  9. கிடைக்கக்கூடிய அதிகபட்ச அதிர்வெண்ணில் கணினி செயல்பட அறிவுறுத்த, அன்கோர் அதிர்வெண்ணை அதிகபட்சமாக அமைக்கவும்.
  10. டெல் இயங்குதளங்களில், CPU கோர்களின் தெளிவான மற்றும் கணிக்கக்கூடிய மேப்பிங்கை வழங்க, மல்டிபிள் APIC டிஸ்கிரிப்ஷன் டேபிள் (MADT) கோர் எமுலேஷனை லீனியராக (அல்லது BIOS-ஐப் பொறுத்து ரவுண்ட்-ராபின்) அமைக்கவும்.

மேம்படுத்தப்பட்ட செயல்திறனுக்காக பரிந்துரைக்கப்பட்ட OS நிலை டியூனிங்ஸ்

  1. CPU அதிர்வெண் அளவிடுதல் கவர்னரை செயல்திறனுக்கு அமைக்கவும். cpupower frequency-set -g செயல்திறன் cpupower frequency-info
  2. C-States ஐ முடக்கு. cpupower idle-set -D0
  3. கோர் Rx (rmem) மற்றும் Tx (wmem) இடையகங்களை அதிகபட்ச மதிப்புக்கு அமைக்கவும். sysctl -w net.core.rmem_max=16777216 sysctl -w net.core.wmem_max=16777216
  4. பிணைய சாதன பேக்லாக்கை அமைக்கவும். sysctl -w net.core.netdev_max_backlog=8192
  5. டியூன் செய்யப்பட்ட ப்ரோவை அமைக்கவும்file (செயல்திறன்/தாமதத்தைப் பொறுத்து பணிச்சுமை).
    டியூன் செய்யப்பட்ட-அட்மி புரோfile நெட்வொர்க்-செயல்திறன்

உகந்த செயல்திறனுக்காக பரிந்துரைக்கப்பட்ட அடாப்டர் நிலை டியூனிங்ஸ்

  1. பயன்பாட்டு போக்குவரத்திற்கு பயன்படுத்த வேண்டிய வரிசைகளின் எண்ணிக்கையை வரம்பிடவும். தொடர்புடைய CPU கோர்கள் ஆழமான செயலற்ற நிலைகளுக்குள் நுழைவதைத் தடுக்க, அவற்றை செயலில் வைத்திருக்க தேவையான குறைந்தபட்ச வரிசைகளின் எண்ணிக்கையைப் பயன்படுத்தவும் (பணிச்சுமைக்கு ஏற்ப சரிசெய்யவும்): ethtool -L இணைந்தது 32
  2. குறுக்கீடு மிதமான விகிதங்களை அமைக்கவும். ethtool -C அடாப்டிவ்-ஆர்எக்ஸ் ஆஃப் அடாப்டிவ்-டிஎக்ஸ் ஆஃப் ஆர்எக்ஸ்-யூசெக்ஸ்-ஹை 50 ஆர்எக்ஸ்-யூசெக்ஸ் 50 டிஎக்ஸ்-யூசெக்ஸ் 50
    பணிச்சுமைக்கு உகந்த மதிப்பைக் கண்டறிய, பரிமாற்றம்/பெறுதல்/உயர்-முன்னுரிமை ஒருங்கிணைப்பு டைமரை அதிகமாக (80/100/150/200) அல்லது குறைவாக (25/20/10/5) சரிசெய்ய முயற்சிக்கவும்.
  3. Rx/Tx வளைய அளவுகளை அமைக்கவும். ethtool -G ஆர்எக்ஸ் 4096 டிஎக்ஸ் 4096
    குறிப்பு
    ethtool -S| grep டிராப் உடன் Rx பாக்கெட் டிராப்களைக் கண்டால், வளைய அளவை <4096 ஆகக் குறைக்க முயற்சிக்கவும். பாக்கெட்டுகள் டிராப் செய்யப்படாத பணிச்சுமைக்கு உகந்த மதிப்பைக் கண்டறிய முயற்சிக்கவும்.
  4. IRQ இணைப்புகளை அமைக்கவும். NIC க்கு உள்ளூர் கோர்களை அல்லது குறிப்பிட்ட கோர் மேப்பிங்கைப் பயன்படுத்தவும் (இங்கு # கோர்கள் பக்கம் 1 இல் 26 இல் அமைக்கப்பட்ட வரிசைகளின் எண்ணிக்கைக்கு சமம். systemctl stop irqbalance set_irq_affinity -X local அல்லது set_irq_affinity -X

5.9.2 AMD EPYC
AMD EPYC செயலிகள், AMD இன் ஜென் கட்டமைப்பில் கட்டமைக்கப்பட்ட சர்வர்கள் மற்றும் தரவு மையங்களுக்காக உருவாக்கப்பட்ட சக்திவாய்ந்த CPUகள் ஆகும். கீழே உள்ள அமைப்புகள் AMD இன் 4வது தலைமுறை EPYC தொடரிலிருந்து வந்தவை.
அதிகபட்ச செயல்திறனுக்கான பரிந்துரைக்கப்பட்ட பயாஸ் அமைப்புகள்

  1. பயனர்கள் CPU செயல்திறன், மின் நுகர்வு மற்றும் பிற அமைப்புகளை சரிசெய்ய அனுமதிக்க தனிப்பயன் பயன்முறையை இயக்கவும். செயல்திறன் மற்றும் ஆற்றல் திறன் ஆகியவற்றுக்கு இடையே சிறந்த சமநிலையை அடைய கணினியை நன்றாகச் சரிசெய்ய இது உதவுகிறது.
  2. ஒட்டுமொத்த செயல்திறனை மேம்படுத்தி, அதிக தீவிரமான பணிகளைக் கையாள CPU தானாகவே அதன் வேகத்தை அதிகரிக்க அனுமதிக்க, முக்கிய செயல்திறன் ஊக்கத்தை இயக்கவும்.
  3. CPU, C-ஸ்டேட்ஸ் எனப்படும் ஆழமான மின் சேமிப்பு நிலைகளுக்குள் நுழைவதைத் தடுக்க, உலகளாவிய C-ஸ்டேட் கட்டுப்பாட்டை முடக்கவும், இது மறுமொழித்தன்மையை பராமரிக்க முடியும்.
    குறிப்பு
    C-நிலைகளை முடக்குவது கூடுதல் மின் நுகர்வுக்கு வழிவகுக்கும் மற்றும் வெப்ப வெப்பநிலையை அதிகரிக்கும். பணிச்சுமைக்காக இரண்டையும் கண்காணிக்கவும்.
  4. பணிச்சுமை தேவை மற்றும் செயல்திறன் இலக்குகளின் அடிப்படையில், CPU இல் ஒரே நேரத்தில் மல்டித்ரெடிங்கை (SMT) இயக்கு/முடக்கு. SMT என்பது இன்டெல் CPU களில் ஹைப்பர் த்ரெடிங்கிற்குச் சமம்.
    குறிப்பு
    உகந்த செயல்திறனுக்காக, பரிந்துரைக்கப்பட்ட OS மற்றும் அடாப்டர் நிலை டியூனிங்கிற்கு பக்கம் 40 இல் உள்ள ட்யூனிங் i13e டிரைவர் அமைப்புகளையும் பக்கம் 40 இல் உள்ள பிளாட்ஃபார்ம் ட்யூனிங் (i19e குறிப்பிட்டதல்ல) ஐயும் பார்க்கவும்.

அடாப்டர் பிணைப்பு

லினக்ஸ் பிணைப்பு என்பது சேவையக சூழல்களில் பிணைய செயல்திறன், பணிநீக்கம் மற்றும் தவறு சகிப்புத்தன்மையை கணிசமாக மேம்படுத்தக்கூடிய ஒரு சக்திவாய்ந்த அம்சமாகும். இருப்பினும், சேவையகம் மற்றும் சுவிட்ச் இரண்டிலும் இணக்கமான பிணைய வன்பொருள் மற்றும் சரியான உள்ளமைவு சரியாகச் செயல்பட வேண்டும் என்பதைக் கவனத்தில் கொள்ள வேண்டும்.
லினக்ஸில் உள்ள பிணைப்பு இயக்கி பல இயற்பியல் பிணைய இடைமுகங்களை ஒரு பிணைக்கப்பட்ட இடைமுகமாக ஒருங்கிணைக்க உங்களை அனுமதிக்கிறது. இந்த பிணைக்கப்பட்ட இடைமுகம் இயக்க முறைமை மற்றும் பயன்பாடுகளுக்கு ஒற்றை மெய்நிகர் பிணைய இடைமுகமாகத் தோன்றும்.
குறிப்பு
பிணைப்பு ஒரு தருக்க இடைமுகம், எனவே பிணைப்பு இடைமுகத்தில் நேரடியாக CPU இணக்கத்தை அமைக்க முடியாது (எ.கா.ample, bond0). அதாவது, குறுக்கீடு கையாளுதல் அல்லது CPU தொடர்பு மீது இதற்கு நேரடி கட்டுப்பாடு இல்லை. பிணைப்பின் ஒரு பகுதியாக இருக்கும் அடிப்படை இடைமுகங்களுக்கு CPU தொடர்பு உள்ளமைக்கப்பட வேண்டும்.
பிணைப்பு பல செயல்பாட்டு முறைகளை வழங்குகிறது, ஒவ்வொன்றும் அதன் சொந்த குணாதிசயங்களைக் கொண்டுள்ளன.

பயன்முறை  வகை
0 ரவுண்ட் ராபின்
1 செயலில் உள்ள காப்புப்பிரதி
2 XOR
3 ஒளிபரப்பு
4 LACP
5 சுமை இருப்பை அனுப்பு
6 தகவமைப்பு சுமை இருப்பு

லினக்ஸில் பிணைப்பை உருவாக்க பல்வேறு முறைகள் உள்ளன. மிகவும் பொதுவான முறைகளில் ஒன்று பிணைய உள்ளமைவைப் பயன்படுத்துவதாகும். fileகள் (எ.காample, /etc/network/ இடைமுகங்கள் அல்லது /etc/sysconfig/network-scripts/ifcfg-bondX).
பிணைய உள்ளமைவைப் பயன்படுத்தி உள்ளமைவு Files
பின்வரும் படிகள் பிணைய உள்ளமைவு மூலம் பிணைப்பை உருவாக்குகின்றன. files.

  1. பிணைப்புக்கு இரண்டு அல்லது அதற்கு மேற்பட்ட NIC போர்ட்களைத் தேர்ந்தெடுக்கவும் (எ.கா.ample, ethX மற்றும் ethY)
  2. NIC உள்ளமைவைத் திறக்கவும் Fileதேவையான NIC இடைமுகத்திற்கு /etc/sysconfig/network-scripts/ இன் கீழ் s (எ.கா.ample, vi ifcfg-ethX மற்றும் vi ifcfg-ethY) என உள்ளிட்டு, பின்வரும் உரையைச் சேர்க்கவும்:
    MASTER=bondN [குறிப்பு: பிணைப்பு எண்ணைக் குறிப்பிட N என்பது ஒரு முழு எண்.] SLAVE=yes
  3. ஒரு பாண்ட் நெட்வொர்க் ஸ்கிரிப்டை உருவாக்கவும் file vi /etc/sysconfig/networkscripts/ifcfg-bondN ஐப் பயன்படுத்தி பின்வரும் உரையை உள்ளிடவும்:
    DEVICE=bondN [குறிப்பு: பிணைப்பு எண்ணைக் குறிப்பிட N என்பது ஒரு முழு எண்] ONBOOT=ஆம் USERCTL=இல்லை BOOTPROTO=dhcp (அல்லது) எதுவுமில்லை
    IPADDR=200.20.2.4 [BOOTPROTO=none எனில் அவசியம்] NETMASK=255.255.255.0 [BOOTPROTO=none எனில் அவசியம்] NETWORK=200.20.2.0 [BOOTPROTO=none எனில் அவசியம்] BROADCAST=200.20.2.255 [BOOTPROTO=none எனில் அவசியம்] BONDING_OPTS=”mode=1 miimon=100″
    குறிப்பு
    தேவைக்கேற்ப, பயன்முறையானது 0 முதல் 6 வரையிலான எந்த முழு எண்ணாகவும் இருக்கலாம்.
  4. சேவை நெட்வொர்க் மறுதொடக்கம் அல்லது systemctl மறுதொடக்கம் NetworkManager.service ஐப் பயன்படுத்தி பிணைய சேவைகளை மறுதொடக்கம் செய்யுங்கள்.

செயல்திறன் சரிசெய்தல்

7.1 CPU பயன்பாடு
பணிச்சுமை இயங்கும் போது, ​​ஒவ்வொரு மையத்திற்கும் CPU பயன்பாட்டைச் சரிபார்க்கவும்.
ஒட்டுமொத்த CPU பயன்பாட்டை விட செயல்திறனுக்கு ஒரு மையத்திற்கான பயன்பாடு மிகவும் பொருத்தமானது என்பதை நினைவில் கொள்ளவும், ஏனெனில் இது ஒரு நெட்வொர்க் வரிசைக்கான CPU பயன்பாட்டைப் பற்றிய ஒரு யோசனையை வழங்குகிறது. உங்களிடம் நெட்வொர்க் டிராஃபிக்கை இயக்கும் சில த்ரெட்கள் மட்டுமே இருந்தால், உங்களிடம் ஒரு சில கோர்கள் மட்டுமே பயன்படுத்தப்படலாம். இருப்பினும், அந்த கோர்கள் 100% இல் இருந்தால், உங்கள் நெட்வொர்க் செயல்திறன் CPU பயன்பாட்டால் வரையறுக்கப்பட்டிருக்கலாம், மேலும் பின்வருவனவற்றைச் செய்ய வேண்டிய நேரம் இது:

  1. இன்டரப்ட் மாடரேஷனில் விவரிக்கப்பட்டுள்ளபடி IRQ மாடரேஷன்/மோதிர அளவை டியூன் செய்யவும்.
  2. CPU சுமையை அதிக கோர்களில் பரப்ப பயன்பாட்டு நூல்களின் எண்ணிக்கையை அதிகரிக்கவும். அனைத்து கோர்களும் 100% இல் இயங்கினால், உங்கள் பயன்பாடு நெட்வொர்க் பிணைப்புக்கு பதிலாக CPU பிணைப்புக்கு உட்பட்டதாக இருக்கலாம்.

பொதுவாகக் கிடைக்கும் கருவிகள்:

  • மேல்
    — CPUகளின் பட்டியலை விரிவுபடுத்தவும், எவை பயன்படுத்தப்படுகின்றன என்பதைச் சரிபார்க்கவும் 1 ஐ அழுத்தவும்.
    — பயன்பாட்டின் அளவைக் கவனியுங்கள்.
    — எந்த செயல்முறைகள் மிகவும் செயலில் உள்ளன என்பதைக் கவனியுங்கள் (பட்டியலின் மேல்).
  • எம்பிஸ்டாட்
    பின்வரும் முன்னாள்ampகட்டளை வரி Red Hat Enterprise Linux 7.x இல் சோதிக்கப்பட்டது.
    இது ஒரு மையத்திற்கு CPU பயன்பாட்டைக் காட்டுகிறது (மொத்த சதவீத செயலற்ற தன்மையைக் கண்டறிந்து 100 இலிருந்து கழிப்பதன் மூலம்) மேலும் 80% க்கும் அதிகமான மதிப்புகளை சிவப்பு நிறத்தில் முன்னிலைப்படுத்துகிறது. mpstat -P ALL 1 1 | grep -v சராசரி | tail -n +5 | head -n -1 | awk '{ print (100-$13)}' | egrep -color=always '[^\.][8-9][0-9][\.]?.*|^[8-9][0-9][\.]?.*| 100|' | நெடுவரிசை
  • perf top சுழற்சிகள் எங்கு செலவிடப்படுகின்றன என்பதைக் கண்டறியவும்.

7.2 i40e கவுண்டர்கள்
i40e இயக்கி, ethtool -S ethX கட்டளை மூலம் இடைமுக பிழைத்திருத்தம் மற்றும் கண்காணிப்புக்கான கவுண்டர்களின் நீண்ட பட்டியலை வழங்குகிறது. பணிச்சுமை இயங்கும் போது வெளியீட்டைக் கண்காணிப்பது மற்றும்/அல்லது பணிச்சுமை இயக்கத்திற்கு முன்னும் பின்னும் கவுண்டர் மதிப்புகளை ஒப்பிடுவது உதவியாக இருக்கும்.

  • i40e கவுண்டர்களின் முழு டம்ப் பெற: ethtool -S ethX
  • பூஜ்ஜியமற்ற கவுண்டர்களை மட்டும் பார்க்க: watch -d (ethtool -S ethX) | egrep -v :\ 0 | நெடுவரிசை
    கவனிக்க வேண்டிய சில விஷயங்கள்:
  • rx_dropped என்றால் CPU போதுமான அளவு வேகமாக இடையகங்களைச் சேவை செய்யவில்லை என்று அர்த்தம்.
  • port.rx_dropped என்றால் ஸ்லாட்/மெமரி/ சிஸ்டத்தில் ஏதோ ஒன்று போதுமான அளவு வேகமாக இல்லை என்று அர்த்தம்.

7.3 நெட்வொர்க் கவுண்டர்கள்
பணிச்சுமை இயக்கத்திற்கு முன்/பின் netstat -s ஐ சரிபார்க்கவும்.
Netstat, கணினியில் உள்ள அனைத்து நெட்வொர்க் சாதனங்களிலிருந்தும் நெட்வொர்க் தகவல்களைச் சேகரிக்கிறது. எனவே, சோதனைக்கு உட்பட்ட நெட்வொர்க்கைத் தவிர வேறு நெட்வொர்க்குகளிலிருந்து முடிவுகள் பாதிக்கப்படலாம். netstat -s இன் வெளியீடு Linux இயக்க முறைமை அல்லது கர்னலில் செயல்திறன் சிக்கல்களுக்கு ஒரு நல்ல குறிகாட்டியாக இருக்கலாம். பொதுவான இயக்க முறைமை சரிப்படுத்தும் முறைமை பற்றிய கூடுதல் நுண்ணறிவுக்கு, Red Hat Enterprise Linux நெட்வொர்க் செயல்திறன் சரிப்படுத்தும் வழிகாட்டி போன்ற இயக்க முறைமை சரிப்படுத்தும் வழிகாட்டிகளைப் பார்க்கவும்.
7.4 கணினி பதிவுகள்
பிழைகள் மற்றும் எச்சரிக்கைகளுக்காக கணினி பதிவுகளைச் சரிபார்க்கவும் (/var/log/messages, dmesg).
7.5 இன்டெல் எஸ்விஆர்-தகவல் கருவி
இன்டெல் ஒரு svr-தகவல் கருவியை வழங்குகிறது (பார்க்க https://github.com/intel/svr-info) ஒரு சேவையகத்திலிருந்து தொடர்புடைய வன்பொருள் மற்றும் மென்பொருள் விவரங்களைப் பிடிக்கும் லினக்ஸுக்கு. பணிச்சுமைக்கு உகந்ததாக இல்லாத கணினி சிக்கல்கள் அல்லது அமைப்புகள்/சரிப்படுத்தல்களை அடையாளம் காண svr-info வெளியீடு மிகவும் உதவியாக இருக்கும். ஈதர்நெட் தொடர்பான செயல்திறன் சிக்கல்களுக்கு இன்டெல்லுடன் ஒரு ஆதரவு வழக்கைத் திறக்கும்போது, ​​svr-info வெளியீட்டைச் சேர்க்க மறக்காதீர்கள் (உரை file) சோதனை உள்ளமைவில் உள்ள ஒவ்வொரு லினக்ஸ் சேவையகத்திற்கும்.

  1. svr-info-ஐ பதிவிறக்கி நிறுவவும்:
    wget -qO- https://github.com/intel/svr-info/releases/latest/download/svrinfo.tgz| tar xvz சிடி svr-தகவல்
    ./svr-தகவல்
    > ஹோஸ்ட்பெயர்.txt
  2. வெளியீட்டைச் சேகரிக்கவும்:
    ./svr-தகவல் > ஹோஸ்ட்பெயர்.txt
  3. ஒரு உரையை (.txt) இணைக்கவும். file ஒவ்வொரு சேவையகத்திற்கும் பகுப்பாய்விற்காக உங்கள் இன்டெல் ஆதரவு வழக்குக்கு.

பொதுவான செயல்திறன் காட்சிகளுக்கான பரிந்துரைகள்

8.1 ஐபி பகிர்தல்

  • கர்னலைப் புதுப்பிக்கவும்.
    பாதுகாப்பு காரணமாக ரூட்டிங் கேச் அகற்றப்பட்டதில் தொடங்கி ரூட்டிங் குறியீட்டில் ஏற்பட்ட கர்னல் மாற்றங்கள் காரணமாக சில சமீபத்திய இன்-டிஸ்ட்ரோ கர்னல்கள் ரூட்டிங் செயல்திறனைக் குறைத்துள்ளன. சமீபத்திய டிஸ்ட்ரோவுக்கு வெளியே உள்ள கர்னல்களில் இந்த மாற்றங்களின் செயல்திறன் தாக்கத்தைத் தணிக்கும் பேட்ச்கள் இருக்க வேண்டும் மற்றும் மேம்பட்ட செயல்திறனை வழங்கக்கூடும்.
  • ஹைப்பர்-த்ரெடிங்கை (லாஜிக்கல் கோர்கள்) முடக்கு.
  • கர்னல் துவக்க அளவுருக்களைத் திருத்தவும்.
    — மெய்நிகராக்கத்திற்குத் தேவைப்படாவிட்டால், கர்னல் துவக்க வரியிலிருந்து iommu ஐ (intel_iommu=off அல்லது iommu=off) கட்டாயப்படுத்தவும்.
    — மின் நிர்வாகத்தை அணைக்கவும்: processor.max_cstates=1 idle=poll pcie_aspm=off
  • வரிசைகளின் எண்ணிக்கையை உள்ளூர் சாக்கெட்டில் உள்ள கோர்களின் எண்ணிக்கைக்கு சமமாக வரம்பிடவும் (இந்த எடுத்துக்காட்டில் 12)ample). ethtool -L ethX இணைந்தது 12
  • லோக்கல் சாக்கெட்டுக்கு மட்டும் பின் குறுக்கீடுகளை செய்கிறது. set_irq_affinity -X லோக்கல் ethX அல்லது set_irq_affinity -X லோக்கல் ethX
    குறிப்பு
    பணிச்சுமையைப் பொறுத்து -X அல்லது -x ஐப் பயன்படுத்தலாம்.
  • தேவைக்கேற்ப Tx மற்றும் Rx வளைய அளவுகளை மாற்றவும். ஒரு பெரிய மதிப்பு அதிக வளங்களை எடுக்கும், ஆனால் சிறந்த பகிர்தல் விகிதங்களை வழங்க முடியும். ethtool -G ethX rx 4096 tx 4096
  • ரூட்டிங் செய்யும்போது GRO ஐ முடக்கு.
    அறியப்பட்ட கர்னல் சிக்கல் காரணமாக, ரூட்டிங்/ஃபார்வர்டிங் செய்யும் போது GRO அணைக்கப்பட வேண்டும். ethtool -K ethX gro அணைக்கப்படும், இங்கு ethX என்பது மாற்றப்பட வேண்டிய ஈதர்நெட் இடைமுகமாகும்.
  • தகவமைப்பு குறுக்கீடு மிதமான தன்மையை முடக்கி, ஒரு நிலையான மதிப்பை அமைக்கவும். ethtool -C ethX adaptive-rx off adaptive-tx off ethtool -C ethX rx-usecs 64 tx-usecs 64

குறிப்பு
செயலியின் வகை மற்றும் பணிச்சுமையைப் பொறுத்து, RX மற்றும் TX க்கான ஒருங்கிணைப்பு அளவுருக்களை மேம்பட்ட செயல்திறனுக்காக (அல்லது குறைவான பிரேம் இழப்பு) சரிசெய்யலாம்.

  • ஃபயர்வாலை முடக்கு. sudo systemctl firewalld ஐ முடக்கு sudo systemctl firewalld ஐ நிறுத்து
  • ஐபி பகிர்தலை இயக்கு. sysctl -w net.ipv4.ip_forward=1
  • பெறுதல் மற்றும் அனுப்புதல் சாக்கெட் இடையக அளவுகளுக்கான அதிகபட்ச மதிப்புகளை உள்ளமைக்கவும். sysctl -w net.core.rmem_max=16777216 sysctl -w net.core.wmem_max=16777216

குறிப்பு
பணிச்சுமை அல்லது தேவையைப் பொறுத்து, இந்த மதிப்புகளை இயல்புநிலையிலிருந்து மாற்றலாம்.
8.2 குறைந்த தாமதம்

  • ஹைப்பர்-த்ரெடிங்கை (லாஜிக்கல் கோர்கள்) ஆஃப் செய்யவும்.
  • நெட்வொர்க் சாதனம் numa core 0 க்கு உள்ளூர் என்பதை உறுதிப்படுத்தவும்.
  • taskset -c 0 ஐப் பயன்படுத்தி பெஞ்ச்மார்க்கை கோர் 0 உடன் பொருத்தவும்.
  • systemctl stop irqbalance அல்லது systemctl disable irqbalance ஐப் பயன்படுத்தி irqbalance ஐ அணைக்கவும்.
  • கோர்களில் பரவ அஃபினிட்டி ஸ்கிரிப்டை இயக்கவும். லோக்கல் அல்லது அனைத்தையும் முயற்சிக்கவும்.
  • குறுக்கீடு மிதமானதை அணைக்கவும். ethtool -C ethX rx-usecs 0 tx-usecs 0 adaptive-rx off adaptive-tx off rxusecs- high 0
  • உள்ளூர் சாக்கெட்டில் உள்ள கோர்களின் எண்ணிக்கைக்கு சமமாக வரிசைகளின் எண்ணிக்கையை வரம்பிடவும் (இந்த எடுத்துக்காட்டில் 32)ample). ethtool -L ethX இணைந்தது 32
  • பின் இடையூறுகள் உள்ளூர் சாக்கெட்டுக்கு மட்டுமே (ஸ்கிரிப்ட் i40e இயக்கி மூலத்துடன் தொகுக்கப்பட்டுள்ளது). set_irq_affinity -X உள்ளூர் ethX
  • netperf -t TCP_RR, netperf -t UDP_RR, அல்லது NetPipe போன்ற நிறுவப்பட்ட அளவுகோலைப் பயன்படுத்தவும். netperf -t TCP_RR அல்லது netperf -t UDP_RR
  • உள்ளூர் NUMA முனையில் ஒற்றை மையத்தில் பெஞ்ச்மார்க்கைப் பொருத்து. taskset -c

இன்டெல் ® ஈதர்நெட் 700 தொடர்
லினக்ஸ் செயல்திறன் சரிப்படுத்தும் வழிகாட்டி
டிசம்பர் 2024
ஆவண எண்: 334019, திருத்தம்: 1.2

ஆவணங்கள் / ஆதாரங்கள்

இன்டெல் ஈதர்நெட் 700 தொடர் லினக்ஸ் செயல்திறன் ட்யூனிங் [pdf] பயனர் வழிகாட்டி
334019, ஈதர்நெட் 700 தொடர் லினக்ஸ் செயல்திறன் ட்யூனிங், ஈதர்நெட் 700 தொடர், லினக்ஸ் செயல்திறன் ட்யூனிங், செயல்திறன் ட்யூனிங், ட்யூனிங்

குறிப்புகள்

கருத்து தெரிவிக்கவும்

உங்கள் மின்னஞ்சல் முகவரி வெளியிடப்படாது. தேவையான புலங்கள் குறிக்கப்பட்டுள்ளன *