Intel® Ethernet 700 serían
Leiðbeiningar um afköstastillingu Linux
NEX skýjanethópur (NCNG)
sr. 1.2
desember 2024
Endurskoðunarsaga
Endurskoðun | Dagsetning | Athugasemdir |
1.2 | desember 2024 | · Bætt við viðbótarleiðbeiningum um orkunýtingu. · Bætt við Intel* Turbo Boost. · Bætt við biðlista nettækja. · Bætt við stillingum og fínstillingum fyrir hvert stýrikerfi. · Bætt við stigstærðar örgjörvum frá fjórðu kynslóð Intel* %eon*. · AMD EPYC bætt við. · Uppfært Athugaðu vélbúnaðargetu kerfisins. · Uppfært iPerf2. · Uppfært iPerf3. · Uppfærðar sendingar-/móttökuraðir. · Uppfært truflunarstjórnun. · Uppfærð hringstærð. · Uppfærð stilling á undirvagni (ótilgreind i40e). · Uppfærðar BIOS stillingar. · Uppfært C-ástandsstýring. · Uppfærð tíðnikvarða örgjörva. · Uppfærðar stillingar forritsins. · Uppfærðar stýrikerfis-/kjarnastillingar. · Uppfærð IP-áframsending. · Uppfært lágt seinkun. |
ágúst 2023 | Breytingar á þessu skjali fela í sér: · Bætt við tengdum tilvísunum. · Bætt við að tryggja að DDP-pakkinn hleðst rétt inn. · Bætt við iPerf2. · Bætt við iPerf3. · Bætt við netperf. · Uppfært IRQ-tengsl. · Bætt við sendingar-/móttökuröðum. · Uppfærð hringstærð. · Bætti við risastórum römmum. · Bætt við millistykki. · Bætt við Intel svr-info tólinu. |
|
1.0 | mars 2016 | Upphafleg útgáfa (Intel Public). |
Inngangur
Þessi handbók er ætluð til að veita leiðbeiningar um hvernig á að stilla netkerfisumhverfi til að hámarka afköst með því að nota Intel® Ethernet 700 Series NIC í Linux umhverfi. Hún fjallar um vélbúnað, rekla og stýrikerfisskilyrði og stillingar sem gætu bætt afköst netsins. Athuga skal að afköst netsins geta orðið fyrir áhrifum af ýmsum utanaðkomandi áhrifum, aðeins þau algengustu og mestu eru fjallað um í þessari handbók.
1.1 Tengdar heimildir
- Notendahandbók fyrir öll Intel® Ethernet millistykki og tæki, sem styðja Windows og Linux:
Notendahandbók fyrir Intel® Ethernet millistykki og tæki - Tækniblað:
Gagnablað fyrir Intel® Ethernet stýringu X710/XXV710/XL710 - Heill hugbúnaðarpakki fyrir allar Intel® Ethernet vörur (sækja alla rekla, NVM, verkfæri o.s.frv.):
Intel ® Ethernet millistykki heill reklapakki - Uppfærslupakki fyrir NVM (óstöðugt minni):
Uppfærslugagnsemi fyrir óstöðugt minni (NVM) fyrir Intel® Ethernet netkort 700 seríuna - svr-info tól fyrir Linux sem safnar viðeigandi upplýsingum um vélbúnað og hugbúnað af netþjóni: https://github.com/intel/svr-info
- DDP tæknihandbók:
Tæknihandbók Intel® Ethernet 700 seríunnar fyrir breytilega persónugerð tækja (DDP)
Upphafleg gátlisti
2.1 Uppfæra útgáfur af bílstjóra/hugbúnaði
Athugaðu útgáfur bílstjórans/hugbúnaðarins með því að nota ethtool -i ethx.
Uppfærðu eftirfarandi eftir þörfum:
- Uppfæra bílstjóra fyrir i40e
http://sourceforge.net/projects/e1000/files/i40e%20stable/ or https:// downloadcenter.intel.com/ download/24411/Network-Adapter-Driver-for-PCI-E-40- Gigabit-Network-Connections-under-Linux - Uppfærðu vélbúnaðar
https://downloadcenter.intel.com/download/24769/NVM-Update-Utility-for-Intel-Ethernet-ConvergedNetwork-Adapter-XL710-X710-Series
2.2 Lesið README skrána
Athugaðu fyrir þekkt vandamál og fáðu nýjustu stillingarleiðbeiningarnar frá README file innifalinn í i40e frumpakkanum.
2.3 Gakktu úr skugga um að PCI Express (PCIe) raufin þín sé x8
Sumar PCIe x8 raufar eru í raun stilltar sem x4 raufar. Þessar raufar hafa ófullnægjandi bandbreidd fyrir fullan línuhraða með tækjum með tvöföldum tengi og fjórum tengi. Að auki, ef þú setur PCIe v3.0-hæfan millistykki í PCIe v2.x rauf, geturðu ekki fengið fulla bandbreidd. Bílstjóri hugbúnaðartækisins skynjar þetta ástand og skrifar eftirfarandi skilaboð í kerfisskrána:
PCI-Express bandbreidd sem er tiltæk fyrir þetta kort er ekki nægjanleg fyrir bestu frammistöðu. Til að ná sem bestum árangri þarf x8 PCI-Express rauf.
Ef þessi villa kemur upp skaltu færa millistykkið þitt í sanna PCIe v3.0 x8 rauf til að leysa málið.
2.4 Athugaðu getu kerfisvélbúnaðar
Við 10 Gbps, 25 Gbps og 40 Gbps Ethernet eru nokkrar lágmarkskröfur um örgjörva og kerfi. Almennt séð ætti nútíma miðlaraflokks örgjörvi og ákjósanlegur minnisstilling fyrir pallinn þinn að vera nægjanlegur, en þarfirnar eru mismunandi eftir vinnuálagi þínu. Allar minnisrásir ættu að vera fylltar og minnisflutningshamur ætti að vera virkur í BIOS. Staðfestu að örgjörvi og minnisstillingar þínar séu færar um að styðja við það stig netafkasta sem þú þarfnast fyrir vinnuálag þitt.
ATH
XL710 er 40 GbE stjórnandi. 2 x 40 GbE millistykkið sem notar þennan stjórnanda er ekki ætlað að vera 2 x 40 GbE heldur 1 x 40 GbE með virkri varatengi. Þegar reynt er að nota línuhraðaumferð sem felur í sér báðar tengjar er innri rofinn mettaður og samanlögð bandvídd milli tengjanna tveggja er takmörkuð við samtals XNUMX Gbps.
2.4.1 Kjarnræsingarfæribreytur
Ef Intel® Virtualization Technology for Directed I/O (Intel® VT-d) er virkjað í BIOS, mælir Intel með að IOMMU sé í gegnumfærsluham (pass-through mode) til að hámarka afköst hýsilnetsins. Þetta útilokar DMA-álag á hýsilumferð en gerir sýndarvélum (VMs) kleift að njóta góðs af Intel® VT-d. Þetta er gert með því að bæta eftirfarandi línu við kjarnaræsingarfæribreyturnar: fommu-pt.
2.5 Gakktu úr skugga um að DDP pakkinn hleðst rétt inn
Grunnreklar fyrir 140ea og 140eb styðja ekki beinan DDP (Dynamic Device Personalization). Til að nota DDP með tækjum í 700 seríunni þarf DDP-prófara.file hægt að nota með testpmd umsókninni.
Fyrir upplýsingar um DDP profiles, og hvernig á að sækja um DDP atvinnumannfile með testpmd á 700 Series tækjum, sjá Intel® Ethernet 700 Series Dynamic Device Personalization (DDP) tæknileiðbeiningar.
Til að staðfesta hvort DDP atvinnumaðurfile var hlaðið með góðum árangri:
testpmd> ddp fá lista 0 Profile númerið er: 1
ATH
Ef atvinnumaðurinnfile Ef talan er 0, þá er enginn DDP-pakki hlaðinn. Ef villa kemur upp við hleðslu DDP-pakka fer tækið sjálfkrafa í örugga stillingu og margir afkastaeiginleikar eru ekki tiltækir. Ef villur koma upp við hleðslu DDP-pakkans mun það valda afkastavandamálum. Fyrir úrræðaleitarskref, vísað er til tæknihandbókarinnar fyrir Inte/* Ethernet 700 Series Dynamic Device Personalization (DDP).
Grunnframmistöðumælingar og aðferðafræði við aðlögun
3.1 Viðmið um netafköst
Áður en þú byrjar að stilla æfingu er mikilvægt að hafa góða grunnmælingu á frammistöðu netkerfisins. Venjulega, auk þess að fá fyrstu mælingu á frammistöðu tiltekins forrits/vinnuálags, er góð hugmynd að nota einnig staðlað netafköst viðmið til að sannreyna að nettækið þitt sé í góðu ástandi.
Til að hámarka einstök kerfi eru netperf eða iperf og NetPIPE öll traust, opin hugbúnaðarlaus verkfæri sem gera þér kleift að leggja áherslu á tengingu og greina afköstavandamál.
Netperf er öflugt bæði fyrir afköst og seinkunarprófanir. NetPIPE er tól sem sérhæfir sig í seinkun en hægt er að þýða það fyrir hvaða umhverfi sem er.
ATH
TCP_RR prófið í netperf skilar seinkun sem gildi færslna/sek. Þetta er tala fram og til baka. Einstefnu seinkunina er hægt að reikna út með eftirfarandi jöfnu:
Seinkun(usec) = (1⁄2) / [Færslur/sek] * 1,000,000
3.1.1 iPerf2
Intel mælir með iperf2 frekar en iperf3 fyrir flestar viðmiðunartilvik vegna auðveldrar notkunar og stuðnings við marga þræði í einni forritseinkunn. Intel mælir með að keyra með -P valkostinum með 2-4 þráðum fyrir 25G tengingar og um 4-6 þræði fyrir 40G tengingar.
- Til að keyra einátta umferð frá viðskiptavini til netþjóns: Server skipunin t.d.ample: iperf2 -s
Viðskiptavinaskipun tdamples: iperf2 -c -P - Til að keyra tvíátta umferð frá notanda til netþjóns (og öfugt): Server skipunin t.d.ample: iperf2 –s –p
Viðskiptavinaskipun tdample:
iperf2 -c -p -P -–full-duplex EÐA
iperf2 -c -p -P –d
ATH
Bæði –full-duplex og -d valkostirnir í iperf2 leyfa notandanum að framkvæma tvíátta prófanir. Hins vegar einbeitir –full-duplex valkosturinn sér sérstaklega að full-duplex prófunum.
ATH
Þegar iperf2 er prófað á mörgum netþjónstengingum er hægt að bæta -d fánanum við server skipunina til að keyra allar netþjónslotur í bakgrunni frá sama glugga. Einnig er hægt að nota -d fánann þegar server skipunin er felld inn í for-lykkju í handriti.
ATH
Þegar netafköstapróf er keyrt með einum straumi/þræði (t.d.ample: P1), gætu AMD örgjörvar ekki veitt væntanlega afköst, sérstaklega NIC með meiri bandbreidd (ef hraði er >= 25G bandbreidd). Þar af leiðandi þarf að festa forrit við sérstaka kjarna til að ná meiri afköstum. Sjá Stillingar forrita á síðu 22.
3.1.2 iPerf3
Ef iperf3 er notað þarf mörg tilvik af forritinu til að nýta sér þaðtage af fjölþráðum, RSS og vélbúnaðarröðum. Intel mælir með að keyra með 2-4 forritalotum fyrir 25G tengingar og um 4-6 lotum fyrir 40G tengingar. Hver lota ætti að tilgreina einstakt TCP tengigildi með því að nota -p valkostinn.
- Til að keyra einátta umferð frá viðskiptavini til netþjóns:
Server skipun tdample:
iperf3 -s -p
Viðskiptavinaskipun tdample:
iperf3 -c -bls - Til að keyra tvíátta umferð frá biðlara til netþjóns (og öfugt):
Server skipun tdample:
iperf3 –s –p
Viðskiptavinaskipun tdamples: iperf3 -c -p -P –-bíðir - Til að ræsa mörg tilvik (þræði) af iperf3 er mælt með því að nota for-lykkju til að tengja þræði við TCP tengi og keyra iperf3 í bakgrunni með & til að búa til mörg ferli samhliða.
Server skipun tdample, byrjaðu 4 þræði: port=””; for i in {0..3}; do port=520$i; bash -c “iperf3 -s -p $port &”; done; Skipun biðlara t.d.ample, byrjaðu 4 þræði – Senda test port=””; for i in {0..3}; do port=520$i; bash -c “iperf3 -c $serverIP -p $port &”; done; Skipun viðskiptavinar t.d.ample, byrjaðu 4 þræði – Móttaka prófunar port=””; for i in {0..3}; do port=520$i; bash -c “iperf3 -R -c $serverIP -p $port &”; lokið; Fyrir 40G tengingar, aukið for-lykkjuna til að búa til allt að 6 tilvik/þræði.
ATH
Þegar netafköstapróf er keyrt með einum straumi/þræði (t.d.ampt.d.: P1), AMD örgjörvar bjóða hugsanlega ekki upp á væntanlegan afköst, sérstaklega meiri bandvídd
Netkort (ef hraðinn er >= 25G bandbreidd). Þar af leiðandi er nauðsynlegt að forrit festist við ákveðna kjarna til að ná meiri afköstum. Sjá Forritstillingar á blaðsíðu 22 og AMD EPYC á blaðsíðu 26.
3.1.3 netperf
Netperf tólið er sterkt val fyrir bæði afköst og seinkunarprófanir.
- TCP_STREAM prófið í netperf mælir afköst tækisins. Skipunin Server, til dæmisample: netþjónn Viðskiptavinaskipun tdample: netperf -t TCP_STREAM -l 30 -H
- TCP_RR prófið í netperf skilar seinkun sem gildið færslur/sekúndu. Þetta er tala fram og til baka. Mælt er með að nota -T x,x valkostinn, þar sem x er örgjörvi staðbundinn á tækinu. Einstefnu seinkunina er hægt að reikna út með: Latency(usec)=(1⁄2)/ [Færslur/sek]*1,000,\ Server skipunin t.d.ample: netþjónn
Viðskiptavinaskipun tdample: netperf -t TCP_RR -l 30 -H -T x,x - Til að ræsa mörg tilvik (þræði) af netperf er mælt með því að nota for-lykkju til að tengja þræði við TCP tengi og keyra netperf í bakgrunni með & til að búa til mörg ferli samhliða.
Server skipun tdample, byrjaðu 8 þræði:
port=""; fyrir i í {0..7}; gera port=520$i; bash -c “netserver -L $serverIP -p $port &”; gert;
Viðskiptavinaskipun tdample, byrjaðu 8 þræði: port=””; for i in {0..7}; do port=520$i; bash -c “netperf -H $serverIP -p $port -t TCP_STREAM -l 30 &”; búinn;
3.2 Stillingaraðferðafræði
Einbeittu þér að einni stillingarbreytingu í einu svo þú veist hvaða áhrif hver breyting hefur á prófið þitt. Því aðferðaríkari sem þú ert í stillingarferlinu, því auðveldara verður að greina og takast á við orsakir flöskuhálsa í frammistöðu.
Stilla i40e bílstjóri stillingar
4.1 IRQ-skyldleiki
Að stilla IRQ-sækni þannig að truflanir fyrir mismunandi netbiðraðir séu tengdar mismunandi örgjörvakjarna getur haft mikil áhrif á afköst, sérstaklega fjölþráða afköstaprófanir.
Til að stilla IRQ-skyldleika, stöðvaðu irqbalance og notaðu síðan annað hvort set_irq_affinity forskriftina úr i40e frumkóðapakkanum eða festu biðraðir handvirkt. Slökktu á IRQ-jöfnun notendarýmis til að virkja biðröðfestingu:
- kerfisstýringin slökkva á jafnvægi
- systemctl stöðva irqbalance
Að nota set_irq_affinity forskriftina úr frumkóðapakkanum fyrir i40e (ráðlagt): - Til að nota alla kjarna:
[path-to-i40epackage]/scripts/set_irq_affinity -X allt ethX - Til að nota aðeins kjarna á staðbundnu NUMA-tengi: [path-to-i40epackage]/scripts/set_irq_affinity -X local ethX
- Þú getur líka valið fjölda kjarna. Forðastu að nota cpu0 því það keyrir tímastillta verkefni. [path-to-i40epackage]/scripts/set_irq_affinity 1-2 ethX
ATH
Tengdarforskriftin virkjar Sendingarpakkastýringu (XPS) sem hluta af festingarferlinu þegar -x valkosturinn er tilgreindur. Þegar XPS er virkt mælir Intel með því að þú slökkvir á irqbalance, þar sem kjarnajöfnunin með XPS getur valdið ófyrirsjáanlegri afköstum. Tengdarforskriftin slökkvir á XPS þegar -X valkosturinn er tilgreindur. Að slökkva á XPS og virkja samhverfar biðraðir er gagnlegt fyrir vinnuálag þar sem bestum afköstum næst þegar Tx og Rx umferð er þjónustað á sama biðraðapörum.
Að stilla samhverfar biðraðir í Linux felur í sér að stilla færibreytur netviðmóts rekils til að virkja samhverfar móttökuraðir (Rx) og samhverfar sendarraðir (Tx) fyrir studd netmillistykki.
ATH
- Samhverfar biðraðir eru háþróaður neteiginleiki og ekki allir netkort eða reklar í 700 seríunni styðja þá.
- Gakktu úr skugga um að þú hafir nauðsynlegan stuðning fyrir rekla og vélbúnað áður en þú reynir að stilla samhverfar biðraðir.
Til að stilla samhverfar biðraðir skal fylgja þessum almennu skrefum:
- Breyta stillingum netviðmóts File: Notaðu textaritil (tdample, vi, nano eða gedit) til að breyta stillingum netviðmótsins file. The file er venjulega staðsett í /etc/sysconfig/network-scripts/ möppunni og hefur nafn eins og ifcfg-ethX, þar sem ethX er nafn netviðmótsins þíns.
- Bæta við samhverfum biðröðunarparameterum. Bæta eftirfarandi línum við stillingar netviðmótsins. fileETHTOOL_OPTS = "móttöku-biðraðir 8 sendingar-biðraðir 8"
- Endurræsa netþjónustuna.
Eftir að breytingarnar hafa verið gerðar skaltu endurræsa netþjónustuna til að virkja nýju stillingarnar. sudo systemctl endurræsa netið
Handvirkt:
-
Finndu örgjörvana sem eru tengdir hverjum hnút með því að nota: numactl –hardware lscpu
-
Finndu bitamaskana fyrir hvern örgjörva:
- Miðað við kjarna 0-11 fyrir hnút 0: [1,2,4,8,10,20,40,80,100,200,400,800]
- Finndu IRQ-tölurnar sem eru úthlutaðar tenginu sem verið er að úthluta: grep ethX /proc/interrupts og skráðu IRQ-gildin. Til dæmisample, 181-192 fyrir 12 vigrana sem eru hlaðnir.
- Endurtakið SMP sækni gildið í samsvarandi IRQ færslu. Athugið að þetta þarf að gera fyrir hverja IRQ færslu: echo 1 > /proc/irq/181/smp_affinity echo 2 > /proc/irq/182/smp_affinity echo 4 > /proc/irq/183/smp_affinity Sýna IRQ sækni:
- Til að sýna IRQ-skyldleika fyrir alla kjarna: /scripts/set_irq_affinity -s ethX
- Til að sýna aðeins kjarna á staðbundnu NUMA-tengi: /scripts/set_irq_affinity -s staðbundið ethX
- Þú getur einnig valið úrval af kjarna: /scripts/set_irq_affinity -s 40-0-8,16 ethX
ATH
Handritið set_irq_affinity styður -s fánann í i40e bílstjóraútgáfu 2.16.11 og nýrri.
4.2 Sendingar-/móttökuraðir
Sjálfgefinn fjöldi biðraða sem ökumaðurinn virkjar fyrir hvert Ethernet tengi við frumstillingu er jafn heildarfjölda örgjörva sem eru tiltækir á pallinum. Þetta virkar vel fyrir marga vettvanga og vinnuálagsstillingar. Hins vegar, á kerfum með háa kjarnafjölda og/eða háan Ethernet tengiþéttleika, getur þessi uppsetning valdið deilum um auðlindir. Þess vegna gæti verið nauðsynlegt í sumum tilfellum að breyta sjálfgefnu fyrir hverja höfn í kerfinu.
Sjálfgefinn fjöldi Tx/Rx biðraða getur verið mismunandi eftir tiltekinni gerð og útgáfu bílstjóra. Hægt er að breyta fjölda biðraða með því að nota ethtool -L skipunina sem skráð er hér að neðan.
ATH
Í þessum tilfellum mælir Intel með því að þú minnkir sjálfgefna biðraðafjölda fyrir hverja tengingu í ekki meira en fjölda örgjörva sem eru tiltækir í NUMA hnútnum sem er staðsettur við millistykkið. Í sumum tilfellum, þegar reynt er að jafna auðlindir í útfærslum með miklum tengifjölda, gæti verið nauðsynlegt að minnka þessa tölu enn frekar.
Til að breyta biðröðstillingu:
Eftirfarandi frvamp`le` stillir tengið á 32 Tx/Rx biðraðir: ethtool -L ethX sameinað 32
Example framleiðsla:
ethtool -l ethX
Rásarbreytur fyrir ethX: Forstillt hámark:
RX: 96
TX: 96
Annað: 1
Samanlagt: 96
Núverandi vélbúnaðarstillingar:
RX: 0
TX: 0
Annað: 1
Samanlagt: 32
4.3 Truflun á hófsemi
Sjálfgefið er kveikt á aðlögunarrofsstjórnun og er hannað til að veita jafnvægi á milli lítillar örgjörvanotkunar og mikillar afkasta. Hins vegar gætirðu reynt að stilla truflunarstillingar handvirkt til að passa við notkunartilvikið þitt.
Sviðið 0-235 míkrósekúndur gefur virkt svið frá 4,310 til 250,000 truflanir á sekúndu. Gildi rx-μsecs-high er hægt að stilla óháð rx-μsecs og tx-μsecs í sömu ethtool skipun og er einnig óháð aðlögunarhæfum truflunarstýringarreikniritum. Undirliggjandi vélbúnaður styður nákvæmni í 2 míkrósekúndna millibilum, þannig að samliggjandi gildi gætu leitt til sömu truflunartíðni.
- Til að slökkva á aðlögunarhæfri truflunarstýringu: ethtool -C ethX adaptive-rx off adaptive-tx off
- Til að kveikja á aðlögunarhæfri truflunarstýringu: ethtool -C ethX adaptive-rx on adaptive-tx on
Gott er að byrja á almennri stillingu við 84 μs, eða ~12000 truflanir/s. Ef þú sérð að rx_dropped teljarar keyra á meðan umferð stendur yfir (með því að nota ethtool -S ethX) þá er örgjörvinn líklega of hægur, ekki nægjanlegt biðminni frá hringstærð millistykkisins (ethtool -G) til að geyma pakka í 84 μs eða of lágt truflunarhlutfall.
- Til að stilla truflanastýringu á fasta truflanatíðni upp á 84 μs milli truflana (12000 truflanir/s): ethtool -C ethX adaptive-rx off adaptive-tx off rx-usecs 84 tx-usecs 84 Næsta gildi til að prófa, ef örgjörvanotkun þín er ekki fullnægjandi, er 62 μs. Þetta notar meiri örgjörva en þjónustar biðminni hraðar og krefst færri lýsinga (hringstærð, ethtool -G).
- Til að stilla truflanastýringu á fasta truflanatíðni upp á 62 usecs milli truflana (16000 truflanir/s). ethtool -C ethX adaptive-rx off adaptive-tx off rx-usecs 62 tx-usecs 62
Ef rx_dropped teljarar hækka meðan á umferð stendur (með því að nota ethtool -S ethX), ertu líklega með of hægan örgjörva, ekki næga biðminni frá hringastærð millistykkisins (ethtool -G) eða of lágan truflunarhraða. Ef þú ert ekki hámarksnýttur af CPU nýtingu geturðu aukið truflunartíðnina með því að lækka ITR gildið. Þetta notar meiri örgjörva, en þjónusta biðminni hraðar og krefst færri lýsingar (hringastærð, ethool -G).
Ef örgjörvinn þinn er í 100% álagi er ekki ráðlagt að auka truflunartíðnina. Við ákveðnar aðstæður, svo sem þegar örgjörvinn er bundinn af vinnuálagi, gætirðu viljað auka μs gildið til að leyfa örgjörvanum meiri tíma fyrir önnur forrit.
Ef þú þarfnast lítillar leyndafkösts og/eða hefur nóg af örgjörva til að verja til netvinnslu geturðu slökkt algjörlega á truflunum, sem gerir truflunum kleift að skjóta eins hratt og mögulegt er. - Til að slökkva á truflunarstýringu skaltu nota ethtool -C ethX adaptive-rx off adaptive-tx off rx-usecs 0 tx-usecs 0
ATH
Þegar truflunarstýring er keyrð með óvirka truflunartíðni getur truflunartíðnin í hverri biðröð verið mjög há. Íhugaðu að nota rx-usec-high breytuna til að stilla efri mörk á truflunartíðni. Eftirfarandi skipun slekkur á aðlögunarhæfri truflunarstýringu og leyfir allt að 5 míkrósekúndur áður en móttaka eða sending er lokið. Í stað þess að leiða til allt að 200,000 truflana á sekúndu, takmarkar hún heildarfjölda truflana á sekúndu við 50,000 með rx-usec-high breytunni. # ethtool -C ethX adaptive-rx off adaptive-tx off rx-usecs-high 20 rx-usecs 5 txusecs 5 Reyndu að stilla send/receive/high-priority sameiningartíma hærra (80/100/150/200) eða lægra (25/20/10/5) til að finna besta gildið fyrir vinnuálagið.
4.4 Hringstærð
Ef þú sérð rx_dropped teljara í ethtool -S ethX (rx_dropped, rx_dropped.nic), eða grunar að skyndiminni sé álag með margar biðraðir virkar, gætirðu reynt að aðlaga hringstærðina frá sjálfgefnu gildi. Sjálfgefið gildi er 512, hámarkið er 4096.
- Til að athuga núverandi gildi: ethtool -g ethX
Ef grunur leikur á að skortur á biðminni valdi lækkunum á núverandi truflunarhraða gætirðu reynt hámarkið fyrst, síðan lágmarkið, og haldið síðan áfram í tvíundarleit þar til þú sérð bestu frammistöðu.
Ef grunur leikur á álagi á skyndiminnið (margar biðraðir virkar) getur það hjálpað Intel® Data Direct I/O (Intel® DDIO) að vinna betur með minni biðminni en sjálfgefið. Intel mælir með að prófa 128 eða 256 í hverri biðröð, en það gæti verið nauðsynlegt að auka truflunartíðni með ethtool -C til að forðast aukningu á rx_dropped. - Til að stilla hringstærð á fast gildi: ethtool -G eth12 rx 256 tx 256
ATH
Til að laga Rx pakkatap sem finnast með ethtool -S ethX|grep drop, íhugaðu að auka hringstærðina í 4096. Prófaðu að finna bestu stillinguna fyrir vinnuálagið en gætið að of mikilli minnisnotkun með hærri gildum.
4.5 Rennslisstýring
Flæðistýring á lagi 2 getur haft töluverð áhrif á afköst TCP og er mælt með því að slökkva á henni fyrir flest vinnuálag. Hugsanleg undantekning er umferð með miklum hraða þegar hraðar hraðar eru ekki langar.
Flæðistýring er sjálfgefið óvirk.
- Til að virkja flæðistýringu: ethtool -A ethX rx on tx on
- Til að slökkva á flæðistýringu: ethtool -A ethX rx off tx off
ATH
Þú verður að hafa tengil sem getur stjórnað flæði til að virkja flæðistýringu með góðum árangri.
4.6 Jumbo rammar
Þegar væntanlegt umferðarumhverfi samanstendur af stórum gagnablokkum sem verið er að flytja gæti verið hagkvæmt að virkja júmbó rammaeiginleikann. Jumbo Frames stuðningur er virkur með því að breyta hámarkssendingareiningunni (MTU) í gildi sem er stærra en sjálfgefið gildi 1500. Þetta gerir tækinu kleift að flytja gögn í stærri pökkum innan netumhverfisins. Þessi stilling gæti bætt afköst og dregið úr CPU nýtingu fyrir mikið I/O vinnuálag. Hins vegar gæti það haft áhrif á vinnuálag sem er viðkvæmt fyrir litlum pakka eða leynd.
ATH
Stillingar fyrir risaframma eða stærri MTU verða að vera rétt stilltar í netumhverfinu þínu.
Notaðu ifconfig skipunina til að auka MTU stærðina. Til dæmisample, sláðu inn eftirfarandi, þar sem er viðmótsnúmerið: ifconfig mtu 9000 upp
Einnig er hægt að nota ip skipunina á eftirfarandi hátt: ip link set mtu 9000 dev IP tengil uppsetningarforrit
Pallstilling (i40e ósértæk)
5.1 BIOS stillingar
- Virkjaðu Intel® VT-d fyrir sýndarvæðingarvinnuálag.
- Ofurþráðun (rökvinnsluforrit) getur haft áhrif á afköst. Prófaðu hvort þú getir virkjað eða slökkt á því fyrir vinnuálag þitt.
- Intel® Turbo Boost gerir örgjörvum kleift að vinna á hærri tíðni en grunntíðni örgjörvans. Að virkja Intel® Turbo Boost getur bætt afköst fyrir marga vinnuálag en notar meiri orku til að halda kjarnanum á hærri tíðni. Prófaðu að slökkva/kveikja á Turbo Boost fyrir vinnuálagið þitt.
ATH
Túrbótíðni er ekki tryggð ef heildarnotkun örgjörvans er mikil. Hærri kjarnatúrbótíðni minnkar eftir því sem heildarnotkun örgjörvans eykst.
5.2 Orkustjórnun
Orkustýring getur haft áhrif á frammistöðu, sérstaklega í vinnuálagi með litla leynd. Ef frammistaða er í meiri forgangi en að lækka orkunotkun mælir Intel með því að þú gerir tilraunir með að takmarka áhrif orkustýringar. Það eru margar mismunandi leiðir til að takmarka orkustjórnun, með stýrikerfisverkfærum, BIOS stillingum og ræsibreytum kjarna. Veldu bestu aðferðina og stigið sem hentar umhverfi þínu.
5.2.1 C-ástandsstýring
Að takmarka aðgang C-fasa að CO eða C1 bætir afköst og eykur orkunýtingu.
Að slökkva á CPU Pakki C6 stöðufærslu getur bætt netafköst. Hins vegar eykur þetta orkunotkun.
Eftirfarandi valkostir eru í boði:
- Stjórnaðu C-ástandsfærslunni kraftmikið:
Opið
/dev/cpu_dma_latency og skrifaðu hámarks leyfilega leynd á það.
ATH
Það er til lítið forrit sem heitir cpudmalatency.c sem hægt er að hlaða niður af opnum hugbúnaðarsamfélaginu, þýða og keyra úr skipanalínunni til að gera nákvæmlega þetta.
Eftirfarandi frvample leyfir fimm μs af vökutíma og gerir þannig C1 aðgang mögulegan: cpudmalatency 5 &
- Takmarkaðu hámarks C-ástand í kjarnaræsingarstillingum:
Fyrir Intel örgjörva: intel_idle.max_cstates=1
Fyrir örgjörva sem ekki eru frá Intel: processor.max_cstates=1 - Notaðu cpupower skipunina til að athuga og slökkva á stöðu örgjörva C6: Athugaðu: cpupower monitor eða cpupower idle-info
Slökkva á C6: cpupower idle-set -d3 eða
Slökkva á C-stöðum: cpupower idle-set -D0
Athugasemdir:
- Slökkvið á C-stöðum á örgjörvanum ef netþjónninn er með Intel® 4. kynslóðar Intel® Xeon® stigstærðar örgjörva. Þegar Hyper Threading er virkt eða óvirkt, þá kemur óvirkjun á aðgerðaleysisstöðum (-D0) í veg fyrir að kjarnar fari í orkusparnaðarstöður á aðgerðaleysistímabilum og dregur úr seinkun örgjörvans á milli aðgerðaleysis og virks stöðu.
- Orkustýringin í Intel® 4. kynslóð Intel® Xeon® stigstærðar örgjörvanum er afar árásargjörn. Til að koma í veg fyrir að kjarnar fari í orkusparnaðarástand skaltu reyna að fækka kjarna sem eru í notkun til að halda þeim vakandi lengur (ethtool -L samanlagt Einnig skal tengja truflanir við ákveðna kjarna með því að nota set irq affinity (oftast með -x local eða lista yfir örgjörvakjarna) og tryggja að vinnuálagið keyri á sömu kjarna með taskset eða numactl. Þetta bætir afköst með því að halda kjörnum virkum og hámarka meðhöndlun truflana.
Virkja C6:
cpupower aðgerðalaus-sett -d3
Virkja C-ríki:
cpupower aðgerðalaus-sett -E
- Önnur aðferð er að nota stillta tólið (fylgir með mörgum Linux dreifingum) til að stilla afköst.file. Þessir atvinnumennfiles breyta nokkrum OS stillingum sem geta haft áhrif á frammistöðu í mörgum forritum. Það hefur komið í ljós að netframleiðsla profile veitir úrbætur fyrir flest vinnuálag.
Athugaðu:
stillt-adm virkur
Sett:
stillt-adm profile netafköst
ATH
Stillt þjónusta verður að vera í gangi fyrir ofangreindar skipanir. Til að athuga/endurræsa, stillt: systemctl status stillt systemctl restart stillt
Þú getur líka bannað hvaða C-stöðu færslu sem er með því að bæta eftirfarandi við ræsilínuna kjarna:
aðgerðalaus = skoðanakönnun - Takmarkaðu C-ástandið í gegnum orkusparnaðarstillingar BIOS kerfisins, sem gætu haft áhrif á afköst.file í boði.
Hægt er að nota verkfæri eins og turbostat eða x86_energy_perf_policy til að athuga eða stilla orkusparnaðarstillingar.
5.2.2 PCIe orkustjórnun
Orkustjórnun í virkri stöðu (ASPM) gerir kleift að lækka orkunotkun PCIe-tengja þegar þeir eru ekki í notkun. Þetta getur valdið meiri seinkun á PCIe-nettækjum, þannig að Intel mælir með að þú slökkvir á ASPM fyrir vinnuálag sem er viðkvæmt fyrir seinkun. Slökktu á ASPM með því að bæta eftirfarandi við ræsilínu kjarnans: pcie_aspm=off
5.2.3 Tíðnistilling örgjörva
CPU tíðni scaling (eða CPU hraða scaling) er Linux orkustjórnunartækni þar sem klukkuhraði kerfisins er stilltur á flugi til að spara orku og hita. Rétt eins og C-ríki getur þetta valdið óæskilegri leynd á nettengingum.
Einnig er hægt að nota cpupower tólið til að athuga og breyta sjálfgefnum stillingum og takmörkunum á afköstum örgjörvans:
- Athugaðu: örgjörvaaflsskjá eða
- Stilla örgjörva í afköstastillingu: cpupower frequency-set -g performance
ATH
Breytingar á tíðnimörkum örgjörva geta haft áhrif á margs konar vinnuálag og gætu gert aðra eiginleika óvirka, svo sem örgjörvatúrbóstillingu.
Til að slökkva á örgjörva tíðnikvarða skaltu slökkva á CPU orkuþjónustunni með eftirfarandi skipunum:
kerfisstýring stöðva cpupower.service
systemctl slökkva á cpupower.service
5.2.4 Viðbótarleiðbeiningar um orkusparnað
Viðbótarupplýsingar eru veittar í þessu yfirliti á háu stigiview af mörgum af orkusparnaðareiginleikum í 3. kynslóð Intel® Xeon® Scalable örgjörvum, sem og leiðbeiningum um hvernig hægt er að samþætta þessa eiginleika á kerfisstigi: https://networkbuilders.intel.com/solutionslibrary/power-management-technologyoverview-technology-guide
5.3 Intel® Turbo Boost
Intel® Turbo Boost gerir örgjörvann hraðari þegar þörf krefur en getur neytt aukins orku. Slökkt er á Turbo Boost heldur örgjörvanum á jöfnum hraða, sem gefur þér stöðugt afköst fyrir tiltekið vinnuálag.
5.4 Eldveggir
Eldveggir geta haft áhrif á afköst, sérstaklega seinkun.
Slökkvið á iptables/firewalld ef það er ekki nauðsynlegt.
5.5 Stillingar forrita
Oft dugar einn þráður (sem samsvarar einni netröð) ekki til að ná hámarksbandbreidd. Sumir vettvangsarkitektúrar, eins og AMD, hafa tilhneigingu til að sleppa fleiri Rx-pökkum með einum þræði samanborið við palla með Intel-undirstaða örgjörva.
Íhugaðu að nota verkfæri eins og taskset eða numactl til að festa forrit við NUMA hnútinn eða CPU kjarna staðbundið við nettækið. Fyrir sumt vinnuálag eins og inn/út geymslu veitir það ávinning að færa forritið yfir á hnút sem er ekki á staðnum.
Gerðu tilraunir með að auka fjölda þráða sem forritið þitt notar ef mögulegt er.
5.6 Kjarnaútgáfa
Flestir nútíma kjarna í kassanum eru sæmilega vel fínstilltir fyrir frammistöðu en, allt eftir notkunartilvikum þínum, gæti uppfærsla kjarnans veitt betri afköst. Að hlaða niður upprunanum gerir þér einnig kleift að virkja/slökkva á ákveðnum eiginleikum áður en þú byggir kjarnann.
5.7 Stillingar stýrikerfis/kjarna
Skoðaðu stýrikerfisstillingarleiðbeiningar, svo sem Red Hat Enterprise Linux Network Performance Tuning Guide, til að fá meiri innsýn í almenna stillingu stýrikerfis.
Sumar algengar breytur til að stilla eru taldar upp í eftirfarandi töflu. Athugaðu að þetta eru aðeins ráðlagðir upphafspunktar og að breyta þeim frá sjálfgefnum stillingum gæti aukið tilföngin sem notuð eru í kerfinu. Þó að auka gildin geti hjálpað til við að bæta árangur er nauðsynlegt að gera tilraunir með mismunandi gildi til að ákvarða hvað virkar best fyrir tiltekið kerfi, vinnuálag og umferðartegund.
Kjarnafæribreyturnar eru stillanlegar með sysctl tólinu í Linux eins og sýnt er hér að neðan.
Til view sjálfgefin gildi fyrir rmem og wmem á kerfinu:
sysctl net.core.rmem_default
sysctl net.core.wmem_default
Stilltu gildin á hámark (16 MB):
sysctl -w net.core.rmem_max=16777216
sysctl -w net.core.wmem_max=16777216
Stærðir tengiminni, einnig þekktar sem móttökuminni (rmem) og sendiminni (wmem), eru kerfisbreytur sem tilgreina magn minnis sem er frátekið fyrir inn- og útleiðandi netumferð.
Að keyra sysctl án -w röksemdafærslunnar sýnir færibreytuna með núverandi stillingu.
Staflastilling | Lýsing |
net.core.rmem_default | Sjálfgefin stærð móttökuglugga |
net.core.wmem_default | Sjálfgefin stærð sendingarglugga |
net.core.rmem_max | Hámarksstærð móttökuglugga |
net.core.wmem_max | Hámarksstærð sendiglugga |
net.core.optmem_max | Hámarksfjöldi valkostaminnis |
net.core.netdev_max_backlog | Óunninn pakkabakki áður en kjarninn byrjar að falla |
net.ipv4.tcp_rmem | Minnisgeymsla fyrir TCP lesbiðminnis |
net.ipv4.tcp_wmem | Minnisgeymsla fyrir TCP sendingarbiðminni |
Kjarni, netstafla, minnisstýring, örgjörvahraði og orkustjórnunarfæribreytur geta haft mikil áhrif á afköst netsins. Algengar ráðleggingar eru að sækja um netafköstfile með því að nota stillta skipunina. Þetta breytir nokkrum OS stillingum til að veita val fyrir netforrit.
Athugaðu:
stillt-adm virkur
Sett:
stillt-adm profile netafköst
5.8 Ófullnægjandi nettækjaskrá
Þessi eiginleiki hjálpar til við að bæta netafköst með því að stjórna komandi umferð á áhrifaríkan hátt, draga úr pakkatapi, lækka leynd og auka afköst. Þetta leiðir til betri notendaupplifunar og hraðari viðbragða kerfisins.
Sjálfgefið er það virkt í flestum Linux stýrikerfum. Til að athuga sjálfgefið gildi:
sysctl net.core.netdev_max_backlog
Hámarksgildið fyrir netdev_max_backlog getur verið breytilegt eftir þáttum eins og kjarnaútgáfu, vélbúnaði, minni og vinnuálagi. Í mörgum tilfellum er 8192 talið gott gildi. sysctl -w net.core.netdev_max_backlog=8192
5.9 Stillingar og stillingar fyrir hvert kerfi
5.9.1 4. kynslóðar stigstærðar Intel® Xeon® örgjörvar
Aflstýring Intel® 4th Generation Intel® Xeon® Scalable örgjörva er afar árásargjarn miðað við 3. kynslóð Intel® Xeon® Scalable örgjörva. Til að koma í veg fyrir að kjarna fari inn í orkulítið ástand skaltu reyna að fækka kjarna sem eru í notkun til að halda þeim vakandi lengur.
Ráðlagðar BIOS stillingar fyrir bestu afköst
- Virkjun/afvirkjun á ofurþráðun (byggt á vinnuálagskröfum og afkastamarkmiðum) á örgjörvanum.
- Stilltu kerfisprófiðfile til árangurs fyrir hámarksafköst.
ATH
Þetta leiðir til meiri orkunotkunar - Stilltu orkustjórnun örgjörvans á hámarksafköst til að forgangsraða hámarksafköstum örgjörvans fram yfir orkunýtni.
- Virkjaðu Turbo Boost. Að slökkva á Turbo Boost í BIOS-stillingum kerfisins kemur venjulega í veg fyrir að örgjörvinn auki klukkuhraða sinn umfram grunntíðni sína.
- ATH
Að slökkva á Turbo Boost gæti hentað í ákveðnum tilfellum þar sem stöðug afköst, orkunýting eða hitastjórnun eru forgangsraðaðar fram yfir hámarksafköst. - Slökktu á eiginleikanum Single Root I/O Virtualization (SR-IOV) ef kerfið notar ekki sýndarvæðingartækni.
- Slökktu á C-stöðum til að fyrirskipa örgjörvanum að vera virkur og koma í veg fyrir að hann fari í dýpri aðgerðaleysi.
- Slökkvið á C1E til að tryggja að örgjörvinn haldist virkur og fari ekki í C1E óvirka stöðu.
- Stilltu kjarnalausa tíðnina á hámark til að fyrirskipa kerfinu að starfa á hæstu mögulegu tíðni.
- Á Dell-kerfum skal stilla kjarnahermun Multiple APIC Description Table (MADT) á Linear (eða Round-Robin eftir BIOS) til að fá skýra og fyrirsjáanlega kortlagningu á kjarna örgjörvans.
Ráðlagðar stillingar á stýrikerfisstigi fyrir hámarksafköst
- Stilltu tíðnikvarða örgjörvans á afköst. cpupower frequency-set -g afköst cpupower frequency-info
- Slökkva á C-stöðum. cpupower idle-set -D0
- Stilltu Rx (rmem) og Tx (wmem) biðminni kjarna á hámarksgildi. sysctl -w net.core.rmem_max=16777216 sysctl -w net.core.wmem_max=16777216
- Setja upp biðlista nettækja. sysctl -w net.core.netdev_max_backlog=8192
- Stilltu stillt atvinnumaðurfile (vinnuálag háð afköstum/leynd).
stillt-adm profile netafköst
Ráðlagðar stillingar á millistykki fyrir hámarksafköst
- Takmarkaðu fjölda biðraða sem nota skal fyrir forritaumferð. Notaðu lágmarksfjölda biðraða sem þarf til að halda tengdum örgjörvakjarna virkum til að koma í veg fyrir að þeir fari í dýpri biðstöðu (aðlagaðu eftir vinnuálagi): ethtool -L samanlagt 32
- Stilla truflunarstýringartíðni. ethtool -C aðlögunarhæf-lyfjagjöf slökkt aðlögunarhæf-sending slökkt lyfseðilsskyld-notkun-há 50 lyfseðilsskyld-notkun-50 sendingarskyld-notkun-50
Reyndu að stilla tímastillinn fyrir sendingu/móttöku/sameiningu með háum forgangi hærra (80/100/150/200) eða lægra (25/20/10/5) til að finna besta gildið fyrir vinnuálagið. - Stilltu Rx/Tx hringstærðirnar. ethtool -G Rx 4096 sending 4096
ATH
Ef þú sérð pakka sem eru teknir með ethtool -S| grep drop, reyndu að minnka hringstærðina í <4096. Reyndu að finna besta gildið fyrir vinnuálagið þar sem pakkar eru ekki teknir með. - Stilltu IRQ-skyldleika. Notaðu kjarna sem eru staðbundnir fyrir netkortið, eða tiltekna kjarnavörpun (þar sem # kjarnar er jafnt og fjöldi biðraða sem stilltur er í 1 á blaðsíðu 26). systemctl stop irqbalance set_irq_affinity -X local EÐA set_irq_affinity -X
5.9.2 AMD EPYC
AMD EPYC örgjörvar eru öflugir örgjörvar hannaðir fyrir netþjóna og gagnaver, byggðir á Zen arkitektúr AMD. Stillingarnar hér að neðan eru úr 4. kynslóð EPYC seríunnar frá AMD.
Ráðlagðar BIOS stillingar fyrir bestu afköst
- Virkjaðu sérsniðna stillingu til að leyfa notendum að stilla afköst örgjörvans, orkunotkun og aðrar stillingar. Þetta hjálpar til við að fínstilla kerfið til að ná sem bestum jafnvægi milli afkasta og orkunýtingar.
- Virkjaðu kjarnaafköst til að leyfa örgjörvanum að auka hraða sinn sjálfkrafa til að takast á við krefjandi verkefni og bæta þannig heildarafköst.
- Slökktu á alhliða C-ástandsstýringu til að koma í veg fyrir að örgjörvinn fari í dýpri orkusparnaðarástand, þekkt sem C-ástand, sem getur viðhaldið viðbragðstíðni.
ATH
Að slökkva á C-stöðum getur valdið aukinni orkunotkun og aukið hitastig. Fylgist með báðum með tilliti til vinnuálags. - Virkja/slökkva á samtímis fjölþráðun (SMT) á örgjörvanum, byggt á vinnuálagskröfum og afkastamarkmiðum. SMT jafngildir ofurþráðun á Intel örgjörvum.
ATH
Til að hámarka afköst, vísað er til Stillingar i40e bílstjóra á blaðsíðu 13 og Stillingar kerfis (ótilgreint fyrir i40e) á blaðsíðu 19 fyrir ráðlagða stillingu á stýrikerfi og millistykki.
Tenging millistykki
Linux tenging er öflugur eiginleiki sem getur verulega bætt netafköst, offramboð og bilanaþol í netþjónsumhverfi. Hins vegar er mikilvægt að hafa í huga að það krefst samhæfs netbúnaðar og réttrar uppsetningar á bæði þjóninum og rofanum til að virka rétt.
Tengibílstjórinn í Linux gerir þér kleift að safna saman mörgum líkamlegum netviðmótum í tengt viðmót. Þetta tengda viðmót birtist sem eitt sýndarnetviðmót við stýrikerfið og forritin.
ATH
Tengingin er rökrétt viðmót, þannig að það er ekki hægt að stilla CPU-sækni beint á tengiviðmótinu (til dæmisample, skuldabréf0). Það er, það hefur enga beina stjórn á meðhöndlun truflana eða CPU sækni. CPU sækni verður að stilla fyrir undirliggjandi tengi sem eru hluti af skuldabréfinu.
Tenging býður upp á nokkrar aðgerðir, hver með sínum eigin einkennum.
Mode | Tegund |
0 | Round Robin |
1 | Virk öryggisafrit |
2 | XOR |
3 | Útsending |
4 | LACP |
5 | Senda álagsjöfnuð |
6 | Aðlagandi álagsjafnvægi |
Það eru mismunandi aðferðir til að búa til tengingu í Linux. Ein algengasta aðferðin er að nota netstillingar files (tdample, /etc/network/ interfaces eða /etc/sysconfig/network-scripts/ifcfg-bondX).
Stillingar með netstillingu Files
Eftirfarandi skref skapa tengingu í gegnum netstillinguna files.
- Veldu tvö eða fleiri NIC tengi fyrir tengingu (til dæmisample, ethX og ethY)
- Opna netkortstillingar Files undir /etc/sysconfig/network-scripts/ fyrir nauðsynlegt netkortsviðmót (til dæmisample, vi ifcfg-ethX og vi ifcfg-ethY) og bættu við eftirfarandi texta:
MASTER=bindingN [Athugið: N er heiltala til að nefna skuldabréfanúmerið.] ÞRÆL=já - Búa til handrit fyrir skuldabréfanet file með vi /etc/sysconfig/networkscripts/ifcfg-bondN og sláðu inn eftirfarandi texta:
TÆKI=tenginúmer [Athugið: N er heiltala sem gefur til kynna tenginúmerið] ONBOOT=já USERCTL=nei BOOTPROTO=dhcp (eða) ekkert
IPADDR=200.20.2.4 [þarf ef BOOTPROTO=engin] NETMASK=255.255.255.0 [þarf ef BOOTPROTO=engin] NETVERK=200.20.2.0 [þarf ef BOOTPROTO=engin] ÚTSENDING=200.20.2.255 [þarf ef BOOTPROTO=engin] BONDING_OPTS=”mode=1 miimon=100″
ATH
Stillingin getur verið hvaða heiltala sem er frá 0 til 6 eftir kröfunni. - Endurræstu netþjónusturnar með því að nota `service network restart` eða `systemctl restart NetworkManager.service`.
Úrræðaleit á frammistöðu
7.1 Örgjörvanotkun
Athugaðu nýtingu örgjörvans á hvern kjarna á meðan vinnuálagið er í gangi.
Athugið að nýting á kjarna skiptir meira máli fyrir afköst en heildarnotkun örgjörva þar sem hún gefur hugmynd um nýtingu örgjörvans á hverja netröð. Ef þú ert aðeins með fáa þræði sem keyra netumferð, þá gætirðu aðeins haft fáa kjarna í notkun. Hins vegar, ef þessir kjarnar eru 100%, þá er líklega netafköst þín takmörkuð af örgjörvanotkun og þá er kominn tími til að framkvæma eftirfarandi:
- Stilltu IRQ-stjórnun/hringistærð eins og lýst er í Truflunarstjórnun.
- Auka fjölda forritþráða til að dreifa álaginu á örgjörvann yfir fleiri kjarna. Ef allir kjarnar keyra á 100% gæti forritið verið bundið við örgjörvann frekar en netið.
Algeng verkfæri:
- efst
— Ýttu á 1 til að stækka lista yfir örgjörva og athuga hvaða örgjörvar eru í notkun.
— Takið eftir nýtingarstiginu.
— Takið eftir hvaða ferlar eru skráðir sem virkustu (efst á listanum). - mpstat
Eftirfarandi frvampSkipanalínan var prófuð á Red Hat Enterprise Linux 7.x.
Það sýnir örgjörvanýtingu á hvern kjarna (með því að finna heildarprósentu óvirkni og draga frá 100) og auðkennir gildi yfir 80% með rauðu. mpstat -P ALL 1 1 | grep -v Meðaltal | tail -n +5 | head -n -1 | awk '{ print (100-$13)}' | egrep -color=always '[^\.][8-9][0-9][\.]?.*|^[8-9][0-9][\.]?.*| 100|' | dálkur - perf top Leitaðu að því hvar hringrásum er eytt.
7.2 i40e teljarar
Rekstrarforritið fyrir i40e býður upp á langan lista af teljara fyrir villuleit og eftirlit með viðmóti með skipuninni ethtool -S ethX. Það getur verið gagnlegt að fylgjast með úttakinu á meðan vinnuálag er í gangi og/eða bera saman teljaragildi fyrir og eftir keyrslu vinnuálags.
- Til að fá fulla yfirlit yfir i40e teljara: ethtool -S ethX
- Til að fylgjast aðeins með teljara sem eru ekki núll: watch -d (ethtool -S ethX) | egrep -v :\ 0 | dálkur
Nokkur atriði sem vert er að leita að: - rx_dropped þýðir að örgjörvinn þjónustar ekki biðminnið nógu hratt.
- port.rx_dropped þýðir að eitthvað er ekki nógu hratt í raufinni/minni/kerfinu.
7.3 Netteljarar
Athugaðu netstat -s fyrir/eftir vinnuálagskeyrslu.
Netstat safnar netupplýsingum frá öllum nettækjum í kerfinu. Þess vegna gætu niðurstöður haft áhrif frá öðrum netkerfum en netkerfinu sem verið er að prófa. Úttakið frá netstat -s getur verið góður vísbending um árangursvandamál í Linux stýrikerfinu eða kjarnanum. Skoðaðu stýrikerfisstillingarleiðbeiningar, svo sem Red Hat Enterprise Linux Network Performance Tuning Guide, til að fá meiri innsýn í almenna stillingu stýrikerfis.
7.4 Kerfisskrár
Athugaðu kerfisskrár fyrir villur og viðvaranir (/var/log/messages, dmesg).
7.5 Intel svr-upplýsingatólið
Intel býður upp á svr-info tól (sjá https://github.com/intel/svr-info) fyrir Linux sem safnar viðeigandi upplýsingum um vélbúnað og hugbúnað af netþjóni. svr-info úttak getur verið afar gagnlegt til að bera kennsl á flöskuhálsa í kerfinu eða stillingar/stillingar sem eru ekki fínstilltar fyrir vinnuálagið. Þegar þú opnar stuðningsmál hjá Intel vegna vandamála tengdum Ethernet-afköstum skaltu gæta þess að taka með svr-info úttak (texti file) fyrir hvern Linux netþjón í prófunarstillingunni.
- Sækja og setja upp svr-info:
wget -qO- https://github.com/intel/svr-info/releases/latest/download/svrinfo.tgz| tar xvz geisladiskur svr-upplýsingar
./svr-info
> hostname.txt - Safnaðu úttakinu:
./svr-info > hýsingarnafn.txt - Hengdu við einn texta (.txt) file fyrir hvern netþjón til Intel stuðningsmálsins til greiningar.
Ráðleggingar um algengar frammistöðusviðsmyndir
8.1 IP-áframsending
- Uppfærðu kjarnann.
Sumir nýlegir kjarnar í dreifingu hafa versnað afköst leiðarkerfisins vegna breytinga á leiðarkóðanum, sem byrjaði á því að leiðarskyndiminnið var fjarlægt vegna öryggis. Nýlegir kjarnar utan dreifingar ættu að hafa lagfæringar sem draga úr áhrifum þessara breytinga á afköst og gætu bætt afköstin. - Slökkva á ofurþráðun (rökréttum kjarna).
- Breyta ræsingarstillingum kjarnans.
— Þvingaðu slökkt á iommu (intel_iommu=slökkt eða iommu=off) úr ræsilínu kjarna nema þess sé krafist fyrir sýndarvæðingu
— Slökkva á orkusparnaði: processor.max_cstates=1 idle=poll pcie_aspm=off - Takmarkaðu fjölda biðraða þannig að þeir séu jafnir fjölda kjarna á staðbundnum tengipunkti (12 í þessu dæmi)ample). ethtool -L ethX sameinað 12
- Tengja truflanir aðeins við staðbundinn tengil. set_irq_affinity -X local ethX EÐA set_irq_affinity -X local ethX
ATH
Hægt er að nota -X eða -x eftir því hversu mikið álag er um að ræða. - Breytið hringstærðum Tx og Rx eftir þörfum. Stærra gildi krefst meiri auðlinda en getur veitt betri áframsendingarhraða. ethtool -G ethX rx 4096 tx 4096
- Slökkva á GRO við leiðsögn.
Vegna þekkts kjarnavandamáls verður að slökkva á GRO við leiðsögn/áframsendingu. ethtool -K ethX gro off þar sem ethX er Ethernet-viðmótið sem á að breyta. - Slökkvið á aðlögunarhæfri truflunarstýringu og stillið fast gildi. ethtool -C ethX adaptive-rx off adaptive-tx off ethtool -C ethX rx-usecs 64 tx-usecs 64
ATH
Eftir því hvaða gerð örgjörva er um að ræða og hvaða vinnuálag er um að ræða, er hægt að aðlaga sameiningarbreytur fyrir RX og TX til að bæta afköst (eða minna rammatap).
- Slökktu á eldveggnum. sudo systemctl slökkva á eldveggnum sudo systemctl stöðva eldvegginn
- Virkja IP-áframsendingu. sysctl -w net.ipv4.ip_forward=1
- Stilltu hámarksgildi fyrir stærð biðminnisins fyrir móttöku og sendingu. sysctl -w net.core.rmem_max=16777216 sysctl -w net.core.wmem_max=16777216
ATH
Hægt er að breyta þessum gildum frá sjálfgefnu gildi, allt eftir vinnuálagi eða kröfum.
8.2 Lágt seinkun
- Slökktu á ofurþráðun (rökréttum kjarna).
- Gakktu úr skugga um að nettækið sé staðbundið við Numa Core 0.
- Festið viðmiðið við kjarna 0 með því að nota taskset -c 0.
- Slökktu á irqbalance með því að nota systemctl, stop irqbalance eða systemctl, disable irqbalance.
- Keyrðu skyldleikaforskriftina til að dreifa yfir kjarna. Prófaðu annað hvort staðbundið eða allt.
- Slökktu á truflunarstýringu. ethtool -C ethX rx-usecs 0 tx-usecs 0 adaptive-rx off adaptive-tx off rxusecs- high 0
- Takmarkaðu fjölda biðraða við fjölda kjarna á staðbundnum tengipunkti (32 í þessu dæmiample). ethtool -L ethX sameinað 32
- Festa truflanir aðeins við staðbundið tengi (skrifta pakkað með i40e bílstjórauppsprettu). set_irq_affinity -X local ethX
- Notið viðurkennt viðmið eins og netperf -t TCP_RR, netperf -t UDP_RR eða NetPipe. netperf -t TCP_RR eða netperf -t UDP_RR
- Festa viðmiðunargildi við einn kjarna í staðbundnum NUMA hnút. taskset -c
Intel® Ethernet 700 serían
Leiðbeiningar um afköstastillingu Linux
desember 2024
Doc. nr.: 334019, Rev.: 1.2
Skjöl / auðlindir
![]() |
Intel Ethernet 700 Series Linux árangursstilling [pdfNotendahandbók 334019, Ethernet 700 Series Linux Performance Tuning, Ethernet 700 Series, Linux Performance Tuning, Performance Tuning, Tuning |