Cyfres Intel® Ethernet 700
Canllaw Addasu Perfformiad Linux
Grŵp Rhwydweithio Cwmwl NEX (NCNG)
Parch 1.2
Rhagfyr 2024
Hanes Adolygu
Adolygu | Dyddiad | Sylwadau |
1.2 | Rhagfyr 2024 | · Ychwanegwyd Canllawiau Rheoli Pŵer Ychwanegol. · Ychwanegwyd Intel* Turbo Boost. · Ychwanegwyd Ôl-groniad Dyfeisiau Rhwydwaith. · Ychwanegwyd Ffurfweddiadau a Thiwnio Penodol i'r Platfform. · Ychwanegwyd Proseswyr Graddadwy Intel* %eon* 4ydd Genhedlaeth. · Ychwanegwyd AMD EPYC. · Galluoedd Caledwedd System Gwirio wedi'u Diweddaru. · Wedi diweddaru iPerf2. · Wedi diweddaru iPerf3. · Ciwiau Tx/Rx wedi'u diweddaru. · Diweddarwyd Cymedroli Ymyriadau. · Maint y Fodrwy wedi'i Ddiweddaru. · Tiwnio Platfform wedi'i Ddiweddaru (i40e Heb ei Benodol). · Gosodiadau BIOS wedi'u diweddaru. · Rheolaeth Cyflwr-C wedi'i diweddaru. · Graddio Amledd CPU wedi'i Ddiweddaru. · Gosodiadau'r Cais wedi'u Diweddaru. · Gosodiadau System Weithredu/Cnewyllyn wedi'u Diweddaru. · Anfon IP ymlaen wedi'i ddiweddaru. · Wedi'i ddiweddaru ar gyfer oedi isel. |
Awst 2023 | Mae newidiadau i'r ddogfen hon yn cynnwys: · Ychwanegwyd Cyfeiriadau Perthnasol. · Ychwanegwyd Sicrhau bod y Pecyn DDP yn Llwytho'n Iawn. · Ychwanegwyd iPerf2. · Ychwanegwyd iPerf3. · Ychwanegwyd netperf. · Perthynas IRQ wedi'i diweddaru. · Ychwanegwyd Ciwiau Tx/Rx. · Maint y Fodrwy wedi'i Ddiweddaru. · Ychwanegwyd Fframiau Jumbo. · Ychwanegwyd Bondio Addasydd. · Ychwanegwyd Offeryn svr-info Intel. |
|
1.0 | Mawrth 2016 | Datganiad Cychwynnol (Intel Cyhoeddus). |
Rhagymadrodd
Bwriad y canllaw hwn yw darparu canllawiau ar gyfer addasu amgylcheddau ar gyfer perfformiad rhwydweithio gorau posibl gan ddefnyddio NICs Cyfres 700 Ethernet Intel ® mewn amgylcheddau Linux. Mae'n canolbwyntio ar amodau a gosodiadau caledwedd, gyrwyr a systemau gweithredu a allai wella perfformiad rhwydwaith. Dylid nodi y gall unrhyw nifer o ddylanwadau allanol effeithio ar berfformiad rhwydweithio, dim ond y rhai mwyaf cyffredin a dramatig o'r rhain sy'n cael eu trafod yn y canllaw hwn.
1.1 Cyfeiriadau Cysylltiedig
- Canllaw Defnyddiwr ar gyfer pob addasydd a dyfais Ethernet Intel ®, sy'n cefnogi Windows a Linux:
Canllaw Defnyddiwr Addasyddion a Dyfeisiau Ethernet Intel ® - Taflen ddata dechnegol:
Taflen Ddata Rheolydd Ethernet Intel ® X710/XXV710/XL710 - Pecyn Meddalwedd cyflawn ar gyfer pob cynnyrch Ethernet Intel ® (lawrlwythwch yr holl yrwyr, NVMs, offer, ac ati):
Pecyn Gyrwyr Cyflawn Addasydd Ethernet Intel ® - Pecyn Diweddaru NVM (Cof Anwadal):
Cyfleustodau Diweddaru Cof Anwadal (NVM) ar gyfer Addasydd Rhwydwaith Ethernet Intel ® Cyfres 700 - offeryn svr-info ar gyfer Linux sy'n cipio manylion caledwedd a meddalwedd perthnasol o weinydd: https://github.com/intel/svr-info
- Canllaw Technoleg DDP:
Canllaw Technoleg Personoli Dyfeisiau Dynamig (DDP) Cyfres Intel ® Ethernet 700
Rhestr Wirio Cychwynnol
2.1 Diweddaru Fersiynau Gyrwyr/ Cadarnwedd
Gwiriwch fersiynau'r gyrrwr/cadarnwedd gan ddefnyddio ethtool -i ethx.
Diweddarwch y canlynol yn ôl yr angen:
- Diweddaru gyrrwr i40e
http://sourceforge.net/projects/e1000/files/i40e%20stable/ or https:// downloadcenter.intel.com/ download/24411/Network-Adapter-Driver-for-PCI-E-40- Gigabit-Network-Connections-under-Linux - Diweddaru'r firmware
https://downloadcenter.intel.com/download/24769/NVM-Update-Utility-for-Intel-Ethernet-ConvergedNetwork-Adapter-XL710-X710-Series
2.2 Darllenwch y README
Gwiriwch am faterion hysbys a chael y cyfarwyddiadau ffurfweddu diweddaraf gan y README file wedi'i gynnwys yn y pecyn ffynhonnell i40e.
2.3 Gwiriwch Fod Eich Slot PCI Express (PCIe) yn x8
Mae rhai slotiau PCIe x8 mewn gwirionedd wedi'u ffurfweddu fel slotiau x4. Nid oes gan y slotiau hyn lled band digonol ar gyfer cyfradd llinell lawn gyda dyfeisiau porthladd deuol a phorthladd cwad. Yn ogystal, os rhowch addasydd PCIe v3.0-alluog i mewn i slot PCIe v2.x, ni allwch gael lled band llawn. Mae gyrrwr y ddyfais feddalwedd yn canfod y sefyllfa hon ac yn ysgrifennu'r neges ganlynol yn log y system:
Nid yw lled band PCI-Express sydd ar gael ar gyfer y cerdyn hwn yn ddigonol ar gyfer y perfformiad gorau posibl. I gael y perfformiad gorau posibl, mae angen slot x8 PCI-Express.
Os bydd y gwall hwn yn digwydd, symudwch eich addasydd i slot PCIe v3.0 x8 go iawn i ddatrys y mater.
2.4 Gwirio Galluoedd Caledwedd y System
Ar 10 Gbps, 25 Gbps, a 40 Gbps Ethernet, mae rhai gofynion CPU a system sylfaenol. Yn gyffredinol, dylai prosesydd dosbarth gweinydd modern a chyfluniad cof gorau posibl ar gyfer eich platfform fod yn ddigonol, ond mae'r anghenion yn amrywio yn dibynnu ar eich llwyth gwaith. Dylai pob sianel cof gael ei phoblogi a dylid galluogi modd perfformiad cof yn y BIOS. Gwiriwch fod eich CPU a'ch cyfluniad cof yn gallu cefnogi'r lefel o berfformiad rhwydwaith sydd ei angen arnoch ar gyfer eich llwyth gwaith.
NODYN
Rheolydd 710 GbE yw'r XL40. Nid yw'r addasydd 2 x 40 GbE sy'n defnyddio'r rheolydd hwn wedi'i fwriadu i fod yn 2 x 40 GbE ond yn 1 x 40 GbE gyda phorthladd wrth gefn gweithredol. Wrth geisio defnyddio traffig cyfradd llinell sy'n cynnwys y ddau borthladd, mae'r switsh mewnol wedi'i ddirlawn ac mae'r lled band cyfun rhwng y ddau borthladd wedi'i gyfyngu i gyfanswm o XNUMX Gbps.
2.4.1 Paramedrau Cychwyn y Cnewyllyn
Os yw Technoleg Rhithwiroli Intel® ar gyfer Mewnbwn/Allbwn Cyfeiriedig (Intel® VT-d) wedi'i galluogi yn y BIOS, mae Intel yn argymell bod IOMMU yn y modd pasio drwodd ar gyfer perfformiad rhwydwaith gwesteiwr gorau posibl. Mae hyn yn dileu gorbenion DMA ar draffig gwesteiwr wrth alluogi Peiriannau Rhithwir (VMs) i barhau i gael manteision Intel® VT-d. Cyflawnir hyn trwy ychwanegu'r llinell ganlynol at baramedrau cychwyn y cnewyllyn: fommu-pt.
2.5 Sicrhewch fod y Pecyn DDP yn Llwytho'n Iawn
Nid oes gan yrwyr sylfaenol 140ea a 140eb gefnogaeth uniongyrchol ar gyfer Personoli Dyfeisiau Dynamig (DDP). I ddefnyddio DDP gyda dyfeisiau Cyfres 700, mae angen pro DDPfile gellir ei gymhwyso gyda'r cais testpmd.
I gael manylion am DDP profiles, a sut i gymhwyso pro DDPfile gyda testpmd ar ddyfeisiau Cyfres 700, cyfeiriwch at Ganllaw Technoleg Personoli Dyfais Dynamig Cyfres 700 Intel® Ethernet (DDP).
I wirio a yw DDP profile wedi'i lwytho'n llwyddiannus:
testpmd> ddp cael rhestr 0 Profile rhif yw: 1
NODYN
Os bydd y profile Os yw'r rhif yn 0, nid oes pecyn DDP wedi'i lwytho. Os bydd gwall llwytho pecyn DDP, mae'r ddyfais yn mynd i'r modd diogel yn ddiofyn ac nid yw llawer o nodweddion perfformiad ar gael. Os oes gwallau sy'n gysylltiedig â llwytho'r pecyn DDP, bydd yn achosi problemau perfformiad. Am gamau datrys problemau, cyfeiriwch at y Canllaw Technoleg Personoli Dyfeisiau Dynamig (DDP) Cyfres 700 Ethernet Inte/*.
Mesuriadau Perfformiad Sylfaenol a Methodoleg Addasu
3.1 Meincnodau Perfformiad Rhwydwaith
Cyn dechrau ymarfer tiwnio, mae'n bwysig cael mesuriad gwaelodlin da o berfformiad eich rhwydwaith. Fel arfer yn ogystal â chael mesuriad cychwynnol o berfformiad eich cais/llwyth gwaith penodol, mae hefyd yn syniad da defnyddio meincnod perfformiad rhwydwaith safonol i wirio bod eich dyfais rhwydwaith mewn cyflwr da.
Ar gyfer optimeiddio system sengl, mae netperf neu iperf a NetPIPE i gyd yn offer ffynhonnell agored cadarn am ddim sy'n eich galluogi i bwysleisio cysylltiad a diagnosio problemau perfformiad.
Mae Netperf yn gryf ar gyfer profi trwybwn a latency. Mae NetPIPE yn offeryn sy'n benodol i latency ond gellir ei lunio ar gyfer unrhyw fath o amgylchedd.
NODYN
Mae'r prawf TCP_RR yn netperf yn dychwelyd latency mewn gwerth o drafodion/eiliad. Mae hwn yn rhif taith gron. Gellir cyfrifo'r latency unffordd gan ddefnyddio'r hafaliad canlynol:
Latency(usec) = (1⁄2) / [Trafodion/eiliad] * 1,000,000
3.1.1 iPerf2
Mae Intel yn argymell iperf2 dros iperf3 ar gyfer y rhan fwyaf o sefyllfaoedd meincnodi oherwydd rhwyddineb defnydd a chefnogaeth i nifer o edafedd mewn un enghraifft o gymhwysiad. Mae Intel yn argymell rhedeg gyda'r opsiwn -P gyda 2-4 edafedd ar gyfer cysylltiadau 25G a thua 4-6 edafedd ar gyfer cysylltiadau 40G.
- I redeg traffig unffordd o'r cleient i'r gweinydd: Gorchymyn gweinydd e.e.ample: iperf2 -s
Gorchymyn cleient example: iperf2 -c -P - I redeg traffig dwyffordd o'r cleient i'r gweinydd (ac i'r gwrthwyneb): Gorchymyn gweinydd e.e.ample: iperf2 –s –p
Gorchymyn cleient example:
iperf2 -c -p -P -–llawn-ddwplecs NEU
iperf2 -c -p -P –d
NODYN
Mae'r opsiynau –full-duplex a -d yn iperf2 yn caniatáu i'r defnyddiwr gynnal profion dwyffordd. Fodd bynnag, mae'r opsiwn –full-duplex yn canolbwyntio'n benodol ar brofion llawn deuplex.
NODYN
Wrth brofi iperf2 ar draws porthladdoedd gweinydd lluosog, gellir ychwanegu'r faner -d at y gorchymyn gweinydd i redeg pob sesiwn gweinydd yn y cefndir o'r un ffenestr derfynell. Gellir defnyddio'r faner -d hefyd pan fydd y gorchymyn gweinydd wedi'i fewnosod y tu mewn i ddolen for mewn sgript.
NODYN
Wrth redeg y prawf trwybwn rhwydwaith gydag un nant/edau (e.e.ample: P1), efallai na fydd proseswyr AMD yn darparu trwygyrch disgwyliedig, yn enwedig NICs lled band uwch (os yw'r cyflymder yn > = lled band 25G). O ganlyniad, mae angen pinio cymwysiadau i greiddiau penodol i gyflawni trwybwn uwch. Gweler Gosodiadau Cais ar dudalen 22.
3.1.2 iPerf3
Os defnyddir iperf3, mae angen sawl achos o'r cais i gymryd advantage o'r ciwiau aml-edau, RSS, a chaledwedd. Mae Intel yn argymell rhedeg gyda'r 2-4 sesiwn cymhwysiad ar gyfer cysylltiadau 25G a thua 4-6 sesiwn ar gyfer cysylltiadau 40G. Dylai pob sesiwn nodi gwerth porthladd TCP unigryw gan ddefnyddio'r opsiwn -p.
- I redeg traffig unffordd o'r cleient i'r gweinydd:
Gorchymyn gweinydd example:
iperf3 -s -p
Gorchymyn cleient example:
iperf3 -c -p - I redeg traffig dwyffordd o'r cleient i'r gweinydd (ac i'r gwrthwyneb):
Gorchymyn gweinydd example:
iperf3 –s –p
Gorchymyn cleient example: iperf3 -c -p -P –-bidir - I gychwyn sawl achos (edau) o iperf3, yr argymhelliad yw defnyddio dolen-for i fapio edafedd i borthladdoedd TCP a rhedeg iperf3 yn y cefndir gan ddefnyddio & i greu sawl proses ochr yn ochr.
Gorchymyn gweinydd example, dechreuwch 4 edau: porthladd=””; ar gyfer i yn {0..3}; do porthladd=520$i; bash -c “iperf3 -s -p $porthladd &”; wedi'i wneud; Gorchymyn y cleient e.e.ample, dechreuwch 4 edau – Trosglwyddo prawf porthladd=””; ar gyfer i yn {0..3}; gwneud porthladd=520$i; bash -c “iperf3 -c $serverIP -p $porthladd &”; wedi'i wneud; Gorchymyn cleient e.e.ample, dechreuwch 4 edau – Derbyn prawf porthladd=””; ar gyfer i yn {0..3}; do porthladd=520$i; bash -c “iperf3 -R -c $serverIP -p $porthladd &”; wedi'i wneud; Ar gyfer cysylltiadau 40G, cynyddwch y ddolen-for i greu hyd at 6 achos/edau.
NODYN
Wrth redeg y prawf trwybwn rhwydwaith gydag un nant/edau (e.e.ample: P1), efallai na fydd proseswyr AMD yn darparu'r trwybwn disgwyliedig, yn enwedig lled band uwch
NICs (os yw'r cyflymder yn lled band >= 25G). O ganlyniad, mae angen pinio cymwysiadau i greiddiau penodol i gyflawni trwybwn uwch. Gweler Gosodiadau'r Cymhwysiad ar dudalen 22 ac AMD EPYC ar dudalen 26.
3.1.3 netperf
Mae'r offeryn netperf yn ddewis cryf ar gyfer profi trwybwn a hwyrni.
- Mae'r prawf TCP_STREAM yn netperf yn mesur galluoedd trwybwn y ddyfais. Gorchymyn gweinydd e.e.ample: netserver Gorchymyn cleient example: netperf -t TCP_STREAM -l 30 -H
- Mae'r prawf TCP_RR yn netperf yn dychwelyd latency mewn gwerth o drafodion/eiliad. Mae hwn yn rhif taith gron. Argymhellir defnyddio'r opsiwn -T x,x, lle mae x yn CPU lleol i'r ddyfais. Gellir cyfrifo'r latency unffordd gan ddefnyddio: Latency(usec)=(1⁄2)/ [Trafodion/eiliad]*1,000,\ Gorchymyn gweinydd e.e.ample: gweinydd rhwyd
Gorchymyn cleient example: netperf -t TCP_RR -l 30 -H -T x,x - I gychwyn sawl achos (edau) o netperf, yr argymhelliad yw defnyddio dolen-for i fapio edafedd i borthladdoedd TCP a rhedeg netperf yn y cefndir gan ddefnyddio & i greu sawl proses ochr yn ochr.
Gorchymyn gweinydd example, dechreuwch 8 edefyn:
porthladd =””; am i yn {0..7}; gwneud porthladd=520$i; bash -c “netserver -L $serverIP -p $port &”; gwneud;
Gorchymyn cleient example, dechreuwch 8 edau: porthladd=””; ar gyfer i yn {0..7}; do porthladd=520$i; bash -c “netperf -H $serverIP -p $porthladd -t TCP_STREAM -l 30 &”; wedi'i wneud;
3.2 Methodoleg Tiwnio
Canolbwyntiwch ar un newid tiwnio ar y tro fel eich bod yn gwybod pa effaith y mae pob newid yn ei gael ar eich prawf. Po fwyaf trefnus ydych chi yn y broses diwnio, yr hawsaf fydd hi i nodi a mynd i'r afael ag achosion tagfeydd perfformiad.
Tiwnio Gosodiadau Gyrwyr i40e
4.1 Perthynas IRQ
Gall ffurfweddu affinedd IRQ fel bod ymyrraethau ar gyfer ciwiau rhwydwaith gwahanol wedi'u affineiddio i greiddiau CPU gwahanol gael effaith enfawr ar berfformiad, yn enwedig profion trwybwn aml-edau.
I ffurfweddu afinedd IRQ, stopiwch irqbalance ac yna naill ai defnyddiwch y sgript set_irq_affinity o'r pecyn ffynhonnell i40e neu biniwch giwiau â llaw. Analluogwch gydbwysydd IRQ gofod defnyddiwr i alluogi pinio ciw:
- systemctl analluogi cydbwysedd irq
- systemctl atal cydbwysedd
Gan ddefnyddio'r sgript set_irq_affinity o'r pecyn ffynhonnell i40e (argymhellir): - I ddefnyddio'r holl greiddiau:
[llwybr-i-i40epecyn]/scripts/set_irq_affinity -X all ethX - I ddefnyddio creiddiau ar y soced NUMA lleol yn unig: [path-to-i40epackage]/scripts/set_irq_affinity -X local ethX
- Gallwch hefyd ddewis ystod o greiddiau. Osgowch ddefnyddio cpu0 oherwydd ei fod yn rhedeg tasgau amserydd. [path-to-i40epackage]/scripts/set_irq_affinity 1-2 ethX
NODYN
Mae'r sgript affinedd yn galluogi Llywio Pecynnau Trosglwyddo (XPS) fel rhan o'r broses binio pan nodir yr opsiwn -x. Pan fydd XPS wedi'i alluogi, mae Intel yn argymell eich bod yn analluogi irqbalance, gan y gall y cydbwysydd cnewyllyn gydag XPS achosi perfformiad anrhagweladwy. Mae'r sgript affinedd yn analluogi XPS pan nodir yr opsiwn -X. Mae analluogi XPS a galluogi ciwiau cymesur yn fuddiol ar gyfer llwythi gwaith lle cyflawnir y perfformiad gorau pan fydd traffig Tx a Rx yn cael eu gwasanaethu ar yr un pâr (pâr) ciw.
Mae ffurfweddu ciwiau cymesur yn Linux yn golygu tiwnio paramedrau gyrrwr rhyngwyneb y rhwydwaith i alluogi ciwiau derbyn cymesur (Rx) a chiwiau trawsyrru cymesur (Tx) ar gyfer addaswyr rhwydwaith â chymorth.
NODYN
- Mae ciwiau cymesur yn nodwedd rhwydweithio uwch, ac nid yw pob addasydd rhwydwaith na gyrrwr cyfres 700 yn eu cefnogi.
- Gwnewch yn siŵr bod gennych y gefnogaeth gyrrwr a chaledwedd angenrheidiol cyn ceisio ffurfweddu ciwiau cymesur.
I ffurfweddu ciwiau cymesur, dilynwch y camau cyffredinol hyn:
- Golygu Ffurfweddiad Rhyngwyneb Rhwydwaith File: Defnyddiwch olygydd testun (ar gyfer example, vi, nano, neu gedit) i olygu ffurfweddiad y rhyngwyneb rhwydwaith file. Mae'r file fel arfer mae wedi'i leoli o dan y cyfeiriadur /etc/sysconfig/network-scripts/ ac mae ganddo enw fel ifcfg-ethX, lle mae ethX yn enw eich rhyngwyneb rhwydwaith.
- Ychwanegu Paramedrau Ciw Cymesur. Ychwanegwch y llinellau canlynol at gyfluniad rhyngwyneb y rhwydwaith fileETHTOOL_OPTS = "ciwiau-rx 8 ciwiau-tx 8"
- Ailgychwyn y Gwasanaeth Rhwydwaith.
Ar ôl gwneud y newidiadau, ailgychwynwch y gwasanaeth rhwydwaith i gymhwyso'r ffurfweddiad newydd. sudo systemctl ailgychwyn rhwydwaith
Gyda llaw:
-
Dewch o hyd i'r proseswyr sydd ynghlwm wrth bob nod gan ddefnyddio: numactl –hardware lscpu
-
Dewch o hyd i'r masgiau bit ar gyfer pob un o'r proseswyr:
- Gan dybio creiddiau 0-11 ar gyfer nod 0: [1,2,4,8,10,20,40,80,100,200,400,800]
- Dewch o hyd i'r IRQs sydd wedi'u neilltuo i'r porthladd sy'n cael ei neilltuo: grep ethX /proc/interrupts a nodwch y gwerthoedd IRQ Er enghraifftample, 181-192 ar gyfer y 12 fector a lwythwyd.
- Adleisiwch werth afinedd SMP i'r cofnod IRQ cyfatebol. Sylwch fod angen gwneud hyn ar gyfer pob cofnod IRQ: echo 1 > /proc/irq/181/smp_affinity echo 2 > /proc/irq/182/smp_affinity echo 4 > /proc/irq/183/smp_affinity Dangos afinedd IRQ:
- I ddangos y berthynas IRQ ar gyfer pob craidd: /sgriptiau/set_irq_affinity -s ethX
- I ddangos creiddiau ar y soced NUMA lleol yn unig: /scripts/set_irq_affinity -s ethX lleol
- Gallwch hefyd ddewis ystod o greiddiau: /sgriptiau/set_irq_affinity -s 40-0-8,16 ethX
NODYN
Mae'r sgript set_irq_affinity yn cefnogi'r faner -s yn fersiwn 40 o'r gyrrwr i2.16.11e ac yn ddiweddarach.
4.2 Ciwiau Tx/Rx
Mae nifer rhagosodedig y ciwiau a alluogwyd ar gyfer pob porthladd Ethernet gan y gyrrwr wrth gychwyn yn hafal i gyfanswm nifer y CPUs sydd ar gael yn y platfform. Mae hyn yn gweithio'n dda ar gyfer llawer o lwyfannau a ffurfweddau llwyth gwaith. Fodd bynnag, mewn llwyfannau â chyfrif craidd uchel a/neu ddwysedd porthladd Ethernet uchel, gall y cyfluniad hwn achosi cynnen adnoddau. Felly, efallai y bydd angen mewn rhai achosion addasu'r rhagosodiad ar gyfer pob porthladd yn y system.
Gall nifer rhagosodedig y ciwiau Tx/Rx amrywio yn dibynnu ar y model penodol a'r fersiwn gyrrwr. Gellir addasu nifer y ciwiau gan ddefnyddio'r gorchymyn ethtool -L a restrir isod.
NODYN
Yn yr achosion hyn, mae Intel yn argymell eich bod yn lleihau'r cyfrif ciw diofyn ar gyfer pob porthladd i ddim mwy na nifer y CPUs sydd ar gael yn y nod NUMA sy'n lleol i'r porthladd addasydd. Mewn rhai achosion, wrth geisio cydbwyso adnoddau ar weithrediadau cyfrif porthladd uchel, efallai y bydd angen lleihau'r nifer hwn ymhellach fyth.
I addasu ffurfweddiad y ciw:
Mae'r cynampMae le yn gosod y porthladd i 32 ciw Tx/Rx: ethtool -L ethX wedi'i gyfuno 32
Exampallbwn le:
ethtool -l ethX
Paramedrau sianel ar gyfer ethX: Uchafswm wedi'u gosod ymlaen llaw:
RX: 96
TX: 96
Eraill: 1
Cyfunol: 96
Gosodiadau caledwedd cyfredol:
RX: 0
TX: 0
Eraill: 1
Cyfunol: 32
4.3 Cymedroli Torri Ar Draws
Mae cymedroli ymyrraeth addasol ymlaen yn ddiofyn, ac mae wedi'i gynllunio i ddarparu ymagwedd gytbwys rhwng defnydd CPU isel a pherfformiad uchel. Fodd bynnag, efallai y byddwch yn ceisio tiwnio gosodiadau ymyrraeth â llaw i gyd-fynd â'ch achos defnydd.
Mae'r ystod o 0-235 microeiliad yn darparu ystod effeithiol o 4,310 i 250,000 o ymyrraethau yr eiliad. Gellir gosod gwerth rx-μsecs-high yn annibynnol ar rx-μsecs a tx-μsecs yn yr un gorchymyn ethtool, ac mae hefyd yn annibynnol ar yr algorithm cymedroli ymyrraethau addasol. Mae'r caledwedd sylfaenol yn cefnogi manylder mewn cyfnodau o 2 microeiliad, felly gallai gwerthoedd cyfagos arwain at yr un gyfradd ymyrraethau.
- I ddiffodd cymedroli ymyrraeth addasol: ethtool -C ethX adaptive-rx off adaptive-tx off
- I droi cymedroli ymyrraeth addasol ymlaen: ethtool -C ethX adaptive-rx on adaptive-tx on
Man cychwyn da ar gyfer tiwnio cyffredinol yw 84 μs, neu ~12000 o ymyriadau/eiliad. Os gwelwch chi fod cownteri rx_dropped yn rhedeg yn ystod traffig (gan ddefnyddio ethtool -S ethX) yna mae'n debyg bod gennych chi CPU rhy araf, dim digon o fyfferau o faint cylch yr addasydd (ethtool -G) i ddal pecynnau am 84 μs neu gyfradd ymyriadau rhy isel.
- I osod cymedroli ymyrraeth i gyfradd ymyrraeth sefydlog o 84 μs rhwng ymyrraethau (12000 o ymyrraethau/eiliad): ethtool -C ethX adaptive-rx off adaptive-tx off rx-usecs 84 tx-usecs 84 Y gwerth nesaf i roi cynnig arno, os nad ydych chi wedi cyrraedd eich uchafswm defnydd CPU, yw 62 μs. Mae hyn yn defnyddio mwy o CPU, ond mae'n gwasanaethu byfferau'n gyflymach, ac mae angen llai o ddisgrifwyr (maint y cylch, ethtool -G).
- I osod cymedroli ymyrraeth i gyfradd ymyrraeth sefydlog o 62 usecs rhwng ymyrraethau (16000 ymyrraeth/eiliad). ethtool -C ethX adaptive-rx off adaptive-tx off rx-usecs 62 tx-usecs 62
Os bydd cownteri rx_dropped yn cynyddu yn ystod traffig (gan ddefnyddio ethtool -S ethX), mae'n debyg bod gennych CPU rhy araf, dim digon o glustogau o faint cylch yr addasydd (ethtool -G), neu gyfradd ymyrraeth rhy isel. Os na chewch fwy o ddefnydd o CPU, gallwch gynyddu'r gyfradd ymyrraeth trwy ostwng y gwerth ITR. Mae hyn yn defnyddio mwy o CPU, ond mae gwasanaethau'n clustogi'n gyflymach, ac mae angen llai o ddisgrifyddion (maint cylch, ethtool -G).
Os yw eich CPU ar 100%, yna ni argymhellir cynyddu'r gyfradd ymyrraeth. Mewn rhai amgylchiadau fel llwyth gwaith sydd wedi'i rwymo gan y CPU, efallai yr hoffech gynyddu'r gwerth μs i alluogi mwy o amser CPU ar gyfer cymwysiadau eraill.
Os oes angen perfformiad hwyrni isel arnoch a/neu os oes gennych ddigon o CPU i'w neilltuo i brosesu rhwydwaith, gallwch analluogi cymedroli ymyriadau yn gyfan gwbl, sy'n galluogi'r ymyriadau i danio mor gyflym â phosibl. - I analluogi cymedroli ymyrraeth ethtool -C ethX adaptive-rx off adaptive-tx off rx-usecs 0 tx-usecs 0
NODYN
Wrth redeg gyda chymedroli ymyrraeth wedi'i analluogi, gall y gyfradd ymyrraeth ar bob ciw fod yn uchel iawn. Ystyriwch gynnwys y paramedr rx-usec-high i osod terfyn uchaf ar y gyfradd ymyrraeth. Mae'r gorchymyn canlynol yn analluogi cymedroli ymyrraeth addasol ac yn caniatáu uchafswm o 5 microeiliad cyn nodi bod derbyn neu drosglwyddo wedi'i gwblhau. Yn lle arwain at gymaint â 200,000 o ymyrraethau yr eiliad, mae'n cyfyngu cyfanswm yr ymyrraethau yr eiliad i 50,000 trwy'r paramedr rx-usec-high. # ethtool -C ethX adaptive-rx off adaptive-tx off rx-usecs-high 20 rx-usecs 5 txusecs 5 Rhowch gynnig ar addasu'r amserydd cyfuno trosglwyddo/derbyn/blaenoriaeth uchel yn uwch (80/100/150/200) neu'n is (25/20/10/5) i ddod o hyd i'r gwerth gorau posibl ar gyfer y llwyth gwaith.
4.4 Maint y Fodrwy
Os ydych chi'n gweld cownteri rx_dropped yn ethtool -S ethX (rx_dropped, rx_dropped.nic), neu'n amau pwysau storfa gyda chiwiau lluosog yn weithredol, efallai y gallech chi geisio addasu maint y cylch o'r gwerth diofyn. Y gwerth diofyn yw 512, yr uchafswm yw 4096.
- I wirio'r gwerthoedd cyfredol: ethtool -g ethX
Os amheuir bod diffyg byffro yn achosi gostyngiadau ar y gyfradd ymyrraeth gyfredol, efallai y byddwch chi'n rhoi cynnig ar yr uchafswm yn gyntaf, yna'r isafswm, yna parhewch mewn chwiliad deuaidd nes i chi weld y perfformiad gorau posibl.
Os amheuir bod pwysau yn y storfa (llawer o giwiau'n weithredol) gall lleihau byfferau o'r rhagosodiad helpu Intel ® Data Direct I/O (Intel ® DDIO) i weithredu'n fwy effeithlon. Mae Intel yn argymell rhoi cynnig ar 128 neu 256 fesul ciw, gan fod yn ymwybodol y gallai fod angen cynyddu'r gyfradd ymyrraeth trwy ethtool -C i osgoi cynnydd yn rx_dropped. - I osod maint y fodrwy i werth sefydlog: ethtool -G eth12 rx 256 tx 256
NODYN
I drwsio gollyngiadau pecynnau Rx a geir gyda gollyngiad ethtool -S ethX|grep, ystyriwch gynyddu maint y cylch i 4096. Arbrofwch i ddod o hyd i'r gosodiad gorau ar gyfer y llwyth gwaith ond byddwch yn ofalus am or-ddefnydd cof gyda gwerthoedd uwch.
4.5 Rheoli Llif
Gall rheolaeth llif Haen 2 effeithio'n sylweddol ar berfformiad TCP ac argymhellir ei hanalluogi ar gyfer y rhan fwyaf o lwythi gwaith. Eithriad posibl yw traffig byrstio lle nad yw'r byrstio yn hir o ran hyd.
Mae rheoli llif wedi'i analluogi yn ddiofyn.
- I alluogi rheoli llif: ethtool -A ethX rx on tx on
- I analluogi rheolaeth llif: ethtool -A ethX rx off tx off
NODYN
Rhaid bod gennych bartner cyswllt sy'n gallu rheoli llif i alluogi rheoli llif yn llwyddiannus.
4.6 Fframiau Jumbo
Pan fydd yr amgylchedd traffig disgwyliedig yn cynnwys trosglwyddo blociau mawr o ddata, gallai fod yn fuddiol galluogi'r nodwedd ffrâm jumbo. Galluogir cefnogaeth Fframiau Jumbo trwy newid yr Uned Drosglwyddo Uchaf (MTU) i werth sy'n fwy na'r gwerth rhagosodedig o 1500. Mae hyn yn caniatáu i'r ddyfais drosglwyddo data mewn pecynnau mwy o fewn amgylchedd y rhwydwaith. Gallai'r gosodiad hwn wella trwygyrch a lleihau'r defnydd o CPU ar gyfer llwythi gwaith I/O mawr. Fodd bynnag, gallai effeithio ar becynnau bach neu lwythi gwaith sy'n sensitif i hwyrni.
NODYN
Rhaid ffurfweddu fframiau jumbo neu osodiad MTU mwy yn gywir ar draws amgylchedd eich rhwydwaith.
Defnyddiwch y gorchymyn ifconfig i gynyddu maint MTU. Am gynample, nodwch y canlynol, lle yw rhif y rhyngwyneb: ifconfig mtu 9000 i fyny
Fel arall, gallwch ddefnyddio'r gorchymyn ip fel a ganlyn: ip link set mtu 9000 dev datblygwr sefydlu cyswllt ip
Tiwnio Platfform (i40e Amhenodol)
5.1 Gosodiadau BIOS
- Galluogi Intel® VT-d ar gyfer llwythi gwaith rhithwiroli.
- Gall hyper-edau (proseswyr rhesymegol) effeithio ar berfformiad. Arbrofwch ag ef ymlaen neu i ffwrdd ar gyfer eich llwyth gwaith.
- Mae Intel® Turbo Boost yn caniatáu i greiddiau CPU weithredu ar amledd uwch nag amledd sylfaenol y CPU. Gall galluogi Intel® Turbo Boost wella perfformiad ar gyfer llawer o lwythi gwaith ond mae'n defnyddio mwy o bŵer i gadw'r creiddiau ar amledd uwch. Arbrofwch gyda Turbo Boost i ffwrdd/ymlaen ar gyfer eich llwyth gwaith.
NODYN
Nid yw amleddau turbo yn cael eu gwarantu os yw'r platfform yn profi defnydd CPU cyffredinol uchel. Mae amleddau turbo craidd uwch yn cael eu lleihau wrth i ddefnydd CPU cyffredinol gynyddu.
5.2 Rheoli Pŵer
Gall rheoli pŵer effeithio ar berfformiad, yn enwedig mewn llwythi gwaith hwyrni isel. Os yw perfformiad yn flaenoriaeth uwch na gostwng y defnydd o bŵer, mae Intel yn argymell eich bod yn arbrofi gyda chyfyngu ar effeithiau rheoli pŵer. Mae yna lawer o wahanol ffyrdd o gyfyngu ar reoli pŵer, trwy offer system weithredu, gosodiadau BIOS, a pharamedrau cist cnewyllyn. Dewiswch y dull a'r lefel orau i weddu i'ch amgylchedd.
5.2.1 Rheolaeth Cyflwr-C
Mae cyfyngu mynediad cyflwr-C i CO neu C1 yn gwella perfformiad ac yn cynyddu'r defnydd o bŵer.
Gall analluogi mynediad cyflwr Pecyn CPU C6 wella perfformiad rhwydwaith. Fodd bynnag, mae hyn yn cynyddu'r defnydd o bŵer.
Mae'r opsiynau canlynol ar gael:
- Rheoli'r cofnod cyflwr-C yn ddeinamig:
Agor
/dev/cpu_dma_latency ac ysgrifennwch yr uchafswm hwyrni a ganiateir iddo.
NODYN
Mae rhaglen fach o'r enw cpudmalatency.c y gellir ei lawrlwytho o'r gymuned ffynhonnell agored, ei llunio, a'i rhedeg o'r llinell orchymyn i wneud yn union hyn.
Mae'r cynampMae le yn caniatáu pum μs o amser deffro, ac felly'n caniatáu mynediad C1: cpudmalatency 5 a
- Cyfyngwch y cyflwr-C mwyaf yn y gosodiadau cychwyn cnewyllyn:
Ar gyfer CPUau Intel: intel_idle.max_cstates=1
Ar gyfer CPUs nad ydynt yn rhai Intel: processor.max_cstates=1 - Defnyddiwch y gorchymyn cpupower i wirio ac analluogi cyflwr CPU C6: Gwiriwch: monitor cpupower neu cpupower idle-info
Analluogi C6: cpupower idle-set -d3 neu
Analluogi Cyflyrau-C: cpupower idle-set -D0
Nodiadau:
- Analluogwch gyflyrau-C ar y CPU os oes gan y gweinydd Brosesydd(au) Graddadwy Intel® 4ydd Gen Intel® Xeon®. Pan fydd Hyper Threading wedi'i alluogi neu wedi'i analluogi, mae analluogi cyflyrau segur (-D0) yn atal creiddiau rhag mynd i gyflyrau pŵer isel yn ystod cyfnodau segur ac yn lleihau'r oedi i'r CPU drawsnewid rhwng cyflyrau segur a gweithredol.
- Mae rheoli pŵer Prosesydd Graddadwy Intel® 4ydd Gen Intel® Xeon® yn hynod ymosodol. Er mwyn osgoi creiddiau rhag mynd i gyflyrau pŵer isel, ceisiwch leihau nifer y creiddiau sy'n cael eu defnyddio i'w cadw'n effro am hirach (ethtool -L cyfunol Hefyd, rhwymwch ymyrraethau i greiddiau penodol gan ddefnyddio affinedd irq set (yn amlaf gyda -x local neu restr o greiddiau CPU), a sicrhewch fod y llwyth gwaith yn rhedeg ar yr un greiddiau hynny gyda taskset neu numactl. Mae hyn yn gwella perfformiad trwy gadw creiddiau'n weithredol ac optimeiddio trin ymyrraethau.
Galluogi C6:
cpupower segur-set -d3
Galluogi C-Gwladwriaethau:
cpupower segur-set -E
- Dull arall yw defnyddio'r offeryn wedi'i diwnio (sydd wedi'i gynnwys gyda llawer o ddosraniadau Linux) i osod pro perfformiad.file. Mae'r rhain yn profiles addasu nifer o leoliadau AO a all effeithio ar berfformiad ar draws llawer o geisiadau. Canfuwyd bod y rhwydwaith-trwybwn profile yn darparu gwelliant i'r rhan fwyaf o lwythi gwaith.
Gwiriwch:
diwnio-adm gweithredol
Gosod:
tud-adm profile rhwydwaith-trwybwn
NODYN
Rhaid i'r gwasanaeth tiwnio fod yn rhedeg ar gyfer y gorchmynion uchod. I wirio/ailgychwyn, tiwniwyd: statws systemctl tiwniwyd ailgychwyn systemctl tiwniwyd
Gallwch hefyd wrthod unrhyw gofnod cyflwr C trwy ychwanegu'r canlynol at y llinell gychwyn cnewyllyn:
segur=pôl - Cyfyngwch y cyflwr-C drwy osodiadau rheoli pŵer BIOS y system, a allai gael mantais perfformiadfile ar gael.
Gellir defnyddio offer fel turbostat neu x86_energy_perf_policy i wirio neu osod gosodiadau rheoli pŵer.
5.2.2 Rheoli Pŵer PCIe
Mae Rheoli Pŵer Cyflwr Gweithredol (ASPM) yn galluogi cyflwr pŵer is ar gyfer cysylltiadau PCIe pan nad ydynt mewn defnydd gweithredol. Gall hyn achosi oedi uwch ar ddyfeisiau rhwydwaith PCIe, felly mae Intel yn argymell eich bod yn analluogi ASPM ar gyfer llwythi gwaith sy'n sensitif i oedi. Analluogwch ASPM trwy ychwanegu'r canlynol at linell gychwyn y cnewyllyn: pcie_aspm=off
5.2.3 Graddio Amledd CPU
Mae graddio amledd CPU (neu raddio cyflymder CPU) yn dechneg rheoli pŵer Linux lle mae cyflymder cloc y system yn cael ei addasu ar y hedfan i arbed pŵer a gwres. Yn union fel C-states, gall hyn achosi hwyrni digroeso ar gysylltiadau rhwydwaith.
Gellir defnyddio'r offeryn cpupower hefyd i wirio ac addasu rhagosodiadau a therfynau perfformiad CPU:
- Gwiriwch: monitor pŵer cpu neu
- Gosod CPUs i'r modd perfformiad: cpupower amlder-set -g perfformiad
NODYN
Gall addasiadau i derfynau amledd CPU gael effaith ar lawer o lwythi gwaith a gallant analluogi nodweddion eraill, fel modd turbo CPU.
I analluogi graddio amledd CPU, analluoga'r gwasanaeth pŵer CPU trwy'r gorchmynion canlynol:
systemctl stopio cpupower.service
systemctl analluogi cpupower.service
5.2.4 Canllawiau Rheoli Pŵer Ychwanegol
Darperir manylion ychwanegol yn y lefel uchel hon drosoddview llawer o'r nodweddion rheoli pŵer yn y proseswyr Intel® Xeon® Graddadwy 3ydd Genhedlaeth, yn ogystal â chanllawiau ar sut y gellir integreiddio'r nodweddion hyn ar lefel platfform: https://networkbuilders.intel.com/solutionslibrary/power-management-technologyoverview-technology-guide
5.3 Intel® Turbo Boost
Mae Intel® Turbo Boost yn gwneud y prosesydd yn gyflymach pan fo angen ond gall ddefnyddio pŵer ychwanegol. Mae diffodd Turbo Boost yn cadw'r prosesydd ar gyflymder cyson, gan roi lefel perfformiad cyson i chi ar gyfer llwythi gwaith penodol.
5.4 Waliau Tân
Gall waliau tân effeithio ar berfformiad, yn enwedig perfformiad oedi.
Analluogwch iptables/firewalld os nad oes angen.
5.5 Gosodiadau Cais
Yn aml nid yw edefyn sengl (sy'n cyfateb i un ciw rhwydwaith) yn ddigon i sicrhau'r lled band mwyaf. Mae rhai pensaernïaeth platfform, fel AMD, yn tueddu i ollwng mwy o becynnau Rx gydag un edefyn o'i gymharu â llwyfannau gyda phroseswyr sy'n seiliedig ar Intel.
Ystyriwch ddefnyddio offer fel set tasgau neu numactl i binio cymwysiadau i'r nod NUMA neu greiddiau CPU sy'n lleol i'r ddyfais rhwydwaith. Ar gyfer rhai llwythi gwaith megis storio I/O, mae symud y cais i nod nad yw'n lleol yn fuddiol.
Arbrofwch gyda chynyddu nifer yr edafedd a ddefnyddir gan eich cais os yn bosibl.
Fersiwn Cnewyllyn 5.6
Mae'r rhan fwyaf o gnewyllyn mewn-bocs modern wedi'u hoptimeiddio'n weddol dda ar gyfer perfformiad ond, yn dibynnu ar eich achos defnydd, gallai diweddaru'r cnewyllyn ddarparu perfformiad gwell. Mae lawrlwytho'r ffynhonnell hefyd yn eich galluogi i alluogi / analluogi rhai nodweddion cyn adeiladu'r cnewyllyn.
5.7 Gosodiadau System Weithredu/Cnewyllyn
Ymgynghorwch â chanllawiau tiwnio systemau gweithredu, megis Canllaw Tiwnio Perfformiad Rhwydwaith Red Hat Enterprise Linux, i gael mwy o wybodaeth am diwnio system weithredu gyffredinol.
Rhestrir rhai paramedrau cyffredin i'w tiwnio yn y tabl canlynol. Sylwch mai dim ond mannau cychwyn a awgrymir yw'r rhain, a gallai eu newid o'r rhagosodiadau gynyddu'r adnoddau a ddefnyddir ar y system. Er y gall cynyddu'r gwerthoedd helpu i wella perfformiad, mae angen arbrofi gyda gwerthoedd gwahanol i benderfynu beth sy'n gweithio orau ar gyfer system benodol, llwyth gwaith a math o draffig.
Gellir ffurfweddu'r paramedrau cnewyllyn gan ddefnyddio'r cyfleustodau sysctl yn Linux fel y nodir isod.
I view y gwerthoedd rhagosodedig ar gyfer rmem a wem ar y system:
sysctl net.core.rmem_default
sysctl net.core.wmem_default
Gosodwch y gwerthoedd i'r uchafswm (16 MB):
sysctl -w net.core.rmem_max=16777216
sysctl -w net.core.wmem_max=16777216
Mae meintiau byffer socedi, a elwir hefyd yn byffer derbyn (rmem) a byffer trosglwyddo (wmem), yn baramedrau system sy'n nodi faint o gof sydd wedi'i gadw ar gyfer traffig rhwydwaith sy'n dod i mewn ac allan.
Mae rhedeg sysctl heb y ddadl -w yn rhestru'r paramedr gyda'i osodiad presennol.
Gosodiad Pentwr | Disgrifiad |
net.core.rmem_diofyn | Maint Ffenestr Derbyn Diofyn |
net.core.wmem_default | Maint Ffenestr Drosglwyddo Diofyn |
net.core.rmem_max | Maint Uchafswm y Ffenestr Derbyn |
net.core.wmem_max | Maint Uchafswm y Ffenestr Drosglwyddo |
net.core.optmem_max | Mwyafswm Byfferau Cof Opsiwn |
net.core.netdev_max_backlog | Ôl-groniad o becynnau heb eu prosesu cyn i'r cnewyllyn ddechrau gollwng |
net.ipv4.tcp_rmem | Cadwr cof ar gyfer byfferau darllen TCP |
net.ipv4.tcp_wmem | Cadwr cof ar gyfer byfferau anfon TCP |
Gall cnewyllyn, pentwr rhwydwaith, triniwr cof, cyflymder CPU, a pharamedrau rheoli pŵer gael effaith fawr ar berfformiad rhwydwaith. Argymhelliad cyffredin yw bod yn berthnasol i'r pro trwybwn rhwydwaithfile gan ddefnyddio'r gorchymyn wedi'i diwnio. Mae hyn yn addasu ychydig o osodiadau OS i roi ffafriaeth i gymwysiadau rhwydweithio.
Gwiriwch:
diwnio-adm gweithredol
Gosod:
tud-adm profile rhwydwaith-trwybwn
5.8 Ôl-groniad Dyfeisiau Rhwydwaith
Mae'r nodwedd hon yn helpu i wella perfformiad rhwydwaith trwy reoli traffig sy'n dod i mewn yn effeithiol, lleihau colli pecynnau, lleihau hwyrni, a hybu trwygyrch. Mae hyn yn arwain at well profiad defnyddiwr ac ymateb system cyflymach.
Yn ddiofyn, mae wedi'i alluogi yn y rhan fwyaf o systemau gweithredu Linux. I wirio'r gwerth rhagosodedig:
sysctl net.core.netdev_max_backlog
Gall y gwerth mwyaf ar gyfer netdev_max_backlog amrywio yn dibynnu ar ffactorau fel fersiwn y cnewyllyn, caledwedd, cof, a llwyth gwaith. Mewn llawer o achosion, gwelir 8192 fel gwerth da. sysctl -w net.core.netdev_max_backlog=8192
5.9 Ffurfweddiadau a Thiwnio Penodol i'r Platfform
5.9.1 Proseswyr Graddadwy Intel® Xeon® 4ydd Genhedlaeth
Mae rheolaeth pŵer prosesydd Intel® 4th Generation Intel® Xeon® Scalable yn hynod ymosodol o'i gymharu â phroseswyr 3rd Generation Intel® Xeon® Scalable. Er mwyn osgoi creiddiau rhag mynd i mewn i gyflyrau pŵer isel, ceisiwch leihau nifer y creiddiau a ddefnyddir i'w cadw'n effro am gyfnod hirach.
Gosodiadau Bios a Argymhellir ar gyfer y Perfformiad Uchaf
- Galluogi/analluogi hyper-edau (yn seiliedig ar y gofyniad llwyth gwaith a'r nodau perfformiad) ar y CPU.
- Gosodwch y system profile i Berfformiad am y perfformiad mwyaf.
NODYN
Mae hyn yn arwain at ddefnydd pŵer uwch - Gosodwch reoli pŵer y CPU i Berfformiad Uchaf i flaenoriaethu perfformiad CPU mwyaf dros effeithlonrwydd pŵer.
- Galluogi Turbo Boost. Mae analluogi Turbo Boost yng ngosodiadau BIOS y system fel arfer yn atal y CPU rhag cynyddu cyflymder ei gloc yn ddeinamig y tu hwnt i'w amledd sylfaenol.
- NODYN
Gall analluogi Turbo Boost fod yn addas ar gyfer rhai achosion defnydd lle mae perfformiad cyson, effeithlonrwydd pŵer, neu reolaeth thermol yn cael blaenoriaeth dros berfformiad mwyaf. - Diffoddwch y nodwedd Rhithwiroli Mewnbwn/Allbwn Gwraidd Sengl (SR-IOV), os nad yw'r system yn defnyddio technolegau rhithwiroli.
- Analluogi cyflyrau-C i gyfarwyddo'r CPU i aros yn weithredol ac atal mynd i gyflyrau segur dyfnach.
- Analluogwch C1E, i sicrhau bod y CPU yn parhau i fod yn weithredol ac nad yw'n mynd i gyflwr segur C1E.
- Gosodwch yr amledd anghraidd i'r uchafswm i gyfarwyddo'r system i weithredu ar yr amledd uchaf sydd ar gael.
- Ar lwyfannau Dell, gosodwch efelychiad craidd Tabl Disgrifiad APIC Lluosog (MADT) i Linell (neu Round-Robin yn dibynnu ar y BIOS) i ddarparu mapio clir a rhagweladwy o greiddiau CPU.
Tiwniadau Lefel System Weithredu a Argymhellir ar gyfer Perfformiad Optimeiddiedig
- Gosodwch lywodraethwr graddio amledd CPU i berfformiad. cpupower amlder-set -g perfformiad cpupower amlder-info
- Analluogi Cyflyrau-C. cpupower segur-set -D0
- Gosodwch fwfferau craidd Rx (rmem) a Tx (wmem) i'r gwerth mwyaf. sysctl -w net.core.rmem_max=16777216 sysctl -w net.core.wmem_max=16777216
- Gosod ôl-groniad dyfais rhwydwaith. sysctl -w net.core.netdev_max_backlog=8192
- Gosod pro wedi'i diwniofile (llwyth gwaith yn dibynnu ar gyfer trwygyrch/latency).
tud-adm profile rhwydwaith-trwybwn
Tiwniadau Lefel Addasydd Argymhellir ar gyfer Perfformiad Optimeiddiedig
- Cyfyngwch nifer y ciwiau i'w defnyddio ar gyfer traffig cymwysiadau. Defnyddiwch y nifer lleiaf o giwiau sydd eu hangen i gadw'r creiddiau CPU cysylltiedig yn weithredol i'w hatal rhag mynd i gyflyrau segur dyfnach (addaswch ar gyfer y llwyth gwaith): ethtool -L cyfunol 32
- Gosod cyfraddau cymedroli ymyriadau. ethtool -C addasol-rx i ffwrdd addasol-rx i ffwrdd rx-usecs-uchel 50 rx-usecs 50 tx-usecs 50
Ceisiwch addasu'r amserydd trosglwyddo/derbyn/cyfuno blaenoriaeth uchel yn uwch (80/100/150/200) neu'n is (25/20/10/5) i ddod o hyd i'r gwerth gorau posibl ar gyfer y llwyth gwaith. - Gosodwch meintiau'r cylchoedd Rx/Tx. ethtool -G presgripsiwn 4096 tx 4096
NODYN
Os gwelwch chi ollyngiadau pecynnau Rx gydag ethtool -S| grep drop, ceisiwch leihau maint y cylch i <4096. Ceisiwch ddod o hyd i'r gwerth gorau posibl ar gyfer y llwyth gwaith lle nad yw pecynnau'n cael eu gollwng. - Gosodwch Affinedd IRQ. Defnyddiwch greiddiau lleol i'r NIC, neu fapio craidd penodol (lle mae # creiddiau yn hafal i nifer y ciwiau a osodwyd yn 1 ar dudalen 26. systemctl stop irqbalance set_irq_affinity -X local NEU set_irq_affinity -X
5.9.2 AMD EPYC
Mae proseswyr AMD EPYC yn CPUs pwerus a wneir ar gyfer gweinyddion a chanolfannau data, wedi'u hadeiladu ar bensaernïaeth Zen AMD. Mae'r gosodiadau isod o gyfres EPYC 4ydd genhedlaeth AMD.
Gosodiadau BIOS a Argymhellir ar gyfer y Perfformiad Uchaf
- Galluogwch y modd personol i ganiatáu i ddefnyddwyr addasu perfformiad y CPU, y defnydd o bŵer, a gosodiadau eraill. Mae hyn yn helpu i fireinio'r system i gael y cydbwysedd gorau rhwng perfformiad ac effeithlonrwydd ynni.
- Galluogi hwb perfformiad craidd i ganiatáu i'r CPU gynyddu ei gyflymder yn awtomatig i ymdrin â thasgau mwy dwys, gan wella perfformiad cyffredinol.
- Analluogi rheolaeth cyflwr-C byd-eang, i atal y CPU rhag mynd i gyflyrau arbed pŵer dyfnach a elwir yn gyflyrau-C, a all gynnal ymatebolrwydd.
NODYN
Gall analluogi cyflyrau-C achosi defnydd pŵer ychwanegol a chynyddu tymereddau thermol. Monitro'r ddau am y llwyth gwaith. - Galluogi/analluogi Aml-edau Ar y Pryd (SMT) ar y CPU, yn seiliedig ar y gofyniad llwyth gwaith a'r nodau perfformiad. Mae SMT yn cyfateb i Hyper-edau ar CPUau Intel.
NODYN
I gael perfformiad wedi'i optimeiddio, cyfeiriwch at Addasu Gosodiadau Gyrrwr i40e ar dudalen 13 a Addasu Llwyfan (i40e Heb fod yn Benodol) ar dudalen 19 am y lefel addasu a argymhellir ar gyfer y system weithredu a'r addasydd.
Bondio Addasydd
Mae bondio Linux yn nodwedd bwerus a all wella'n sylweddol berfformiad y rhwydwaith, dileu swyddi, a goddefgarwch namau mewn amgylcheddau gweinydd. Fodd bynnag, mae'n bwysig nodi bod angen caledwedd rhwydwaith cydnaws a chyfluniad priodol ar y gweinydd a'r switsh i weithio'n iawn.
Mae'r gyrrwr bondio yn Linux yn caniatáu ichi agregu rhyngwynebau rhwydwaith corfforol lluosog yn rhyngwyneb wedi'i fondio. Mae'r rhyngwyneb bondio hwn yn ymddangos fel un rhyngwyneb rhwydwaith rhithwir i'r system weithredu a chymwysiadau.
NODYN
Mae'r bond yn rhyngwyneb rhesymegol, felly nid yw'n bosibl gosod affinedd CPU yn uniongyrchol ar ryngwyneb y bond (er enghraifftample, bond0). Hynny yw, nid oes ganddo reolaeth uniongyrchol dros drin ymyrraeth nac affinedd CPU. Rhaid ffurfweddu affinedd CPU ar gyfer y rhyngwynebau gwaelodol sy'n rhan o'r bond.
Mae bondio yn darparu sawl dull gweithredu, pob un â'i nodweddion ei hun.
Modd | Math |
0 | Rownd Robin |
1 | Copi Wrth Gefn Gweithredol |
2 | XOR |
3 | Darllediad |
4 | LACP |
5 | Trosglwyddo Cydbwysedd Llwyth |
6 | Cydbwysedd Llwyth Addasol |
Mae yna wahanol ddulliau o greu bondio yn Linux. Un o'r dulliau mwyaf cyffredin yw defnyddio cyfluniad rhwydwaith files (ar gyfer cynample, /etc/network/ interfaces neu /etc/sysconfig/network-scripts/ifcfg-bondX).
Ffurfweddu Gan Ddefnyddio Ffurfweddiad Rhwydwaith Files
Mae'r camau canlynol yn creu bondio trwy gyfluniad y rhwydwaith files.
- Dewiswch ddau neu fwy o borthladdoedd NIC ar gyfer bondio (er enghraifftample, ethX ac ethY)
- Agor Ffurfweddiad NIC Fileo dan /etc/sysconfig/network-scripts/ ar gyfer y Rhyngwyneb NIC gofynnol (er enghraifftample, vi ifcfg-ethX a vi ifcfg-ethY) ac atodi'r testun canlynol:
MASTER=bondN [Nodyn: Cyfanrif yw N i sôn am y rhif bond.] SLAVE=ie - Creu sgript rhwydwaith bondiau file gan ddefnyddio vi /etc/sysconfig/networkscripts/ifcfg-bondN a rhowch y testun canlynol:
DYFAIS=bondN [Nodyn: Mae N yn gyfanrif i sôn am y rhif bond] ONBOOT=yes USERCTL=na BOOTPROTO=dhcp (neu) dim
IPADDR=200.20.2.4 [angenrheidiol os BOOTPROTO=dim] NETMASK=255.255.255.0 [angenrheidiol os BOOTPROTO=dim] NETWORK=200.20.2.0 [angenrheidiol os BOOTPROTO=dim] BROADCAST=200.20.2.255 [angenrheidiol os BOOTPROTO=dim] BONDING_OPTS=”mode=1 miimon=100″
NODYN
Gall y modd fod yn unrhyw gyfanrif o 0 i 6 yn seiliedig ar y gofyniad. - Ailgychwyn y gwasanaethau rhwydwaith gan ddefnyddio ailgychwyn rhwydwaith gwasanaeth neu ailgychwyn systemctl NetworkManager.service
Datrys Problemau Perfformiad
7.1 Defnydd CPU
Gwiriwch ddefnydd y CPU fesul craidd tra bod y llwyth gwaith yn rhedeg.
Sylwch fod y defnydd fesul craidd yn fwy perthnasol i berfformiad na'r defnydd CPU cyffredinol gan ei fod yn rhoi syniad o'r defnydd CPU fesul ciw rhwydwaith. Os mai dim ond ychydig o edafedd sydd gennych sy'n rhedeg traffig rhwydwaith, yna efallai mai dim ond ychydig o greiddiau sydd gennych yn cael eu defnyddio. Fodd bynnag, os yw'r creiddiau hynny ar 100%, yna mae'n debyg bod eich trwybwn rhwydwaith wedi'i gyfyngu gan y defnydd CPU ac mae'n bryd cyflawni'r canlynol:
- Tiwniwch gymedroli/maint y cylch IRQ fel y manylir yn Cymedroli Torri ar draws.
- Cynyddwch nifer yr edafedd cymhwysiad i ledaenu llwyth y CPU dros fwy o greiddiau. Os yw pob craidd yn rhedeg ar 100% yna efallai bod eich cymhwysiad wedi'i rwymo i'r CPU yn hytrach nag wedi'i rwymo i'r rhwydwaith.
Offer sydd ar gael yn gyffredin:
- brig
— Pwyswch 1 i ehangu'r rhestr o CPUau a gwirio pa rai sy'n cael eu defnyddio.
— Sylwch ar lefel y defnydd.
— Sylwch pa brosesau sydd wedi'u rhestru fel y rhai mwyaf gweithredol (ar frig y rhestr). - mpstat
Mae'r cynampProfwyd y llinell orchymyn ar Red Hat Enterprise Linux 7.x.
Mae'n dangos defnydd CPU fesul craidd (drwy ddod o hyd i'r ganran gyfanswm segur a thynnu o 100) ac yn amlygu'r gwerthoedd uwchlaw 80% mewn coch. mpstat -P ALL 1 1 | grep -v Average | tail -n +5 | head -n -1 | awk '{ print (100-$13)}' | egrep -color=always '[^\.][8-9][0-9][\.]?.*|^[8-9][0-9][\.]?.*| 100|' | colofn - perf top Chwiliwch am ble mae cylchoedd yn cael eu treulio.
7.2 Cownteri i40e
Mae'r gyrrwr i40e yn darparu rhestr hir o gownteri ar gyfer dadfygio a monitro rhyngwyneb trwy'r gorchymyn ethtool -S ethX. Gall fod yn ddefnyddiol gwylio'r allbwn tra bod llwyth gwaith yn rhedeg a/neu gymharu gwerthoedd y cownter cyn ac ar ôl rhedeg llwyth gwaith.
- I gael dymp llawn o gyfrifwyr i40e: ethtool -S ethX
- I wylio cownteri nad ydynt yn sero yn unig: gwylio -d (ethtool -S ethX) | egrep -v :\ 0 | colofn
Rhai pethau i chwilio amdanynt: - Mae rx_dropped yn golygu nad yw'r CPU yn gwasanaethu byfferau yn ddigon cyflym.
- Mae port.rx_dropped yn golygu nad yw rhywbeth yn ddigon cyflym yn y slot/cof/system.
7.3 Cyfrifyddion Rhwydwaith
Gwiriwch netstat -s cyn/ar ôl rhediad llwyth gwaith.
Mae Netstat yn casglu gwybodaeth rhwydwaith o bob dyfais rhwydwaith yn y system. Felly, mae'n bosibl y bydd canlyniadau yn cael eu heffeithio gan rwydweithiau heblaw'r rhwydwaith sy'n cael ei brofi. Gall yr allbwn o netstat -s fod yn ddangosydd da o faterion perfformiad yn system weithredu neu gnewyllyn Linux. Ymgynghorwch â chanllawiau tiwnio systemau gweithredu, megis Canllaw Tiwnio Perfformiad Rhwydwaith Red Hat Enterprise Linux, i gael mwy o wybodaeth am diwnio system weithredu gyffredinol.
7.4 Logiau System
Gwiriwch logiau system am wallau a rhybuddion (/var/log/messages, dmesg).
7.5 Offeryn Intel svr-info
Mae Intel yn darparu offeryn svr-info (gweler https://github.com/intel/svr-info) ar gyfer Linux sy'n cipio manylion caledwedd a meddalwedd perthnasol o weinydd. Gall allbwn svr-info fod yn hynod ddefnyddiol i nodi tagfeydd system neu osodiadau/tiwniadau nad ydynt wedi'u optimeiddio ar gyfer y llwyth gwaith. Wrth agor achos cymorth gydag Intel ar gyfer problemau perfformiad sy'n gysylltiedig ag Ethernet, gwnewch yn siŵr eich bod yn cynnwys allbwn svr-info (testun file) ar gyfer pob gweinydd Linux yn y cyfluniad prawf.
- Lawrlwythwch a gosodwch svr-info:
wget -qO- https://github.com/intel/svr-info/releases/latest/download/svrinfo.tgz| tar xvz cd svr-info
./svr-info
> enw gwesteiwr.txt - Casglwch yr allbwn:
./svr-info > enw gwesteiwr.txt - Atodwch un testun (.txt) file ar gyfer pob gweinydd i'ch achos cymorth Intel i'w ddadansoddi.
Argymhellion ar gyfer Senarios Perfformiad Cyffredin
8.1 Anfon IP ymlaen
- Diweddaru'r cnewyllyn.
Mae rhai cnewyllynnau diweddar mewn-distro wedi diraddio perfformiad llwybro oherwydd newidiadau cnewyllyn yn y cod llwybro gan ddechrau gyda chael gwared ar y storfa llwybro oherwydd diogelwch. Dylai cnewyllynnau diweddar o'r tu allan i'r distro gael clytiau sy'n lleddfu effaith perfformiad y newidiadau hyn a gallant ddarparu perfformiad gwell. - Analluogi hyper-edau (creiddiau rhesymegol).
- Golygu paramedrau cychwyn y cnewyllyn.
— Gorfodi iommu i ffwrdd (intel_iommu=off neu iommu=off) o'r llinell gychwyn cnewyllyn oni bai bod ei angen ar gyfer rhithwiroli
— Diffoddwch reoli pŵer: processor.max_cstates=1 idle=poll pcie_aspm=off - Cyfyngwch nifer y ciwiau i fod yn hafal i nifer y creiddiau ar y soced lleol (12 yn yr enghraifft honample). ethtool -L ethX cyfun 12
- Pinio ymyriadau i soced lleol yn unig. set_irq_affinity -X local ethX NEU set_irq_affinity -X local ethX
NODYN
Gellir defnyddio -X neu -x yn dibynnu ar y llwyth gwaith. - Newidiwch meintiau'r cylchoedd Tx a Rx yn ôl yr angen. Mae gwerth mwy yn cymryd mwy o adnoddau ond gall ddarparu cyfraddau anfon ymlaen gwell. ethtool -G ethX rx 4096 tx 4096
- Analluogi GRO wrth lwybro.
Oherwydd problem cnewyllyn hysbys, rhaid diffodd GRO wrth lwybro/anfon ymlaen. ethtool -K ethX gro i ffwrdd lle mae ethX yn cynrychioli'r rhyngwyneb Ethernet i'w addasu. - Analluogi cymedroli ymyrraeth addasol a gosod gwerth statig. ethtool -C ethX adaptive-rx off adaptive-tx off ethtool -C ethX rx-usecs 64 tx-usecs 64
NODYN
Yn dibynnu ar y math o brosesydd a'r llwyth gwaith, gellir addasu'r paramedrau cyfuno ar gyfer RX a TX i wella perfformiad (neu lai o golled fframiau).
- Analluoga'r wal dân. sudo systemctl analluoga wal dân sudo systemctl stopio wal dân
- Galluogi anfon ymlaen IP. sysctl -w net.ipv4.ip_forward=1
- Ffurfweddwch y gwerthoedd mwyaf ar gyfer meintiau byffer y socedi derbyn ac anfon. sysctl -w net.core.rmem_max=16777216 sysctl -w net.core.wmem_max=16777216
NODYN
Yn dibynnu ar y llwyth gwaith neu'r gofyniad, gellir newid y gwerthoedd hyn o'r rhagosodedig.
8.2 Oedi Isel
- Diffoddwch hyper-edau (creiddiau rhesymegol).
- Gwnewch yn siŵr bod y ddyfais rhwydwaith yn lleol i numa core 0.
- Pinio'r meincnod i graidd 0 gan ddefnyddio taskset -c 0.
- Diffoddwch irqbalance gan ddefnyddio systemctl stop irqbalance neu systemctl disable irqbalance
- Rhedeg y sgript affinedd i ledaenu ar draws creiddiau. Rhowch gynnig ar naill ai lleol neu'r cyfan.
- Diffoddwch gymedroli ymyrraeth. ethtool -C ethX rx-usecs 0 tx-usecs 0 addasol-rx i ffwrdd addasol-tx i ffwrdd rxusecs- uchel 0
- Cyfyngu nifer y ciwiau i fod yn hafal i nifer y creiddiau ar y soced lleol (32 yn yr enghraifft honample). ethtool -L ethX cyfun 32
- Pinio ymyriadau i soced lleol yn unig (sgript wedi'i becynnu gyda ffynhonnell gyrrwr i40e). set_irq_affinity -X local ethX
- Defnyddiwch feincnod sefydledig fel netperf -t TCP_RR, netperf -t UDP_RR, neu NetPipe. netperf -t TCP_RR neu netperf -t UDP_RR
- Pinio meincnod i un craidd yn y nod NUMA lleol. taskset -c
Cyfres Intel® Ethernet 700
Canllaw Addasu Perfformiad Linux
Rhagfyr 2024
Doc. Rhif: 334019, Parch: 1.2
Dogfennau / Adnoddau
![]() |
Tiwnio Perfformiad Linux Cyfres Intel Ethernet 700 [pdfCanllaw Defnyddiwr 334019, Cyfres Ethernet 700 Tiwnio Perfformiad Linux, Cyfres Ethernet 700, Tiwnio Perfformiad Linux, Tiwnio Perfformiad, Tiwnio |