د Intel لوگوانټل ® ایترنیټ 700 لړۍ
د لینکس فعالیت ټونینګ لارښود
د نیکس کلاوډ شبکې ګروپ (NCNG)
Rev. 1.2
دسمبر 2024

د بیاکتنې تاریخ

بیاکتنه نیټه تبصرې
1.2 دسمبر 2024 · د بریښنا مدیریت اضافي لارښوونې اضافه شوې.
· د انټل* ټربو بوسټ اضافه شو.
· د شبکې وسیلو بیکلاګ اضافه شو.
· د پلیټ فارم ځانګړي تشکیلات او ټونینګ اضافه شوي.
· د څلورم نسل انټل* %eon* د اندازې وړ پروسسرونه اضافه شول.
· د AMD EPYC اضافه شو.
· د سیسټم هارډویر وړتیاوې تازه شوي.
· تازه شوی iPerf2.
· تازه شوی iPerf3.
· تازه شوي د ټيکس/آر ایکس کتارونه.
· د مداخلې اعتدال تازه شوی.
· د حلقې اندازه تازه شوې.
· د پلیټ فارم ټونینګ تازه شوی (i40e غیر مشخص).
· د BIOS ترتیبات تازه شوي.
· د سي-سټیټ کنټرول تازه شوی.
· د CPU فریکونسي اندازه کول تازه شوي.
· د اپلیکیشن ترتیبات تازه شوي.
· د عملیاتي سیسټم/کرنل ترتیبات تازه شوي.
· تازه شوی IP فارورډینګ.
· تازه شوی ټیټ ځنډ.
اګست ۲۰۱۹ په دې سند کې بدلونونه شامل دي:
· اړونده حوالې اضافه شوې.
· اضافه شوی ډاډ ترلاسه کړئ چې د DDP بسته په سمه توګه پورته کیږي.
· iPerf2 اضافه شو.
· iPerf3 اضافه شو.
· netperf اضافه شو.
· تازه شوی IRQ افیونټي.
· د ټي ایکس/آر ایکس کتارونه اضافه شول.
· د حلقې اندازه تازه شوې.
· د جمبو چوکاټونه اضافه شول.
· د اډاپټر تړل اضافه شوي.
· د انټل svr-info وسیله اضافه شوه.
1.0 مارچ ۲۰۲۲ لومړنۍ خپرونه (انټل پبلک).

پیژندنه

دا لارښود د لینکس چاپیریالونو کې د انټیل ® ایترنیټ 700 لړۍ NICs په کارولو سره د غوره شبکې فعالیت لپاره د چاپیریال تنظیم کولو لپاره لارښود چمتو کولو لپاره دی. دا په هارډویر، ډرایور، او عملیاتي سیسټم شرایطو او ترتیباتو تمرکز کوي چې ممکن د شبکې فعالیت ښه کړي. دا باید په یاد ولرئ چې د شبکې فعالیت د هر ډول بهرني تاثیراتو لخوا اغیزمن کیدی شي، یوازې د دې خورا عام او ډراماتیک په دې لارښود کې پوښل شوي.
۱.۱ اړونده لارښوونې

لومړنی چک لیست

۲.۱ د ډرایور / فرم ویئر نسخې تازه کړئ
د ethtool -i ethx په کارولو سره د ډرایور/فرم ویئر نسخې وګورئ.
د اړتیا په صورت کې لاندې شیان تازه کړئ:

۲.۲ "README" ولولئ
د پیژندل شویو ستونزو لپاره وګورئ او د README څخه د ترتیب وروستي لارښوونې ترلاسه کړئ file د i40e سرچینې کڅوړې کې شامل دی.
۲.۳ وګورئ چې ستاسو د PCI ایکسپریس (PCIe) سلاټ x2.3 دی
ځینې ​​PCIe x8 سلاټونه په حقیقت کې د x4 سلاټونو په توګه تنظیم شوي دي. دا سلاټونه د دوه ګوني پورټ او کواډ پورټ وسیلو سره د بشپړ لاین نرخ لپاره کافي بینډ ویت نلري. سربیره پردې، که تاسو د PCIe v3.0-وړ اډاپټر په PCIe v2.x سلاټ کې واچوئ، تاسو نشئ کولی بشپړ بینډ ویت ترلاسه کړئ. د سافټویر وسیلې ډرایور دا وضعیت کشف کوي او د سیسټم لاګ کې لاندې پیغام لیکي:
د دې کارت لپاره موجود PCI-Express بینډ ویت د غوره فعالیت لپاره کافي ندي. د غوره فعالیت لپاره د x8 PCI-Express سلاټ ته اړتیا ده.
که دا تېروتنه رامنځته شي، نو د ستونزې د حل لپاره خپل اډاپټر ریښتیني PCIe v3.0 x8 سلاټ ته واستوئ.
۲.۴ د سیسټم هارډویر وړتیاوې وګورئ
په ۱۰ Gbps، ۲۵ Gbps، او ۴۰ Gbps ایترنیټ کې، د CPU او سیسټم ځینې لږترلږه اړتیاوې شتون لري. په عمومي توګه، ستاسو د پلیټ فارم لپاره د عصري سرور کلاس پروسیسر او غوره حافظې ترتیب باید کافي وي، مګر اړتیاوې ستاسو د کاري بار پورې اړه لري توپیر لري. ټول د حافظې چینلونه باید ډک شي او د حافظې فعالیت حالت باید په BIOS کې فعال شي. تایید کړئ چې ستاسو CPU او د حافظې ترتیب د شبکې فعالیت کچې ملاتړ کولو توان لري چې تاسو یې د خپل کاري بار لپاره اړتیا لرئ.
نوټ
XL710 د 40 GbE کنټرولر دی. د 2 x 40 GbE اډاپټر چې دا کنټرولر کاروي د 2 x 40 GbE په توګه نه دی بلکې د فعال بیک اپ پورټ سره 1 x 40 GbE دی. کله چې د دواړو پورټونو سره د لاین-ریټ ټرافیک کارولو هڅه کیږي، داخلي سویچ سیچوریٹ کیږي او د دواړو پورټونو ترمنځ ګډ بینډ ویت د SO Gbps ټولټال پورې محدود دی.
۲.۴.۱ د کرنل بوټ پیرامیټرې
که چیرې د لارښود I/O (Intel® VT-d) لپاره د Intel® مجازی کولو ټیکنالوژي په BIOS کې فعاله وي، Intel سپارښتنه کوي چې IOMMU د کوربه شبکې د غوره فعالیت لپاره د پاس-ترو حالت کې وي. دا د کوربه ترافیک په اړه د DMA اوور هیډ له منځه وړي پداسې حال کې چې مجازی ماشینونه (VMs) فعالوي ترڅو لاهم د Intel® VT-d ګټې ولري. دا د کرنل بوټ پیرامیټرو ته د لاندې کرښې اضافه کولو سره ترسره کیږي: fommu-pt.
۲.۵ ډاډ ترلاسه کړئ چې د DDP بسته په سمه توګه پورته کیږي
د ۱۴۰ ای ای او ۱۴۰ ای بی بیس ډرایورونه د متحرک وسیلې شخصي کولو (DDP) لپاره مستقیم ملاتړ نلري. د ۷۰۰ لړۍ وسیلو سره د DDP کارولو لپاره، د DDP پروfile د testpmd غوښتنلیک سره درخواست کیدی شي.
د DDP پرو په اړه د جزیاتو لپارهfiles، او د DDP پرو پلي کولو څرنګوالیfile د testpmd سره په 700 لړۍ وسیلو کې، د Intel® Ethernet 700 لړۍ متحرک وسیلې شخصي کولو (DDP) ټیکنالوژۍ لارښود ته مراجعه وکړئ.
د دې تصدیق کولو لپاره چې ایا د DDP پرو دیfile په بریالیتوب سره پورته شو:
testpmd> ddp لیست 0 پرو ترلاسه کړئfile شمېره ده: ۱
نوټ
که پروfile شمېره 0 ده، د DDP هیڅ بسته نه ده پورته شوې. د DDP بسته بارولو تېروتنې په صورت کې، وسیله په خوندي حالت کې ډیفالټ کیږي او د فعالیت ډیری ځانګړتیاوې شتون نلري. که چیرې د DDP بسته بارولو پورې اړوند تېروتنې شتون ولري، نو دا به د فعالیت ستونزې رامینځته کړي. د ستونزو حل کولو مرحلو لپاره، د Inte/* Ethernet 700 لړۍ متحرک وسیلې شخصي کولو (DDP) ټیکنالوژۍ لارښود ته مراجعه وکړئ.

د فعالیت اساسي اندازه کول او د تنظیم کولو میتودولوژي

۳.۱ د شبکې د فعالیت معیارونه
د ټونینګ تمرین پیل کولو دمخه، دا مهمه ده چې ستاسو د شبکې فعالیت ښه اساس اندازه ولرئ. معمولا د خپل ځانګړي غوښتنلیک / کاري بار فعالیت لومړني اندازه کولو سربیره، دا یو ښه نظر دی چې د معیاري شبکې فعالیت بنچمارک هم وکاروئ ترڅو تایید کړئ چې ستاسو د شبکې وسیله په ښه حالت کې ده.
د واحد سیسټم اصلاح کولو لپاره، netperf یا iperf او NetPIPE ټول د خلاصې سرچینې وړیا وسیلې دي چې تاسو ته دا توان درکوي چې په اړیکه فشار راوړئ او د فعالیت مسلې تشخیص کړئ.
نیټپرف د تروپټ او لیټینسي دواړو ازموینې لپاره قوي دی. نیټ پایپ د لیټینسي لپاره ځانګړی وسیله ده مګر د هر ډول چاپیریال لپاره تالیف کیدی شي.
نوټ
په netperf کې د TCP_RR ازموینه د معاملو/ثانیې په ارزښت کې ځنډ بیرته راګرځوي. دا د ګرد سفر شمیره ده. یو اړخیز ځنډ د لاندې معادلې په کارولو سره محاسبه کیدی شي:
ځنډ (usec) = (1⁄2) / [معاملې/ثانیې] * 1,000,000
۳.۱.۱ آی پرف۲
انټیل د ډیری بنچمارکینګ حالتونو لپاره د iperf2 په پرتله iperf3 وړاندیز کوي ځکه چې د کارولو اسانتیا او په یوه غوښتنلیک کې د ډیری تارونو ملاتړ شتون لري. انټیل د 2G اتصالاتو لپاره د 4-25 تارونو او د 4G اتصالاتو لپاره شاوخوا 6-40 تارونو سره د -P اختیار سره چلولو وړاندیز کوي.

  • د مراجعینو څخه سرور ته د یو اړخیز ترافیک چلولو لپاره: د سرور قومانده exampپه لاندې ډول: iperf2 -s
    د مراجعینو قومانده پخوانیampپه لاندې ډول: iperf2 -c -پي
  • د مراجعینو څخه سرور ته دوه اړخیزه ترافیک چلولو لپاره (او برعکس): د سرور قومانده exampپه: iperf2 –s –p
    د مراجعینو قومانده پخوانیampLe:
    iperf2 -c د -p -پي --بشپړ ډوپلیکس OR
    iperf2 -c د -p -پي -د

نوټ
په iperf2 کې -full-d او -d دواړه انتخابونه کارونکي ته اجازه ورکوي چې دوه اړخیزه ازموینه ترسره کړي. په هرصورت، -full-d اختیار په ځانګړي ډول په بشپړ ډوپلیکس ازموینې تمرکز کوي.
نوټ
کله چې د ډیری سرور پورټونو په اوږدو کې iperf2 ازموینه کیږي، د -d بیرغ د سرور کمانډ ته اضافه کیدی شي ترڅو د ورته ټرمینل کړکۍ څخه په شالید کې ټولې سرور ناستې پرمخ بوځي. د -d بیرغ هم کارول کیدی شي کله چې د سرور کمانډ په سکریپټ کې د فار لوپ دننه ځای په ځای شوی وي.
نوټ
کله چې د شبکې تروپټ ازموینه د یو واحد جریان/تار سره پرمخ وړئ (مثالample: P1)، د AMD پروسس کونکي ممکن تمه شوي تروپټ چمتو نه کړي، په ځانګړي توګه لوړ بینډ ویت NICs (که چیرې سرعت >= 25G بینډ ویت وي). په پایله کې، د لوړ تروپټ ترلاسه کولو لپاره د ځانګړو کورونو سره د غوښتنلیک پین کول اړین دي. د غوښتنلیک ترتیبات په 22 پاڼه کې وګورئ.
۳.۱.۱ آی پرف۲
که چیرې iperf3 وکارول شي، نو د مرستې لپاره د غوښتنلیک ډیری مثالونو ته اړتیا دهtagد څو-تریډونو، RSS، او هارډویر کتارونو څخه e. انټیل د 2G اتصالاتو لپاره د 4-25 غوښتنلیک غونډو او د 4G اتصالاتو لپاره شاوخوا 6-40 غونډو سره د چلولو وړاندیز کوي. هره ناسته باید د -p اختیار په کارولو سره د TCP پورټ یو ځانګړی ارزښت مشخص کړي.

  • د مراجعینو څخه سرور ته د یو اړخیز ترافیک چلولو لپاره:
    د سرور قومانده exampLe:
    iperf3 -s -p
    د مراجعینو قومانده پخوانیampLe:
    iperf3 -c د -p
  • د مراجعینو څخه سرور ته دوه اړخیزه ترافیک چلولو لپاره (او برعکس):
    د سرور قومانده exampLe:
    iperf3 –s –p
    د مراجعینو قومانده پخوانیampپه لاندې ډول: iperf3 -c -p -پي –-بیدیر
  • د iperf3 د څو مثالونو (تارونو) د پیل کولو لپاره، سپارښتنه دا ده چې د TCP پورټونو ته د تارونو نقشه کولو لپاره د فار-لوپ څخه کار واخلئ او په شالید کې iperf3 چل کړئ ترڅو & په موازي ډول ډیری پروسې رامینځته کړئ.
    د سرور قومانده example، څلور تارونه پیل کړئ: port=””; د i لپاره په {4..0} کې; do port=3$i; bash -c “iperf520 -s -p $port &”; done; د مراجعینو قومانده example، 4 تارونه پیل کړئ - د ازموینې پورټ لیږد کړئ = ""؛ د i لپاره په {0..3} کې؛ do port=520$i؛ bash -c "iperf3 -c $serverIP -p $port &"؛ بشپړ شوی؛ د مراجعینو قومانده example، 4 تارونه پیل کړئ - د ازموینې پورټ ترلاسه کړئ=””; د i لپاره په {0..3} کې; do port=520$i; bash -c “iperf3 -R -c $serverIP -p $port &”; بشپړ شوی; د 40G اتصالاتو لپاره، د 6 مثالونو/تارونو جوړولو لپاره د فار لوپ زیات کړئ.

نوټ
کله چې د شبکې تروپټ ازموینه د یو واحد جریان/تار سره پرمخ وړئ (مثالample: P1)، د AMD پروسسرونه ممکن تمه شوي تروپټ چمتو نه کړي، په ځانګړي توګه لوړ بینډ ویت
NICs (که چیرې سرعت >= 25G بینډ ویت وي). په پایله کې، د لوړ تروپټ ترلاسه کولو لپاره د غوښتنلیک ځانګړي کورونو ته پن کول اړین دي. په 22 مخ کې د غوښتنلیک تنظیمات او په 26 مخ کې د AMD EPYC وګورئ.
۳.۱.۳ خالص فعالیت
د نیټپرف وسیله د تروپټ او لیټینسي ازموینې دواړو لپاره قوي انتخاب دی.

  • په netperf کې د TCP_STREAM ازموینه د وسیلې د تروپټ وړتیاوې اندازه کوي. د سرور قومانده example: د netserver مراجع کمانډ exampپه لاندې ډول: netperf -t TCP_STREAM -l 30 -H
  • په netperf کې د TCP_RR ازموینه د معاملو/ثانیې په ارزښت کې ځنډ بیرته راګرځوي. دا د ګرد سفر شمیره ده. سپارښتنه کیږي چې د -T x,x اختیار وکاروئ، که چیرې x د وسیلې لپاره CPU ځایی وي. یو طرفه ځنډ د دې په کارولو سره محاسبه کیدی شي: Latency(usec)=(1⁄2)/ [معاملې/ثانیې]*1,000,\ د سرور قومانده exampلي: نيټ سرور
    د مراجعینو قومانده پخوانیampپه لاندې ډول: netperf -t TCP_RR -l 30 -H -ټ ایکس، ایکس
  • د netperf د څو مثالونو (تارونو) د پیل کولو لپاره، سپارښتنه دا ده چې د TCP پورټونو ته د تارونو نقشه کولو لپاره د فار-لوپ څخه کار واخلئ او په شالید کې د & په کارولو سره netperf چل کړئ ترڅو په موازي ډول ډیری پروسې رامینځته کړئ.
    د سرور قومانده example، 8 تارونه پیل کړئ:
    پورټ=””; د i لپاره په {0..7} کې; پورټ=520$i وکړئ; باش -c “نیټ سرور -L $سرور آی پي -p $پورټ &”; بشپړ شوی;
    د مراجعینو قومانده پخوانیample، 8 تارونه پیل کړئ: port=””; د i لپاره په {0..7} کې; do port=520$i; bash -c “netperf -H $serverIP -p $port -t TCP_STREAM -l 30 &”; بشپړ شوی;

۳.۲ د سمون میتودولوژي
په یو وخت کې په یو ټونینګ بدلون تمرکز وکړئ ترڅو تاسو پوه شئ چې هر بدلون ستاسو په ازموینه څه اغیزه کوي. څومره چې تاسو د ټونینګ په پروسه کې ډیر میتودیک یاست، هومره به د فعالیت د خنډونو لاملونه پیژندل او حل کول اسانه وي.

د i40e ډرایور ترتیبات تنظیم کول

۴.۱ د IRQ تړاو
د IRQ تړاو تنظیم کول ترڅو د مختلفو شبکو قطارونو لپاره مداخلې د مختلفو CPU کورونو سره وصل شي، کولی شي په فعالیت باندې لوی اغیزه ولري، په ځانګړې توګه د څو تریډ تروپټ ازموینې.
د IRQ اتصال تنظیمولو لپاره، irqbalance ودروئ او بیا یا د i40e سرچینې پیکج څخه د set_irq_affinity سکریپټ وکاروئ یا په لاسي ډول قطارونه پن کړئ. د قطار پن کولو فعالولو لپاره د کارونکي ځای IRQ بیلانسر غیر فعال کړئ:

  • systemctl د irqbalance غیر فعال کول
  • د سیسټم سی ټي ایل د بې توازن مخه ونیسئ
    د i40e سرچینې پیکج څخه د set_irq_affinity سکریپټ کارول (سپارښتنه شوې):
  • د ټولو کورونو کارولو لپاره:
    [path-to-i40epackage]/scripts/set_irq_affinity -X ټول ethX
  • په محلي NUMA ساکټ کې یوازې د کورونو کارولو لپاره: [path-to-i40epackage]/scripts/set_irq_affinity -X محلي ethX
  • تاسو کولی شئ د کورونو لړۍ هم وټاکئ. د cpu0 کارولو څخه ډډه وکړئ ځکه چې دا د ټایمر دندې پرمخ وړي. [path-to-i40epackage]/scripts/set_irq_affinity 1-2 ethX

نوټ
د اتصال سکریپټ د پن کولو پروسې د یوې برخې په توګه د ټرانسمیټ پیکټ سټیرینګ (XPS) فعالوي کله چې -x اختیار مشخص شوی وي. کله چې XPS فعال شي، انټیل سپارښتنه کوي چې تاسو irqbalance غیر فعال کړئ، ځکه چې د XPS سره د کرنل بیلانسر کولی شي د غیر متوقع فعالیت لامل شي. د اتصال سکریپټ XPS غیر فعالوي کله چې -X اختیار مشخص شوی وي. د XPS غیر فعال کول او د متقابل قطارونو فعالول د کاري بارونو لپاره ګټور دي چیرې چې غوره فعالیت ترلاسه کیږي کله چې Tx او Rx ترافیک په ورته قطار جوړه کې خدمت کیږي.
په لینکس کې د سمیټریک قطارونو تنظیم کول د شبکې انٹرفیس ډرایور پیرامیټرونو تنظیم کول شامل دي ترڅو د ملاتړ شوي شبکې اډاپټرونو لپاره سمیټریک ترلاسه کولو کتارونه (Rx) او سمیټریک لیږد کتارونه (Tx) فعال کړي.
نوټ

  • سمیټریک کتارونه د شبکې پرمختللې ځانګړتیا ده، او ټول 700 لړۍ شبکې اډاپټرونه یا ډرایورونه یې ملاتړ نه کوي.
  • ډاډ ترلاسه کړئ چې تاسو د سمیټریک قطارونو تنظیم کولو هڅه کولو دمخه اړین ډرایور او هارډویر ملاتړ لرئ.

د سمیټریک قطارونو تنظیم کولو لپاره، دا عمومي ګامونه تعقیب کړئ:

  1. د شبکې انٹرفیس ترتیب سم کړئ File: د متن مدیر وکاروئ (د مثال په توګهample، vi، nano، یا gedit) د شبکې انٹرفیس ترتیب سمولو لپاره file. د file معمولا د /etc/sysconfig/network-scripts/ ډایرکټرۍ لاندې موقعیت لري او د ifcfg-ethX په څیر نوم لري، چیرې چې ethX ستاسو د شبکې انٹرفیس نوم دی.
  2. د سمیټریک قطار پیرامیټرونه اضافه کړئ. لاندې کرښې د شبکې انٹرفیس ترتیب ته اضافه کړئ file: ETHTOOL_OPTS=”rx-کتارونه ۸ tx-کتارونه ۸″
  3. د شبکې خدمت بیا پیل کړئ.
    د بدلونونو کولو وروسته، د نوي ترتیب پلي کولو لپاره د شبکې خدمت بیا پیل کړئ. sudo systemctl بیا پیل شبکه

په لاسي ډول:

  • د هر نوډ سره وصل شوي پروسیسرونه ومومئ د دې په کارولو سره: numactl –hardware lscpu
  • د هر پروسیسر لپاره بټ ماسکونه ومومئ:
  • د نوډ 0 لپاره د 11-0 کورونو فرض کول: [1,2,4,8,10,20,40,80,100,200,400,800]
  • هغه IRQs ومومئ چې ټاکل شوي پورټ ته ټاکل شوي دي: grep ethX /proc/interrupts او د IRQ ارزښتونه یادداشت کړئ د مثال لپارهample، 181-192 د 12 بار شوي ویکتورونو لپاره.
  • د SMP د تړاو ارزښت د اړونده IRQ ننوتلو سره یوځای کړئ. په یاد ولرئ چې دا باید د هر IRQ ننوتلو لپاره ترسره شي: echo 1 > /proc/irq/181/smp_affinity echo 2 > /proc/irq/182/smp_affinity echo 4 > /proc/irq/183/smp_affinity د IRQ تړاو وښایاست:
  • د ټولو کورونو لپاره د IRQ تړاو ښودلو لپاره: / سکریپټونه / set_irq_affinity -s اخلاق ایکس
  • په محلي NUMA ساکټ کې یوازې د کورونو ښودلو لپاره: /scripts/set_irq_affinity -s سیمه ایز اخلاق ایکس
  • تاسو کولی شئ د کورونو لړۍ هم غوره کړئ: / سکرپټونه / سیټ_یرق_ایفینیټي -s 40-0-8,16 ایت ایکس

نوټ
د set_irq_affinity سکریپټ د i40e ډرایور نسخې 2.16.11 او وروسته کې د -s بیرغ ملاتړ کوي.
۴.۲ د ټکس/رکس کتارونه
د پیل کولو په وخت کې د ډرایور لخوا د هر ایترنیټ پورټ لپاره فعال شوي قطارونو ډیفالټ شمیر په پلیټ فارم کې د شته CPUs ټول شمیر سره مساوي دی. دا د ډیری پلیټ فارمونو او کاري بار ترتیبونو لپاره ښه کار کوي. په هرصورت، په پلیټ فارمونو کې چې لوړ کور شمیرې او/یا لوړ ایترنیټ پورټ کثافت لري، دا ترتیب کولی شي د سرچینو شخړې لامل شي. له همدې امله، دا ممکن په ځینو مواردو کې اړین وي چې په سیسټم کې د هر پورټ لپاره ډیفالټ تعدیل شي.
د Tx/Rx قطارونو ډیفالټ شمیر د ځانګړي ماډل او ډرایور نسخې پورې اړه لري توپیر کولی شي. د قطارونو شمیر د لاندې لیست شوي ethtool -L کمانډ په کارولو سره تنظیم کیدی شي.
نوټ
په دې قضیو کې، انټیل سپارښتنه کوي چې تاسو د هر پورټ لپاره د ډیفالټ قطار شمیر کم کړئ ترڅو د NUMA نوډ کې د اډاپټر پورټ ته د محلي CPUs شمیر څخه ډیر نه وي. په ځینو مواردو کې، کله چې د لوړ پورټ شمیر پلي کولو کې د سرچینو توازن هڅه کوئ، نو ممکن دا شمیره نوره هم کمه شي.
د قطار ترتیب بدلولو لپاره:
لاندې پخوانيample پورټ د 32 Tx/Rx قطارونو ته تنظیموي: ethtool -L ethX ګډ 32
Exampمحصول:
ایتهول -l ایته ایکس
د ethX لپاره د چینل پیرامیټرې: مخکې له مخکې ټاکل شوي اعظمي حدونه:
RX: 96
TX: 96
نور: ۳۸۴
ګډ: ۹۶
د هارډویر اوسني ترتیبات:
RX: 0
TX: 0
نور: ۳۸۴
ګډ: ۹۶
۴.۳ د منځګړیتوب مداخله
د تطبیق وړ مداخلې اعتدال په ډیفالټ ډول فعال دی، او د ټیټ CPU کارونې او لوړ فعالیت ترمنځ متوازن چلند چمتو کولو لپاره ډیزاین شوی. په هرصورت، تاسو ممکن هڅه وکړئ چې د مداخلې ترتیبات په لاسي ډول تنظیم کړئ ترڅو ستاسو د کارونې قضیې سره سمون ولري.
د ۰-۲۳۵ مایکرو ثانیو حد په هره ثانیه کې د ۴،۳۱۰ څخه تر ۲۵۰،۰۰۰ انټرپټونو اغیزمن حد چمتو کوي. د rx-μsecs-high ارزښت په ورته ethtool قوماندې کې د rx-μsecs او tx-μsecs څخه خپلواک ټاکل کیدی شي، او د تطبیقي انټرپټ اعتدال الګوریتم څخه هم خپلواک دی. اصلي هارډویر په ۲ مایکرو ثانیو وقفو کې د ګرینولریت ملاتړ کوي، نو نږدې ارزښتونه ممکن د ورته انټرپټ نرخ پایله ولري.

  • د تطبیقي مداخلې اعتدال بندولو لپاره: ethtool -C ethX adaptive-rx off adaptive-tx off
  • د تطبیقي مداخلې اعتدال فعالولو لپاره: ethtool -C ethX adaptive-rx on adaptive-tx on

د عمومي ټونینګ لپاره د پیل کولو لپاره یو ښه ځای 84 μs، یا ~12000 انټرپټونه/s دي. که تاسو وګورئ چې rx_dropped کاونټرونه د ټرافیک په جریان کې روان دي (د ethtool -S ethX په کارولو سره) نو تاسو شاید د CPU ډیر ورو یاست، د اډاپټر د حلقې اندازې (ethtool -G) څخه کافي بفرونه نشته چې د 84 μs لپاره پاکټونه وساتي یا د انټرپټ نرخ څخه ټیټ وي.

  • د مداخلې منځګړیتوب د مداخلې ترمنځ د 84 μs ثابت مداخلې نرخ ته ټاکلو لپاره (12000 مداخلې/s): ethtool -C ethX adaptive-rx off adaptive-tx off rx-usecs 84 tx-usecs 84 بل ارزښت چې هڅه یې وکړئ، که تاسو د CPU کارولو اعظمي حد ته نه یاست رسیدلی، 62 μs دی. دا ډیر CPU کاروي، مګر دا بفرونه ګړندي خدمت کوي، او لږ تشریح کونکو ته اړتیا لري (د حلقې اندازه، ethtool -G).
  • د مداخلې اعتدال د مداخلې ترمنځ د 62 یوزیک ثابت مداخلې نرخ ته تنظیم کړئ (16000 انټرپټونه/سیکنډونه). ethtool -C ethX adaptive-rx off adaptive-tx off rx-usecs 62 tx-usecs 62
    که چیرې د ټرافیک په جریان کې rx_dropped کاونټرونه زیات شي (د ethtool -S ethX په کارولو سره)، تاسو شاید د CPU ډیر ورو، د اډاپټر د حلقې اندازې څخه کافي بفرونه (ethtool -G)، یا د مداخلې کچه ډیره ټیټه وي. که تاسو د CPU کارولو څخه اعظمي نه یاست، تاسو کولی شئ د ITR ارزښت کمولو سره د مداخلې کچه لوړه کړئ. دا ډیر CPU کاروي، مګر خدمات ګړندي بفر کوي، او لږ تشریح کونکو ته اړتیا لري (د حلقې اندازه، ethtool -G).
    که ستاسو CPU په 100٪ کې وي، نو د مداخلې کچه زیاتول سپارښتنه نه کیږي. په ځینو شرایطو کې لکه د CPU پورې تړلی کاري بار، تاسو ممکن وغواړئ چې د μs ارزښت زیات کړئ ترڅو د نورو غوښتنلیکونو لپاره د CPU وخت ډیر شي.
    که تاسو د ټیټ ځنډ فعالیت ته اړتیا لرئ او/یا د شبکې پروسس کولو لپاره ډیر CPU لرئ، تاسو کولی شئ د مداخلې اعتدال په بشپړ ډول غیر فعال کړئ، کوم چې مداخلې ته اجازه ورکوي چې ژر تر ژره فعال شي.
  • د مداخلې اعتدال غیر فعالولو لپاره ethtool -C ethX adaptive-rx off adaptive-tx off rx-usecs 0 tx-usecs 0

نوټ
کله چې د مداخلې اعتدال غیر فعال وي، په هر قطار کې د مداخلې کچه خورا لوړه کیدی شي. د مداخلې نرخ باندې د لوړ حد ټاکلو لپاره د rx-usec-high پیرامیټر شاملولو په اړه فکر وکړئ. لاندې قومانده د تطبیقي مداخلې اعتدال غیر فعالوي او د ترلاسه کولو یا لیږد بشپړیدو ښودلو دمخه اعظمي حد 5 مایکرو ثانیو ته اجازه ورکوي. د دې پرځای چې په هره ثانیه کې تر 200,000 پورې مداخلې رامینځته کړي، دا د rx-usec-high پیرامیټر له لارې په هره ثانیه کې ټول مداخلې 50,000 ته محدودوي. # ethtool -C ethX adaptive-rx off adaptive-tx off rx-usecs-high 20 rx-usecs 5 txusecs 5 د لیږد/رسیدنې/لوړ لومړیتوب د یوځای کولو ټایمر لوړ (80/100/150/200) یا ټیټ (25/20/10/5) تنظیم کولو هڅه وکړئ ترڅو د کاري بار لپاره غوره ارزښت ومومئ.
۴.۴ د حلقې اندازه
که تاسو په ethtool -S ethX (rx_dropped، rx_dropped.nic) کې rx_dropped کاونټرونه ګورئ، یا د څو فعالو کتارونو سره د کیش فشار شکمن یاست، تاسو ممکن د ډیفالټ ارزښت څخه د حلقې اندازه تنظیم کولو هڅه وکړئ. ډیفالټ ارزښت 512 دی، اعظمي حد 4096 دی.

  • د اوسني ارزښتونو د چک کولو لپاره: ethtool -g ethX
    که چیرې دا شک وي چې د بفرینګ نشتوالی د اوسني مداخلې نرخ کې د کمښت لامل کیږي، تاسو ممکن لومړی اعظمي هڅه وکړئ، بیا لږترلږه، بیا په بائنری لټون کې دوام ورکړئ تر هغه چې تاسو غوره فعالیت ونه ګورئ.
    که چیرې د کیش فشار شکمن وي (ډیری قطارونه فعال وي) د ډیفالټ څخه د بفرونو کمول کولی شي د انټیل ® ډیټا ډایرکټ I/O (انټیل ® DDIO) سره په ښه موثریت سره کار کولو کې مرسته وکړي. انټیل سپارښتنه کوي چې په هر قطار کې 128 یا 256 هڅه وکړي، په دې پوهیدل چې د ethtool -C له لارې د مداخلې کچه کې زیاتوالی ممکن د rx_dropped زیاتوالي څخه مخنیوي لپاره اړین وي.
  • د حلقې اندازه ثابت ارزښت ته د ټاکلو لپاره: ethtool -G eth12 rx 256 tx 256

نوټ
د ethtool -S ethX|grep drop سره موندل شوي Rx پیکټ ډراپونو د حل کولو لپاره، د حلقې اندازه 4096 ته لوړولو په اړه فکر وکړئ. د کاري بار لپاره غوره ترتیب موندلو لپاره تجربه وکړئ مګر د لوړو ارزښتونو سره د حافظې ډیر کارولو ته پام وکړئ.
4.5 د جریان کنټرول
د دوهمې طبقې د جریان کنټرول کولی شي د TCP فعالیت باندې د پام وړ اغیزه وکړي او سپارښتنه کیږي چې د ډیری کاري بارونو لپاره غیر فعال شي. یو احتمالي استثنا د برسټي ټرافیک دی چیرې چې برسټونه اوږد نه وي.
د جریان کنټرول په ډیفالټ ډول غیر فعال دی.

  • د جریان کنټرول فعالولو لپاره: ethtool -A ethX rx په tx on
  • د جریان کنټرول غیر فعالولو لپاره: ethtool -A ethX rx بند tx بند

نوټ
د جریان کنټرول په بریالیتوب سره فعالولو لپاره تاسو باید د جریان کنټرول وړ لینک ملګری ولرئ.
4.6 جمبو چوکاټونه
کله چې تمه کیدونکی ټرافیک چاپیریال د معلوماتو لوی بلاکونه ولري چې لیږدول کیږي، نو دا ممکن ګټور وي چې د جمبو فریم ځانګړتیا فعاله کړئ. د جمبو فریم ملاتړ د اعظمي لیږد واحد (MTU) د 1500 د ډیفالټ ارزښت څخه لوی ارزښت ته بدلولو سره فعال شوی. دا وسیله ته اجازه ورکوي چې د شبکې چاپیریال کې په لویو پیکټونو کې معلومات انتقال کړي. دا ترتیب ممکن د تروپټ ښه والی او د لوی I/O کاري بارونو لپاره د CPU کارول کم کړي. په هرصورت، دا ممکن د کوچني پیکټونو یا د ځنډ حساس کاري بارونو اغیزه وکړي.
نوټ
جمبو چوکاټونه یا لوی MTU ترتیب باید ستاسو د شبکې چاپیریال کې په سمه توګه تنظیم شي.
د MTU اندازه زیاتولو لپاره د ifconfig قوماندې څخه کار واخلئ. د مثال په توګهample، لاندې دننه کړئ، چیرته چې د انٹرفیس شمیره ده: ifconfig mtu 9000 پورته
په بدیل سره، تاسو کولی شئ د ip کمانډ په لاندې ډول وکاروئ: ip link set mtu 9000 dev د آی پي لینک جوړونکی تنظیم کړئ

د پلیټ فارم ټونینګ (i40e غیر مشخص)

5.1 د BIOS تنظیمات

  • د مجازی کولو کاري بارونو لپاره Intel® VT-d فعال کړئ.
  • هایپر-تریډینګ (منطقي پروسسرونه) کولی شي فعالیت اغیزمن کړي. د خپل کاري بار لپاره یې د فعال یا بندولو سره تجربه وکړئ.
  • د انټل® ټربو بوسټ د CPU کورونو ته اجازه ورکوي چې د CPU د اساس فریکونسۍ په پرتله په لوړه فریکونسۍ کې کار وکړي. د انټل® ټربو بوسټ فعالول کولی شي د ډیری کاري بارونو لپاره فعالیت ښه کړي مګر د لوړ فریکونسۍ کې د کورونو ساتلو لپاره ډیر بریښنا مصرفوي. د خپل کاري بار لپاره د ټربو بوسټ بند/آن سره تجربه وکړئ.

نوټ
که چیرې پلیټ فارم د CPU عمومي استعمال لوړ وي، د ټربو فریکونسۍ تضمین نه کیږي. د CPU عمومي استعمال زیاتیدو سره د ټربو لوړې فریکونسۍ کمیږي.
5.2 د بریښنا مدیریت
د بریښنا مدیریت کولی شي په فعالیت اغیزه وکړي، په ځانګړې توګه د ټیټ ځنډ کاري بارونو کې. که چیرې فعالیت د بریښنا مصرف کمولو په پرتله لوړ لومړیتوب وي، انټیل سپارښتنه کوي چې تاسو د بریښنا مدیریت اغیزو محدودولو سره تجربه وکړئ. د بریښنا مدیریت محدودولو لپاره ډیری مختلفې لارې شتون لري، د عملیاتي سیسټم وسیلو، BIOS ترتیباتو، او د کرنل بوټ پیرامیټرو له لارې. د خپل چاپیریال سره سم غوره میتود او کچه غوره کړئ.
۵.۲.۱ د سي-حالت کنټرول
د C-حالت د ننوتلو محدودول CO یا C1 ته فعالیت ښه کوي او د بریښنا کارول زیاتوي.
د CPU پیکج C6 حالت داخلول غیر فعال کول کولی شي د شبکې فعالیت ښه کړي. په هرصورت، دا د بریښنا کارول زیاتوي.
لاندې اختیارونه شتون لري:

  • د C-حالت ننوتل په متحرک ډول کنټرول کړئ:
    خلاص
    /dev/cpu_dma_latency ولیکئ او په هغې کې اعظمي اجازه لرونکی ځنډ ولیکئ.

نوټ
د cpudmalatency.c په نوم یو کوچنی پروګرام شتون لري چې د خلاصې سرچینې ټولنې څخه ډاونلوډ کیدی شي، تالیف کیدی شي، او د کمانډ لاین څخه چلیدلی شي ترڅو دا کار په سمه توګه ترسره شي.
لاندې پخوانيample د ویښیدو وخت پنځه μs ته اجازه ورکوي، او پدې توګه د C1 ننوتلو ته اجازه ورکوي: cpudmalatency 5 &

  • د کرنل بوټ ترتیباتو کې اعظمي C-حالت محدود کړئ:
    د انټل CPUs لپاره: intel_idle.max_cstates=1
    د غیر انټل CPUs لپاره: processor.max_cstates=1
  • د CPU C6 حالت چک کولو او غیر فعالولو لپاره د cpupower کمانډ وکاروئ: وګورئ: cpupower مانیټر یا cpupower idle-info
    C6 غیر فعال کړئ: cpupower idle-set -d3 یا
    د C-حالاتو غیر فعالول: cpupower idle-set -D0

یادونه:

  1. که چیرې سرور د Intel® 4th Gen Intel® Xeon® Scalable پروسیسر ولري، نو په CPU کې C-حالات غیر فعال کړئ. کله چې هایپر تریډینګ فعال یا غیر فعال وي، د غیر فعال حالتونو (-D0) غیر فعال کول د غیر فعال وخت په جریان کې د ټیټ بریښنا حالتونو ته د ننوتلو څخه د کورونو مخه نیسي او د CPU لپاره د غیر فعال او فعال حالتونو ترمنځ د لیږد لپاره ځنډ کموي.
  2. د انټل® څلورم نسل انټل® ژون® سکیلیبل پروسیسر د بریښنا مدیریت خورا تیریدونکی دی. د ټیټ بریښنا حالتونو ته د کورونو د ننوتلو مخنیوي لپاره، هڅه وکړئ چې د کارول شوي کورونو شمیر کم کړئ ترڅو دوی د اوږدې مودې لپاره ویښ وساتي (ethtool -L ګډ ). همدارنګه، د سیټ irq افیونټي په کارولو سره د ځانګړو کورونو سره مداخلې وتړئ (ډیری وختونه د -x محلي یا د CPU کورونو لیست سره)، او ډاډ ترلاسه کړئ چې کاري بار په ورته کورونو کې د ټاسک سیټ یا نمکټل سره پرمخ ځي. دا د کورونو فعال ساتلو او د مداخلې اداره کولو غوره کولو سره فعالیت ښه کوي.

C6 فعال کړئ:
د cpupower بې کاره سیټ -d3
د سي-حالاتو فعالول:
د cpupower بې کاره سیټ -E

  • بله طریقه دا ده چې د فعالیت پرو تنظیم کولو لپاره د ټون شوي وسیلې (د ډیری لینکس توزیعونو سره شامل دي) څخه کار واخلئfile. دا پروfileکاروونکي د OS ډیری ترتیبات بدلوي چې کولی شي په ډیری غوښتنلیکونو کې فعالیت اغیزمن کړي. دا وموندل شوه چې د شبکې له لارېfile د ډیری کاري بارونو لپاره ښه والی چمتو کوي.
    چک:
    ټون شوی-اډم فعال
    ترتیب:
    ټون شوی-اېډم پروfile د شبکې له لارې
    نوټ
    د پورته ذکر شویو امرونو لپاره باید ټون شوی خدمت روان وي. د چک کولو/بیا پیلولو لپاره، ټون شوی: systemctl status tuned systemctl restart tuned
    تاسو کولی شئ د کرنل بوټ لاین ته لاندې اضافه کولو سره د C-state هر ډول ننوتلو ته اجازه ورنکړئ:
    بې کاره = نظرپوښتنه
  • د سیسټم د BIOS بریښنا مدیریت ترتیباتو له لارې د C-حالت محدود کړئ، کوم چې ممکن د فعالیت پرو ولريfile شته.
    د بریښنا مدیریت ترتیباتو چک کولو یا تنظیم کولو لپاره د ټربوسټاټ یا x86_energy_perf_policy په څیر وسایل کارول کیدی شي.

۵.۲.۲ د PCIe بریښنا مدیریت
د فعال حالت بریښنا مدیریت (ASPM) د PCIe لینکونو لپاره د ټیټ بریښنا حالت فعالوي کله چې دوی په فعاله توګه کارول نه وي. دا کولی شي د PCIe شبکې وسیلو کې د لوړ ځنډ لامل شي، نو انټیل سپارښتنه کوي چې تاسو د ځنډ حساس کاري بارونو لپاره ASPM غیر فعال کړئ. د کرنل بوټ لاین ته لاندې اضافه کولو سره ASPM غیر فعال کړئ: pcie_aspm=off
۵.۲.۳ د CPU فریکونسي اندازه کول
د CPU فریکونسي سکیلینګ (یا د CPU سرعت سکیلینګ) د لینکس بریښنا مدیریت تخنیک دی چې پکې د سیسټم ساعت سرعت په الوتنه کې تنظیم کیږي ترڅو بریښنا او تودوخه خوندي کړي. د C- حالتونو په څیر، دا کولی شي د شبکې اتصالاتو کې ناغوښتل شوي ځنډ لامل شي.
د cpupower وسیله د CPU فعالیت ډیفالټ او محدودیتونو چک کولو او تعدیل لپاره هم کارول کیدی شي:

  • وګورئ: د cpupower مانیټر یا
  • CPUs د فعالیت حالت ته تنظیم کړئ: cpupower فریکوینسي-سیټ -g فعالیت

نوټ
د CPU فریکونسي محدودیتونو کې بدلونونه کولی شي په ډیری کاري بارونو اغیزه ولري او ممکن نور ځانګړتیاوې غیر فعال کړي، لکه د CPU ټربو حالت.
د CPU فریکونسي سکیلینګ غیر فعالولو لپاره، د لاندې امرونو په کارولو سره د CPU بریښنا خدمت غیر فعال کړئ:
systemctl د cpupower.service بندول
systemctl د cpupower.service غیر فعالول
۵.۲.۴ د بریښنا مدیریت اضافي لارښوونې
نور جزئیات په دې لوړه کچه کې چمتو شوي ديview د دریم نسل Intel® Xeon® Scalable پروسیسرونو کې د بریښنا مدیریت ډیری ځانګړتیاو څخه، او همدارنګه د دې ځانګړتیاو د پلیټ فارم په کچه مدغم کولو لارښوونې: https://networkbuilders.intel.com/solutionslibrary/power-management-technologyoverview-technology-guide
۵.۳ انټل® ټربو بوسټ
انټل® ټربو بوسټ د اړتیا په وخت کې پروسیسر ګړندی کوي مګر کولی شي اضافي بریښنا مصرف کړي. د ټربو بوسټ بندول پروسیسر په ثابت سرعت کې ساتي، تاسو ته د ځانګړو کاري بارونو لپاره د فعالیت دوامداره کچه درکوي.
۵.۴ اور وژونکي
فایر والونه کولی شي فعالیت اغیزمن کړي، په ځانګړي توګه د ځنډ فعالیت.
که اړتیا نه وي، iptables/firewalld غیر فعال کړئ.
5.5 د غوښتنلیک ترتیبات
ډیری وختونه یو واحد تار (کوم چې د یوې شبکې قطار سره مطابقت لري) د اعظمي بینډ ویت ترلاسه کولو لپاره کافي ندي. ځینې پلیټ فارمونه، لکه AMD، د انټیل پر بنسټ پروسس کونکو پلیټ فارمونو په پرتله د یو واحد تار سره ډیر Rx پاکټونه غورځوي.
د ټاسک سیټ یا نمکټل په څیر وسیلو کارولو په اړه فکر وکړئ ترڅو غوښتنلیکونه د NUMA نوډ یا CPU کورونو ته د شبکې وسیلې ته ځایی ته وصل کړئ. د ځینې کاري بارونو لپاره لکه د ذخیره کولو I/O لپاره، غوښتنلیک غیر محلي نوډ ته لیږدول ګټه چمتو کوي.
که امکان ولري، ستاسو د غوښتنلیک لخوا کارول شوي تارونو شمیر زیاتولو سره تجربه وکړئ.
۵.۶ د کرنل نسخه
ډیری عصري ان-بکس کرنلونه د فعالیت لپاره په مناسب ډول ښه شوي دي مګر، ستاسو د کارونې قضیې پورې اړه لري، د کرنل تازه کول ممکن ښه فعالیت چمتو کړي. د سرچینې ډاونلوډ کول تاسو ته دا هم اجازه درکوي چې د کرنل جوړولو دمخه ځینې ځانګړتیاوې فعال/غیر فعال کړئ.
۵.۷ د عملیاتي سیسټم/کرنل ترتیبات
د عامل سیسټم د تنظیم کولو په اړه د نورو معلوماتو لپاره، د عملیاتي سیسټم د تنظیم کولو لارښودونو سره مشوره وکړئ، لکه د Red Hat Enterprise Linux شبکې د فعالیت تنظیم کولو لارښود.
د سمون لپاره ځینې عام پیرامیټرې په لاندې جدول کې لیست شوي دي. په یاد ولرئ چې دا یوازې وړاندیز شوي پیل ټکي دي، او د ډیفالټ څخه یې بدلول ممکن په سیسټم کې کارول شوي سرچینې زیاتې کړي. که څه هم د ارزښتونو زیاتوالی کولی شي د فعالیت ښه کولو کې مرسته وکړي، دا اړینه ده چې د مختلفو ارزښتونو سره تجربه وکړئ ترڅو معلومه کړئ چې کوم یو د ورکړل شوي سیسټم، کاري بار او ترافیک ډول لپاره غوره کار کوي.
د کرنل پیرامیټرې د لینکس کې د sysctl یوټیلیټ په کارولو سره تنظیم کیدی شي لکه څنګه چې لاندې ښودل شوي.
ته view په سیسټم کې د rmem او wmem لپاره ډیفالټ ارزښتونه:
sysctl net.core.rmem_default
sysctl net.core.wmem_default
ارزښتونه اعظمي (۱۶ MB) ته تنظیم کړئ:
سيسټل -ډبليو نيټ.کور.رميم_مکس=١٦٧٧٧٢١٦
سيسټل -ډبليو نيټ.کور.ويم_مکس=١٦٧٧٧٢١٦
د ساکټ بفر اندازې، چې د ترلاسه کولو بفر (rmem) او لیږدونکي بفر (wmem) په نوم هم پیژندل کیږي، د سیسټم پیرامیټرونه دي چې د راتلوونکي او وتلو شبکې ترافیک لپاره د خوندي شوي حافظې اندازه مشخص کوي.
د -w دلیل پرته د sysctl چلول پیرامیټر د هغې اوسني ترتیب سره لیست کوي.

د سټېک تنظیم تفصیل
net.core.rmem_default د ترلاسه کولو کړکۍ ډیفالټ اندازه
net.core.wmem_default د لیږد کړکۍ ډیفالټ اندازه
د نیټ.کور.رمیم_مکس د ترلاسه کولو کړکۍ اعظمي اندازه
د نیټ.کور.ډبلیو ایم_مکس د لیږد کړکۍ اعظمي اندازه
د نیټ.کور.اپټمیم_مکس د اعظمي اختیار حافظې بفرونه
د net.core.netdev_max_backlog د کرنل د غورځیدو دمخه د غیر پروسس شوي پاکټونو بیک لاګ
د شبکې.ipv4.tcp_rmem د TCP لوستلو بفرونو لپاره د حافظې ذخیره کوونکی
نیټ.ای پي وي۴.ټي سي پي_وي ايم د TCP لیږلو بفرونو لپاره د حافظې ذخیره کوونکی

کرنل، د شبکې سټیک، د حافظې سمبالونکی، د CPU سرعت، او د بریښنا مدیریت پیرامیټرونه کولی شي د شبکې فعالیت باندې لوی اغیزه ولري. یو عام سپارښتنه دا ده چې د شبکې تروپټ پرو ته پلي شي.file د ټون شوي قوماندې په کارولو سره. دا د شبکې غوښتنلیکونو ته د لومړیتوب ورکولو لپاره د عملیاتي سیسټم ځینې تنظیمات بدلوي.
چک:
ټون شوی-اډم فعال
ترتیب:
ټون شوی-اېډم پروfile د شبکې له لارې
۵.۸ د شبکې وسیلو بیکلاګ
دا ځانګړتیا د راتلونکو ټرافیکونو په مؤثره توګه اداره کولو، د پیکټ ضایع کمولو، د ځنډ کمولو، او د تروپټ زیاتولو له لارې د شبکې فعالیت ښه کولو کې مرسته کوي. دا د کاروونکي غوره تجربه او د سیسټم چټک غبرګون لامل کیږي.
په ډیفالټ ډول، دا په ډیری لینکس عملیاتي سیسټمونو کې فعال شوی دی. د ډیفالټ ارزښت چک کولو لپاره:
sysctl net.core.netdev_max_backlog
د netdev_max_backlog لپاره اعظمي ارزښت د کرنل نسخې، هارډویر، حافظې، او کاري بار په څیر فکتورونو پورې اړه لري. په ډیری مواردو کې، 8192 د ښه ارزښت په توګه لیدل کیږي. sysctl -w net.core.netdev_max_backlog=8192
۵.۹ د پلیټ فارم ځانګړي تشکیلات او ټونینګ
۵.۹.۱ د څلورم نسل انټل® ژون® د اندازې وړ پروسسرونه

د انټل® څلورم نسل انټل® ژیون® سکیلیبل پروسیسر د بریښنا مدیریت د دریم نسل انټل® ژیون® سکیلیبل پروسیسرونو په پرتله خورا تیریدونکی دی. د ټیټ بریښنا حالتونو ته د کورونو د ننوتلو څخه د مخنیوي لپاره، هڅه وکړئ د کارول شوي کورونو شمیر کم کړئ ترڅو دوی د اوږدې مودې لپاره ویښ وساتي.
د لوړ فعالیت لپاره وړاندیز شوي بایوس ترتیبات

  1. په CPU کې د هایپر-تریډینګ فعال/غیر فعال (د کاري بار اړتیا او فعالیت اهدافو پراساس).
  2. د سیسټم پرو تنظیم کړئfile د اعظمي فعالیت لپاره فعالیت ته.
    نوټ
    دا د لوړ بریښنا مصرف لامل کیږي
  3. د CPU بریښنا مدیریت اعظمي فعالیت ته تنظیم کړئ ترڅو د بریښنا موثریت په پرتله اعظمي CPU فعالیت ته لومړیتوب ورکړئ.
  4. د ټربو بوسټ فعالول. د سیسټم په BIOS ترتیباتو کې د ټربو بوسټ غیر فعال کول معمولا د CPU مخه نیسي چې په متحرک ډول د خپل ساعت سرعت د خپل اساس فریکونسۍ څخه هاخوا زیات کړي.
  5. نوټ
    د ټربو بوسټ غیر فعالول ممکن د ځینو ځانګړو استعمال قضیو لپاره مناسب وي چیرې چې دوامداره فعالیت، د بریښنا موثریت، یا د تودوخې مدیریت د اعظمي فعالیت په پرتله لومړیتوب لري.
  6. که چیرې سیسټم د مجازی کولو ټیکنالوژیو څخه کار نه اخلي، د واحد روټ I/O مجازی کولو (SR-IOV) ځانګړتیا بنده کړئ.
  7. د C-حالاتو غیر فعالول ترڅو CPU ته لارښوونه وشي چې فعال پاتې شي او ژورو بې کاره حالتونو ته د ننوتلو مخه ونیسي.
  8. C1E غیر فعال کړئ، ترڅو ډاډ ترلاسه شي چې CPU فعال پاتې کیږي او C1E غیر فعال حالت ته نه ننوځي.
  9. د غیر کور فریکونسۍ اعظمي حد ته تنظیم کړئ ترڅو سیسټم ته لارښوونه وشي چې په لوړه موجوده فریکونسۍ کې کار وکړي.
  10. په ډیل پلیټ فارمونو کې، د څو APIC توضیحاتو جدول (MADT) کور ایمولیشن په لینیر (یا راؤنډ-رابین د BIOS پورې اړه لري) ته تنظیم کړئ ترڅو د CPU کورونو روښانه او وړاندوینې وړ نقشه چمتو کړي.

د غوره شوي فعالیت لپاره د OS کچې وړاندیز شوي سمونونه

  1. د CPU فریکونسي سکیلینګ والي فعالیت ته تنظیم کړئ. cpupower فریکونسي-سیټ -g فعالیت cpupower فریکونسي-معلومات
  2. د C-حالاتو غیر فعالول. cpupower idle-set -D0
  3. د کور Rx (rmem) او Tx (wmem) بفرونه اعظمي ارزښت ته تنظیم کړئ. sysctl -w net.core.rmem_max=16777216 sysctl -w net.core.wmem_max=16777216
  4. د شبکې وسیلې بیکلاګ تنظیم کړئ. sysctl -w net.core.netdev_max_backlog=8192
  5. ټون شوی پرو تنظیم کړئfile (د کار بار د تروپټ/ ځنډ پورې اړه لري).
    ټون شوی-اېډم پروfile د شبکې له لارې

د غوره شوي فعالیت لپاره د اډاپټر کچې وړاندیز شوي تنظیمونه

  1. د اپلیکېشن ټرافیک لپاره د کتارونو شمیر محدود کړئ. د اړونده CPU کورونو فعال ساتلو لپاره د اړتیا وړ کتارونو لږترلږه شمیر وکاروئ ترڅو دوی ژورو بې کاره حالتونو ته د ننوتلو مخه ونیسي (د کار بار لپاره تنظیم کړئ): ethtool -L ګډ ۳۲
  2. د مداخلې د اعتدال کچه تنظیم کړئ. ethtool -C تطابق-rx بند تطابق-tx بند rx-usecs-high 50 rx-usecs 50 tx-usecs 50
    د کاري بار لپاره د غوره ارزښت موندلو لپاره د لیږد/ترلاسه کولو/لوړ لومړیتوب د یوځای کولو ټایمر لوړ (80/100/150/200) یا ټیټ (25/20/10/5) تنظیم کولو هڅه وکړئ.
  3. د Rx/Tx حلقې اندازې تنظیم کړئ. ethtool -G rx 4096 tx 4096
    نوټ
    که تاسو د ethtool -S| grep drop سره د Rx پیکټ ډراپ وګورئ، نو هڅه وکړئ چې د حلقې اندازه <4096 ته راټیټه کړئ. هڅه وکړئ چې د کاري بار لپاره غوره ارزښت ومومئ چیرې چې پیکټونه نه غورځول کیږي.
  4. د IRQ افیونټي تنظیم کړئ. د NIC لپاره محلي کورونه وکاروئ، یا ځانګړي کور نقشه کول (چیرې چې # کورونه د 1 مخ کې په 26 کې ټاکل شوي قطارونو شمیر سره مساوي وي. systemctl stop irqbalance set_irq_affinity -X local یا set_irq_affinity -X

۵.۹.۲ AMD EPYC
د AMD EPYC پروسسرونه د سرورونو او معلوماتو مرکزونو لپاره جوړ شوي پیاوړي CPUs دي، چې د AMD د زین جوړښت باندې جوړ شوي دي. لاندې ترتیبات د AMD د څلورم نسل EPYC لړۍ څخه دي.
د لوړ فعالیت لپاره وړاندیز شوي BIOS ترتیبات

  1. د ګمرک حالت فعال کړئ ترڅو کاروونکو ته اجازه ورکړي چې د CPU فعالیت، د بریښنا مصرف، او نور ترتیبات تنظیم کړي. دا د فعالیت او انرژۍ موثریت ترمنځ د غوره توازن لپاره د سیسټم ښه کولو کې مرسته کوي.
  2. د اصلي فعالیت لوړول فعال کړئ ترڅو CPU ته اجازه ورکړي چې په اتوماتيک ډول خپل سرعت زیات کړي ترڅو ډیر سخت کارونه ترسره کړي، او ټولیز فعالیت ښه کړي.
  3. د نړیوال C-حالت کنټرول غیر فعال کړئ، ترڅو د CPU د بریښنا سپمولو ژورو حالتونو ته د ننوتلو مخه ونیسي چې د C-حالت په نوم پیژندل کیږي، کوم چې کولی شي غبرګون وساتي.
    نوټ
    د C-حالتونو غیر فعالول کولی شي د اضافي بریښنا مصرف لامل شي او د تودوخې تودوخه لوړه کړي. د کار بار لپاره دواړه وڅارئ.
  4. د کاري بار اړتیا او د فعالیت اهدافو پراساس، په CPU کې د هم مهاله ملټي تریډینګ (SMT) فعال/غیر فعال کړئ. SMT د انټیل CPUs کې د هایپر تریډینګ سره مساوي دی.
    نوټ
    د غوره شوي فعالیت لپاره، د وړاندیز شوي OS او اډاپټر کچې ټونینګ لپاره په ۱۳ مخ کې د i40e ډرایور ترتیباتو ټونینګ او په ۱۹ مخ کې د پلیټ فارم ټونینګ (i13e غیر مشخص) ته مراجعه وکړئ.

د اډاپټر تړل

د لینکس تړل یوه پیاوړې ځانګړتیا ده چې کولی شي د سرور چاپیریال کې د شبکې فعالیت، بې ځایه کیدو، او د غلطیو زغم د پام وړ ښه کړي. په هرصورت، دا مهمه ده چې په یاد ولرئ چې دا د مناسب شبکې هارډویر او په سرور او سویچ دواړو کې مناسب ترتیب ته اړتیا لري ترڅو په سمه توګه کار وکړي.
په لینکس کې د بانډینګ ډرایور تاسو ته اجازه درکوي چې ډیری فزیکي شبکې انٹرفیسونه په بانډ شوي انٹرفیس کې راټول کړئ. دا بانډ شوی انٹرفیس د عملیاتي سیسټم او غوښتنلیکونو لپاره د یو واحد مجازی شبکې انٹرفیس په توګه څرګندیږي.
نوټ
بانډ یو منطقي انٹرفیس دی، نو دا ممکنه نه ده چې د CPU تړاو په مستقیم ډول په بانډ انٹرفیس کې تنظیم شي (د مثال په توګهample، bond0). دا ده، دا د مداخلې اداره کولو یا CPU تړاو باندې مستقیم کنټرول نلري. د CPU تړاو باید د هغو اصلي انٹرفیسونو لپاره تنظیم شي چې د بانډ برخه دي.
تړل د عملیاتو څو طریقې وړاندې کوي، چې هر یو یې خپل ځانګړتیاوې لري.

موډ  ډول
0 رانډ رابین
1 فعال بیک اپ
2 XOR
3 خپرول
4 LACP
5 د بار بیلانس لیږدول
6 د تطبیق وړ بار توازن

په لینکس کې د اړیکې جوړولو لپاره مختلفې طریقې شتون لري. یو له خورا عامو طریقو څخه د شبکې ترتیب کارول دي. files (د مثال لپارهample، /etc/network/ انٹرفیسونه یا /etc/sysconfig/network-scripts/ifcfg-bondX).
د شبکې ترتیب په کارولو سره ترتیب کول Files
لاندې ګامونه د شبکې ترتیب له لارې اړیکې رامینځته کوي files.

  1. د نښلولو لپاره دوه یا ډیر NIC پورټونه غوره کړئ (د مثال په توګهamp(le، ethX او ethY)
  2. د NIC ترتیب خلاص کړئ Fileد اړتیا وړ NIC انٹرفیس لپاره د /etc/sysconfig/network-scripts/ لاندې s (د مثال په توګهample، vi ifcfg-ethX او vi ifcfg-ethY) او لاندې متن ضمیمه کړئ:
    MASTER=bondN [یادونه: N د بانډ شمېرې د یادولو لپاره یو بشپړ عدد دی.] SLAVE=yes
  3. د بانډ شبکې سکریپټ جوړ کړئ file د vi /etc/sysconfig/networkscripts/ifcfg-bondN په کارولو سره او لاندې متن دننه کړئ:
    DEVICE=bondN [یادونه: N د بانډ شمیره ذکر کولو لپاره یو بشپړ عدد دی] ONBOOT=yes USERCTL=no BOOTPROTO=dhcp (یا) هیڅ نه
    IPADDR=200.20.2.4 [که BOOTPROTO=هیڅ نه وي نو اړین دی] NETMASK=255.255.255.0 [که BOOTPROTO=هیڅ نه وي نو اړین دی] NETWORK=200.20.2.0 [که BOOTPROTO=هیڅ نه وي نو اړین دی] BROADCAST=200.20.2.255 [که BOOTPROTO=هیڅ نه وي نو اړین دی] BONDING_OPTS="mode=1 miimon=100"
    نوټ
    حالت د اړتیا پر بنسټ له 0 څخه تر 6 پورې هر عدد کېدای شي.
  4. د شبکې خدمات د شبکې بیا پیلولو یا systemctl بیا پیلولو په کارولو سره بیا پیل کړئ NetworkManager.service

د فعالیت ستونزې حل کول

۷.۱ د CPU کارول
د کار بار د چلولو پرمهال د هر کور لپاره د CPU کارول وګورئ.
په یاد ولرئ چې د هر کور کارول د CPU د ټولیز کارونې په پرتله د فعالیت سره ډیر تړاو لري ځکه چې دا د هر شبکې قطار کې د CPU کارولو مفکوره چمتو کوي. که تاسو یوازې یو څو تارونه لرئ چې د شبکې ترافیک چلوي، نو تاسو ممکن یوازې یو څو کورونه وکاروئ. په هرصورت، که چیرې دا کورونه په 100٪ کې وي، نو ستاسو د شبکې تروپټ احتمال د CPU کارولو لخوا محدود دی او دا د لاندې کارونو ترسره کولو وخت دی:

  1. د IRQ اعتدال/د حلقې اندازه تنظیم کړئ لکه څنګه چې په انټرپټ اعتدال کې توضیح شوي.
  2. د غوښتنلیکونو د تارونو شمیر زیات کړئ ترڅو د CPU بار په ډیرو کورونو باندې خپور شي. که ټول کورونه په 100٪ کې روان وي نو ستاسو غوښتنلیک ممکن د شبکې سره تړلی نه بلکه CPU سره تړلی وي.

په عام ډول موجود وسایل:

  • پورته
    — د CPUs لیست پراخولو لپاره 1 فشار ورکړئ او وګورئ چې کوم یو کارول کیږي.
    — د کارولو کچې ته پام وکړئ.
    — پام وکړئ چې کومې پروسې تر ټولو فعالې دي (د لیست په سر کې).
  • mpstat
    لاندې پخوانيampد کمانډ لاین په Red Hat Enterprise Linux 7.x کې ازمول شوی و.
    دا د هر کور لپاره د CPU کارول ښیي (د ټول غیر فعال سلنه موندلو او له 100 څخه کمولو سره) او د 80٪ څخه پورته ارزښتونه په سور رنګ کې روښانه کوي. mpstat -P ALL 1 1 | grep -v اوسط | tail -n +5 | head -n -1 | awk '{ print (100-$13)}' | egrep -color=always '[^\.][8-9][0-9][\.]?.*|^[8-9][0-9][\.]?.*| 100|' | column
  • perf top وګورئ چې سایکلونه چیرته مصرف کیږي.

۷.۲ i7.2e کاونټرونه
د i40e ډرایور د ethtool -S ethX قوماندې له لارې د انٹرفیس ډیبګ او څارنې لپاره د کاونټرونو اوږد لیست چمتو کوي. دا ګټور کیدی شي چې د کار بار چلولو پرمهال د محصول څارنه وکړئ او/یا د کار بار چلولو دمخه او وروسته د کاونټر ارزښتونه پرتله کړئ.

  • د i40e کاونټرونو بشپړ ډمپ ترلاسه کولو لپاره: ethtool -S ethX
  • یوازې د غیر صفر کاونټرونو لیدلو لپاره: watch -d (ethtool -S ethX) | egrep -v :\ 0 | column
    ځینې ​​شیان چې باید په لټه کې شئ:
  • rx_dropped پدې مانا ده چې CPU د بفرونو خدمتونه په کافي اندازه ګړندي نه کوي.
  • port.rx_dropped پدې مانا ده چې یو څه په سلاټ/میموري/ سیسټم کې کافي ګړندی نه دی.

۷.۳ د شبکې شمېرونکي
د کاري بار له چلولو مخکې/وروسته netstat -s وګورئ.
نیټ سټاټ په سیسټم کې د ټولو شبکو وسیلو څخه د شبکې معلومات راټولوي. له همدې امله، پایلې ممکن د ازموینې لاندې شبکې پرته د نورو شبکو څخه اغیزمنې شي. د نیټ سټاټ -s څخه محصول کولی شي د لینکس عملیاتي سیسټم یا کرنل کې د فعالیت مسلو ښه شاخص وي. د عمومي عملیاتي سیسټم ټونینګ په اړه د نورو بصیرت لپاره د عملیاتي سیسټم ټونینګ لارښودونو سره مشوره وکړئ، لکه د ریډ هټ انټرپرائز لینکس شبکې فعالیت ټونینګ لارښود.
۷.۴ د سیسټم لاګونه
د غلطیو او اخطارونو لپاره د سیسټم لاګونه وګورئ (/var/log/messages, dmesg).
۷.۵ د انټل svr-معلوماتو وسیله
انټیل د svr-معلوماتو وسیله چمتو کوي (وګورئ https://github.com/intel/svr-info) د لینکس لپاره چې د سرور څخه اړونده هارډویر او سافټویر توضیحات نیسي. د svr-info محصول کولی شي د سیسټم خنډونو یا ترتیباتو / ټونینګونو پیژندلو لپاره خورا ګټور وي چې د کاري بار لپاره غوره شوي ندي. کله چې د ایترنیټ پورې اړوند فعالیت مسلو لپاره د انټیل سره د ملاتړ قضیه پرانیزئ، ډاډ ترلاسه کړئ چې د svr-info محصول شامل کړئ (متن file) د ازموینې ترتیب کې د هر لینکس سرور لپاره.

  1. د svr-info ډاونلوډ او نصب کړئ:
    ویګټ -کیو- https://github.com/intel/svr-info/releases/latest/download/svrinfo.tgz| tar xvz سي ډي svr-معلومات
    ./svr-معلومات
    > کوربه نوم.txt
  2. محصول راټول کړئ:
    ./svr-info > کوربه نوم.txt
  3. یو متن (.txt) ضمیمه کړئ file د تحلیل لپاره ستاسو د انټیل ملاتړ قضیې ته د هر سرور لپاره.

د ګډ فعالیت سناریوګانو لپاره سپارښتنې

۸.۱ د IP لیږل

  • کرنل تازه کړئ.
    د روټینګ کوډ کې د کرنل بدلونونو له امله چې د امنیت له امله د روټینګ کیش له لرې کولو سره پیل کیږي، ځینې وروستي ان-ډیسټرو کرنلونه د روټینګ فعالیت خراب کړی دی. وروستي آوټ-ډیسټرو کرنلونه باید پیچونه ولري چې د دې بدلونونو د فعالیت اغیز کم کړي او ممکن ښه فعالیت چمتو کړي.
  • هایپر-تریډینګ (منطقي کورونه) غیر فعال کړئ.
  • د کرنل بوټ پیرامیټرې سم کړئ.
    — د کرنل بوټ لاین څخه iommu په زور بند کړئ (intel_iommu=off یا iommu=off) پرته لدې چې د مجازی کولو لپاره اړتیا وي
    — د بریښنا مدیریت بند کړئ: processor.max_cstates=1 idle=poll pcie_aspm=off
  • د کتارونو شمیر محدود کړئ ترڅو په محلي ساکټ کې د کورونو شمیر سره مساوي وي (په دې مثال کې 12)ample). ethtool -L ethX ګډ 12
  • یوازې محلي ساکټ ته د پن مداخله. set_irq_affinity -X محلي ethX یا set_irq_affinity -X محلي ethX
    نوټ
    -X یا -x د کار بار پورې اړه لري کارول کیدی شي.
  • د اړتیا سره سم د Tx او Rx حلقې اندازې بدل کړئ. لوی ارزښت ډیرې سرچینې نیسي مګر کولی شي د لیږلو غوره نرخونه چمتو کړي. ethtool -G ethX rx 4096 tx 4096
  • د روټ کولو پر مهال GRO غیر فعال کړئ.
    د کرنل د یوې پیژندل شوې ستونزې له امله، د روټینګ/فارورډ کولو پر مهال GRO باید بند شي. ethtool -K ethX gro off چیرې چې ethX د ایترنیټ انٹرفیس دی چې باید تعدیل شي.
  • د تطبیقي مداخلې اعتدال غیر فعال کړئ او یو جامد ارزښت تنظیم کړئ. ethtool -C ethX adaptiv-rx off adaptiv-tx off ethtool -C ethX rx-usecs 64 tx-usecs 64

نوټ
د پروسیسر ډول او کاري بار پورې اړه لري، د RX او TX لپاره د یوځای کولو پیرامیټرونه د ښه فعالیت (یا د چوکاټ کم ضایع) لپاره تنظیم کیدی شي.

  • د اور وژنې بند کړئ. sudo systemctl د اور وژنې بند کړئ sudo systemctl د اور وژنې بند کړئ
  • د IP لیږلو فعالول. sysctl -w net.ipv4.ip_forward=1
  • د ترلاسه کولو او لیږلو ساکټ بفر اندازو لپاره اعظمي ارزښتونه تنظیم کړئ. sysctl -w net.core.rmem_max=16777216 sysctl -w net.core.wmem_max=16777216

نوټ
د کار بار یا اړتیا پورې اړه لري، دا ارزښتونه له ډیفالټ څخه بدلیدلی شي.
۸.۲ ټیټ ځنډ

  • هایپر-تریډینګ (منطقي کورونه) بند کړئ.
  • ډاډ ترلاسه کړئ چې د شبکې وسیله د numa core 0 سره محلي ده.
  • د ټاسک سیټ -c 0 په کارولو سره بنچمارک کور 0 ته پین ​​کړئ.
  • د systemctl په کارولو سره irqbalance بند کړئ irqbalance ودروئ یا systemctl irqbalance غیر فعال کړئ
  • د اتصال سکریپټ چل کړئ ترڅو په ټولو کورونو کې خپور شي. سیمه ایز یا ټول هڅه وکړئ.
  • د مداخلې اعتدال بند کړئ. ethtool -C ethX rx-usecs 0 tx-usecs 0 adaptive-rx off adaptive-tx off rxusecs- high 0
  • د کتارونو شمیر محدود کړئ چې په محلي ساکټ کې د کورونو شمیر سره مساوي وي (په دې مثال کې 32)ample). ethtool -L ethX ګډ 32
  • یوازې محلي ساکټ ته د پن مداخلې (سکریپټ د i40e ډرایور سرچینې سره بسته شوی). set_irq_affinity -X محلي ethX
  • یو ټاکل شوی بنچمارک وکاروئ لکه netperf -t TCP_RR، netperf -t UDP_RR، یا NetPipe. netperf -t TCP_RR یا netperf -t UDP_RR
  • په محلي NUMA نوډ کې یو واحد کور ته بنچمارک پین کړئ. taskset -c

انټل ® ایترنیټ 700 لړۍ
د لینکس فعالیت ټونینګ لارښود
دسمبر 2024
د ډاکټر شمېره: ۳۳۴۰۱۹، مخفف: ۱.۲

اسناد / سرچینې

د انټیل ایترنیټ 700 لړۍ لینکس فعالیت ټونینګ [pdf] د کارونکي لارښود
۳۳۴۰۱۹، ایترنیټ ۷۰۰ لړۍ لینکس فعالیت ټونینګ، ایترنیټ ۷۰۰ لړۍ، لینکس فعالیت ټونینګ، د فعالیت ټونینګ، ټونینګ

حوالې

یو نظر پریږدئ

ستاسو بریښنالیک پته به خپره نشي. اړین ساحې په نښه شوي *