Интел ЛогоИнтел® Етхернет 700 серија
Водич за подешавање перформанси Линук-а
НЕКС група за умрежавање у облаку (НЦНГ)
Рев. 1.2
децембар 2024

Историја ревизија

Ревизија Датум Коментари
1.2 децембар 2024 · Додато додатно упутство за управљање напајањем.
· Додато Интел* Турбо Боост.
· Додати заостаци мрежних уређаја.
· Додате конфигурације и подешавања специфичне за платформу.
· Додата 4. генерација Интел* %еон* скалабилних процесора.
· Додат АМД ЕПИЦ.
· Ажурирана провера хардверских могућности система.
· Ажуриран иПерф2.
· Ажуриран иПерф3.
· Ажурирани Тк/Рк редови.
· Ажурирана модерација прекида.
· Ажурирана величина прстена.
· Ажурирано подешавање платформе (и40е неспецифично).
· Ажуриране поставке БИОС-а.
· Ажурирана Ц-Стате Цонтрол.
· Ажурирано скалирање ЦПУ фреквенције.
· Ажурирана подешавања апликације.
· Ажуриране поставке оперативног система/кернела.
· Ажурирано ИП прослеђивање.
· Ажурирано Лов Латенци.
август 2023 Промене овог документа обухватају:
· Додате повезане референце.
· Додато Уверите се да се ДДП пакет исправно учитава.
· Додат иПерф2.
· Додат иПерф3.
· Додат нетперф.
· Ажуриран ИРК Аффинити.
· Додати Тк/Рк редови.
· Ажурирана величина прстена.
· Додати Јумбо оквири.
· Додато Адаптер Лепљење.
· Додата Интел свр-инфо алатка.
1.0 март 2016 Првобитно издање (Интел Публиц).

Увод

Овај водич има за циљ да пружи упутства за подешавање окружења за оптималне мрежне перформансе користећи Интел® Етхернет 700 серије НИЦ-а у Линук окружењима. Фокусира се на услове и подешавања хардвера, драјвера и оперативног система који могу да побољшају перформансе мреже. Треба напоменути да на перформансе умрежавања може утицати било који број спољних утицаја, од којих су само најчешћи и најдраматичнији обухваћени у овом водичу.
1.1 Повезане референце

Иницијална контролна листа

2.1 Ажурирајте верзије управљачког програма/ фирмвера
Проверите верзије драјвера/фирмвера користећи етхтоол -и етхк.
Ажурирајте следеће по потреби:

2.2 Прочитајте РЕАДМЕ
Проверите познате проблеме и преузмите најновија упутства за конфигурацију од РЕАДМЕ-а file укључено у изворни пакет и40е.
2.3 Проверите да ли је ваш ПЦИ Екпресс (ПЦИе) слот к8
Неки ПЦИе к8 слотови су заправо конфигурисани као к4 слотови. Ови слотови имају недовољну пропусност за пуну брзину линије са уређајима са два и четири порта. Поред тога, ако ставите адаптер који подржава ПЦИе в3.0 у ПЦИе в2.к слот, нећете моћи да добијете пун пропусни опсег. Драјвер софтверског уређаја открива ову ситуацију и уписује следећу поруку у системски дневник:
ПЦИ-Екпресс пропусни опсег доступан за ову картицу није довољан за оптималне перформансе. За оптималне перформансе потребан је к8 ПЦИ-Екпресс слот.
Ако дође до ове грешке, померите адаптер у прави ПЦИе в3.0 к8 слот да бисте решили проблем.
2.4 Проверите могућности хардвера система
На 10 Гбпс, 25 Гбпс и 40 Гбпс Етхернет, постоје неки минимални захтеви за процесор и систем. Генерално, савремени процесор класе сервера и оптимална конфигурација меморије за вашу платформу би требало да буду довољни, али потребе варирају у зависности од вашег оптерећења. Сви меморијски канали треба да буду попуњени и режим перформанси меморије треба да буде омогућен у БИОС-у. Проверите да ли ваша конфигурација ЦПУ-а и меморије могу да подрже ниво мрежних перформанси који вам је потребан за ваше радно оптерећење.
НАПОМЕНА
КСЛ710 је 40 ГбЕ контролер. Адаптер 2 к 40 ГбЕ који користи овај контролер није намењен да буде 2 к 40 ГбЕ већ 1 к 40 ГбЕ са активним портом за резервну копију. Када покушавате да користите саобраћај линијске брзине који укључује оба порта, интерни прекидач је засићен и комбиновани пропусни опсег између два порта је ограничен на укупно СО Гбпс.
2.4.1 Параметри покретања кернела
Ако је Интел® технологија виртуелизације за усмерени И/О (Интел® ВТ-д) омогућена у БИОС-у, Интел препоручује да ИОММУ буде у режиму пролаза ради оптималних перформанси мреже хоста. Ово елиминише ДМА оверхеад на хост саобраћају док омогућава виртуелним машинама (ВМ) да и даље имају предности Интел® ВТ-д. Ово се постиже додавањем следећег реда параметрима покретања кернела: фомму-пт.
2.5 Уверите се да се ДДП пакет правилно учитава
Основни драјвери 140еа и 140еб немају директну подршку за динамичку персонализацију уређаја (ДДП). Да бисте користили ДДП са уређајима серије 700, ДДП проfile може се применити са тестпмд апликацијом.
За детаље о ДДП проfileи како да примените ДДП проfile са тестпмд-ом на уређајима серије 700, погледајте Технолошки водич Интел® Етхернет серије 700 за динамичку персонализацију уређаја (ДДП).
Да бисте проверили да ли је ДДП проfile је успешно учитано:
тестпмд> ддп гет лист 0 Проfile број је: 1
НАПОМЕНА
Ако проfile број је 0, ниједан ДДП пакет није учитан. У случају грешке при учитавању ДДП пакета, уређај подразумевано прелази у безбедан режим и многе функције перформанси су недоступне. Ако постоје грешке у вези са учитавањем ДДП пакета, то ће изазвати проблеме са перформансама. За кораке за решавање проблема, погледајте Технолошки водич за динамичку персонализацију уређаја (ДДП) серије Инте/* Етхернет 700.

Базна мерења перформанси и методологија подешавања

3.1 Мерила мрежних перформанси
Пре него што започнете вежбу подешавања, важно је да имате добро основно мерење перформанси ваше мреже. Обично поред добијања иницијалног мерења перформанси ваше специфичне апликације/радног оптерећења, добра је идеја да користите и стандардну референтну вредност мрежних перформанси да бисте проверили да ли је ваш мрежни уређај у добром стању.
За оптимизацију једног система, нетперф или иперф и НетПИПЕ су сви солидни бесплатни алати отвореног кода који вам омогућавају да нагласите везу и дијагностикујете проблеме са перформансама.
Нетперф је јак за тестирање пропусности и кашњења. НетПИПЕ је алатка специфична за кашњење, али се може компајлирати за било коју врсту окружења.
НАПОМЕНА
ТЦП_РР тест у нетперф-у враћа кашњење у вредности трансакција/сек. Ово је повратни број. Једносмерно кашњење се може израчунати коришћењем следеће једначине:
Латенција(усец) = (1⁄2) / [Трансакције/сек] * 1,000,000
3.1.1 иПерф2
Интел препоручује иперф2 у односу на иперф3 за већину ситуација бенчмаркинга због лакоће употребе и подршке за више нити у једној инстанци апликације. Интел препоручује рад са опцијом -П са 2-4 нити за 25Г везе и око 4-6 нити за 40Г везе.

  • Да бисте покренули једносмерни саобраћај од клијента до сервера: серверска команда нпрampле: иперф2 -с
    Клијентска команда прampле: иперф2 -ц -П
  • Да бисте покренули двосмерни саобраћај од клијента до сервера (и обрнуто): серверска команда нпрampле: иперф2 –с –п
    Клијентска команда прampле:
    иперф2 -ц -п -П --фулл-дуплек ОР
    иперф2 -ц -п -П –д

НАПОМЕНА
И опције –фулл-дуплек и -д у иперф2 омогућавају кориснику да изврши двосмерно тестирање. Међутим, опција –фулл-дуплек се посебно фокусира на тестирање пуног дуплекса.
НАПОМЕНА
Када тестирате иперф2 на више серверских портова, заставица -д се може додати на команду сервера да би се све сесије сервера покренуле у позадини из истог прозора терминала. Ознака -д се такође може користити када је команда сервера уграђена унутар фор-петље у скрипту.
НАПОМЕНА
Приликом покретања теста мрежне пропусности са једним током/нитим (нпрampле: П1), АМД процесори можда неће пружити очекивану пропусност, посебно НИЦ-ове већег пропусног опсега (ако је брзина >= 25Г пропусног опсега). Као резултат, потребно је причвршћивање апликације на одређена језгра да би се постигла већа пропусност. Погледајте Подешавања апликације на страници 22.
3.1.2 иПерф3
Ако се користи иперф3, потребно је више инстанци апликације да би се узела предностtagе од више-нитних, РСС и хардверских редова. Интел препоручује покретање са 2-4 сесије апликације за 25Г везе и око 4-6 сесија за 40Г везе. Свака сесија треба да специфицира јединствену вредност ТЦП порта користећи опцију -п.

  • Да бисте покренули једносмерни саобраћај од клијента до сервера:
    Серверска команда прampле:
    иперф3 -с -п
    Клијентска команда прampле:
    иперф3 -ц -п
  • Да бисте покренули двосмерни саобраћај од клијента до сервера (и обрнуто):
    Серверска команда прampле:
    иперф3 –с –п
    Клијентска команда прampле: иперф3 -ц -п -П –-бидир
  • Да бисте покренули више инстанци (нити) иперф3, препорука је да користите фор-петљу за мапирање нити на ТЦП портове и покретање иперф3 у позадини користећи & да бисте креирали више процеса паралелно.
    Серверска команда прampле, започните 4 нити: порт=””; за и у {0..3}; до порт=520$и; басх -ц “иперф3 -с -п $порт &”; урађено; Клијентска команда прampле, започни 4 нити – Предај тест порт=””; за и у {0..3}; до порт=520$и; басх -ц “иперф3 -ц $серверИП -п $порт &”; урађено; Клијентска команда прampле, започни 4 нити – Пријем тест порт=””; за и у {0..3}; до порт=520$и; басх -ц “иперф3 -Р -ц $серверИП -п $порт &”; урађено; За 40Г везе, повећајте фор-петљу да бисте креирали до 6 инстанци/нити.

НАПОМЕНА
Приликом покретања теста мрежне пропусности са једним током/нитим (нпрampле: П1), АМД процесори можда неће пружити очекивану пропусност, посебно већи пропусни опсег
НИЦ (ако је брзина >= 25Г пропусног опсега). Као резултат, потребно је причвршћивање апликације на одређена језгра да би се постигла већа пропусност. Погледајте Подешавања апликације на страници 22 и АМД ЕПИЦ на страници 26.
3.1.3 нетперф
Нетперф алат је јак избор за тестирање пропусности и кашњења.

  • ТЦП_СТРЕАМ тест у нетперфу мери пропусну моћ уређаја. Серверска команда прampле: нетсервер Клијентска команда прampле: нетперф -т ТЦП_СТРЕАМ -л 30 -Х
  • ТЦП_РР тест у нетперф-у враћа кашњење у вредности трансакција/секунди. Ово је повратни број. Препоручљиво је користити опцију -Т к,к, ако је к ЦПУ локално за уређај. Једносмерно кашњење се може израчунати коришћењем: Латенци(усец)=(1⁄2)/ [Трансацтионс/сец]*1,000,\ Сервер цомманд екampле: нетсервер
    Клијентска команда прampле: нетперф -т ТЦП_РР -л 30 -Х -Т к,к
  • Да бисте покренули више инстанци (нити) нетперф-а, препорука је да користите фор-петљу за мапирање нити на ТЦП портове и покретање нетперф-а у позадини користећи & да бисте креирали више процеса паралелно.
    Серверска команда прampле, започни 8 нити:
    порт=””; за и у {0..7}; до порт=520$и; басх -ц “нетсервер -Л $серверИП -п $порт &”; урађено;
    Клијентска команда прampле, започни 8 нити: порт=””; за и у {0..7}; до порт=520$и; басх -ц “нетперф -Х $серверИП -п $порт -т ТЦП_СТРЕАМ -л 30 &”; урађено;

3.2 Методологија подешавања
Фокусирајте се на једну по једну промену подешавања како бисте знали какав утицај свака промена има на ваш тест. Што сте методичнији у процесу подешавања, то ће бити лакше идентификовати и отклонити узроке уских грла у перформансама.

Подешавање поставки драјвера и40е

4.1 ИРК Афинитет
Конфигурисање ИРК афинитета тако да прекиди за различите мрежне редове буду повезани са различитим ЦПУ језграма може имати огроман утицај на перформансе, посебно на тестове пропусности више нити.
Да бисте конфигурисали ИРК афинитет, зауставите иркбаланце, а затим или користите скрипту сет_ирк_афинити из и40е изворног пакета или ручно закачите редове. Онемогућите балансирање ИРК-а у корисничком простору да бисте омогућили качење у реду:

  • системцтл онемогући иркбаланце
  • системцтл стоп иркбаланце
    Коришћење скрипте сет_ирк_афинити из изворног пакета и40е (препоручено):
  • Да бисте користили сва језгра:
    [патх-то-и40епацкаге]/сцриптс/сет_ирк_аффинити -Кс алл етхКс
  • Да бисте користили само језгра на локалном НУМА сокету: [патх-то-и40епацкаге]/сцриптс/сет_ирк_аффинити -Кс локални етхКс
  • Такође можете одабрати низ језгара. Избегавајте коришћење цпу0 јер покреће задатке тајмера. [патх-то-и40епацкаге]/сцриптс/сет_ирк_аффинити 1-2 етхКс

НАПОМЕНА
Скрипта афинитета омогућава управљање преносом пакета (КСПС) као део процеса качења када је наведена опција -к. Када је КСПС омогућен, Интел препоручује да онемогућите иркбаланце, пошто балансирање кернела са КСПС-ом може да изазове непредвидиве перформансе. Скрипта афинитета онемогућава КСПС када је наведена опција -Кс. Онемогућавање КСПС-а и омогућавање симетричних редова је корисно за радна оптерећења у којима се најбоље перформансе постижу када се Тк и Рк саобраћај сервисирају на истом пару(овима) реда.
Конфигурисање симетричних редова у Линук-у укључује подешавање параметара драјвера мрежног интерфејса да би се омогућили симетрични редови за пријем (Рк) и симетрични редови за пренос (Тк) за подржане мрежне адаптере.
НАПОМЕНА

  • Симетрични редови су напредна мрежна функција и не подржавају их сви мрежни адаптери или драјвери серије 700.
  • Уверите се да имате неопходну подршку за драјвер и хардвер пре него што покушате да конфигуришете симетричне редове.

Да бисте конфигурисали симетричне редове, следите ове опште кораке:

  1. Уредите конфигурацију мрежног интерфејса File: Користите уређивач текста (нпрampле, ви, нано или гедит) да бисте уредили конфигурацију мрежног интерфејса file. Тхе file се обично налази у директоријуму /етц/сисцонфиг/нетворк-сцриптс/ и има име као што је ифцфг-етхКс, где је етхКс име вашег мрежног интерфејса.
  2. Додајте параметре симетричног реда. Додајте следеће редове у конфигурацију мрежног интерфејса file: ЕТХТООЛ_ОПТС=”рк-редови 8 тк-редови 8″
  3. Поново покрените мрежну услугу.
    Након што извршите измене, поново покрените мрежни сервис да бисте применили нову конфигурацију. судо системцтл рестарт нетворк

ручно:

  • Пронађите процесоре прикључене на сваки чвор користећи: нумацтл –хардваре лсцпу
  • Пронађите битне маске за сваки од процесора:
  • Под претпоставком да су језгра 0-11 за чвор 0: [1,2,4,8,10,20,40,80,100,200,400,800]
  • Пронађите ИРК-ове додељене порту који се додељује: греп етхКс /проц/интерруптс и забележите ИРК вредности нпр.ampле, 181-192 за 12 учитаних вектора.
  • Ецхо вредност СМП афинитета у одговарајући ИРК унос. Имајте на уму да ово треба да се уради за сваки ИРК унос: ецхо 1 > /проц/ирк/181/смп_аффинити ецхо 2 > /проц/ирк/182/смп_аффинити ецхо 4 > /проц/ирк/183/смп_аффинити Прикажи ИРК афинитет:
  • Да бисте приказали ИРК афинитет за сва језгра: /сцриптс/сет_ирк_афинити -с етхКс
  • Да бисте приказали само језгра на локалном НУМА сокету: /сцриптс/сет_ирк_афинити -с локални етхКс
  • Такође можете изабрати низ језгара: /сцриптс/сет_ирк_афинити -с 40-0-8,16 етхКс

НАПОМЕНА
Скрипта сет_ирк_афинити подржава ознаку -с у и40е драјверу верзије 2.16.11 и новијим.
4.2 Тк/Рк редови
Подразумевани број редова које је драјвер омогућио за сваки Етхернет порт при иницијализацији једнак је укупном броју ЦПУ-а доступних на платформи. Ово добро функционише за многе платформе и конфигурације радног оптерећења. Међутим, на платформама са великим бројем језгара и/или великом густином Етхернет портова, ова конфигурација може да изазове свађу око ресурса. Због тога ће можда бити потребно у неким случајевима да измените подразумеване вредности за сваки порт у систему.
Подразумевани број Тк/Рк редова може да варира у зависности од специфичног модела и верзије драјвера. Број редова се може подесити помоћу команде етхтоол -Л која је наведена у наставку.
НАПОМЕНА
У овим случајевима, Интел препоручује да смањите подразумевани број редова за сваки порт на не више од броја ЦПУ-а доступних у НУМА чвору локално на порту адаптера. У неким случајевима, када покушавате да избалансирате ресурсе на имплементацији великог броја портова, можда ће бити потребно још више смањити овај број.
Да бисте изменили конфигурацију реда:
Следећи прampле поставља порт на 32 Тк/Рк редова: етхтоол -Л етхКс комбиновано 32
Exampле оутпут:
етхтоол -л етхКс
Параметри канала за етхКс: Унапред подешени максимуми:
РКС: 96
ТКС: 96
Остало: 1
Комбиновано: 96
Тренутна подешавања хардвера:
РКС: 0
ТКС: 0
Остало: 1
Комбиновано: 32
4.3 Модерирање прекида
Адаптивна модерација прекида је подразумевано укључена и дизајнирана је да обезбеди уравнотежен приступ између ниске искоришћености ЦПУ-а и високих перформанси. Међутим, можете покушати ручно да подесите поставке прекида како би одговарале вашем случају употребе.
Опсег од 0-235 микросекунди обезбеђује ефикасан опсег од 4,310 до 250,000 прекида у секунди. Вредност рк-μсецс-хигх се може поставити независно од рк-μсецс и тк-μсецс у истој команди етхтоол, а такође је независна од адаптивног алгоритма за модерирање прекида. Основни хардвер подржава грануларност у интервалима од 2 микросекунде, тако да суседне вредности могу довести до исте стопе прекида.

  • Да бисте искључили модерирање адаптивног прекида: етхтоол -Ц етхКс адаптиве-рк офф адаптиве-тк офф
  • Да бисте укључили модерирање адаптивног прекида: етхтоол -Ц етхКс адаптиве-рк он адаптиве-тк он

Добро место за почетак општег подешавања је 84 μс, или ~12000 прекида/с. Ако видите да се бројачи рк_дроппед покрећу током саобраћаја (користећи етхтоол -С етхКс), онда вероватно имате преспоро ЦПУ, немате довољно бафера од величине прстена адаптера (етхтоол -Г) да бисте држали пакете 84 μс или на ниској стопи прекида.

  • Да бисте подесили модерацију прекида на фиксну стопу прекида од 84 μс између прекида (12000 прекида/с): етхтоол -Ц етхКс адаптиве-рк офф адаптиве-тк офф рк-усецс 84 тк-усецс 84 Следећа вредност коју треба да покушате, ако нисте максимално искоришћени, је коришћење ЦПУ62μ. Ово користи више ЦПУ-а, али брже сервисира бафере и захтева мање дескриптора (величина прстена, етхтоол -Г).
  • За подешавање модерације прекида на фиксну стопу прекида од 62 усецс између прекида (16000 прекида/с). етхтоол -Ц етхКс адаптиве-рк офф адаптиве-тк офф рк-усецс 62 тк-усецс 62
    Ако се бројачи рк_дроппед повећавају током саобраћаја (користећи етхтоол -С етхКс), вероватно имате преспоро ЦПУ, немате довољно бафера од величине прстена адаптера (етхтоол -Г) или прениску стопу прекида. Ако нисте максимално искористили ЦПУ, можете повећати стопу прекида тако што ћете смањити ИТР вредност. Ово користи више ЦПУ-а, али услуге баферују брже и захтевају мање дескриптора (величина прстена, етхтоол -Г).
    Ако је ваш ЦПУ на 100%, онда се не препоручује повећање стопе прекида. У одређеним околностима као што је радно оптерећење везано за ЦПУ, можда ћете желети да повећате вредност μс да бисте омогућили више ЦПУ времена за друге апликације.
    Ако су вам потребне перформансе са ниским кашњењем и/или имате довољно ЦПУ-а који можете посветити мрежној обради, можете у потпуности да онемогућите модерирање прекида, што омогућава да се прекиди активирају што је брже могуће.
  • Да бисте онемогућили модерирање прекида етхтоол -Ц етхКс адаптиве-рк офф адаптиве-тк офф рк-усецс 0 тк-усецс 0

НАПОМЕНА
Када се ради са онемогућеном модерацијом прекида, стопа прекида у сваком реду може бити веома висока. Размислите о укључивању параметра рк-усец-хигх да бисте поставили горњу границу брзине прекида. Следећа команда онемогућава модерирање адаптивног прекида и дозвољава максимално 5 микросекунди пре него што назначи да је пријем или пренос завршен. Уместо да резултира са чак 200,000 прекида у секунди, он ограничава укупан број прекида у секунди на 50,000 преко параметра рк-усец-хигх. # етхтоол -Ц етхКс адаптиве-рк офф адаптиве-тк офф рк-усецс-хигх 20 рк-усецс 5 ткусецс 5 Покушајте да подесите тајмер за спајање преноса/пријема/високог приоритета на више (80/100/150/200) или ниже да бисте пронашли оптималну вредност/оптерећење (25/20).
4.4 Величина прстена
Ако видите бројаче рк_дроппед у етхтоол -С етхКс (рк_дроппед, рк_дроппед.ниц) или сумњате да је притисак у кеш меморији са више активних редова, можете покушати да подесите величину звона са подразумеване вредности. Подразумевана вредност је 512, максимална је 4096.

  • Да бисте проверили тренутне вредности: етхтоол -г етхКс
    Ако се сумња да недостатак баферовања узрокује опадање тренутне стопе прекида, можете прво покушати са максимумом, а затим са минимумом, а затим наставити са бинарном претрагом док не видите оптималне перформансе.
    Ако се сумња на притисак кеша (многи редови активни), смањење бафера од подразумеваних може помоћи да Интел® Дата Дирецт И/О (Интел® ДДИО) ради ефикасније. Интел препоручује да покушате са 128 или 256 по реду, свестан да би повећање стопе прекида путем етхтоол -Ц могло бити неопходно да би се избегло повећање рк_дроппед.
  • Да бисте подесили величину прстена на фиксну вредност: етхтоол -Г етх12 рк 256 тк 256

НАПОМЕНА
Да бисте поправили падове Рк пакета пронађених помоћу етхтоол -С етхКс|греп дроп, размислите о повећању величине прстена на 4096. Експериментишите да бисте пронашли најбољу поставку за радно оптерећење, али пазите на прекомерну употребу меморије са већим вредностима.
4.5 Контрола протока
Контрола тока на нивоу 2 може значајно да утиче на ТЦП перформансе и препоручује се да буде онемогућена за већину радних оптерећења. Потенцијални изузетак је брз саобраћај где рафали не трају дуго.
Контрола тока је подразумевано онемогућена.

  • Да бисте омогућили контролу тока: етхтоол -А етхКс рк он тк он
  • Да бисте онемогућили контролу тока: етхтоол -А етхКс рк офф тк офф

НАПОМЕНА
Морате имати партнера за везу са способном контролом тока да бисте успешно омогућили контролу тока.
4.6 Јумбо оквири
Када се очекивано саобраћајно окружење састоји од великих блокова података који се преносе, можда би било корисно омогућити функцију великог оквира. Подршка за Јумбо Фрамес је омогућена променом максималне јединице преноса (МТУ) на вредност већу од подразумеване вредности од 1500. Ово омогућава уређају да преноси податке у већим пакетима унутар мрежног окружења. Ова поставка може побољшати пропусност и смањити искоришћеност ЦПУ-а за велика И/О радна оптерећења. Међутим, то може утицати на мале пакете или радна оптерећења осетљива на кашњење.
НАПОМЕНА
Јумбо оквири или веће МТУ поставке морају бити правилно конфигурисане у вашем мрежном окружењу.
Користите команду ифцонфиг да повећате МТУ величину. Фор екampле, унесите следеће, где је број интерфејса: ифцонфиг мту 9000 уп
Алтернативно, можете користити ип команду на следећи начин: ип линк сет мту 9000 дев ип линк сетуп дев

Подешавање платформе (и40е неспецифично)

5.1 БИОС подешавања

  • Омогућите Интел® ВТ-д за радна оптерећења виртуелизације.
  • Хипер-тхреадинг (логички процесори) може утицати на перформансе. Експериментишите са њим укљученим или искљученим за своје радно оптерећење.
  • Интел® Турбо Боост омогућава језгрима ЦПУ-а да раде на вишој фреквенцији од основне фреквенције ЦПУ-а. Омогућавање Интел® Турбо Боост-а може побољшати перформансе за многа радна оптерећења, али троши више енергије да би језгра одржала на вишој фреквенцији. Експериментишите са искљученим/укљученим Турбо Боост-ом за своје радно оптерећење.

НАПОМЕНА
Турбо фреквенције нису загарантоване ако платформа доживљава високу укупну искоришћеност ЦПУ-а. Више турбо фреквенције језгра се смањују како се укупна искоришћеност ЦПУ-а повећава.
5.2 Управљање напајањем
Управљање напајањем може утицати на перформансе, посебно у радним оптерећењима са малим кашњењем. Ако су перформансе већи приоритет од смањења потрошње енергије, Интел препоручује да експериментишете са ограничавањем ефеката управљања напајањем. Постоји много различитих начина да се ограничи управљање напајањем, путем алатки оперативног система, БИОС поставки и параметара покретања кернела. Изаберите најбољи метод и ниво који одговара вашем окружењу.
5.2.1 Контрола Ц-државе
Ограничавање уласка у Ц-стање на ЦО или Ц1 побољшава перформансе и повећава коришћење енергије.
Онемогућавање уноса стања ЦПУ пакета Ц6 може побољшати перформансе мреже. Међутим, ово повећава потрошњу енергије.
Доступне су следеће опције:

  • Динамички контролишите унос Ц-стања:
    Отвори
    /дев/цпу_дма_латенци и у њега упишите максимално дозвољено кашњење.

НАПОМЕНА
Постоји мали програм који се зове цпудмалатенци.ц који се може преузети из заједнице отвореног кода, компајлирати и покренути из командне линије да би се урадио управо то.
Следећи прampле омогућава пет μс времена буђења, и на тај начин омогућава унос Ц1: цпудмалатенци 5 &

  • Ограничите максимално Ц-стање у подешавањима покретања кернела:
    За Интел ЦПУ: интел_идле.мак_цстатес=1
    За процесоре који нису Интел: процессор.мак_цстатес=1
  • Користите команду цпуповер да проверите и онемогућите ЦПУ Ц6 стање: Проверите: цпуповер монитор или цпуповер идле-инфо
    Онемогућите Ц6: цпуповер идле-сет -д3 или
    Онемогући Ц-Стате: цпуповер идле-сет -Д0

напомене:

  1. Онемогућите Ц-стања на ЦПУ-у ако сервер има Интел® 4. Ген Интел® Ксеон® скалабилни процесор(е). Када је Хипер Тхреадинг омогућен или онемогућен, онемогућавање стања мировања (-Д0) спречава језгра да уђу у стања ниске потрошње током периода мировања и смањује кашњење за ЦПУ да пређе између стања мировања и активног стања.
  2. Управљање напајањем Интел® 4. генерације Интел® Ксеон® скалабилног процесора је изузетно агресивно. Да бисте избегли да језгра уђу у стања мале снаге, покушајте да смањите број језгара у употреби да бисте дуже остали будни (етхтоол -Л комбиновано ). Такође, повежите прекиде са одређеним језграма користећи сет ирк афинитета (најчешће са -к локалном или листом ЦПУ језгара) и осигурајте да се радно оптерећење покреће на тим истим језграма помоћу скупа задатака или нумацтл. Ово побољшава перформансе тако што одржава језгра активним и оптимизује руковање прекидима.

Омогући Ц6:
цпуповер идле-сет -д3
Омогући Ц-Стате:
цпуповер идле-сет -Е

  • Други метод је коришћење прилагођеног алата (који је укључен у многе Линук дистрибуције) за постављање професионалца за перформансеfile. Ови проfileс измените неколико поставки ОС-а које могу утицати на перформансе многих апликација. Утврђено је да мрежни проток проfile обезбеђује побољшање већине радних оптерећења.
    Проверите:
    тунед-адм активан
    Сет:
    тунед-адм проfile мрежни проток
    НАПОМЕНА
    Подешени сервис мора да ради за горе наведене команде. За проверу/поновно покретање, подешено: системцтл статус подешено системцтл рестарт тунед
    Такође можете да забраните било који унос Ц-стања додавањем следећег у линију за покретање кернела:
    идле=полл
  • Ограничите Ц-стање кроз системске поставке управљања напајањем БИОС-а, које би могле имати професионалне перформансеfile доступан.
    Алати као што су турбостат или к86_енерги_перф_полици могу се користити за проверу или подешавање подешавања управљања напајањем.

5.2.2 ПЦИе управљање напајањем
Управљање напајањем у активном стању (АСПМ) омогућава ниже стање напајања за ПЦИе везе када нису у активној употреби. Ово може да изазове веће кашњење на ПЦИе мрежним уређајима, па Интел препоручује да онемогућите АСПМ за радна оптерећења осетљива на кашњење. Онемогућите АСПМ додавањем следећег у линију за покретање кернела: пцие_аспм=офф
5.2.3 Скалирање фреквенције процесора
Скалирање фреквенције процесора (или скалирање брзине процесора) је Линук техника управљања напајањем у којој се брзина системског такта прилагођава у ходу ради уштеде енергије и топлоте. Баш као и Ц-стања, ово може изазвати нежељено кашњење на мрежним везама.
Алат цпуповер се такође може користити за проверу и измену подразумеваних и ограничења перформанси процесора:

  • Проверите: цпуповер монитор или
  • Подесите ЦПУ на режим перформанси: цпуповер фреквенција-сет -г перформансе

НАПОМЕНА
Измене ограничења фреквенције процесора могу да утичу на многа радна оптерећења и могу да онемогуће друге функције, као што је ЦПУ турбо режим.
Да бисте онемогућили скалирање фреквенције процесора, онемогућите услугу напајања процесора следећим командама:
системцтл стоп цпуповер.сервице
системцтл онемогући цпуповер.сервице
5.2.4 Додатна упутства за управљање напајањем
Додатни детаљи су дати у овом високом нивоуview многих функција управљања напајањем у 3. генерацији Интел® Ксеон® Сцалабле процесора, као и упутства о томе како се ове функције могу интегрисати на нивоу платформе: https://networkbuilders.intel.com/solutionslibrary/power-management-technologyoverview-technology-guide
5.3 Интел® Турбо Боост
Интел® Турбо Боост чини процесор бржим када је то потребно, али може да троши додатну енергију. Искључивање Турбо Боост-а одржава процесор на сталној брзини, дајући вам доследан ниво перформанси за одређена радна оптерећења.
5.4 Заштитни зидови
Заштитни зидови могу утицати на перформансе, посебно на перформансе кашњења.
Онемогућите иптаблес/фиреваллд ако није потребно.
5.5 Подешавања апликације
Често једна нит (која одговара једном мрежном реду) није довољна за постизање максималног пропусног опсега. Неке архитектуре платформе, као што је АМД, имају тенденцију да одбаце више Рк пакета са једном нити у поређењу са платформама са процесорима заснованим на Интел-у.
Размислите о коришћењу алата као што су скуп задатака или нумацтл да бисте закачили апликације на НУМА чвор или ЦПУ језгра локално на мрежни уређај. За нека оптерећења као што је улаз/излаз за складиштење, премештање апликације на нелокални чвор пружа предност.
Експериментишите са повећањем броја нити које ваша апликација користи ако је могуће.
5.6 Верзија кернела
Већина модерних ин-бок кернела је прилично добро оптимизована за перформансе, али, у зависности од вашег случаја употребе, ажурирање кернела може да обезбеди побољшане перформансе. Преузимање извора такође вам омогућава да омогућите/онемогућите одређене функције пре изградње кернела.
5.7 Подешавања оперативног система/кернела
Консултујте водиче за подешавање оперативног система, као што је Ред Хат Ентерприсе Линук водич за подешавање перформанси мреже, за више увида у опште подешавање оперативног система.
Неки уобичајени параметри за подешавање су наведени у следећој табели. Имајте на уму да су ово само предложене почетне тачке и да њихова промена са подразумеваних вредности може повећати ресурсе који се користе у систему. Иако повећање вредности може помоћи у побољшању перформанси, неопходно је експериментисати са различитим вредностима да бисте утврдили шта најбоље функционише за дати систем, оптерећење и тип саобраћаја.
Параметри језгра се могу конфигурисати помоћу сисцтл услужног програма у Линук-у као што је наведено у наставку.
То view подразумеване вредности за рмем и вмем на систему:
сисцтл нет.цоре.рмем_дефаулт
сисцтл нет.цоре.вмем_дефаулт
Подесите вредности на максимум (16 МБ):
сисцтл -в нет.цоре.рмем_мак=16777216
сисцтл -в нет.цоре.вмем_мак=16777216
Величине бафера утичнице, познате и као бафер за пријем (рмем) и бафер за пренос (вмем), су системски параметри који одређују количину меморије резервисане за долазни и одлазни мрежни саобраћај.
Покретање сисцтл-а без аргумента -в наводи параметар са његовом тренутном поставком.

Стацк Сеттинг Опис
нет.цоре.рмем_дефаулт Подразумевана величина прозора за пријем
нет.цоре.вмем_дефаулт Подразумевана величина прозора за пренос
нет.цоре.рмем_мак Максимална величина прозора за пријем
нет.цоре.вмем_мак Максимална величина прозора за пренос
нет.цоре.оптмем_мак Максимална опција меморијских бафера
нет.цоре.нетдев_мак_бацклог Заостатак необрађених пакета пре него што кернел почне да се испушта
нет.ипв4.тцп_рмем Меморијски резервар за ТЦП бафере за читање
нет.ипв4.тцп_вмем Меморијски резервар за ТЦП бафере за слање

Параметри кернела, мрежног стека, руковања меморијом, брзине процесора и управљања напајањем могу имати велики утицај на перформансе мреже. Уобичајена препорука је да се примените на мрежни пропусни проfile користећи тунед команду. Ово мења неколико подешавања ОС-а да би се дала предност мрежним апликацијама.
Проверите:
тунед-адм активан
Сет:
тунед-адм проfile мрежни проток
5.8 Заостатак мрежних уређаја
Ова функција помаже у побољшању перформанси мреже ефективним управљањем долазним саобраћајем, смањењем губитка пакета, смањењем кашњења и повећањем протока. Ово доводи до бољег корисничког искуства и бржег одговора система.
Подразумевано је омогућено у већини Линук оперативних система. Да бисте проверили подразумевану вредност:
сисцтл нет.цоре.нетдев_мак_бацклог
Максимална вредност за нетдев_мак_бацклог може да варира у зависности од фактора као што су верзија кернела, хардвер, меморија и радно оптерећење. У многим случајевима, 8192 се сматра добром вредношћу. сисцтл -в нет.цоре.нетдев_мак_бацклог=8192
5.9 Конфигурације и подешавања специфичне за платформу
5.9.1 Интел® Ксеон® скалабилни процесори 4. генерације

Управљање напајањем Интел® 4. генерације Интел® Ксеон® Сцалабле процесора је изузетно агресивно у поређењу са Интел® Ксеон® Сцалабле процесорима треће генерације. Да бисте избегли да језгра уђу у стања мале снаге, покушајте да смањите број језгара у употреби да бисте дуже остали будни.
Препоручене Биос поставке за најбоље перформансе

  1. Омогућавање/онемогућавање хипер-нитности (на основу захтева радног оптерећења и циљева перформанси) на ЦПУ-у.
  2. Подесите систем проfile до Перформансе за максималне перформансе.
    НАПОМЕНА
    Ово резултира већом потрошњом енергије
  3. Подесите управљање напајањем ЦПУ-а на Максималне перформансе да бисте дали приоритет максималним перформансама ЦПУ-а у односу на енергетску ефикасност.
  4. Омогућите Турбо Боост. Онемогућавање Турбо Боост-а у поставкама системског БИОС-а обично спречава ЦПУ да динамички повећава брзину такта изнад своје основне фреквенције.
  5. НАПОМЕНА
    Онемогућавање Турбо Боост-а може бити погодно за одређене случајеве употребе где су доследне перформансе, ефикасност енергије или управљање топлотом приоритет у односу на максималне перформансе.
  6. Искључите функцију виртуелизације једног корена И/О (СР-ИОВ) ако систем не користи технологије виртуелизације.
  7. Онемогућите Ц-стања да бисте упутили ЦПУ да остане активан и спречи улазак у дубља стања мировања.
  8. Онемогућите Ц1Е да бисте осигурали да ЦПУ остане активан и да не уђе у стање мировања Ц1Е.
  9. Поставите неосновну фреквенцију на максимум да бисте наложили систему да ради на највишој доступној фреквенцији.
  10. На Делл платформама, подесите емулацију вишеструке АПИЦ описне табеле (МАДТ) на Линеар (или Роунд-Робин у зависности од БИОС-а) да бисте обезбедили јасно и предвидљиво мапирање ЦПУ језгара.

Препоручена подешавања на нивоу ОС за оптимизоване перформансе

  1. Подесите регулатор скалирања ЦПУ фреквенције на перформансе. цпуповер фреквенција-сет -г перформансе цпуповер фреквенција-инфо
  2. Онемогућите Ц-Стате. цпуповер идле-сет -Д0
  3. Подесите основне Рк (рмем) и Тк (вмем) бафере на максималну вредност. сисцтл -в нет.цоре.рмем_мак=16777216 сисцтл -в нет.цоре.вмем_мак=16777216
  4. Подесите заостатак мрежног уређаја. сисцтл -в нет.цоре.нетдев_мак_бацклог=8192
  5. Сет тунед проfile (оптерећење зависи од пропусности/кашњења).
    тунед-адм проfile мрежни проток

Препоручена подешавања нивоа адаптера за оптимизоване перформансе

  1. Ограничите број редова за коришћење за саобраћај апликације. Користите минимални број редова потребних да придружена ЦПУ језгра буду активна како бисте их спречили да уђу у дубља стања мировања (прилагодите радно оптерећење): етхтоол -Л комбиновано 32
  2. Подесите стопу модерирања прекида. етхтоол -Ц адаптиве-рк офф адаптиве-тк офф рк-усецс-хигх 50 рк-усецс 50 тк-усецс 50
    Покушајте да подесите тајмер за обједињавање одашиљања/пријема/високог приоритета на више (80/100/150/200) или ниже (25/20/10/5) да бисте пронашли оптималну вредност за радно оптерећење.
  3. Подесите величине Рк/Тк прстена. етхтоол -Г рк 4096 тк 4096
    НАПОМЕНА
    Ако видите да Рк пакет пада са етхтоол -С| греп дроп, покушајте да смањите величину прстена на <4096. Покушајте да пронађете оптималну вредност за радно оптерећење где се пакети не испуштају.
  4. Подесите ИРК афинитет. Користите локална језгра на НИЦ-у или специфично мапирање језгра (где је # језгра једнако броју редова постављеним у 1 на страни 26. системцтл стоп иркбаланце сет_ирк_аффинити -Кс локални ИЛИ сет_ирк_афинити -Кс

5.9.2 АМД ЕПИЦ
АМД ЕПИЦ процесори су моћни процесори направљени за сервере и центре података, изграђени на АМД-овој Зен архитектури. Подешавања у наставку су из АМД-ове 4. генерације ЕПИЦ серије.
Препоручене поставке БИОС-а за највеће перформансе

  1. Омогућите прилагођени режим да бисте омогућили корисницима да прилагоде перформансе процесора, потрошњу енергије и друга подешавања. Ово помаже у фином подешавању система за најбољи баланс између перформанси и енергетске ефикасности.
  2. Омогућите повећање перформанси језгра да бисте омогућили ЦПУ-у да аутоматски повећа своју брзину за обављање интензивнијих задатака, побољшавајући укупне перформансе.
  3. Онемогућите глобалну контролу Ц-стања, да спречите ЦПУ да уђе у дубља стања уштеде енергије позната као Ц-стања, која могу да одрже одзив.
    НАПОМЕНА
    Онемогућавање Ц-стања може довести до додатне потрошње енергије и повећања термичких температура. Надгледајте оба ради оптерећења.
  4. Омогућите/онемогућите Симултанеоус Мултитхреадинг (СМТ) на ЦПУ-у, на основу захтева радног оптерећења и циљева перформанси. СМТ је еквивалентан Хипер Тхреадинг-у на Интеловим процесорима.
    НАПОМЕНА
    За оптимизоване перформансе, погледајте Подешавање поставки драјвера и40е на страници 13 и Подешавање платформе (и40е неспецифично) на страници 19 за препоручено подешавање на нивоу ОС и адаптера.

Адаптер Бондинг

Линук повезивање је моћна карактеристика која може значајно побољшати перформансе мреже, редундантност и толеранцију грешака у серверским окружењима. Међутим, важно је напоменути да за правилно функционисање захтева компатибилан мрежни хардвер и одговарајућу конфигурацију и на серверу и на комутатору.
Драјвер за повезивање у Линук-у вам омогућава да агрегирате више физичких мрежних интерфејса у повезани интерфејс. Овај повезани интерфејс се појављује као јединствен виртуелни мрежни интерфејс за оперативни систем и апликације.
НАПОМЕНА
Веза је логички интерфејс, тако да није могуће подесити афинитет ЦПУ директно на интерфејсу везе (нпр.ampле, бонд0). То јест, нема директну контролу над руковањем прекидима или афинитетом ЦПУ-а. ЦПУ афинитет мора бити конфигурисан за основне интерфејсе који су део везе.
Везивање пружа неколико начина рада, од којих сваки има своје карактеристике.

Режим  Тип
0 Роунд Робин
1 Ацтиве Бацкуп
2 КСОР
3 Броадцаст
4 ЛАЦП
5 Баланс оптерећења преноса
6 Прилагодљиви баланс оптерећења

Постоје различите методе за стварање везе у Линуку. Једна од најчешћих метода је коришћење мрежне конфигурације fileс (нпрampле, /етц/нетворк/ интерфејси или /етц/сисцонфиг/нетворк-сцриптс/ифцфг-бондКс).
Конфигурација Коришћењем мрежне конфигурације Files
Следећи кораци стварају повезивање кроз конфигурацију мреже files.

  1. Изаберите два или више НИЦ портова за повезивање (нпрampле, етхКс и етхИ)
  2. Отворите НИЦ конфигурацију Fileс под /етц/сисцонфиг/нетворк-сцриптс/ за потребан НИЦ интерфејс (нпр.ampле, ви ифцфг-етхКс и ви ифцфг-етхИ) и приложите следећи текст:
    МАСТЕР=обвезницаН [Напомена: Н је цео број за помињање броја обвезнице.] СЛАВЕ=да
  3. Креирајте мрежну скрипту веза file користећи ви /етц/сисцонфиг/нетворксцриптс/ифцфг-бондН и унесите следећи текст:
    ДЕВИЦЕ=везаН [Напомена: Н је цео број за помињање броја везе] ОНБООТ=да УСЕРЦТЛ=не БООТПРОТО=дхцп (или) нема
    ИПАДДР=200.20.2.4 [обавезно ако БООТПРОТО=нема] НЕТМАСК=255.255.255.0 [обавезно ако БООТПРОТО=нема] НЕТВОРК=200.20.2.0 [обавезно ако БООТПРОТО=нема] БРОАДЦАСТ.200.20.2.255 захтева1 ако је потребно.100 БООТПРОТО=ноне] БОНДИНГ_ОПТС=”моде=XNUMX миимон=XNUMX″
    НАПОМЕНА
    Режим може бити било који цео број од 0 до 6 на основу захтева.
  4. Поново покрените мрежне услуге помоћу сервисног поновног покретања мреже или системцтл рестартовања НетворкМанагер.сервице

Решавање проблема са перформансама

7.1 Коришћење ЦПУ-а
Проверите искоришћеност ЦПУ-а по језгру док је радно оптерећење покренуто.
Имајте на уму да је коришћење по језгру релевантније за перформансе него укупна искоришћеност ЦПУ-а јер даје идеју о коришћењу ЦПУ-а по мрежном реду. Ако имате само неколико нити које покреће мрежни саобраћај, можда ћете користити само неколико језгара. Међутим, ако су та језгра на 100%, онда је пропусност ваше мреже вероватно ограничена коришћењем ЦПУ-а и време је да извршите следеће:

  1. Подесите модерацију ИРК/величину звона као што је детаљно описано у Интеррупт Модератион.
  2. Повећајте број нити апликације да бисте распоредили оптерећење ЦПУ-а на више језгара. Ако сва језгра раде на 100% онда би ваша апликација могла бити везана за ЦПУ, а не за мрежу.

Уобичајени алати:

  • топ
    — Притисните 1 да проширите листу ЦПУ-а и проверите који се користе.
    — Обратите пажњу на ниво искоришћености.
    — Обратите пажњу који процеси су наведени као најактивнији (врх листе).
  • мпстат
    Следећи прampле командна линија је тестирана на Ред Хат Ентерприсе Линук 7.к.
    Приказује искоришћеност ЦПУ-а по језгру (проналажењем укупног процента у мировању и одузимањем од 100) и истиче вредности изнад 80% црвеном бојом. мпстат -П СВЕ 1 1 | греп -в Просечно | реп -н +5 | глава -н -1 | авк '{принт (100-$13)}' | егреп -цолор=алваис '[^\.][8-9][0-9][\.]?.*|^[8-9][0-9][\.]?.*| 100|' | колона
  • перф топ Потражите где се циклуси троше.

7.2 и40е Бројачи
и40е драјвер пружа дугу листу бројача за отклањање грешака у интерфејсу и надгледање преко етхтоол -С етхКс команде. Може бити корисно гледати излаз док је радно оптерећење покренуто и/или упоредити вредности бројача пре и после покретања радног оптерећења.

  • Да бисте добили пуну копију и40е бројача: етхтоол -С етхКс
  • Да бисте гледали само бројаче који нису нула: ватцх -д (етхтоол -С етхКс) | егреп -в :\ 0 | колона
    Неке ствари које треба тражити:
  • рк_дроппед значи да ЦПУ не опслужује бафере довољно брзо.
  • порт.рк_дроппед значи да нешто није довољно брзо у слоту/меморији/ систему.

7.3 Мрежни бројачи
Проверите нетстат -с пре/после покретања радног оптерећења.
Нетстат прикупља информације о мрежи са свих мрежних уређаја у систему. Због тога на резултате могу утицати мреже које нису мреже која се тестира. Излаз из нетстат -с може бити добар показатељ проблема са перформансама у Линук оперативном систему или кернелу. Консултујте водиче за подешавање оперативног система, као што је Ред Хат Ентерприсе Линук водич за подешавање перформанси мреже, за више увида у опште подешавање оперативног система.
7.4 Системски дневники
Проверите системске дневнике за грешке и упозорења (/вар/лог/мессагес, дмесг).
7.5 Интел свр-инфо алат
Интел обезбеђује свр-инфо алат (погледајте https://github.com/intel/svr-info) за Линук који хвата релевантне детаље о хардверу и софтверу са сервера. свр-инфо излаз може бити изузетно користан за идентификацију уских грла у систему или подешавања/подешавања која нису оптимизована за радно оптерећење. Када отварате случај подршке са Интелом за проблеме са перформансама у вези са Етхернетом, обавезно укључите излаз свр-инфо (текст file) за сваки Линук сервер у тест конфигурацији.

  1. Преузмите и инсталирајте свр-инфо:
    вгет -кО- https://github.com/intel/svr-info/releases/latest/download/svrinfo.tgz| тар квз цд свр-инфо
    ./свр-инфо
    > име хоста.ткт
  2. Сакупите излаз:
    ./свр-инфо > име хоста.ткт
  3. Приложите један текст (.ткт) file за сваки сервер вашем Интеловом случају подршке ради анализе.

Препоруке за заједничке сценарије учинка

8.1 ИП прослеђивање

  • Ажурирајте кернел.
    Неки новији кернели у дистрибуцији су погоршали перформансе рутирања због промена језгра у коду за рутирање почевши од уклањања кеша за рутирање због безбедности. Недавна језгра ван дистрибуције треба да имају закрпе које ублажавају утицај ових промена на перформансе и могу да обезбеде побољшане перформансе.
  • Онемогућите хипер-нитовање (логичка језгра).
  • Уредите параметре покретања кернела.
    — Искључите иомму (интел_иомму=искључено или иомму=искључено) из линије за покретање кернела осим ако није потребно за виртуелизацију
    — Искључите управљање напајањем: процессор.мак_цстатес=1 идле=полл пцие_аспм=офф
  • Ограничите број редова тако да буде једнак броју језгара на локалној утичници (12 у овом пр.ampле). етхтоол -Л етхКс комбиновано 12
  • Пин прекида само у локалној утичници. сет_ирк_аффинити -Кс локални етхКс ИЛИ сет_ирк_аффинити -Кс локални етхКс
    НАПОМЕНА
    -Кс или -к се могу користити у зависности од оптерећења.
  • Промените величине Тк и Рк прстена по потреби. Већа вредност захтева више ресурса, али може да обезбеди боље стопе прослеђивања. етхтоол -Г етхКс рк 4096 тк 4096
  • Онемогућите ГРО приликом рутирања.
    Због познатог проблема с кернелом, ГРО мора бити искључен приликом рутирања/прослеђивања. етхтоол -К етхКс гро офф где је етхКс Етхернет интерфејс који треба модификовати.
  • Онемогућите модерирање адаптивног прекида и поставите статичку вредност. етхтоол -Ц етхКс адаптиве-рк офф адаптиве-тк офф етхтоол -Ц етхКс рк-усецс 64 тк-усецс 64

НАПОМЕНА
У зависности од типа процесора и радног оптерећења, параметри спајања за РКС и ТКС могу да се подесе ради побољшања перформанси (или мањег губитка оквира).

  • Онемогућите заштитни зид. судо системцтл дисабле фиреваллд судо системцтл стоп фиреваллд
  • Омогућите ИП прослеђивање. сисцтл -в нет.ипв4.ип_форвард=1
  • Конфигуришите максималне вредности за величине бафера утичнице за пријем и слање. сисцтл -в нет.цоре.рмем_мак=16777216 сисцтл -в нет.цоре.вмем_мак=16777216

НАПОМЕНА
У зависности од радног оптерећења или захтева, ове вредности се могу променити од подразумеваних.
8.2 Мала латенција

  • ИСКЉУЧИТЕ хипер-тхреадинг (логичка језгра).
  • Уверите се да је мрежни уређај локални на нума цоре 0.
  • Закачите бенцхмарк на језгро 0 помоћу скупа задатака -ц 0.
  • Искључите иркбаланце помоћу системцтл стоп иркбаланце или системцтл онемогућите иркбаланце
  • Покрените скрипту афинитета за ширење по језграма. Покушајте локално или све.
  • Искључите модерирање прекида. етхтоол -Ц етхКс рк-усецс 0 тк-усецс 0 адаптиве-рк офф адаптиве-тк офф ркусецс- хигх 0
  • Ограничите број редова да буде једнак броју језгара на локалној утичници (32 у овом пр.ampле). етхтоол -Л етхКс комбиновано 32
  • Пин прекида само у локалној утичници (скрипта упакована са извором драјвера и40е). сет_ирк_афинити -Кс локални етхКс
  • Користите утврђени стандард као што је нетперф -т ТЦП_РР, нетперф -т УДП_РР или НетПипе. нетперф -т ТЦП_РР или нетперф -т УДП_РР
  • Закачите бенцхмарк на једно језгро у локалном НУМА чвору. скуп задатака -ц

Интел® Етхернет 700 серија
Водич за подешавање перформанси Линук-а
децембар 2024
Доц. бр.: 334019, рев.: 1.2

Документи / Ресурси

Подешавање перформанси Линук серије Интел Етхернет 700 [пдф] Упутство за кориснике
334019, Етхернет 700 серија Линук подешавање перформанси, Етхернет 700 серија, подешавање Линук перформанси, подешавање перформанси, подешавање

Референце

Оставите коментар

Ваша емаил адреса неће бити објављена. Обавезна поља су означена *