ټیلی میټری په جونوس کې د AI/ML کاري بارونو لپاره
لیکواله: شالیني موکرجي
پیژندنه
لکه څنګه چې د AI کلستر ټرافیک د لوړې کچې او ټیټ ځنډ سره بې ضرر شبکې ته اړتیا لري، د AI شبکې یو مهم عنصر د څارنې معلوماتو راټولول دي. د جونوس ټیلی میټری د فعالیت د کلیدي شاخصونو دقیقې څارنې ته وړتیا ورکوي، پشمول د ګڼې ګوڼې مدیریت او د ټرافیک بار توازن لپاره حدونه او کاونټرونه. د gRPC ناستې د ټیلی میټري ډیټا جریان ملاتړ کوي. gRPC یو عصري، خلاصې سرچینې، د لوړ فعالیت چوکاټ دی چې په HTTP/2 ټرانسپورټ کې جوړ شوی. دا د اصلي دوه اړخیز سټیمینګ وړتیاوې پیاوړي کوي او د غوښتنې سرلیکونو کې د انعطاف وړ دودیز میټاډاټا شامل دي. په ټیلی میټری کې لومړنی ګام دا دی چې پوه شي چې کوم معلومات باید راټول شي. بیا موږ کولی شو دا معلومات په مختلف شکلونو کې تحلیل کړو. یوځل چې موږ معلومات راټول کړو، نو دا مهمه ده چې دا په داسې بڼه کې وړاندې کړئ چې د څارنې، پریکړې کولو او وړاندیز شوي خدماتو ته وده ورکول اسانه وي. په دې مقاله کې، موږ د ټیلیګراف، انفلوکس ډی بی، او ګرافانا څخه د ټیلی میټری سټیک کاروو. دا ټیلی میټری سټیک د پش ماډل په کارولو سره ډاټا راټولوي. دودیز پل موډلونه د منابعو ژور دي، لاسي مداخلې ته اړتیا لري، او کیدای شي د معلوماتو تشې په هغه معلوماتو کې شاملې کړي چې دوی یې راټولوي. پش موډلونه په غیر متناسب ډول ډیټا وړاندې کولو سره دا محدودیتونه لرې کوي. دوی د کاروونکي دوستانه کارولو له لارې ډاټا بډایه کوي tags او نومونه. یوځل چې ډاټا په ډیر لوستلو وړ شکل کې وي، موږ یې په ډیټابیس کې ذخیره کوو او په متقابل لید کې یې کاروو web د شبکې تحلیل لپاره غوښتنلیک. شکل. 1 موږ ته ښیې چې دا سټیک څنګه د مؤثره ډیټا راټولولو ، ذخیره کولو او لید لپاره ډیزاین شوی ، د شبکې وسیلو څخه راټولونکي ته ډیټا فشاروي ترڅو ډیټا د تحلیل لپاره په ډشبورډونو کې ښودل کیږي.
د TIG سټیک
موږ د TIG سټیک په شمول ټول سافټویر نصبولو لپاره د اوبنټو سرور کارولی.
ټیلګراف
د معلوماتو راټولولو لپاره، موږ په اوبنټو سرور کې ټیلګراف کاروو چې 22.04.2 چلوي. په دې ډیمو کې د ټیلګراف نسخه روانه ده 1.28.5.
ټیلګراف د میټریکونو راټولولو او راپور ورکولو لپاره د پلگ ان لخوا پرمخ وړل شوي سرور اجنټ دی. دا پروسیسر کاروي plugins د معلوماتو بډایه او نورمال کولو لپاره. محصول plugins د دې معلوماتو مختلف ډیټا پلورنځیو ته لیږلو لپاره کارول کیږي. پدې سند کې موږ دوه کاروو plugins: یو د Openconfig سینسرونو لپاره او بل د جونیپر اصلي سینسرونو لپاره.
InfluxDB
د وخت لړۍ ډیټابیس کې د معلوماتو ذخیره کولو لپاره، موږ انفلوکس ډی بی کاروو. په Telegraf کې د محصول پلگ ان معلومات InfluxDB ته لیږي، کوم چې دا په خورا اغیزمن ډول ذخیره کوي. موږ V1.8 کاروو ځکه چې د V2 او پورته لپاره هیڅ CLI شتون نلري.
ګرافانا
ګرافانا د دې معلوماتو لید لپاره کارول کیږي. ګرافانا د InfluxDB څخه ډاټا راوباسي او کاروونکو ته اجازه ورکوي چې بډایه او متقابل ډشبورډونه رامینځته کړي. دلته، موږ نسخه 10.2.2 چلوو.
په سویچ کې ترتیب کول
د دې سټک د پلي کولو لپاره، موږ لومړی اړتیا لرو چې سویچ ترتیب کړو لکه څنګه چې په 2 شکل کې ښودل شوي. موږ 50051 پورټ کارولی دی. هر پورټ دلته کارول کیدی شي. د QFX سویچ ته ننوتل او لاندې ترتیب اضافه کړئ.
یادونه: دا ترتیب د لابراتوارونو / POCs لپاره دی ځکه چې پټنوم په روښانه متن کې لیږدول کیږي. د دې څخه د مخنیوي لپاره SSL وکاروئ.
چاپیریال
Nginx
دا اړینه ده که تاسو نشئ کولی هغه بندر افشا کړئ په کوم کې چې ګرافانا کوربه شوی. بل ګام د اوبنټو سرور کې د نګینکس نصب کول دي ترڅو د ریورس پراکسي اجنټ په توګه خدمت وکړي. یوځل چې nginx نصب شي، په 4 شکل کې ښودل شوي کرښې په "ډیفالټ" فایل کې اضافه کړئ او فایل له /etc/nginx څخه /etc/nginx/sites-enabled ته واړوئ.
ډاډ ترلاسه کړئ چې فایروال د نګینکس خدمت ته بشپړ لاسرسي لپاره تنظیم شوی لکه څنګه چې په 5 شکل کې ښودل شوی.
یوځل چې نګینکس نصب شي او اړین بدلونونه رامینځته شي ، موږ باید وړتیا ولرو چې له a څخه ګرافانا ته لاسرسی ومومئ web د اوبنټو سرور IP پتې په کارولو سره براوزر چیرې چې ټول سافټویر نصب شوی وي.
په ګرافانا کې یو کوچنی غلطی شتون لري چې تاسو ته اجازه نه ورکوي چې ډیفالټ پاسورډ بیا تنظیم کړئ. دا ګامونه وکاروئ که تاسو دې مسلې ته ځئ.
په ګرافانا کې د رمز تنظیم کولو لپاره په اوبنټو سرور کې ترسره شوي ګامونه:
- /var/lib/grafana/grafana.db ته لاړ شئ
- sqllite3 نصب کړئ
o sudo apt sqlite3 نصب کړئ - دا کمانډ په خپل ټرمینل کې چل کړئ
o sqlite3 grafana.db - د Sqlite کمانډ پرامپټ خلاصیږي؛ لاندې پوښتنه پرمخ وړئ:
> له هغه کارن څخه حذف کړئ چیرې چې ننوت = 'اډمین' - ګرافانا بیا پیل کړئ او د کارونکي نوم او پټنوم په توګه اډمین ټایپ کړئ. دا د نوي پټنوم غوښتنه کوي.
یوځل چې ټول سافټویر نصب شي، په ټیلګراف کې د کنفیګ فایل رامینځته کړئ کوم چې به د سویچ څخه د ټیل میټري ډیټا ایستلو کې مرسته وکړي او انفلیکس ډی بی ته یې فشار ورکړي.
Openconfig سینسر پلگ ان
په اوبنټو سرور کې، ټول اړین اضافه کولو لپاره /etc/telegraf/telegraf.conf فایل سم کړئ plugins او سینسرونه. د Openconfig سینسرونو لپاره، موږ د gNMI پلگ ان څخه کار اخلو چې په 6 شکل کې ښودل شوي. د ډیمو موخو لپاره، کوربه نوم د "spine1" په توګه اضافه کړئ، د پورټ شمیره "50051" چې د gRPC لپاره کارول کیږي، د سویچ کارونکي نوم او پټنوم، او شمیره د ناکامۍ په صورت کې د بیا ځل لپاره د ثانیو.
د ګډون په بند کې، د دې ځانګړي سینسر لپاره یو ځانګړی نوم، "cpu" اضافه کړئ، د سینسر لاره، او د سویچ څخه د دې ډاټا د نیولو لپاره وخت وقفه. د ټولو خلاص کنفیګ سینسرونو لپاره ورته پلگ ان inputs.gnmi او inputs.gnmi.subscription اضافه کړئ. (شکل 6)
د اصلي سینسر پلگ ان
دا د جونیپر ټیلی میټری انٹرفیس پلگ ان دی چې د اصلي سینسرونو لپاره کارول کیږي. په ورته telegraf.conf فایل کې، د اصلي سینسر پلگ ان inputs.jti_openconfig_telemetry اضافه کړئ چیرې چې ساحې تقریبا د openconfig په څیر دي. د هر سینسر لپاره د ځانګړي پیرودونکي ID وکاروئ؛ دلته، موږ "telegraf3" کاروو. د دې سینسر لپاره دلته کارول شوی ځانګړی نوم "میم" دی (7 شکل).
په نهایت کې ، د دې سینسر ډیټا InfluxDB ته د لیږلو لپاره outputs.influxdb د محصول پلگ ان اضافه کړئ. دلته، ډیټابیس د "telegraf" په نوم نومول شوی د کارن نوم سره د "انفلیکس" او پټنوم "انفلوکس ډی بی" (8 شکل).
یوځل چې تاسو د telegraf.conf فایل ایډیټ کړئ، د ټیلګراف خدمت بیا پیل کړئ. اوس، په InfluxDB CLI کې وګورئ ترڅو ډاډ ترلاسه کړئ چې اندازه کول د ټولو ځانګړي سینسرونو لپاره رامینځته شوي. InflaxDB CLI ته د ننوتلو لپاره "انفلیکس" ټایپ کړئ.
لکه څنګه چې په انځور کې لیدل کیږي. 9، د انفلوکس ډی بی پرامپټ داخل کړئ او ډیټابیس "ټیلیګراف" وکاروئ. سینسر ته ورکړل شوي ټول ځانګړي نومونه د اندازه کولو په توګه لیست شوي.
د هرې یوې اندازه کولو محصول لیدلو لپاره، یوازې د دې لپاره چې ډاډ ترلاسه کړئ چې د ټیلګراف فایل سم دی او سینسر کار کوي، د "select * from cpu limit 1" کمانډ وکاروئ لکه څنګه چې په 10 شکل کې ښودل شوي.
هرکله چې د telegraf.conf فایل کې بدلونونه راشي، ډاډ ترلاسه کړئ چې InfluxDB ودروئ، Telegraf بیا پیل کړئ، او بیا InfluxDB پیل کړئ.
د براوزر څخه ګرافانا ته ننوتل او ډشبورډونه رامینځته کړئ وروسته له دې چې ډاډ ترلاسه کړئ چې معلومات په سمه توګه راټول شوي.
اړیکو ته لاړ شئ> InfuxDB> د معلوماتو نوې سرچینه اضافه کړئ.
- د دې معلوماتو سرچینې ته نوم ورکړئ. په دې ډیمو کې دا "ازموینه-1" ده.
- د HTTP سټانزا لاندې ، د اوبنټو سرور IP او 8086 بندر وکاروئ.
- د InfluxDB توضیحاتو کې ، د ورته ډیټابیس نوم ، "ټیلیګراف" وکاروئ او د اوبنټو سرور کارونکي نوم او پټنوم چمتو کړئ.
- کلیک وکړئ خوندي کړئ او ازموینه وکړئ. ډاډ ترلاسه کړئ چې تاسو پیغام وګورئ، "بریالی".
- یوځل چې د معلوماتو سرچینه په بریالیتوب سره اضافه شي ، ډشبورډ ته لاړشئ او نوي کلیک وکړئ. راځئ چې یو څو ډشبورډونه جوړ کړو چې د مدیر حالت کې د AI/ML کاري بارونو لپاره اړین دي.
Exampد سینسر ګرافونه
لاندې مثالونه ديampد ځینې لوی کاونټرونو لیست چې د AI/ML شبکې څارنې لپاره اړین دي.
پرسینtagد انګریس انٹرفیس لپاره کارول et-0/0/0 په سپین -1 کې
- د معلوماتو سرچینه د ټیسټ-1 په توګه وټاکئ.
- د FROM برخه کې، اندازه کول د "انټرفیس" په توګه غوره کړئ. دا یو ځانګړی نوم دی چې د دې سینسر لارې لپاره کارول کیږي.
- په چیرته برخه کې، وسیله غوره کړئ::tag، او په tag ارزښت، د سویچ کوربه نوم غوره کړئ، دا دی، spine1.
- د SELECT برخه کې، د سینسر څانګه غوره کړئ چې تاسو یې څارنه غواړئ؛ پدې حالت کې "فیلډ(/انټرفیس/انټرفیس[if_name='et-0/0/0']/state/counters/if_in_1s_octets)" غوره کړئ. اوس په ورته برخه کې، په "+" کلیک وکړئ او دا محاسبه ریاضی اضافه کړئ (/50000000000 * 100). موږ اساسا د فیصدي محاسبه کووtagد 400G انٹرفیس کارول.
- ډاډ ترلاسه کړئ چې فارمیټ د "وخت لړۍ" ده او د ALIAS برخه کې ګراف ته نوم ورکړئ.
د هرې کتار لپاره د لوړ بفر اشغال
- د معلوماتو سرچینه د ټیسټ-1 په توګه وټاکئ.
- د FROM برخه کې، اندازه کول د "بفرر" په توګه غوره کړئ.
- د WHERE برخه کې، د ډکولو لپاره درې ساحې شتون لري. وسیله غوره کړئ:tag، او په tag ارزښت د سویچ کوربه نوم غوره کړئ (د بیلګې په توګه سپین - 1)؛ او وټاکئ /cos/interfaces/interface/@name::tag او انٹرفیس غوره کړئ (یعنې et- 0/0/0)؛ او همدارنګه قطار هم وټاکئ، /cos/interfaces/interface/queues/queue/@queue::tag او د قطار شمیره 4 غوره کړئ.
- د SELECT برخه کې، د سینسر څانګه غوره کړئ چې تاسو یې څارنه غواړئ؛ په دې حالت کې "فیلډ(/cos/interfaces/interface/queues/queue/PeakBufferOccupancy) غوره کړئ."
- ډاډ ترلاسه کړئ چې فارمیټ د "وخت لړۍ" ده او د ALIAS برخه کې ګراف ته نوم ورکړئ.
تاسو کولی شئ په ورته ګراف کې د ډیری انٹرفیسونو لپاره ډیټا راټول کړئ لکه څنګه چې د et-17/0/0، et-0/0/0، et-1/0/0 وغيره لپاره په 2 شکل کې لیدل شوي.
PFC او ECN د مشتق معنی لري
د اوسط مشتق موندلو لپاره (د وخت په حد کې د ارزښت توپیر)، د خام پوښتنې حالت وکاروئ.
دا د انفلیکس پوښتنه ده چې موږ په یوه ثانیه کې د Spine-0 په et-0/0/1 کې د دوو PFC ارزښتونو تر مینځ د معنی مشتق موندلو لپاره کارولې.
مشتق وټاکئ(مطلب("/interfaces/interface[if_name='et-0/0/0′]/state/pfc-counter/tx_pkts")، 1s) له "انټرفیس" چیرته ("وسیلې"::tag = 'Spine-1') او $timeFilter ګروپ د وخت له مخې ($interval)
مشتق وټاکئ(معنی("/interfaces/interface[if_name='et-0/0/8′]/state/error-counters/ecn_ce_marked_pkts")، 1s) له "انټرفیس" چیرته ("وسیلې"::tag = 'Spine-1') او $timeFilter ګروپ د وخت له مخې ($interval)
د منابعو د داخلولو تېروتنې مطلب مشتق دی
د منابعو د تېروتنو لپاره خام پوښتنه د مشتق معنی ده:
مشتق وټاکئ(مطلب("/interfaces/interface[if_name='et-0/0/0′]/state/error-counters/if_in_resource_errors")، 1s) له "انټرفیس" چیرته ("وسیلې"::tag = 'Spine-1') او $timeFilter ګروپ د وخت له مخې ($interval)
د ټال څاڅکي د مشتق معنی لري
د tail drops لپاره خام پوښتنه د مشتق معنی ده:
مشتق وټاکئ (مطلب ("/cos/interfaces/interface/queues/queue/tailDropBytes")، 1s) له "بفر" چیرته ("وسیلې"::tag = 'Leaf-1' او "/cos/interfaces/interface/@name"::tag = 'et-0/0/0' او "/cos/interfaces/interface/queues/queue/@queue"::tag = '4') او $timeFilter ګروپ د وخت ($__interval) له مخې ډکول (نال)
د CPU کارول
- د معلوماتو سرچینه د ټیسټ-1 په توګه وټاکئ.
- د FROM برخه کې، اندازه کول د "newcpu" په توګه غوره کړئ
- په WHERE کې، د ډکولو لپاره درې ساحې شتون لري. وسیله غوره کړئ:tag او په tag ارزښت د سویچ کوربه نوم غوره کړئ (د بیلګې په توګه سپین - 1). او په / اجزاو / اجزاو / ملکیتونو / ملکیت / نوم کې:tag، او د cpuutilization-total AND په نوم غوره کړئ::tag RE0 غوره کړئ.
- د SELECT برخه کې، د سینسر څانګه غوره کړئ چې تاسو یې څارنه غواړئ. په دې حالت کې، "فیلډ (ریاست/ارزښت)" غوره کړئ.
په بټس/سیکنډ کې په څو انٹرفیسونو کې د څو سویچونو لپاره د tail drops غیر منفي مشتق موندلو لپاره خام پوښتنه.
غیر_منفی_ډیریویټیو وټاکئ(مطلب("/cos/interfaces/interface/queues/queue/tailDropBytes"), 1s)*8 د "بفر" څخه چیرته (آلې::tag =~ /^Spine-[1-2]$/) او ("/cos/interfaces/interface/@name"::tag =~ /et-0\/0\/[0-9]/ یا "/cos/interfaces/interface/@name"::tag=~/et-0\/0\/1[0-5]/) او $timeFilter ګروپ د وخت ($__interval)، وسیله::tag ډک (نال)
دا ځینې پخواني ووampد ګرافونو لست چې د AI/ML شبکې څارنې لپاره رامینځته کیدی شي.
لنډیز
دا مقاله د ټیلی میټری ډیټا ایستلو او د ګرافونو په جوړولو سره د لیدلو طریقه روښانه کوي. دا پاڼه په ځانګړې توګه د AI/ML سینسرونو په اړه خبرې کوي، دواړه اصلي او اوپن کنفیګ مګر ترتیب د هر ډول سینسرونو لپاره کارول کیدی شي. موږ د ډیری مسلو لپاره حلونه هم شامل کړي چې تاسو ممکن د تنظیم کولو پرمهال ورسره مخ شئ. په دې مقاله کې ښودل شوي ګامونه او پایلې د TIG سټیک نسخو لپاره ځانګړي دي چې مخکې یې یادونه وشوه. دا د سافټویر نسخه، سینسر او جونوس نسخه پورې اړه لري د بدلون تابع دی.
حوالې
د ټولو سینسر انتخابونو لپاره د جونیپر یانګ ډیټا ماډل اکسپلورر
https://apps.juniper.net/ydm-explorer/
د Openconfig سینسرونو لپاره د Openconfig فورم
https://www.openconfig.net/projects/models/
د کارپوریټ او پلور مرکزي دفتر
Juniper Networks, Inc.
1133 د نوښت لاره
Sunnyvale ، CA 94089 USA
تلیفون: 888. JUNIPER (888.586.4737)
یا +1.408.745.2000
فکس: +1.408.745.2100
www.juniper.net
د APAC او EMEA مرکزي دفتر
د جونیپر شبکې نړیوال BV
بوینګ ایونیو ۲۴۰
1119 PZ Schiphol-Rijk
امستردام، هالنډ
تلیفون: +31.207.125.700
فکس: +31.207.125.701
د کاپی حق 2023 جونیپر شبکې. Inc. Ail حقوق خوندي دي. د جونیپر شبکې، د جونیپر شبکې لوگو، جونیپر، جونوس او نور سوداګریزې نښې د جونیپر شبکې راجستر شوي سوداګریزې نښې دي. inc. او/یا په متحده ایالاتو او نورو هیوادونو کې د هغې ملګري. نور نومونه ممکن د دوی د اړوندو مالکینو سوداګریزې نښې وي. د جونیپر شبکې په دې سند کې د کومې غلطۍ لپاره هیڅ مسؤلیت په غاړه نه اخلي. د جونیپر شبکې د بدلون حق لري. تعدیل لیږد، یا بل ډول دا خپرونه پرته له خبرتیا څخه بیاکتنه وکړئ.
نظرونه واستوئ: design-center-comments@juniper.net V1.0/240807/ejm5-telemetry-junos-ai-ml
اسناد / سرچینې
![]() |
د AI ML کاري بارونو سافټویر لپاره جونوس کې د جونیپر شبکې ټیلی میټري [pdf] د کارونکي لارښود ټیلی میټری په جونوس کې د AI ML کاري بار سافټویر لپاره، جونوس د AI ML کاري بار سافټویر لپاره، د AI ML کاري بار سافټویر، د کار بار کولو سافټویر، سافټویر |