د NVIDIA نیمو چوکاټ
مشخصات
- د محصول نوم: د NVIDIA نیمو چوکاټ
- اغیزمن شوي پلیټ فارمونه: وینډوز، لینکس، macOS
- اغیزمن شوي نسخې: د ۲۴ څخه مخکې ټولې نسخې
- امنیتي زیانمننې: CVE-2025-23360
- د خطر ارزونې اساس نمره: ۷.۱ (سي وي ایس ایس ۳.۱)
د محصول کارولو لارښوونې
د امنیتي تازه معلوماتو نصبول:
د خپل سیسټم د ساتنې لپاره، دا ګامونه تعقیب کړئ:
- د ګیټ هب په اړه د نیمو-فریم ورک-لانچر ریلیز پاڼې څخه وروستۍ نسخه ډاونلوډ کړئ.
- د نورو معلوماتو لپاره د NVIDIA محصول امنیت ته لاړ شئ.
د امنیتي تازه معلوماتو جزئیات:
د امنیت تازه معلومات د NVIDIA NeMo چوکاټ کې هغه زیان منونکي حالت ته اشاره کوي چې کولی شي د کوډ اجرا او د معلوماتو ضایع کیدو لامل شي.ampد.
د سافټویر لوړول:
که تاسو د څانګې پخوانۍ نسخه کاروئ، نو سپارښتنه کیږي چې د امنیتي ستونزې د حل لپاره وروستي څانګې نسخه ته لوړ کړئ.
اوورview
د NVIDIA نیمو چوکاټ یو د پیمانه وړ او کلاوډ اصلي تولیدي AI چوکاټ دی چې د څیړونکو او پراختیا کونکو لپاره جوړ شوی چې کار کوي د لوی ژبې ماډلونه، څو ماډل، او د وینا AI د مثال په توګه د غږ اتومات پیژندنه او له متن څخه وینا). دا کاروونکو ته دا توان ورکوي چې د موجوده کوډ او مخکې له مخکې روزل شوي ماډل چیک پوائنټونو په کارولو سره په مؤثره توګه نوي تولیدي AI ماډلونه رامینځته کړي، تنظیم کړي او ځای په ځای کړي.
د تنظیم کولو لارښوونې: د نیمو چوکاټ نصب کړئ
د نیمو چوکاټ د لویو ژبو ماډلونو (LLMs) او څو ماډلونو (MMs) پراختیا لپاره له پای څخه تر پایه ملاتړ چمتو کوي. دا د انعطاف وړتیا چمتو کوي چې په احاطه کې، په ډیټا مرکز کې، یا ستاسو د خوښې کلاوډ چمتو کونکي سره وکارول شي. دا د SLURM یا Kubernetes فعال چاپیریالونو کې د اجرا کولو ملاتړ هم کوي.
د معلوماتو تنظیم کول
د نیمو کیوریټر [1] د پایتون کتابتون دی چې د معلوماتو کان کیندنې او مصنوعي معلوماتو تولید لپاره د ماډلونو یوه ټولګه لري. دوی د GPUs لپاره د اندازې وړ او غوره شوي دي، دوی د طبیعي ژبې معلوماتو د روزنې یا LLMs ښه کولو لپاره مثالي کوي. د NeMo کیوریټر سره، تاسو کولی شئ په مؤثره توګه د پراخه خام څخه لوړ کیفیت متن استخراج کړئ. web د معلوماتو سرچینې.
روزنه او اصلاح کول
د نیمو چوکاټ د اغیزمن روزنې او تنظیم کولو لپاره وسایل چمتو کوي LLMs او څو ماډل ماډلونه. پدې کې د کمپیوټ کلستر تنظیم، د معلوماتو ډاونلوډ کولو، او ماډل هایپر پیرامیټرونو لپاره ډیفالټ ترتیبات شامل دي، کوم چې د نوي ډیټاسیټونو او ماډلونو روزنې لپاره تنظیم کیدی شي. د مخکې روزنې سربیره، نیمو د څارل شوي فاین ټونینګ (SFT) او پیرامیټر موثر فاین ټونینګ (PEFT) تخنیکونو لکه LoRA، Ptuning، او نور ملاتړ کوي.
په نیمو کې د روزنې پیل کولو لپاره دوه انتخابونه شتون لري - د نیمو 2.0 API انٹرفیس کارول یا د نیمو رن سره.
- د نیمو رن سره (سپارښتنه شوې): نیمو رن د مختلفو کمپیوټري چاپیریالونو کې د تجربو ترتیب، اجرا او مدیریت ساده کولو لپاره یو انٹرفیس چمتو کوي. پدې کې ستاسو په کاري سټیشن کې په محلي ډول یا په لویو کلسترونو کې د دندو پیل کول شامل دي - دواړه SLURM فعال شوي یا په کلاوډ چاپیریال کې Kubernetes.
- د نیمو رن سره د روزنې دمخه او PEFT چټک پیل
- د NeMo 2.0 API کارول: دا طریقه د کوچني ماډلونو سره د ساده تنظیم سره ښه کار کوي، یا که تاسو د خپل دودیز ډیټالوډر لیکلو، د روزنې لوپونو، یا د ماډل پرتونو بدلولو کې لیوالتیا لرئ. دا تاسو ته د تشکیلاتو په اړه ډیر انعطاف او کنټرول درکوي، او د پروګرام له مخې د تشکیلاتو پراخول او تنظیم کول اسانه کوي.
-
ټراد NeMo 2.0 API سره Quickstart پیل کول
-
له NeMo 1.0 څخه NeMo 2.0 API ته لیږدول
-
السلیک
- نیمو-الاینګر [1] د موثر ماډل سمون لپاره د پیمانه وړ وسیله ده. دا وسیله د عصري ماډل سمون الګوریتمونو لکه سټیر ایل ایم، ډي پي او، د بشري فیډبیک څخه د پیاوړتیا زده کړه (RLHF)، او ډیر څه ملاتړ کوي. دا الګوریتمونه کاروونکو ته دا توان ورکوي چې د ژبې ماډلونه تنظیم کړي ترڅو ډیر خوندي، بې ضرره او ګټور وي.
- د نیمو-الاینر ټولې پوستې د نیمو ایکوسیستم سره متقابلې دي، چې د نورو دودیز کولو او استنباط کولو لپاره اجازه ورکوي.
په یوه کوچني GPT-2B ماډل کې د RLHF د ټولو دریو مرحلو ګام په ګام کاري جریان:
- د SFT روزنه
- د انعام ماډل روزنه
- د PPO روزنه
برسېره پردې، موږ د مختلفو نورو نويو سمون میتودونو ملاتړ ښکاره کوو:
- DPO: د RLHF په پرتله د سپک وزن د سمون الګوریتم د ساده ضایع فعالیت سره.
- ځان-لوبه ښه ټونینګ (سپن)
- سټېر اېل اېم: یو تخنیک چې د کنډیشنډ-SFT پر بنسټ ولاړ دی، د سټیریبل محصول سره.
د نورو معلوماتو لپاره اسناد وګورئ: د سمون اسناد
څو ماډل ماډلونه
- د نیمو چوکاټ په څو کټګوریو کې د عصري ملټي موډل ماډلونو د روزنې او ځای پرځای کولو لپاره غوره سافټویر چمتو کوي: د څو موډل ژبې ماډلونه، د لید ژبې بنسټونه، د متن څخه انځور ماډلونه، او د عصبي وړانګو ساحو (NeRF) په کارولو سره د 2D نسل څخه هاخوا.
- هره کټګوري د دې لپاره ډیزاین شوې چې په ساحه کې ځانګړي اړتیاوې او پرمختګونه پوره کړي، د متن، انځورونو او 3D ماډلونو په ګډون د معلوماتو پراخه لړۍ اداره کولو لپاره د عصري ماډلونو څخه ګټه پورته کوي.
نوټ
موږ د څو ماډلونو لپاره ملاتړ له نیمو ۱.۰ څخه نیمو ۲.۰ ته لیږدوو. که تاسو غواړئ په عین حال کې دا ډومین وپلټئ، مهرباني وکړئ د نیمو ۲۴.۰۷ (مخکیني) خپریدو لپاره اسنادو ته مراجعه وکړئ.
ځای پرځای کول او استنباط
د نیمو چوکاټ د LLM استنباط لپاره مختلفې لارې چمتو کوي، د مختلفو پلي کولو سناریوګانو او د فعالیت اړتیاو ته پاملرنه کوي.
د NVIDIA NIM سره ځای پر ځای کړئ
- د نیمو چوکاټ په بې ساري ډول د NVIDIA NIM له لارې د تشبث کچې ماډل ځای پرځای کولو وسیلو سره مدغم کیږي. دا ادغام د NVIDIA TensorRT-LLM لخوا پرمخ وړل کیږي، چې غوره شوي او د اندازې وړ استنباط ډاډمن کوي.
- د NIM په اړه د نورو معلوماتو لپاره، NVIDIA ته مراجعه وکړئ webسایټ
د TensorRT-LLM یا vLLM سره ځای پر ځای کړئ
- د نیمو چوکاټ سکریپټونه او API وړاندې کوي ترڅو ماډلونه دوه انفرنس غوره شوي کتابتونونو، ټینسر آر ټي-ایل ایل ایم او وی ایل ایل ایم ته صادر کړي، او صادر شوي ماډل د NVIDIA ټریټون انفرنس سرور سره ځای په ځای کړي.
- د هغو سناریوګانو لپاره چې مطلوب فعالیت ته اړتیا لري، د نیمو ماډلونه کولی شي د TensorRT-LLM څخه ګټه پورته کړي، چې د NVIDIA GPUs په اړه د LLM انفرنس ګړندي کولو او اصلاح کولو لپاره یو ځانګړی کتابتون دی. پدې پروسه کې د NeMo ماډلونو بدلول شامل دي چې د nemo.export ماډل په کارولو سره د TensorRT-LLM سره مطابقت لري.
- د LLM ګمارنه پای ته ورسیدهview
- د NIM سره د نیمو لوی ژبې ماډلونه ځای په ځای کړئ
- د TensorRT-LLM سره د NeMo لوی ژبې ماډلونه ځای په ځای کړئ
- د vLLM سره د نیمو لوی ژبې ماډلونه ځای په ځای کړئ
ملاتړ شوي ماډلونه
د لوی ژبې ماډلونه
د لوی ژبې ماډلونه | مخکې روزنه او SFT | پیفټ | السلیک | د FP8 روزنې همغږي | ټي آر ټي/ټي آر ټي ايل ايم | د غېږې ورکولو مخ ته او له هغې څخه بدل کړئ | ارزونه |
---|---|---|---|---|---|---|---|
لاما۳ ۸ بي/۷۰ بي، لاما۳.۱ ۴۰۵ بي | هو | هو | x | هو (په جزوي ډول تایید شوی) | هو | دواړه | هو |
مکسټرال ۸x۷B/۸x۲۲B | هو | هو | x | هو (نا تایید شوی) | هو | دواړه | هو |
نیموترون ۳ ۸B | هو | x | x | هو (نا تایید شوی) | x | دواړه | هو |
نیموترون ۳ ۸B | هو | x | x | هو (نا تایید شوی) | x | دواړه | هو |
بای چوان۲ ۷ ب | هو | هو | x | هو (نا تایید شوی) | x | دواړه | هو |
چیټ جی ایل ایم ۳ ۶ بي | هو | هو | x | هو (نا تایید شوی) | x | دواړه | هو |
جیما ۲بي/۷بي | هو | هو | x | هو (نا تایید شوی) | هو | دواړه | هو |
ګېما۲ ۲بي/۹بي/۲۷بي | هو | هو | x | هو (نا تایید شوی) | x | دواړه | هو |
Mamba2 130M/370M/780M/1.3B/2.7B/8B/ Hybrid-8B | هو | هو | x | هو (نا تایید شوی) | x | x | هو |
د فای ۳ مینی ۴k | x | هو | x | هو (نا تایید شوی) | x | x | x |
Qwen2 0.5B/1.5B/7B/72B | هو | هو | x | هو (نا تایید شوی) | هو | دواړه | هو |
سټار کوډر ۱۵ بي | هو | هو | x | هو (نا تایید شوی) | هو | دواړه | هو |
سټار کوډر۲ ۳بي/۷بي/۱۵بي | هو | هو | x | هو (نا تایید شوی) | هو | دواړه | هو |
برټ ۱۱۰ مې/۳۴۰ مې | هو | هو | x | هو (نا تایید شوی) | x | دواړه | x |
د T5 220M/3B/11B لپاره تفتیش وسپارئ، موږ به په XNUMX ساعتونو کې له تاسو سره اړیکه ونیسو. | هو | هو | x | x | x | x | x |
د لید ژبې ماډلونه
د لید ژبې ماډلونه | مخکې روزنه او SFT | پیفټ | السلیک | د FP8 روزنې همغږي | ټي آر ټي/ټي آر ټي ايل ايم | د غېږې ورکولو مخ ته او له هغې څخه بدل کړئ | ارزونه |
---|---|---|---|---|---|---|---|
نیوا (LLaVA 1.5) | هو | هو | x | هو (نا تایید شوی) | x | څخه | x |
لاما ۳.۲ ویژن ۱۱B/۹۰B | هو | هو | x | هو (نا تایید شوی) | x | څخه | x |
LLaVA بل (LLaVA 1.6) | هو | هو | x | هو (نا تایید شوی) | x | څخه | x |
د سرایت کولو ماډلونه
د ژبې ماډلونه ځای پر ځای کول | مخکې روزنه او SFT | پیفټ | السلیک | د FP8 روزنې همغږي | ټي آر ټي/ټي آر ټي ايل ايم | د غېږې ورکولو مخ ته او له هغې څخه بدل کړئ | ارزونه |
---|---|---|---|---|---|---|---|
سبرت ۳۴۰م | هو | x | x | هو (نا تایید شوی) | x | دواړه | x |
لاما ۳.۲ د ۱B ځای پر ځای کول | هو | x | x | هو (نا تایید شوی) | x | دواړه | x |
د نړیوال بنسټ ماډلونه
د نړیوال بنسټ ماډلونه | د روزنې وروسته | چټکه اټکل |
---|---|---|
کاسموس-۱.۰-ډیفیوژن-ټیکسټ۲ورلډ-۷ب | هو | هو |
کاسموس-۱.۰-ډیفیوژن-ټیکسټ۲ورلډ-۷ب | هو | هو |
کاسموس-۱.۰-ډیفیوژن-ویډیو۲ورلډ-۷ب | ژر راځي | ژر راځي |
کاسموس-۱.۰-ډیفیوژن-ویډیو۲ورلډ-۷ب | ژر راځي | ژر راځي |
کاسموس-۱.۰-آټو ریګریسیو-۴B | هو | هو |
کاسموس-۱.۰-آټو ریګریسیو-ویډیو۲ورلډ-۵ب | ژر راځي | ژر راځي |
کاسموس-۱.۰-آټو ریګریسیو-۴B | هو | هو |
کاسموس-۱.۰-آټو ریګریسیو-ویډیو۲ورلډ-۵ب | ژر راځي | ژر راځي |
نوټ
نیمو د خپریدو او اتوماتیک معمارۍ دواړو لپاره د مخکې روزنې ملاتړ هم کوي. text2world
د بنسټ ماډلونه.
د وینا AI
د خبرو اترو د مصنوعي ذهانت ماډلونو جوړول یوه پیچلې پروسه ده چې په ځانګړو ساحو کې د ماډلونو تعریف، جوړول او روزنه پکې شامله ده. دا پروسه معمولا د لوړې کچې دقت ته د رسیدو لپاره څو تکرارونو ته اړتیا لري. دا ډیری وختونه د لوړ دقت ترلاسه کولو لپاره ډیری تکرارونه، د مختلفو دندو او د ډومین ځانګړي معلوماتو ښه کول، د روزنې فعالیت ډاډمن کول، او د استنباط پلي کولو لپاره ماډلونه چمتو کول شامل دي.
د نیمو چوکاټ د سپیچ AI ماډلونو د روزنې او تنظیم کولو لپاره ملاتړ چمتو کوي. پدې کې د اتوماتیک سپیچ ریکګنیشن (ASR) او د متن څخه وینا (TTS) ترکیب په څیر دندې شاملې دي. دا د NVIDIA ریوا سره د تصدۍ کچې تولید ځای پرځای کولو ته یو اسانه لیږد وړاندې کوي. د پراختیا کونکو او څیړونکو سره د مرستې لپاره، د نیمو چوکاټ کې د عصري مخکې روزل شوي پوستې، د بیا تولید وړ وینا ډیټا پروسس کولو لپاره وسایل، او د وینا ډیټاسیټونو متقابل سپړنې او تحلیل لپاره ځانګړتیاوې شاملې دي. د سپیچ AI لپاره د نیمو چوکاټ اجزا په لاندې ډول دي:
روزنه او اصلاح کول
د نیمو چوکاټ هر هغه څه لري چې د وینا ماډلونو روزنې او تنظیمولو لپاره اړین دي (ASR, د وینا طبقه بندي, د ویناوال پیژندنه, د سپیکر ډایریزیشن، او TTS) په تکثیر وړ ډول.
د SOTA مخکې روزل شوي ماډلونه
- د نیمو چوکاټ د څو عصري ترکیبونو او دمخه روزل شوي پوستې چمتو کوي ASR او TTS ماډلونه، او همدارنګه د هغوی د بارولو لارښوونې.
- د وینا وسایل
- د نیمو چوکاټ د ASR او TTS ماډلونو د پراختیا لپاره ګټورو وسیلو سیټ چمتو کوي، په شمول د:
- د نیمو جبري الاینر (NFA) د ټوکن، کلمې او برخې کچې مهال ویش جوړولو لپارهampد نیمو د CTC پر بنسټ د اتوماتیک وینا پیژندنې ماډلونو په کارولو سره په آډیو کې د وینا غږونه.
- د وینا معلوماتو پروسسر (SDP)، د وینا معلوماتو پروسس کولو ساده کولو لپاره یوه وسیله. دا تاسو ته اجازه درکوي چې په ترتیب کې د معلوماتو پروسس کولو عملیات استازیتوب وکړئ file، د بویلر پلیټ کوډ کمول او د تکثیر او شریکولو اجازه ورکول.
- د وینا معلوماتو سپړونکی (SDE)، د ډش پر بنسټ web د وینا ډیټاسیټونو د متقابل سپړنې او تحلیل لپاره غوښتنلیک.
- د ډیټاسیټ جوړولو وسیله کوم چې د اوږدې آډیو د سمون لپاره فعالیت چمتو کوي fileد اړونده نقلونو سره یې ولیکئ او په لنډو ټوټو یې وویشئ چې د اتوماتیک وینا پیژندنې (ASR) ماډل روزنې لپاره مناسب دي.
- د پرتله کولو وسیله د ASR ماډلونو لپاره د کلمو دقت او د خبرو په کچه د مختلفو ASR ماډلونو وړاندوینې پرتله کول.
- د ASR ارزونکی د ASR ماډلونو د فعالیت ارزولو او نورو ځانګړتیاو لکه د غږ فعالیت کشف لپاره.
- د متن نورمال کولو وسیله د متن د لیکل شوي بڼې څخه خبرې ته د بدلولو لپاره او برعکس (د مثال په توګه "۳۱مه" د "یو دېرشمه" په مقابل کې).
- د ځای پرځای کولو لاره
- د نیمو ماډلونه چې د نیمو چوکاټ په کارولو سره روزل شوي یا دودیز شوي دي د NVIDIA ریوا سره اصلاح او ځای په ځای کیدی شي. ریوا کانټینرونه او هیلم چارټونه چمتو کوي چې په ځانګړي ډول د پش بټن ځای په ځای کولو لپاره مرحلو اتومات کولو لپاره ډیزاین شوي.
نورې سرچینې
- نیمو: د نیمو چوکاټ لپاره اصلي زیرمه
- نیمو–منډه کړه: ستاسو د ماشین زده کړې تجربو تنظیمولو، پیلولو او اداره کولو لپاره یوه وسیله.
- نیمو-الاینګر: د موثر ماډل سمون لپاره د توزیع وړ اوزار کټ
- نیمو-کیوریټر: د LLMs لپاره د توزیع وړ معلوماتو دمخه پروسس کولو او کیوریشن اوزار کټ
د نیمو ټولنې سره ښکیل شئ، پوښتنې وکړئ، ملاتړ ترلاسه کړئ، یا د ستونزو راپور ورکړئ.
- د نیمو بحثونه
- د نیمو مسلې
د پروګرام کولو ژبې او چوکاټونه
- پیتون: د نیمو چوکاټ کارولو لپاره اصلي انٹرفیس
- Pytorch: د نیمو چوکاټ د پای ټورچ په سر کې جوړ شوی دی
جوازونه
- د نیمو ګیتوب ریپو د اپاچي ۲.۰ جواز لاندې جواز لري
- د نیمو چوکاټ د NVIDIA AI محصول تړون لاندې جواز لري. د کانټینر په ایستلو او کارولو سره، تاسو د دې جواز شرایط او مقررات منئ.
- د نیمو چوکاټ کانټینر د لاما مواد لري چې د میټا لاما 3 ټولنې جواز تړون لخوا اداره کیږي.
فوټ نوټونه
اوس مهال، د څو ماډلونو ماډلونو لپاره د نیمو کیوریټر او نیمو الاینر ملاتړ کار روان دی او ډیر ژر به شتون ولري.
FAQ
پوښتنه: زه څنګه کولی شم وګورم چې زما سیسټم د زیان مننې له امله اغیزمن شوی دی؟
ځواب: تاسو کولی شئ د نصب شوي NVIDIA NeMo چوکاټ نسخه تاییدولو سره وګورئ چې ستاسو سیسټم اغیزمن شوی که نه. که دا د 24 نسخې څخه ښکته وي، ستاسو سیسټم ممکن زیانمنونکی وي.
پوښتنه: د CVE-2025-23360 امنیتي ستونزه چا راپور کړه؟
الف: د امنیت ستونزه د اور پیلس - JFrog امنیت لخوا راپور شوې وه. NVIDIA د دوی ونډه مني.
پوښتنه: زه څنګه کولی شم د راتلونکي امنیتي خبرتیا خبرتیاوې ترلاسه کړم؟
الف: د امنیتي خبرتیاوو د ګډون لپاره د NVIDIA محصول امنیت پاڼې ته مراجعه وکړئ او د محصول امنیتي تازه معلوماتو په اړه خبر اوسئ.
اسناد / سرچینې
![]() |
د NVIDIA نیمو چوکاټ [pdf] د کارونکي لارښود د نیمو چوکاټ، نیمو، چوکاټ |