NVIDIA NeMo ਫਰੇਮਵਰਕ
ਨਿਰਧਾਰਨ
- ਉਤਪਾਦ ਦਾ ਨਾਮ: NVIDIA NeMo ਫਰੇਮਵਰਕ
- ਪ੍ਰਭਾਵਿਤ ਪਲੇਟਫਾਰਮ: ਵਿੰਡੋਜ਼, ਲੀਨਕਸ, ਮੈਕੋਸ
- ਪ੍ਰਭਾਵਿਤ ਵਰਜਨ: 24 ਤੋਂ ਪਹਿਲਾਂ ਦੇ ਸਾਰੇ ਸੰਸਕਰਣ
- ਸੁਰੱਖਿਆ ਕਮਜ਼ੋਰੀ: CVE-2025-23360
- ਜੋਖਮ ਮੁਲਾਂਕਣ ਅਧਾਰ ਸਕੋਰ: 7.1 (ਸੀਵੀਐਸਐਸ ਵਰਜਨ 3.1)
ਉਤਪਾਦ ਵਰਤੋਂ ਨਿਰਦੇਸ਼
ਸੁਰੱਖਿਆ ਅੱਪਡੇਟ ਇੰਸਟਾਲੇਸ਼ਨ:
ਆਪਣੇ ਸਿਸਟਮ ਨੂੰ ਸੁਰੱਖਿਅਤ ਰੱਖਣ ਲਈ, ਇਹਨਾਂ ਕਦਮਾਂ ਦੀ ਪਾਲਣਾ ਕਰੋ:
- GitHub 'ਤੇ NeMo-Framework-Launcher Releases ਪੰਨੇ ਤੋਂ ਨਵੀਨਤਮ ਰੀਲੀਜ਼ ਡਾਊਨਲੋਡ ਕਰੋ।
- ਹੋਰ ਜਾਣਕਾਰੀ ਲਈ NVIDIA ਉਤਪਾਦ ਸੁਰੱਖਿਆ 'ਤੇ ਜਾਓ।
ਸੁਰੱਖਿਆ ਅੱਪਡੇਟ ਵੇਰਵੇ:
ਸੁਰੱਖਿਆ ਅੱਪਡੇਟ NVIDIA NeMo ਫਰੇਮਵਰਕ ਵਿੱਚ ਇੱਕ ਕਮਜ਼ੋਰੀ ਨੂੰ ਸੰਬੋਧਿਤ ਕਰਦਾ ਹੈ ਜਿਸ ਨਾਲ ਕੋਡ ਐਗਜ਼ੀਕਿਊਸ਼ਨ ਅਤੇ ਡੇਟਾ ਟੀampਅਰਿੰਗ.
ਸਾੱਫਟਵੇਅਰ ਅਪਗ੍ਰੇਡ:
ਜੇਕਰ ਤੁਸੀਂ ਪਹਿਲਾਂ ਵਾਲੀ ਬ੍ਰਾਂਚ ਰੀਲੀਜ਼ ਵਰਤ ਰਹੇ ਹੋ, ਤਾਂ ਸੁਰੱਖਿਆ ਮੁੱਦੇ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਨਵੀਨਤਮ ਬ੍ਰਾਂਚ ਰੀਲੀਜ਼ 'ਤੇ ਅੱਪਗ੍ਰੇਡ ਕਰਨ ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।
ਵੱਧview
NVIDIA NeMo ਫਰੇਮਵਰਕ ਇੱਕ ਸਕੇਲੇਬਲ ਅਤੇ ਕਲਾਉਡ-ਨੇਟਿਵ ਜਨਰੇਟਿਵ AI ਫਰੇਮਵਰਕ ਹੈ ਜੋ ਖੋਜਕਰਤਾਵਾਂ ਅਤੇ ਡਿਵੈਲਪਰਾਂ ਲਈ ਬਣਾਇਆ ਗਿਆ ਹੈ ਜਿਸ 'ਤੇ ਕੰਮ ਕਰ ਰਹੇ ਹਨ ਵੱਡੇ ਭਾਸ਼ਾ ਦੇ ਮਾਡਲ, ਮਲਟੀਮੋਡਲ, ਅਤੇ ਸਪੀਚ ਏ.ਆਈ. (ਉਦਾ ਆਟੋਮੈਟਿਕ ਸਪੀਚ ਪਛਾਣ ਅਤੇ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ). ਇਹ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਮੌਜੂਦਾ ਕੋਡ ਅਤੇ ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਮਾਡਲ ਚੈਕਪੁਆਇੰਟਸ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਨਵੇਂ ਜਨਰੇਟਿਵ ਏਆਈ ਮਾਡਲਾਂ ਨੂੰ ਕੁਸ਼ਲਤਾ ਨਾਲ ਬਣਾਉਣ, ਅਨੁਕੂਲਿਤ ਕਰਨ ਅਤੇ ਤੈਨਾਤ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ।
ਸੈੱਟਅੱਪ ਨਿਰਦੇਸ਼: NeMo ਫਰੇਮਵਰਕ ਸਥਾਪਤ ਕਰੋ
NeMo ਫਰੇਮਵਰਕ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲ (LLMs) ਅਤੇ ਮਲਟੀਮੋਡਲ ਮਾਡਲ (MMs) ਵਿਕਸਤ ਕਰਨ ਲਈ ਐਂਡ-ਟੂ-ਐਂਡ ਸਹਾਇਤਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਇਹ ਆਨ-ਪ੍ਰੀਮਿਸਸ, ਡੇਟਾ-ਸੈਂਟਰ ਵਿੱਚ, ਜਾਂ ਤੁਹਾਡੇ ਪਸੰਦੀਦਾ ਕਲਾਉਡ ਪ੍ਰਦਾਤਾ ਨਾਲ ਵਰਤੇ ਜਾਣ ਲਈ ਲਚਕਤਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਇਹ SLURM ਜਾਂ Kubernetes ਸਮਰਥਿਤ ਵਾਤਾਵਰਣਾਂ 'ਤੇ ਐਗਜ਼ੀਕਿਊਸ਼ਨ ਦਾ ਵੀ ਸਮਰਥਨ ਕਰਦਾ ਹੈ।
ਡਾਟਾ ਕਿਊਰੇਸ਼ਨ
ਨੀਮੋ ਕਿਊਰੇਟਰ [1] ਇੱਕ ਪਾਈਥਨ ਲਾਇਬ੍ਰੇਰੀ ਹੈ ਜਿਸ ਵਿੱਚ ਡੇਟਾ ਮਾਈਨਿੰਗ ਅਤੇ ਸਿੰਥੈਟਿਕ ਡੇਟਾ ਜਨਰੇਸ਼ਨ ਲਈ ਮਾਡਿਊਲਾਂ ਦਾ ਇੱਕ ਸੂਟ ਸ਼ਾਮਲ ਹੈ। ਇਹ ਸਕੇਲੇਬਲ ਹਨ ਅਤੇ GPU ਲਈ ਅਨੁਕੂਲਿਤ ਹਨ, ਜੋ ਉਹਨਾਂ ਨੂੰ LLM ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਜਾਂ ਵਧੀਆ-ਟਿਊਨ ਕਰਨ ਲਈ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਡੇਟਾ ਨੂੰ ਕਿਊਰੇਟ ਕਰਨ ਲਈ ਆਦਰਸ਼ ਬਣਾਉਂਦੇ ਹਨ। NeMo ਕਿਊਰੇਟਰ ਦੇ ਨਾਲ, ਤੁਸੀਂ ਵਿਆਪਕ ਕੱਚੇ ਤੋਂ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲਾ ਟੈਕਸਟ ਕੁਸ਼ਲਤਾ ਨਾਲ ਕੱਢ ਸਕਦੇ ਹੋ। web ਡਾਟਾ ਸਰੋਤ।
ਸਿਖਲਾਈ ਅਤੇ ਅਨੁਕੂਲਤਾ
NeMo ਫਰੇਮਵਰਕ ਕੁਸ਼ਲ ਸਿਖਲਾਈ ਅਤੇ ਅਨੁਕੂਲਤਾ ਲਈ ਟੂਲ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ ਐਲਐਲਐਮ ਅਤੇ ਮਲਟੀਮੋਡਲ ਮਾਡਲ। ਇਸ ਵਿੱਚ ਕੰਪਿਊਟ ਕਲੱਸਟਰ ਸੈੱਟਅੱਪ, ਡੇਟਾ ਡਾਊਨਲੋਡਿੰਗ, ਅਤੇ ਮਾਡਲ ਹਾਈਪਰਪੈਰਾਮੀਟਰਾਂ ਲਈ ਡਿਫੌਲਟ ਸੰਰਚਨਾਵਾਂ ਸ਼ਾਮਲ ਹਨ, ਜਿਨ੍ਹਾਂ ਨੂੰ ਨਵੇਂ ਡੇਟਾਸੈੱਟਾਂ ਅਤੇ ਮਾਡਲਾਂ 'ਤੇ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਐਡਜਸਟ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਤੋਂ ਇਲਾਵਾ, NeMo ਸੁਪਰਵਾਈਜ਼ਡ ਫਾਈਨ-ਟਿਊਨਿੰਗ (SFT) ਅਤੇ ਪੈਰਾਮੀਟਰ ਐਫੀਸ਼ੀਐਂਟ ਫਾਈਨ-ਟਿਊਨਿੰਗ (PEFT) ਤਕਨੀਕਾਂ ਜਿਵੇਂ ਕਿ LoRA, Ptuning, ਅਤੇ ਹੋਰ ਬਹੁਤ ਕੁਝ ਦਾ ਸਮਰਥਨ ਕਰਦਾ ਹੈ।
NeMo ਵਿੱਚ ਸਿਖਲਾਈ ਸ਼ੁਰੂ ਕਰਨ ਲਈ ਦੋ ਵਿਕਲਪ ਉਪਲਬਧ ਹਨ - NeMo 2.0 API ਇੰਟਰਫੇਸ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਜਾਂ NeMo Run ਨਾਲ।
- ਨੀਮੋ ਰਨ ਦੇ ਨਾਲ (ਸਿਫ਼ਾਰਸ਼ੀ): NeMo Run ਵੱਖ-ਵੱਖ ਕੰਪਿਊਟ ਵਾਤਾਵਰਣਾਂ ਵਿੱਚ ਪ੍ਰਯੋਗਾਂ ਦੀ ਸੰਰਚਨਾ, ਐਗਜ਼ੀਕਿਊਸ਼ਨ ਅਤੇ ਪ੍ਰਬੰਧਨ ਨੂੰ ਸੁਚਾਰੂ ਬਣਾਉਣ ਲਈ ਇੱਕ ਇੰਟਰਫੇਸ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਇਸ ਵਿੱਚ ਤੁਹਾਡੇ ਵਰਕਸਟੇਸ਼ਨ 'ਤੇ ਸਥਾਨਕ ਤੌਰ 'ਤੇ ਜਾਂ ਵੱਡੇ ਕਲੱਸਟਰਾਂ 'ਤੇ ਨੌਕਰੀਆਂ ਸ਼ੁਰੂ ਕਰਨਾ ਸ਼ਾਮਲ ਹੈ - ਦੋਵੇਂ SLURM ਸਮਰਥਿਤ ਜਾਂ ਕਲਾਉਡ ਵਾਤਾਵਰਣ ਵਿੱਚ Kubernetes।
- NeMo Run ਨਾਲ ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਅਤੇ PEFT ਕੁਇੱਕਸਟਾਰਟ
- NeMo 2.0 API ਦੀ ਵਰਤੋਂ: ਇਹ ਵਿਧੀ ਛੋਟੇ ਮਾਡਲਾਂ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਵਾਲੇ ਇੱਕ ਸਧਾਰਨ ਸੈੱਟਅੱਪ ਦੇ ਨਾਲ ਵਧੀਆ ਕੰਮ ਕਰਦੀ ਹੈ, ਜਾਂ ਜੇਕਰ ਤੁਸੀਂ ਆਪਣਾ ਖੁਦ ਦਾ ਕਸਟਮ ਡੇਟਾਲੋਡਰ ਲਿਖਣ, ਲੂਪਸ ਸਿਖਲਾਈ ਦੇਣ, ਜਾਂ ਮਾਡਲ ਲੇਅਰਾਂ ਨੂੰ ਬਦਲਣ ਵਿੱਚ ਦਿਲਚਸਪੀ ਰੱਖਦੇ ਹੋ। ਇਹ ਤੁਹਾਨੂੰ ਸੰਰਚਨਾਵਾਂ 'ਤੇ ਵਧੇਰੇ ਲਚਕਤਾ ਅਤੇ ਨਿਯੰਤਰਣ ਦਿੰਦਾ ਹੈ, ਅਤੇ ਸੰਰਚਨਾਵਾਂ ਨੂੰ ਪ੍ਰੋਗਰਾਮੈਟਿਕ ਤੌਰ 'ਤੇ ਵਧਾਉਣਾ ਅਤੇ ਅਨੁਕੂਲਿਤ ਕਰਨਾ ਆਸਾਨ ਬਣਾਉਂਦਾ ਹੈ।
-
ਟਰਾNeMo 2.0 API ਨਾਲ ਕੁਇੱਕਸਟਾਰਟ ਸ਼ੁਰੂ ਕਰਨਾ
-
NeMo 1.0 ਤੋਂ NeMo 2.0 API ਵਿੱਚ ਮਾਈਗ੍ਰੇਟ ਕਰਨਾ
-
ਅਲਾਈਨਮੈਂਟ
- ਨੇਮੋ-ਅਲਾਈਨਰ [1] ਕੁਸ਼ਲ ਮਾਡਲ ਅਲਾਈਨਮੈਂਟ ਲਈ ਇੱਕ ਸਕੇਲੇਬਲ ਟੂਲਕਿੱਟ ਹੈ। ਟੂਲਕਿੱਟ ਵਿੱਚ ਅਤਿ-ਆਧੁਨਿਕ ਮਾਡਲ ਅਲਾਈਨਮੈਂਟ ਐਲਗੋਰਿਦਮ ਜਿਵੇਂ ਕਿ ਸਟੀਅਰਐਲਐਮ, ਡੀਪੀਓ, ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਫਰਾਮ ਹਿਊਮਨ ਫੀਡਬੈਕ (ਆਰਐਲਐਚਐਫ), ਅਤੇ ਹੋਰ ਬਹੁਤ ਕੁਝ ਲਈ ਸਮਰਥਨ ਹੈ। ਇਹ ਐਲਗੋਰਿਦਮ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਨੂੰ ਵਧੇਰੇ ਸੁਰੱਖਿਅਤ, ਨੁਕਸਾਨ ਰਹਿਤ ਅਤੇ ਮਦਦਗਾਰ ਬਣਾਉਣ ਲਈ ਅਲਾਈਨ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦੇ ਹਨ।
- ਸਾਰੇ NeMo-Aligner ਚੈੱਕਪੁਆਇੰਟ NeMo ਈਕੋਸਿਸਟਮ ਦੇ ਨਾਲ ਕਰਾਸ-ਅਨੁਕੂਲ ਹਨ, ਜੋ ਹੋਰ ਅਨੁਕੂਲਤਾ ਅਤੇ ਅਨੁਮਾਨ ਤੈਨਾਤੀ ਦੀ ਆਗਿਆ ਦਿੰਦੇ ਹਨ।
ਇੱਕ ਛੋਟੇ GPT-2B ਮਾਡਲ 'ਤੇ RLHF ਦੇ ਤਿੰਨੋਂ ਪੜਾਵਾਂ ਦਾ ਕਦਮ-ਦਰ-ਕਦਮ ਵਰਕਫਲੋ:
- SFT ਸਿਖਲਾਈ
- ਇਨਾਮ ਮਾਡਲ ਸਿਖਲਾਈ
- ਪੀਪੀਓ ਸਿਖਲਾਈ
ਇਸ ਤੋਂ ਇਲਾਵਾ, ਅਸੀਂ ਕਈ ਹੋਰ ਨਵੇਂ ਅਲਾਈਨਮੈਂਟ ਤਰੀਕਿਆਂ ਲਈ ਸਮਰਥਨ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਦੇ ਹਾਂ:
- ਡੀ.ਪੀ.ਓ: RLHF ਦੇ ਮੁਕਾਬਲੇ ਇੱਕ ਹਲਕਾ ਅਲਾਈਨਮੈਂਟ ਐਲਗੋਰਿਦਮ, ਇੱਕ ਸਰਲ ਨੁਕਸਾਨ ਫੰਕਸ਼ਨ ਦੇ ਨਾਲ।
- ਸਵੈ-ਖੇਡ ਫਾਈਨ-ਟਿਊਨਿੰਗ (ਸਪਿਨ)
- ਸਟੀਅਰਐਲਐਮ: ਕੰਡੀਸ਼ਨਡ-SFT 'ਤੇ ਅਧਾਰਤ ਇੱਕ ਤਕਨੀਕ, ਸਟੀਅਰੇਬਲ ਆਉਟਪੁੱਟ ਦੇ ਨਾਲ।
ਹੋਰ ਜਾਣਕਾਰੀ ਲਈ ਦਸਤਾਵੇਜ਼ ਵੇਖੋ: ਅਲਾਈਨਮੈਂਟ ਦਸਤਾਵੇਜ਼
ਮਲਟੀਮੋਡਲ ਮਾਡਲ
- NeMo ਫਰੇਮਵਰਕ ਕਈ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਅਤਿ-ਆਧੁਨਿਕ ਮਲਟੀਮੋਡਲ ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਅਤੇ ਤੈਨਾਤ ਕਰਨ ਲਈ ਅਨੁਕੂਲਿਤ ਸੌਫਟਵੇਅਰ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ: ਮਲਟੀਮੋਡਲ ਭਾਸ਼ਾ ਮਾਡਲ, ਵਿਜ਼ਨ-ਭਾਸ਼ਾ ਫਾਊਂਡੇਸ਼ਨ, ਟੈਕਸਟ-ਟੂ-ਇਮੇਜ ਮਾਡਲ, ਅਤੇ ਨਿਊਰਲ ਰੇਡੀਐਂਸ ਫੀਲਡ (NeRF) ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ 2D ਜਨਰੇਸ਼ਨ ਤੋਂ ਪਰੇ।
- ਹਰੇਕ ਸ਼੍ਰੇਣੀ ਨੂੰ ਖੇਤਰ ਵਿੱਚ ਖਾਸ ਜ਼ਰੂਰਤਾਂ ਅਤੇ ਤਰੱਕੀਆਂ ਨੂੰ ਪੂਰਾ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਟੈਕਸਟ, ਚਿੱਤਰਾਂ ਅਤੇ 3D ਮਾਡਲਾਂ ਸਮੇਤ ਡੇਟਾ ਕਿਸਮਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਨੂੰ ਸੰਭਾਲਣ ਲਈ ਅਤਿ-ਆਧੁਨਿਕ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।
ਨੋਟ ਕਰੋ
ਅਸੀਂ ਮਲਟੀਮੋਡਲ ਮਾਡਲਾਂ ਲਈ ਸਮਰਥਨ ਨੂੰ NeMo 1.0 ਤੋਂ NeMo 2.0 ਵਿੱਚ ਮਾਈਗ੍ਰੇਟ ਕਰ ਰਹੇ ਹਾਂ। ਜੇਕਰ ਤੁਸੀਂ ਇਸ ਦੌਰਾਨ ਇਸ ਡੋਮੇਨ ਦੀ ਪੜਚੋਲ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ ਕਿਰਪਾ ਕਰਕੇ NeMo 24.07 (ਪਿਛਲੇ) ਰੀਲੀਜ਼ ਲਈ ਦਸਤਾਵੇਜ਼ ਵੇਖੋ।
ਤੈਨਾਤੀ ਅਤੇ ਅਨੁਮਾਨ
ਨੇਮੋ ਫਰੇਮਵਰਕ ਐਲਐਲਐਮ ਅਨੁਮਾਨ ਲਈ ਵੱਖ-ਵੱਖ ਮਾਰਗ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਵੱਖ-ਵੱਖ ਤੈਨਾਤੀ ਦ੍ਰਿਸ਼ਾਂ ਅਤੇ ਪ੍ਰਦਰਸ਼ਨ ਦੀਆਂ ਜ਼ਰੂਰਤਾਂ ਨੂੰ ਪੂਰਾ ਕਰਦਾ ਹੈ।
NVIDIA NIM ਨਾਲ ਤੈਨਾਤ ਕਰੋ
- ਨੇਮੋ ਫਰੇਮਵਰਕ NVIDIA NIM ਰਾਹੀਂ ਐਂਟਰਪ੍ਰਾਈਜ਼-ਪੱਧਰ ਦੇ ਮਾਡਲ ਡਿਪਲਾਇਮੈਂਟ ਟੂਲਸ ਨਾਲ ਸਹਿਜੇ ਹੀ ਏਕੀਕ੍ਰਿਤ ਹੁੰਦਾ ਹੈ। ਇਹ ਏਕੀਕਰਣ NVIDIA TensorRT-LLM ਦੁਆਰਾ ਸੰਚਾਲਿਤ ਹੈ, ਜੋ ਅਨੁਕੂਲਿਤ ਅਤੇ ਸਕੇਲੇਬਲ ਅਨੁਮਾਨ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ।
- NIM ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਲਈ, NVIDIA 'ਤੇ ਜਾਓ webਸਾਈਟ.
TensorRT-LLM ਜਾਂ vLLM ਨਾਲ ਤੈਨਾਤ ਕਰੋ
- NeMo ਫਰੇਮਵਰਕ ਦੋ ਇਨਫਰੈਂਸ ਅਨੁਕੂਲਿਤ ਲਾਇਬ੍ਰੇਰੀਆਂ, TensorRT-LLM ਅਤੇ vLLM ਨੂੰ ਮਾਡਲਾਂ ਨੂੰ ਨਿਰਯਾਤ ਕਰਨ ਲਈ ਸਕ੍ਰਿਪਟਾਂ ਅਤੇ API ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ, ਅਤੇ NVIDIA ਟ੍ਰਾਈਟਨ ਇਨਫਰੈਂਸ ਸਰਵਰ ਨਾਲ ਨਿਰਯਾਤ ਕੀਤੇ ਮਾਡਲ ਨੂੰ ਤੈਨਾਤ ਕਰਦਾ ਹੈ।
- ਅਨੁਕੂਲਿਤ ਪ੍ਰਦਰਸ਼ਨ ਦੀ ਲੋੜ ਵਾਲੇ ਦ੍ਰਿਸ਼ਾਂ ਲਈ, NeMo ਮਾਡਲ TensorRT-LLM ਦਾ ਲਾਭ ਉਠਾ ਸਕਦੇ ਹਨ, ਜੋ ਕਿ NVIDIA GPUs 'ਤੇ LLM ਅਨੁਮਾਨ ਨੂੰ ਤੇਜ਼ ਕਰਨ ਅਤੇ ਅਨੁਕੂਲ ਬਣਾਉਣ ਲਈ ਇੱਕ ਵਿਸ਼ੇਸ਼ ਲਾਇਬ੍ਰੇਰੀ ਹੈ। ਇਸ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ nemo.export ਮੋਡੀਊਲ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ NeMo ਮਾਡਲਾਂ ਨੂੰ TensorRT-LLM ਦੇ ਅਨੁਕੂਲ ਫਾਰਮੈਟ ਵਿੱਚ ਬਦਲਣਾ ਸ਼ਾਮਲ ਹੈ।
- ਐਲਐਲਐਮ ਤੈਨਾਤੀ ਖਤਮview
- NIM ਨਾਲ NeMo ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਨੂੰ ਤੈਨਾਤ ਕਰੋ
- TensorRT-LLM ਨਾਲ NeMo ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਨੂੰ ਤੈਨਾਤ ਕਰੋ
- vLLM ਦੇ ਨਾਲ NeMo ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਨੂੰ ਤੈਨਾਤ ਕਰੋ
ਸਮਰਥਿਤ ਮਾਡਲ
ਵੱਡੇ ਭਾਸ਼ਾ ਦੇ ਮਾਡਲ
ਵੱਡੇ ਭਾਸ਼ਾ ਦੇ ਮਾਡਲ | ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਐਸ.ਐਫ.ਟੀ. | ਪੀਈਐਫਟੀ | ਅਲਾਈਨਮੈਂਟ | FP8 ਸਿਖਲਾਈ ਕਨਵਰਜੈਂਸ | ਟੀਆਰਟੀ/ਟੀਆਰਟੀਐਲਐਲਐਮ | ਹੱਗਿੰਗ ਫੇਸ ਵਿੱਚ ਅਤੇ ਤੋਂ ਬਦਲੋ | ਮੁਲਾਂਕਣ |
---|---|---|---|---|---|---|---|
ਲਾਮਾ3 8ਬੀ/70ਬੀ, ਲਾਮਾ3.1 405ਬੀ | ਹਾਂ | ਹਾਂ | x | ਹਾਂ (ਅੰਸ਼ਕ ਤੌਰ 'ਤੇ ਪੁਸ਼ਟੀ ਕੀਤੀ ਗਈ) | ਹਾਂ | ਦੋਵੇਂ | ਹਾਂ |
ਮਿਕਸਟ੍ਰਲ 8x7B/8x22B | ਹਾਂ | ਹਾਂ | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | ਹਾਂ | ਦੋਵੇਂ | ਹਾਂ |
ਨੇਮੋਟ੍ਰੋਨ 3 8B | ਹਾਂ | x | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | x | ਦੋਵੇਂ | ਹਾਂ |
ਨੇਮੋਟ੍ਰੋਨ 4 340B | ਹਾਂ | x | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | x | ਦੋਵੇਂ | ਹਾਂ |
ਬਾਈਚੁਆਨ2 7B | ਹਾਂ | ਹਾਂ | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | x | ਦੋਵੇਂ | ਹਾਂ |
ਚੈਟਜੀਐਲਐਮ3 6ਬੀ | ਹਾਂ | ਹਾਂ | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | x | ਦੋਵੇਂ | ਹਾਂ |
ਜੇਮਾ 2B/7B | ਹਾਂ | ਹਾਂ | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | ਹਾਂ | ਦੋਵੇਂ | ਹਾਂ |
ਜੇਮਾ2 2ਬੀ/9ਬੀ/27ਬੀ | ਹਾਂ | ਹਾਂ | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | x | ਦੋਵੇਂ | ਹਾਂ |
Mamba2 130M/370M/780M/1.3B/2.7B/8B/ Hybrid-8B | ਹਾਂ | ਹਾਂ | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | x | x | ਹਾਂ |
ਫਾਈ3 ਮਿੰਨੀ 4ਕੇ | x | ਹਾਂ | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | x | x | x |
Qwen2 0.5B/1.5B/7B/72B | ਹਾਂ | ਹਾਂ | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | ਹਾਂ | ਦੋਵੇਂ | ਹਾਂ |
ਸਟਾਰਕੋਡਰ 15ਬੀ | ਹਾਂ | ਹਾਂ | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | ਹਾਂ | ਦੋਵੇਂ | ਹਾਂ |
ਸਟਾਰਕੋਡਰ2 3B/7B/15B | ਹਾਂ | ਹਾਂ | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | ਹਾਂ | ਦੋਵੇਂ | ਹਾਂ |
ਬਰਟ 110 ਮੀਟਰ/340 ਮੀਟਰ | ਹਾਂ | ਹਾਂ | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | x | ਦੋਵੇਂ | x |
ਟੀ5 220ਐਮ/3ਬੀ/11ਬੀ | ਹਾਂ | ਹਾਂ | x | x | x | x | x |
ਵਿਜ਼ਨ ਲੈਂਗਵੇਜ ਮਾਡਲ
ਵਿਜ਼ਨ ਲੈਂਗਵੇਜ ਮਾਡਲ | ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਐਸ.ਐਫ.ਟੀ. | ਪੀਈਐਫਟੀ | ਅਲਾਈਨਮੈਂਟ | FP8 ਸਿਖਲਾਈ ਕਨਵਰਜੈਂਸ | ਟੀਆਰਟੀ/ਟੀਆਰਟੀਐਲਐਲਐਮ | ਹੱਗਿੰਗ ਫੇਸ ਵਿੱਚ ਅਤੇ ਤੋਂ ਬਦਲੋ | ਮੁਲਾਂਕਣ |
---|---|---|---|---|---|---|---|
ਨੇਵਾ (LLaVA 1.5) | ਹਾਂ | ਹਾਂ | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | x | ਤੋਂ | x |
ਲਾਮਾ 3.2 ਵਿਜ਼ਨ 11B/90B | ਹਾਂ | ਹਾਂ | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | x | ਤੋਂ | x |
LLaVA ਅੱਗੇ (LLaVA 1.6) | ਹਾਂ | ਹਾਂ | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | x | ਤੋਂ | x |
ਏਮਬੈਡਿੰਗ ਮਾਡਲ
ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਨੂੰ ਏਮਬੈਡ ਕਰਨਾ | ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਐਸ.ਐਫ.ਟੀ. | ਪੀਈਐਫਟੀ | ਅਲਾਈਨਮੈਂਟ | FP8 ਸਿਖਲਾਈ ਕਨਵਰਜੈਂਸ | ਟੀਆਰਟੀ/ਟੀਆਰਟੀਐਲਐਲਐਮ | ਹੱਗਿੰਗ ਫੇਸ ਵਿੱਚ ਅਤੇ ਤੋਂ ਬਦਲੋ | ਮੁਲਾਂਕਣ |
---|---|---|---|---|---|---|---|
ਐਸਬਰਟ 340 ਐਮ | ਹਾਂ | x | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | x | ਦੋਵੇਂ | x |
ਲਾਮਾ 3.2 ਏਮਬੈਡਿੰਗ 1B | ਹਾਂ | x | x | ਹਾਂ (ਗੈਰ-ਪ੍ਰਮਾਣਿਤ) | x | ਦੋਵੇਂ | x |
ਵਰਲਡ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ
ਵਰਲਡ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ | ਸਿਖਲਾਈ ਤੋਂ ਬਾਅਦ | ਐਕਸਲਰੇਟਿਡ ਇਨਫਰੈਂਸ |
---|---|---|
ਕੌਸਮੌਸ-1.0-ਡਿਫਿਊਜ਼ਨ-ਟੈਕਸਟ2ਵਰਲਡ-7ਬੀ | ਹਾਂ | ਹਾਂ |
ਕੌਸਮੌਸ-1.0-ਡਿਫਿਊਜ਼ਨ-ਟੈਕਸਟ2ਵਰਲਡ-14ਬੀ | ਹਾਂ | ਹਾਂ |
ਕੌਸਮੌਸ-1.0-ਡਿਫਿਊਜ਼ਨ-ਵੀਡੀਓ2ਵਰਲਡ-7ਬੀ | ਆਨ ਵਾਲੀ | ਆਨ ਵਾਲੀ |
ਕੌਸਮੌਸ-1.0-ਡਿਫਿਊਜ਼ਨ-ਵੀਡੀਓ2ਵਰਲਡ-14ਬੀ | ਆਨ ਵਾਲੀ | ਆਨ ਵਾਲੀ |
ਕੌਸਮੌਸ-1.0-ਆਟੋਰੀਗ੍ਰੇਸਿਵ-4B | ਹਾਂ | ਹਾਂ |
ਕੌਸਮੌਸ-1.0-ਆਟੋਰੀਗ੍ਰੇਸਿਵ-ਵੀਡੀਓ2ਵਰਲਡ-5ਬੀ | ਆਨ ਵਾਲੀ | ਆਨ ਵਾਲੀ |
ਕੌਸਮੌਸ-1.0-ਆਟੋਰੀਗ੍ਰੇਸਿਵ-12B | ਹਾਂ | ਹਾਂ |
ਕੌਸਮੌਸ-1.0-ਆਟੋਰੀਗ੍ਰੇਸਿਵ-ਵੀਡੀਓ2ਵਰਲਡ-13ਬੀ | ਆਨ ਵਾਲੀ | ਆਨ ਵਾਲੀ |
ਨੋਟ ਕਰੋ
NeMo ਪ੍ਰਸਾਰ ਅਤੇ ਆਟੋਰਿਗਰੈਸਿਵ ਆਰਕੀਟੈਕਚਰ ਦੋਵਾਂ ਲਈ ਪ੍ਰੀਟ੍ਰੇਨਿੰਗ ਦਾ ਵੀ ਸਮਰਥਨ ਕਰਦਾ ਹੈ। text2world
ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ।
ਸਪੀਚ ਏ.ਆਈ.
ਗੱਲਬਾਤ ਵਾਲੇ AI ਮਾਡਲਾਂ ਦਾ ਵਿਕਾਸ ਇੱਕ ਗੁੰਝਲਦਾਰ ਪ੍ਰਕਿਰਿਆ ਹੈ ਜਿਸ ਵਿੱਚ ਖਾਸ ਡੋਮੇਨਾਂ ਦੇ ਅੰਦਰ ਮਾਡਲਾਂ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨਾ, ਨਿਰਮਾਣ ਕਰਨਾ ਅਤੇ ਸਿਖਲਾਈ ਦੇਣਾ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ। ਇਸ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਆਮ ਤੌਰ 'ਤੇ ਉੱਚ ਪੱਧਰੀ ਸ਼ੁੱਧਤਾ ਤੱਕ ਪਹੁੰਚਣ ਲਈ ਕਈ ਦੁਹਰਾਓ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਸ ਵਿੱਚ ਅਕਸਰ ਉੱਚ ਸ਼ੁੱਧਤਾ ਪ੍ਰਾਪਤ ਕਰਨ, ਵੱਖ-ਵੱਖ ਕਾਰਜਾਂ ਅਤੇ ਡੋਮੇਨ-ਵਿਸ਼ੇਸ਼ ਡੇਟਾ 'ਤੇ ਸੁਧਾਰ ਕਰਨ, ਸਿਖਲਾਈ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ, ਅਤੇ ਅਨੁਮਾਨ ਤੈਨਾਤੀ ਲਈ ਮਾਡਲ ਤਿਆਰ ਕਰਨ ਲਈ ਕਈ ਦੁਹਰਾਓ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ।
NeMo ਫਰੇਮਵਰਕ ਸਪੀਚ AI ਮਾਡਲਾਂ ਦੀ ਸਿਖਲਾਈ ਅਤੇ ਅਨੁਕੂਲਤਾ ਲਈ ਸਹਾਇਤਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਇਸ ਵਿੱਚ ਆਟੋਮੈਟਿਕ ਸਪੀਚ ਰਿਕੋਗਨੀਸ਼ਨ (ASR) ਅਤੇ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ (TTS) ਸਿੰਥੇਸਿਸ ਵਰਗੇ ਕੰਮ ਸ਼ਾਮਲ ਹਨ। ਇਹ NVIDIA ਰੀਵਾ ਨਾਲ ਐਂਟਰਪ੍ਰਾਈਜ਼-ਪੱਧਰ ਦੇ ਉਤਪਾਦਨ ਤੈਨਾਤੀ ਲਈ ਇੱਕ ਸੁਚਾਰੂ ਤਬਦੀਲੀ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ। ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਖੋਜਕਰਤਾਵਾਂ ਦੀ ਸਹਾਇਤਾ ਲਈ, NeMo ਫਰੇਮਵਰਕ ਵਿੱਚ ਅਤਿ-ਆਧੁਨਿਕ ਪੂਰਵ-ਸਿਖਿਅਤ ਚੈਕਪੁਆਇੰਟ, ਪ੍ਰਜਨਨਯੋਗ ਸਪੀਚ ਡੇਟਾ ਪ੍ਰੋਸੈਸਿੰਗ ਲਈ ਟੂਲ, ਅਤੇ ਸਪੀਚ ਡੇਟਾਸੈਟਾਂ ਦੇ ਇੰਟਰਐਕਟਿਵ ਖੋਜ ਅਤੇ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਸ਼ਾਮਲ ਹਨ। ਸਪੀਚ AI ਲਈ NeMo ਫਰੇਮਵਰਕ ਦੇ ਹਿੱਸੇ ਹੇਠ ਲਿਖੇ ਅਨੁਸਾਰ ਹਨ:
ਸਿਖਲਾਈ ਅਤੇ ਅਨੁਕੂਲਤਾ
NeMo ਫਰੇਮਵਰਕ ਵਿੱਚ ਸਪੀਚ ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਅਤੇ ਅਨੁਕੂਲਿਤ ਕਰਨ ਲਈ ਲੋੜੀਂਦੀ ਹਰ ਚੀਜ਼ ਸ਼ਾਮਲ ਹੈ (ASR, ਬੋਲੀ ਵਰਗੀਕਰਨ, ਸਪੀਕਰ ਪਛਾਣ, ਸਪੀਕਰ ਡਾਇਰਾਈਜ਼ੇਸ਼ਨ, ਅਤੇ ਟੀ.ਟੀ.ਐੱਸ) ਨੂੰ ਦੁਬਾਰਾ ਪੈਦਾ ਕਰਨ ਯੋਗ ਤਰੀਕੇ ਨਾਲ।
SOTA ਪੂਰਵ-ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਮਾਡਲ
- ਨੇਮੋ ਫਰੇਮਵਰਕ ਅਤਿ-ਆਧੁਨਿਕ ਪਕਵਾਨਾਂ ਅਤੇ ਕਈ ਤਰ੍ਹਾਂ ਦੀਆਂ ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਚੌਕੀਆਂ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ ASR ਅਤੇ ਟੀ.ਟੀ.ਐੱਸ ਮਾਡਲ, ਅਤੇ ਨਾਲ ਹੀ ਉਹਨਾਂ ਨੂੰ ਕਿਵੇਂ ਲੋਡ ਕਰਨਾ ਹੈ ਇਸ ਬਾਰੇ ਹਦਾਇਤਾਂ।
- ਸਪੀਚ ਟੂਲ
- NeMo ਫਰੇਮਵਰਕ ASR ਅਤੇ TTS ਮਾਡਲਾਂ ਨੂੰ ਵਿਕਸਤ ਕਰਨ ਲਈ ਉਪਯੋਗੀ ਔਜ਼ਾਰਾਂ ਦਾ ਇੱਕ ਸੈੱਟ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:
- ਨੀਮੋ ਫੋਰਸਡ ਅਲਾਈਨਰ (NFA) ਟੋਕਨ-, ਸ਼ਬਦ- ਅਤੇ ਖੰਡ-ਪੱਧਰ ਦਾ ਸਮਾਂ ਤਿਆਰ ਕਰਨ ਲਈampNeMo ਦੇ CTC-ਅਧਾਰਿਤ ਆਟੋਮੈਟਿਕ ਸਪੀਚ ਰਿਕੋਗਨੀਸ਼ਨ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਆਡੀਓ ਵਿੱਚ ਭਾਸ਼ਣ ਦੇ s।
- ਸਪੀਚ ਡੇਟਾ ਪ੍ਰੋਸੈਸਰ (SDP), ਸਪੀਚ ਡੇਟਾ ਪ੍ਰੋਸੈਸਿੰਗ ਨੂੰ ਸਰਲ ਬਣਾਉਣ ਲਈ ਇੱਕ ਟੂਲਕਿੱਟ। ਇਹ ਤੁਹਾਨੂੰ ਇੱਕ ਸੰਰਚਨਾ ਵਿੱਚ ਡੇਟਾ ਪ੍ਰੋਸੈਸਿੰਗ ਕਾਰਜਾਂ ਨੂੰ ਦਰਸਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ file, ਬਾਇਲਰਪਲੇਟ ਕੋਡ ਨੂੰ ਘੱਟ ਤੋਂ ਘੱਟ ਕਰਨਾ ਅਤੇ ਪ੍ਰਜਨਨਯੋਗਤਾ ਅਤੇ ਸਾਂਝਾਕਰਨ ਦੀ ਆਗਿਆ ਦੇਣਾ।
- ਸਪੀਚ ਡੇਟਾ ਐਕਸਪਲੋਰਰ (SDE), ਇੱਕ ਡੈਸ਼-ਅਧਾਰਿਤ web ਭਾਸ਼ਣ ਡੇਟਾਸੈਟਾਂ ਦੀ ਇੰਟਰਐਕਟਿਵ ਖੋਜ ਅਤੇ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਐਪਲੀਕੇਸ਼ਨ।
- ਡਾਟਾਸੈੱਟ ਬਣਾਉਣ ਵਾਲਾ ਟੂਲ ਜੋ ਲੰਬੇ ਆਡੀਓ ਨੂੰ ਇਕਸਾਰ ਕਰਨ ਲਈ ਕਾਰਜਸ਼ੀਲਤਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ fileਸੰਬੰਧਿਤ ਟ੍ਰਾਂਸਕ੍ਰਿਪਟਾਂ ਦੇ ਨਾਲ s ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਛੋਟੇ ਟੁਕੜਿਆਂ ਵਿੱਚ ਵੰਡੋ ਜੋ ਆਟੋਮੈਟਿਕ ਸਪੀਚ ਰਿਕੋਗਨੀਸ਼ਨ (ASR) ਮਾਡਲ ਸਿਖਲਾਈ ਲਈ ਢੁਕਵੇਂ ਹਨ।
- ਤੁਲਨਾ ਟੂਲ ASR ਮਾਡਲਾਂ ਲਈ ਸ਼ਬਦ ਸ਼ੁੱਧਤਾ ਅਤੇ ਉਚਾਰਨ ਪੱਧਰ 'ਤੇ ਵੱਖ-ਵੱਖ ASR ਮਾਡਲਾਂ ਦੀਆਂ ਭਵਿੱਖਬਾਣੀਆਂ ਦੀ ਤੁਲਨਾ ਕਰਨ ਲਈ।
- ASR ਮੁਲਾਂਕਣਕਰਤਾ ASR ਮਾਡਲਾਂ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਅਤੇ ਵੌਇਸ ਐਕਟੀਵਿਟੀ ਡਿਟੈਕਸ਼ਨ ਵਰਗੀਆਂ ਹੋਰ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ।
- ਟੈਕਸਟ ਨੌਰਮਲਾਈਜ਼ੇਸ਼ਨ ਟੂਲ ਲਿਖਤੀ ਰੂਪ ਤੋਂ ਬੋਲੇ ਰੂਪ ਵਿੱਚ ਟੈਕਸਟ ਨੂੰ ਬਦਲਣ ਲਈ ਅਤੇ ਇਸਦੇ ਉਲਟ (ਜਿਵੇਂ ਕਿ "31ਵਾਂ" ਬਨਾਮ "ਪਹਿਲੀ")।
- ਤੈਨਾਤੀ ਲਈ ਮਾਰਗ
- NeMo ਮਾਡਲ ਜਿਨ੍ਹਾਂ ਨੂੰ NeMo ਫਰੇਮਵਰਕ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਹੈ ਜਾਂ ਅਨੁਕੂਲਿਤ ਕੀਤਾ ਗਿਆ ਹੈ, ਨੂੰ NVIDIA Riva ਨਾਲ ਅਨੁਕੂਲਿਤ ਅਤੇ ਤੈਨਾਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। Riva ਕੰਟੇਨਰ ਅਤੇ ਹੈਲਮ ਚਾਰਟ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ ਜੋ ਖਾਸ ਤੌਰ 'ਤੇ ਪੁਸ਼-ਬਟਨ ਤੈਨਾਤੀ ਲਈ ਕਦਮਾਂ ਨੂੰ ਸਵੈਚਾਲਿਤ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਹਨ।
ਹੋਰ ਸਰੋਤ
- ਨੀਮੋ: NeMo ਫਰੇਮਵਰਕ ਲਈ ਮੁੱਖ ਭੰਡਾਰ
- ਨੀਮੋ–ਚਲਾਓ: ਤੁਹਾਡੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਪ੍ਰਯੋਗਾਂ ਨੂੰ ਕੌਂਫਿਗਰ ਕਰਨ, ਲਾਂਚ ਕਰਨ ਅਤੇ ਪ੍ਰਬੰਧਿਤ ਕਰਨ ਲਈ ਇੱਕ ਟੂਲ।
- ਨੇਮੋ-ਅਲਾਈਨਰ: ਕੁਸ਼ਲ ਮਾਡਲ ਅਲਾਈਨਮੈਂਟ ਲਈ ਸਕੇਲੇਬਲ ਟੂਲਕਿੱਟ
- ਨੀਮੋ-ਕਿਊਰੇਟਰ: LLM ਲਈ ਸਕੇਲੇਬਲ ਡੇਟਾ ਪ੍ਰੀ-ਪ੍ਰੋਸੈਸਿੰਗ ਅਤੇ ਕਿਊਰੇਸ਼ਨ ਟੂਲਕਿੱਟ
NeMo ਭਾਈਚਾਰੇ ਨਾਲ ਜੁੜੋ, ਸਵਾਲ ਪੁੱਛੋ, ਸਹਾਇਤਾ ਪ੍ਰਾਪਤ ਕਰੋ, ਜਾਂ ਬੱਗ ਰਿਪੋਰਟ ਕਰੋ।
- ਨੀਮੋ ਚਰਚਾਵਾਂ
- ਨੀਮੋ ਮੁੱਦੇ
ਪ੍ਰੋਗਰਾਮਿੰਗ ਭਾਸ਼ਾਵਾਂ ਅਤੇ ਫਰੇਮਵਰਕ
- ਪਾਈਥਨ: NeMo ਫਰੇਮਵਰਕ ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ ਮੁੱਖ ਇੰਟਰਫੇਸ
- ਪਾਇਟੋਰਚ: NeMo ਫਰੇਮਵਰਕ PyTorch ਦੇ ਸਿਖਰ 'ਤੇ ਬਣਾਇਆ ਗਿਆ ਹੈ।
ਲਾਇਸੰਸ
- NeMo Github ਰੈਪੋ ਅਪਾਚੇ 2.0 ਲਾਇਸੈਂਸ ਦੇ ਅਧੀਨ ਲਾਇਸੈਂਸਸ਼ੁਦਾ ਹੈ।
- NeMo ਫਰੇਮਵਰਕ NVIDIA AI ਉਤਪਾਦ ਸਮਝੌਤੇ ਦੇ ਤਹਿਤ ਲਾਇਸੰਸਸ਼ੁਦਾ ਹੈ। ਕੰਟੇਨਰ ਨੂੰ ਖਿੱਚ ਕੇ ਅਤੇ ਵਰਤ ਕੇ, ਤੁਸੀਂ ਇਸ ਲਾਇਸੈਂਸ ਦੇ ਨਿਯਮਾਂ ਅਤੇ ਸ਼ਰਤਾਂ ਨੂੰ ਸਵੀਕਾਰ ਕਰਦੇ ਹੋ।
- NeMo ਫਰੇਮਵਰਕ ਕੰਟੇਨਰ ਵਿੱਚ Meta Llama3 ਕਮਿਊਨਿਟੀ ਲਾਇਸੈਂਸ ਸਮਝੌਤੇ ਦੁਆਰਾ ਨਿਯੰਤਰਿਤ Llama ਸਮੱਗਰੀ ਸ਼ਾਮਲ ਹੈ।
ਫੁਟਨੋਟ
ਵਰਤਮਾਨ ਵਿੱਚ, ਮਲਟੀਮੋਡਲ ਮਾਡਲਾਂ ਲਈ NeMo ਕਿਊਰੇਟਰ ਅਤੇ NeMo Aligner ਸਹਾਇਤਾ 'ਤੇ ਕੰਮ ਚੱਲ ਰਿਹਾ ਹੈ ਅਤੇ ਬਹੁਤ ਜਲਦੀ ਉਪਲਬਧ ਹੋਵੇਗਾ।
FAQ
ਸ: ਮੈਂ ਕਿਵੇਂ ਜਾਂਚ ਕਰ ਸਕਦਾ ਹਾਂ ਕਿ ਮੇਰਾ ਸਿਸਟਮ ਕਮਜ਼ੋਰੀ ਤੋਂ ਪ੍ਰਭਾਵਿਤ ਹੈ?
A: ਤੁਸੀਂ ਇੰਸਟਾਲ ਕੀਤੇ NVIDIA NeMo ਫਰੇਮਵਰਕ ਦੇ ਵਰਜਨ ਦੀ ਪੁਸ਼ਟੀ ਕਰਕੇ ਜਾਂਚ ਕਰ ਸਕਦੇ ਹੋ ਕਿ ਤੁਹਾਡਾ ਸਿਸਟਮ ਪ੍ਰਭਾਵਿਤ ਹੋਇਆ ਹੈ ਜਾਂ ਨਹੀਂ। ਜੇਕਰ ਇਹ ਵਰਜਨ 24 ਤੋਂ ਘੱਟ ਹੈ, ਤਾਂ ਤੁਹਾਡਾ ਸਿਸਟਮ ਕਮਜ਼ੋਰ ਹੋ ਸਕਦਾ ਹੈ।
ਸਵਾਲ: ਸੁਰੱਖਿਆ ਸਮੱਸਿਆ CVE-2025-23360 ਕਿਸਨੇ ਦੱਸੀ?
A: ਸੁਰੱਖਿਆ ਮੁੱਦੇ ਦੀ ਰਿਪੋਰਟ ਓਰ ਪੇਲਸ - ਜੇਫ੍ਰੌਗ ਸੁਰੱਖਿਆ ਦੁਆਰਾ ਕੀਤੀ ਗਈ ਸੀ। NVIDIA ਉਨ੍ਹਾਂ ਦੇ ਯੋਗਦਾਨ ਨੂੰ ਸਵੀਕਾਰ ਕਰਦਾ ਹੈ।
ਸ: ਮੈਂ ਭਵਿੱਖ ਦੀਆਂ ਸੁਰੱਖਿਆ ਬੁਲੇਟਿਨ ਸੂਚਨਾਵਾਂ ਕਿਵੇਂ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦਾ ਹਾਂ?
A: ਸੁਰੱਖਿਆ ਬੁਲੇਟਿਨ ਸੂਚਨਾਵਾਂ ਦੀ ਗਾਹਕੀ ਲੈਣ ਅਤੇ ਉਤਪਾਦ ਸੁਰੱਖਿਆ ਅੱਪਡੇਟਾਂ ਬਾਰੇ ਜਾਣੂ ਰਹਿਣ ਲਈ NVIDIA ਉਤਪਾਦ ਸੁਰੱਖਿਆ ਪੰਨੇ 'ਤੇ ਜਾਓ।
ਦਸਤਾਵੇਜ਼ / ਸਰੋਤ
![]() |
NVIDIA NeMo ਫਰੇਮਵਰਕ [pdf] ਯੂਜ਼ਰ ਗਾਈਡ ਨੀਮੋ ਫਰੇਮਵਰਕ, ਨੀਮੋ, ਫਰੇਮਵਰਕ |