इंटेल VTune Pro सह प्रारंभ कराfiler
Intel® VTune™ Pro सह प्रारंभ कराfiler
इंटेल व्हीट्यून प्रो वापराfileWindows*, macOS*, आणि Linux* यजमानांकडील स्थानिक आणि दूरस्थ लक्ष्य प्रणालीचे विश्लेषण करण्यासाठी. या ऑपरेशन्सद्वारे अनुप्रयोग आणि सिस्टम कार्यप्रदर्शन सुधारित करा:
- अल्गोरिदम निवडींचे विश्लेषण करा.
- अनुक्रमांक आणि समांतर कोड अडथळे शोधा.
- तुमच्या ॲप्लिकेशनला उपलब्ध हार्डवेअर संसाधनांचा कुठे आणि कसा फायदा होऊ शकतो हे समजून घ्या.
- तुमच्या अर्जाच्या अंमलबजावणीला गती द्या.
इंटेल व्हीट्यून प्रो डाउनलोड कराfileयापैकी एका मार्गाने तुमच्या सिस्टमवर आर. - स्टँडअलोन आवृत्ती डाउनलोड करा.
- इंटेल व्हीट्यून प्रो मिळवाfiler Intel® oneAPI बेस टूलकिटचा भाग म्हणून.
VTune Pro पहाfileव्हिडिओसाठी प्रशिक्षण पृष्ठ, webinars, आणि तुम्हाला प्रारंभ करण्यात मदत करण्यासाठी अधिक सामग्री.
टीप
Intel® VTune™ Pro च्या आवृत्त्यांसाठी दस्तऐवजीकरणfiler 2021 रिलीझपूर्वी फक्त डाउनलोडसाठी उपलब्ध आहेत. उत्पादन आवृत्तीनुसार उपलब्ध दस्तऐवज डाउनलोडच्या सूचीसाठी, ही पृष्ठे पहा:
- Intel Parallel Studio XE साठी डॉक्युमेंटेशन डाउनलोड करा
- इंटेल सिस्टम स्टुडिओसाठी दस्तऐवज डाउनलोड करा
वर्कफ्लो समजून घ्या
इंटेल व्हीट्यून प्रो वापराfileआर ते प्रोfile कार्यप्रदर्शन सुधारण्यासाठी अनुप्रयोग आणि परिणामांचे विश्लेषण करा.
सामान्य कार्यप्रवाहात या चरणांचा समावेश आहे:
प्रारंभ करण्यासाठी तुमची यजमान प्रणाली निवडा
Windows*, Linux*, किंवा macOS* साठी सिस्टम-विशिष्ट वर्कफ्लोबद्दल अधिक जाणून घ्या.
Intel® VTune™ Pro सह प्रारंभ कराfiler Windows* OS साठी
आपण सुरू करण्यापूर्वी
- Intel® VTune™ Pro इंस्टॉल कराfiler तुमच्या Windows* सिस्टीमवर.
- तुमचा अनुप्रयोग प्रतीक माहितीसह आणि सर्व ऑप्टिमायझेशन सक्षम करून रिलीझ मोडमध्ये तयार करा. कंपाइलर सेटिंग्जवरील तपशीलवार माहितीसाठी, VTune Pro पहाfiler ऑनलाइन वापरकर्ता मार्गदर्शक.
तुम्ही मॅट्रिक्स s देखील वापरू शकताample अर्ज उपलब्ध आहे \VTune\Sampलेस\मॅट्रिक्स. आपण संबंधित एस पाहू शकताample परिणाम \VTune\Projects\sample (मॅट्रिक्स). - पर्यावरण व्हेरिएबल्स सेट करा: चालवा \setvars.bat स्क्रिप्ट.
डीफॉल्टनुसार, द oneAPI घटकांसाठी प्रोग्राम आहे Files (x86)\Intel\oneAPI.
टीप Intel® VTune™ Pro वापरताना तुम्हाला setvars.bat चालवण्याची गरज नाहीfileमायक्रोसॉफ्ट* व्हिज्युअल स्टुडिओ* मध्ये.
पायरी 1: Intel® VTune™ प्रो सुरू कराfiler
Intel VTune Pro सुरू कराfiler यापैकी एका मार्गाने आणि प्रकल्प सेट करा. प्रकल्प हे तुम्ही विश्लेषण करू इच्छित असलेल्या अनुप्रयोगासाठी, विश्लेषणाचा प्रकार आणि डेटा संकलन परिणामांसाठी एक कंटेनर आहे.
स्रोत / VTune Pro प्रारंभ कराfiler
स्टँडअलोन (GUI)
- vtune-gui कमांड चालवा किंवा Intel® VTune™ Pro चालवाfileस्टार्ट मेनूमधून r.
- GUI उघडल्यावर, स्वागत स्क्रीनवर क्लिक करा.
- प्रोजेक्ट तयार करा डायलॉग बॉक्समध्ये, प्रोजेक्टचे नाव आणि स्थान निर्दिष्ट करा.
- प्रोजेक्ट तयार करा वर क्लिक करा.
स्टँडअलोन (कमांड लाइन)
vtune कमांड चालवा.
मायक्रोसॉफ्ट* व्हिज्युअल स्टुडिओ* IDE
व्हिज्युअल स्टुडिओमध्ये तुमचे समाधान उघडा. VTune Profiler टूलबार स्वयंचलितपणे सक्षम केला जातो आणि तुमचा व्हिज्युअल स्टुडिओ प्रकल्प विश्लेषण लक्ष्य म्हणून सेट केला जातो.
टीप
Intel® VTune™ Pro चालवताना तुम्हाला प्रकल्प तयार करण्याची आवश्यकता नाहीfileकमांड लाइनवरून किंवा मायक्रोसॉफ्ट* व्हिज्युअल स्टुडिओमध्ये.
पायरी 2: विश्लेषण कॉन्फिगर करा आणि चालवा
नवीन प्रकल्प तयार केल्यानंतर, या डीफॉल्ट मूल्यांसह कॉन्फिगर विश्लेषण विंडो उघडेल:
- लाँच ऍप्लिकेशन विभागात, तुमच्या ऍप्लिकेशनच्या एक्झिक्युटेबल स्थानावर ब्राउझ करा file.
- तुमच्या अॅप्लिकेशनवर परफॉर्मन्स स्नॅपशॉट रन करण्यासाठी स्टार्ट वर क्लिक करा. हे विश्लेषण एक सामान्य ओव्हर सादर करतेview लक्ष्य प्रणालीवरील आपल्या अनुप्रयोगाच्या कार्यक्षमतेवर परिणाम करणाऱ्या समस्यांबद्दल.
पायरी 3: View आणि कार्यप्रदर्शन डेटाचे विश्लेषण करा
डेटा संकलन पूर्ण झाल्यावर, VTune Profiler सारांश विंडोमध्ये विश्लेषण परिणाम प्रदर्शित करते. येथे, तुम्हाला एक परफॉर्मन्स दिसलाview आपल्या अर्ज
ओव्हरview सामान्यत: त्यांच्या वर्णनांसह अनेक मेट्रिक्स समाविष्ट करतात.
- A योगदान देणाऱ्या घटकांबद्दल तपशीलवार माहितीसाठी प्रत्येक मेट्रिक विस्तृत करा.
- B ध्वजांकित मेट्रिक स्वीकार्य/सामान्य ऑपरेटिंग श्रेणीबाहेरील मूल्य दर्शवते. फ्लॅग केलेला मेट्रिक कसा सुधारायचा हे समजून घेण्यासाठी टूल टिप्स वापरा.
- C तुम्ही पुढे धावण्याचा विचार करावा अशा इतर विश्लेषणांबद्दल मार्गदर्शन पहा. विश्लेषण वृक्ष या शिफारसी हायलाइट करते.
पुढील पायऱ्या
VTune Pro सह ऍप्लिकेशनच्या कार्यक्षमतेचे एकूण मूल्यमापन करण्यासाठी परफॉर्मन्स स्नॅपशॉट हा एक चांगला प्रारंभ बिंदू आहेfileआर पुढे, तुमच्या अल्गोरिदमला ट्यूनिंग आवश्यक आहे का ते तपासा.
- कार्यप्रदर्शनातील सामान्य अडथळ्यांचे विश्लेषण करण्यासाठी ट्यूटोरियलचे अनुसरण करा.
- एकदा तुमचा अल्गोरिदम चांगला ट्यून झाल्यानंतर, परिणाम कॅलिब्रेट करण्यासाठी आणि इतर क्षेत्रातील संभाव्य कामगिरी सुधारणा ओळखण्यासाठी पुन्हा परफॉर्मन्स स्नॅपशॉट चालवा.
हे देखील पहा
मायक्रोआर्किटेक्चर एक्सप्लोरेशन
व्हीट्यून प्रोfiler मदत दौरा
Exampले: प्रोfile Windows वर OpenMP* अनुप्रयोग*
इंटेल व्हीट्यून प्रो वापराfileप्रो टू विंडोज मशीनवर आरfile म्हणूनample iso3dfd_omp_offload OpenMP ऍप्लिकेशन Intel GPU वर ऑफलोड केले. GPU विश्लेषण कसे चालवायचे ते जाणून घ्या आणि परिणामांचे परीक्षण करा.
पूर्वतयारी
- तुमची प्रणाली Microsoft* Windows 10 किंवा नवीन आवृत्ती चालवत असल्याची खात्री करा.
- इंटेल प्रोसेसर ग्राफिक्सच्या या आवृत्तींपैकी एक वापरा:
- जनरल ५
- जनरल ५
- जनरल ५
- तुमची प्रणाली यापैकी एका इंटेल प्रोसेसरवर चालत असावी:
- 7th Generation Intel® Core™ i7 प्रोसेसर (कोड नाव काबी लेक)
- 8व्या पिढीतील Intel® Core™ i7 प्रोसेसर (कोड नाव कॉफी लेक)
- 10 वी जनरेशन Intel® Core™ i7 प्रोसेसर (कोड नाव आइस लेक)
- इंटेल व्हीट्यून प्रो स्थापित कराfileया स्त्रोतांपैकी एक पासून r:
- स्टँडअलोन उत्पादन डाउनलोड
- Intel® oneAPI बेस टूलकिट
- Intel® सिस्टम ब्रिंग-अप टूलकिट
- Intel® oneAPI HPC टूलकिट डाउनलोड करा ज्यात Intel® oneAPI DPC++/C++ कंपाइलर(icx/icpx) आहे ज्याची तुम्हाला प्रोसाठी गरज आहे.file OpenMP अनुप्रयोग.
- पर्यावरण व्हेरिएबल्स सेट करा. मध्ये स्थित vars.bat स्क्रिप्ट कार्यान्वित करा \env निर्देशिका.
- GPU विश्लेषणासाठी तुमची प्रणाली सेट करा.
टीप
Intel VTune Pro इंस्टॉल करण्यासाठीfileमायक्रोसॉफ्ट* व्हिज्युअल स्टुडिओ वातावरणात, VTune Pro पहाfiler वापरकर्ता मार्गदर्शक.
OpenMP ऑफलोड ऍप्लिकेशन तयार करा आणि संकलित करा
- iso3dfd_omp_offload OpenMP ऑफलोड डाउनलोड कराampले
- एस साठी उघडाample निर्देशिका.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - OpenMP ऑफलोड ऍप्लिकेशन संकलित करा.
mkdir बिल्ड
सीडी बिल्ड
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-लक्ष्य:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp
OpenMP ऑफलोड ऍप्लिकेशनवर GPU विश्लेषण चालवा
तुम्ही आता संकलित केलेल्या OpenMP ऍप्लिकेशनवर GPU ऑफलोड विश्लेषण चालवण्यासाठी तयार आहात.
- VTune Pro उघडाfiler आणि प्रोजेक्ट तयार करण्यासाठी New Project वर क्लिक करा.
- स्वागत पृष्ठावर, तुमचे विश्लेषण सेट करण्यासाठी कॉन्फिगर विश्लेषण वर क्लिक करा.
- तुमच्या विश्लेषणासाठी या सेटिंग्ज निवडा.
- WHERE उपखंडात, स्थानिक होस्ट निवडा.
- WHAT उपखंडात, ऍप्लिकेशन लाँच करा निवडा आणि प्रो टू ऍप्लिकेशन म्हणून iso3dfd_omp_offload बायनरी निर्दिष्ट कराfile.
- HOW उपखंडात, विश्लेषण ट्रीमधील Accelerators गटातून GPU ऑफलोड विश्लेषण प्रकार निवडा.
- विश्लेषण चालवण्यासाठी स्टार्ट बटणावर क्लिक करा.
व्हीट्यून प्रोfiler डेटा संकलित करते आणि GPU ऑफलोडमध्ये विश्लेषण परिणाम प्रदर्शित करते viewबिंदू
- सारांश विंडोमध्ये, CPU आणि GPU संसाधन वापरावरील आकडेवारी पहा. तुमचा अर्ज आहे की नाही हे निर्धारित करण्यासाठी हा डेटा वापरा:
- GPU-बद्ध
- CPU-बद्ध
- आपल्या सिस्टमच्या गणना संसाधनांचा अकार्यक्षमतेने वापर करणे
- मूलभूत CPU आणि GPU मेट्रिक्स पाहण्यासाठी प्लॅटफॉर्म विंडोमधील माहिती वापरा.
- ग्राफिक्स विंडोमध्ये विशिष्ट संगणकीय कार्ये तपासा.
सखोल विश्लेषणासाठी, VTune Pro मध्ये संबंधित रेसिपी पहाfiler कार्यप्रदर्शन विश्लेषण कुकबुक. तुम्ही तुमचे प्रोफाइलिंग GPU Compute/Media Hotspots विश्लेषणासह सुरू ठेवू शकता.
Example: प्रोfile विंडोजवरील SYCL* अर्ज*
प्रोfile म्हणूनample matrix_multiply SYCL ऍप्लिकेशन Intel® VTune™ Pro सहfileआर उत्पादनाशी परिचित व्हा आणि GPU-बद्ध अनुप्रयोगांसाठी गोळा केलेली आकडेवारी समजून घ्या.
पूर्वतयारी
- तुमच्या सिस्टीमवर Microsoft* Visual Studio (v2017 किंवा नवीन) स्थापित असल्याची खात्री करा.
- इंटेल व्हीट्यून प्रो स्थापित कराfileIntel® oneAPI बेस टूलकिट किंवा Intel® सिस्टम ब्रिंग-अप टूलकिट वरून. या टूलकिटमध्ये प्रोफाइलिंग प्रक्रियेसाठी आवश्यक असलेले Intel® oneAPI DPC++/C++ कंपाइलर(icpx -fsycl) कंपाइलर असते.
- पर्यावरण व्हेरिएबल्स सेट करा. मध्ये स्थित vars.bat स्क्रिप्ट कार्यान्वित करा \env निर्देशिका.
- Intel oneAPI DPC++ कंपाइलर (Intel oneAPI बेस टूलकिटसह स्थापित केलेले) मायक्रोसॉफ्ट व्हिज्युअल स्टुडिओमध्ये समाकलित केले आहे याची खात्री करा.
- Intel oneAPI DPC++ कंपाइलरसाठी -gline-tables-only आणि -fdebug-info-for-profiling पर्याय वापरून कोड संकलित करा.
- GPU विश्लेषणासाठी तुमची प्रणाली सेट करा.
Intel VTune Pro इन्स्टॉल करण्याच्या माहितीसाठीfileमायक्रोसॉफ्ट* व्हिज्युअल स्टुडिओ वातावरणात, VTune Pro पहाfiler वापरकर्ता मार्गदर्शक.
मॅट्रिक्स अॅप तयार करा
matrix_multiply_vtune कोड डाउनलोड कराampइंटेल वनएपीआय टूलकिटसाठी le पॅकेज. यामध्ये एसample जे तुम्ही बिल्ड आणि प्रो करण्यासाठी वापरू शकताfile एक SYCL अर्ज.
- मायक्रोसॉफ्ट* व्हिज्युअल स्टुडिओ उघडा.
- क्लिक करा File > उघडा > प्रकल्प/उपाय. matrix_multiply_vtune फोल्डर शोधा आणि matrix_multiply.sln निवडा.
- हे कॉन्फिगरेशन तयार करा (प्रोजेक्ट > बिल्ड).
- प्रोग्राम चालवा (डीबग > डीबगिंगशिवाय प्रारंभ करा).
- s ची DPC++ किंवा थ्रेडेड आवृत्ती निवडण्यासाठीample, प्रीप्रोसेसर व्याख्या वापरा.
- प्रकल्प गुणधर्म > DPC++ > प्रीप्रोसेसर > प्रीप्रोसेसर व्याख्या वर जा.
- icpx -fsycl किंवा USE_THR परिभाषित करा.
GPU विश्लेषण चालवा
मॅट्रिक्स s वर GPU विश्लेषण चालवाampले
- व्हिज्युअल स्टुडिओ टूलबारमधून, कॉन्फिगर विश्लेषण बटणावर क्लिक करा.
कॉन्फिगर विश्लेषण विंडो उघडेल. डीफॉल्टनुसार, ते तुमच्या VS प्रोजेक्ट सेटिंग्ज इनहेरिट करते आणि matrix_multiply.exe ला प्रो टू ऍप्लिकेशन म्हणून निर्दिष्ट करते.file. - कॉन्फिगर विश्लेषण विंडोमध्ये, क्लिक करा
HOW उपखंडातील ब्राउझ बटण.
- अॅनालिसिस ट्रीमधील एक्सीलरेटर्स ग्रुपमधून GPU कॉम्प्युट/मीडिया हॉटस्पॉट विश्लेषण प्रकार निवडा.
- पूर्वनिर्धारित पर्यायांसह विश्लेषण सुरू करण्यासाठी प्रारंभ बटणावर क्लिक करा.
कमांड लाइनवरून GPU विश्लेषण चालवा:
- एस उघडाample निर्देशिका:
<sample_dir>\VtuneProfiler\matrix_multiply_vtune - या निर्देशिकेत, व्हिज्युअल स्टुडिओ* प्रकल्प उघडा file matrix_multiply.sln नाव दिले
- multiply.cpp file मॅट्रिक्स गुणाकाराच्या अनेक आवृत्त्या आहेत. multiply.hpp मध्ये संबंधित #define MULTIPLY ओळ संपादित करून आवृत्ती निवडा
- रिलीझ कॉन्फिगरेशनसह संपूर्ण प्रकल्प तयार करा.
हे matrix_multiply.exe नावाचे एक एक्झिक्यूटेबल व्युत्पन्न करते. - GPU विश्लेषण चालवण्यासाठी सिस्टम तयार करा. GPU विश्लेषणासाठी सेट अप सिस्टम पहा.
- VTune Pro सेट कराfileबॅच चालवून पर्यावरण व्हेरिएबल्स file: निर्यात \env\vars.bat
- विश्लेषण आदेश चालवा:
vtune.exe -gpu-offload गोळा करा — matrix_multiply.exe
व्हीट्यून प्रोfiler डेटा संकलित करते आणि GPU Compute/Media Hotspots मध्ये विश्लेषण परिणाम प्रदर्शित करते viewबिंदू सारांश विंडोमध्ये, तुमचा अनुप्रयोग GPU-बद्ध आहे की नाही हे समजून घेण्यासाठी CPU आणि GPU संसाधन वापरावरील आकडेवारी पहा. कालांतराने कोड अंमलबजावणीचे प्रतिनिधित्व करणारे मूलभूत CPU आणि GPU मेट्रिक्स पाहण्यासाठी ग्राफिक्स विंडोवर स्विच करा.
Intel® VTune™ Pro सह प्रारंभ कराfiler Linux* OS साठी
आपण सुरू करण्यापूर्वी
- Intel® VTune™ Pro इंस्टॉल कराfiler तुमच्या Linux* सिस्टीमवर.
- तुमचा अनुप्रयोग प्रतीक माहितीसह आणि सर्व ऑप्टिमायझेशन सक्षम करून रिलीझ मोडमध्ये तयार करा. कंपाइलर सेटिंग्जवरील तपशीलवार माहितीसाठी, VTune Pro पहाfiler ऑनलाइन वापरकर्ता मार्गदर्शक.
तुम्ही मॅट्रिक्स s देखील वापरू शकताample अर्ज उपलब्ध आहे \sample\matrix. आपण एस पाहू शकताample परिणाम \sample (मॅट्रिक्स). - पर्यावरण व्हेरिएबल्स सेट करा: स्त्रोत /setvars.sh
डीफॉल्टनुसार, द आहे:- $HOME/intel/oneapi/ वापरकर्ता परवानगीसह स्थापित केल्यावर;
- /opt/intel/oneapi/ रूट परवानगीसह स्थापित केल्यावर.
पायरी 1: VTune Pro सुरू कराfiler
VTune Pro सुरू कराfileयापैकी एका मार्गाने आर.
स्रोत / VTune Pro प्रारंभ कराfiler
स्टँडअलोन/आयडीई (GUI)
- vtunegui कमांड चालवा. VTune Pro सुरू करण्यासाठीfileइंटेल सिस्टम स्टुडिओ IDE मधून, टूल्स > VTune Pro निवडाfiler > VTune Pro लाँच कराfileआर हे सर्व योग्य पर्यावरण व्हेरिएबल्स सेट करते आणि उत्पादनाचा एक स्वतंत्र इंटरफेस लाँच करते.
- जेव्हा GUI उघडेल, तेव्हा स्वागत स्क्रीनमध्ये नवीन प्रकल्प क्लिक करा.
- प्रोजेक्ट तयार करा डायलॉग बॉक्समध्ये, प्रोजेक्टचे नाव आणि स्थान निर्दिष्ट करा.
- प्रोजेक्ट तयार करा वर क्लिक करा.
स्टँडअलोन (कमांड लाइन)
- vtune कमांड चालवा.
पायरी 2: विश्लेषण कॉन्फिगर करा आणि चालवा
नवीन प्रकल्प तयार केल्यानंतर, या डीफॉल्ट मूल्यांसह कॉन्फिगर विश्लेषण विंडो उघडेल:
- लाँच ऍप्लिकेशन विभागात, तुमच्या ऍप्लिकेशनचे स्थान ब्राउझ करा.
- तुमच्या अॅप्लिकेशनवर परफॉर्मन्स स्नॅपशॉट रन करण्यासाठी स्टार्ट वर क्लिक करा. हे विश्लेषण एक सामान्य ओव्हर सादर करतेview लक्ष्य प्रणालीवरील आपल्या अनुप्रयोगाच्या कार्यक्षमतेवर परिणाम करणाऱ्या समस्यांबद्दल.
पायरी 3: View आणि कार्यप्रदर्शन डेटाचे विश्लेषण करा
डेटा संकलन पूर्ण झाल्यावर, VTune Profiler सारांश विंडोमध्ये विश्लेषण परिणाम प्रदर्शित करते. येथे, तुम्हाला एक परफॉर्मन्स दिसलाview आपल्या अर्ज
ओव्हरview सामान्यत: त्यांच्या वर्णनांसह अनेक मेट्रिक्स समाविष्ट करतात.
- A योगदान देणाऱ्या घटकांबद्दल तपशीलवार माहितीसाठी प्रत्येक मेट्रिक विस्तृत करा.
- B ध्वजांकित मेट्रिक स्वीकार्य/सामान्य ऑपरेटिंग श्रेणीबाहेरील मूल्य दर्शवते. फ्लॅग केलेला मेट्रिक कसा सुधारायचा हे समजून घेण्यासाठी टूल टिप्स वापरा.
- C तुम्ही पुढे धावण्याचा विचार करावा अशा इतर विश्लेषणांबद्दल मार्गदर्शन पहा. विश्लेषण वृक्ष या शिफारसी हायलाइट करते.
पुढील पायऱ्या
VTune Pro सह ऍप्लिकेशनच्या कार्यक्षमतेचे एकूण मूल्यमापन करण्यासाठी परफॉर्मन्स स्नॅपशॉट हा एक चांगला प्रारंभ बिंदू आहेfileआर पुढे, तुमच्या अल्गोरिदमला ट्यूनिंग आवश्यक आहे का ते तपासा.
- कार्यप्रदर्शनातील सामान्य अडथळ्यांचे विश्लेषण करण्यासाठी ट्यूटोरियलचे अनुसरण करा.
- एकदा तुमचा अल्गोरिदम चांगला ट्यून झाल्यानंतर, परिणाम कॅलिब्रेट करण्यासाठी आणि इतर क्षेत्रातील संभाव्य कामगिरी सुधारणा ओळखण्यासाठी पुन्हा परफॉर्मन्स स्नॅपशॉट चालवा.
हे देखील पहा
मायक्रोआर्किटेक्चर एक्सप्लोरेशन
व्हीट्यून प्रोfiler मदत दौरा
Example: प्रोfile लिनक्स वर एक OpenMP अनुप्रयोग*
इंटेल व्हीट्यून प्रो वापराfiler Linux मशीनवर प्रोfile म्हणूनample iso3dfd_omp_offload OpenMP ऍप्लिकेशन Intel GPU वर ऑफलोड केले. GPU विश्लेषण कसे चालवायचे ते जाणून घ्या आणि परिणामांचे परीक्षण करा.
पूर्वतयारी
- तुमची प्रणाली Linux* OS कर्नल 4.14 किंवा नवीन आवृत्ती चालवत असल्याची खात्री करा.
- इंटेल प्रोसेसर ग्राफिक्सच्या या आवृत्तींपैकी एक वापरा:
- जनरल ५
- जनरल ५
- जनरल ५
- तुमची प्रणाली यापैकी एका इंटेल प्रोसेसरवर चालत असावी:
- 7th Generation Intel® Core™ i7 प्रोसेसर (कोड नाव काबी लेक)
- 8व्या पिढीतील Intel® Core™ i7 प्रोसेसर (कोड नाव कॉफी लेक)
- 10 वी जनरेशन Intel® Core™ i7 प्रोसेसर (कोड नाव आइस लेक)
- Linux GUI साठी, वापरा:
- GTK+ आवृत्ती 2.10 किंवा नवीन (2.18 आणि नवीन आवृत्तीची शिफारस केली जाते)
- Pango आवृत्ती 1.14 किंवा नवीन
- X.Org आवृत्ती 1.0 किंवा नवीन (1.7 आणि नवीन आवृत्तीची शिफारस केली जाते)
- इंटेल व्हीट्यून प्रो स्थापित कराfileया स्त्रोतांपैकी एक पासून r:
- स्टँडअलोन उत्पादन डाउनलोड
- Intel® oneAPI बेस टूलकिट
- Intel® सिस्टम ब्रिंग-अप टूलकिट
- Intel® oneAPI HPC टूलकिट डाउनलोड करा ज्यात Intel® oneAPI DPC++/C++ कंपाइलर(icx/icpx) आहे ज्याची तुम्हाला प्रोसाठी गरज आहे.file OpenMP अनुप्रयोग.
- पर्यावरण व्हेरिएबल्स सेट करा. vars.sh स्क्रिप्ट कार्यान्वित करा.
- GPU विश्लेषणासाठी तुमची प्रणाली सेट करा.
OpenMP ऑफलोड ऍप्लिकेशन तयार करा आणि संकलित करा
- iso3dfd_omp_offload OpenMP ऑफलोड डाउनलोड कराampले
- एस साठी उघडाample निर्देशिका.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - OpenMP ऑफलोड ऍप्लिकेशन संकलित करा.
mkdir बिल्ड;
cmake -DVERIFY_RESULTS=0 ..
बनवा -j
हे src/iso3dfd एक्झिक्युटेबल व्युत्पन्न करते.
प्रोग्राम हटविण्यासाठी, टाइप करा:
स्वच्छ करा
हे एक्झिक्युटेबल आणि ऑब्जेक्ट काढून टाकते fileतुम्ही मेक कमांडने तयार केले आहे.
OpenMP ऑफलोड ऍप्लिकेशनवर GPU विश्लेषण चालवा
तुम्ही आता संकलित केलेल्या OpenMP ऍप्लिकेशनवर GPU ऑफलोड विश्लेषण चालवण्यासाठी तयार आहात.
- VTune Pro उघडाfiler आणि प्रोजेक्ट तयार करण्यासाठी New Project वर क्लिक करा.
- स्वागत पृष्ठावर, तुमचे विश्लेषण सेट करण्यासाठी कॉन्फिगर विश्लेषण वर क्लिक करा.
- तुमच्या विश्लेषणासाठी या सेटिंग्ज निवडा.
- WHERE उपखंडात, स्थानिक होस्ट निवडा.
- WHAT उपखंडात, ऍप्लिकेशन लाँच करा निवडा आणि प्रो टू ऍप्लिकेशन म्हणून iso3dfd_omp_offload बायनरी निर्दिष्ट कराfile.
- HOW उपखंडात, विश्लेषण ट्रीमधील Accelerators गटातून GPU ऑफलोड विश्लेषण प्रकार निवडा.
- विश्लेषण चालवण्यासाठी स्टार्ट बटणावर क्लिक करा.
व्हीट्यून प्रोfiler डेटा संकलित करते आणि GPU ऑफलोडमध्ये विश्लेषण परिणाम प्रदर्शित करते viewबिंदू
- सारांश विंडोमध्ये, CPU आणि GPU संसाधन वापरावरील आकडेवारी पहा. तुमचा अर्ज आहे की नाही हे निर्धारित करण्यासाठी हा डेटा वापरा:
- GPU-बद्ध
- CPU-बद्ध
- आपल्या सिस्टमच्या गणना संसाधनांचा अकार्यक्षमतेने वापर करणे
- मूलभूत CPU आणि GPU मेट्रिक्स पाहण्यासाठी प्लॅटफॉर्म विंडोमधील माहिती वापरा.
- ग्राफिक्स विंडोमध्ये विशिष्ट संगणकीय कार्ये तपासा.
सखोल विश्लेषणासाठी, VTune Pro मध्ये संबंधित रेसिपी पहाfiler कार्यप्रदर्शन विश्लेषण कुकबुक. तुम्ही तुमचे प्रोफाइलिंग GPU Compute/Media Hotspots विश्लेषणासह सुरू ठेवू शकता.
Example: प्रोfile लिनक्स वर एक SYCL* अर्ज*
VTune Pro वापराfiler सहample matrix_multiply SYCL ऍप्लिकेशन GPU-बद्ध ऍप्लिकेशन्ससाठी संकलित केलेल्या उत्पादन आणि आकडेवारीशी त्वरित परिचित होण्यासाठी.
पूर्वतयारी
- VTune Pro स्थापित कराfiler आणि Intel® oneAPI DPC++/C++ कंपाइलर Intel® oneAPI बेस टूलकिट किंवा Intel® सिस्टम ब्रिंग-अप टूलकिट.
- vars.sh स्क्रिप्ट कार्यान्वित करून पर्यावरण व्हेरिएबल्स सेट करा.
- GPU विश्लेषणासाठी तुमची प्रणाली सेट करा.
मॅट्रिक्स ऍप्लिकेशन तयार करा
matrix_multiply_vtune कोड डाउनलोड कराampइंटेल वनएपीआय टूलकिटसाठी le पॅकेज. यामध्ये एसample जे तुम्ही बिल्ड आणि प्रो करण्यासाठी वापरू शकताfile एक SYCL अर्ज.
ते प्रोfile एक SYCL ऍप्लिकेशन, इंटेल वनएपीआय डीपीसी++ कंपाइलर पर्यायांसाठी -gline-टेबल-केवळ आणि -fdebug-माहिती-प्रोफाइलिंग वापरून कोड संकलित केल्याची खात्री करा.
हे संकलन करण्यासाठी एसampअर्ज करण्यासाठी, पुढील गोष्टी करा:
- एस वर जाample निर्देशिका.
cd <sample_dir/VtuneProfile</matrix_multiply> - multiply.cpp file src फोल्डरमध्ये मॅट्रिक्स गुणाकाराच्या अनेक आवृत्त्या आहेत. multiply.h मध्ये संबंधित #define MULTIPLY ओळ संपादित करून आवृत्ती निवडा.
- विद्यमान मेक वापरून अॅप तयार कराfile:
cmake
बनवणे
याने matrix.icpx -fsycl एक्झिक्युटेबल तयार केले पाहिजे.
प्रोग्राम हटविण्यासाठी, टाइप करा:
स्वच्छ करा
हे एक्झिक्युटेबल आणि ऑब्जेक्ट काढून टाकते files जे मेक कमांडने तयार केले होते.
GPU विश्लेषण चालवा
मॅट्रिक्स s वर GPU विश्लेषण चालवाampले
- VTune Pro लाँच कराfilevtune-gui कमांडसह r.
- स्वागत पृष्ठावरून नवीन प्रकल्पावर क्लिक करा.
- तुमच्यासाठी नाव आणि स्थान निर्दिष्ट कराample project आणि Create Project वर क्लिक करा.
- WHAT उपखंडात, matrix.icpx-fsycl वर ब्राउझ करा file.
- HOW उपखंडात, क्लिक करा
ब्राउझ बटण आणि विश्लेषण ट्री मधील एक्सीलरेटर्स ग्रुपमधून GPU कॉम्प्यूट/मीडिया हॉटस्पॉट विश्लेषण निवडा.
- पूर्व-निवडलेल्या पर्यायांसह विश्लेषण सुरू करण्यासाठी तळाशी असलेल्या स्टार्ट बटणावर क्लिक करा.
कमांड लाइनवरून GPU विश्लेषण चालवा:
- GPU विश्लेषण चालवण्यासाठी सिस्टम तयार करा. GPU विश्लेषणासाठी सेट अप सिस्टम पहा.
- इंटेल सॉफ्टवेअर टूल्ससाठी पर्यावरण व्हेरिएबल्स सेट करा:
स्रोत $ONEAPI_ROOT/setvars.sh - GPU कंप्यूट/मीडिया हॉटस्पॉट विश्लेषण चालवा:
vtune -gpu-हॉटस्पॉट्स गोळा करा -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
सारांश अहवाल पाहण्यासाठी, टाइप करा:
vtune -report सारांश -r ./result_gpu-हॉटस्पॉट
व्हीट्यून प्रोfiler डेटा संकलित करते आणि GPU Compute/Media Hotspots मध्ये विश्लेषण परिणाम प्रदर्शित करते viewबिंदू सारांश विंडोमध्ये, तुमचा अनुप्रयोग GPU-बद्ध आहे की नाही हे समजून घेण्यासाठी CPU आणि GPU संसाधन वापरावरील आकडेवारी पहा. कालांतराने कोड अंमलबजावणीचे प्रतिनिधित्व करणारे मूलभूत CPU आणि GPU मेट्रिक्स पाहण्यासाठी ग्राफिक्स विंडोवर स्विच करा.
Intel® VTune™ Pro सह प्रारंभ कराfilemacOS साठी r*
VTune Pro वापराfileनॉन-मॅकओएस प्रणालीवर (फक्त लिनक्स* किंवा Android*) दूरस्थ लक्ष्य विश्लेषण करण्यासाठी macOS प्रणालीवर r.
तुम्ही VTune Pro वापरू शकत नाहीfileया उद्देशांसाठी macOS वातावरणात r:
- प्रोfile macOS प्रणाली ज्यावर ती स्थापित केली आहे.
- दूरस्थ macOS प्रणालीवर डेटा संकलित करा.
macOS होस्टकडून रिमोट Linux* किंवा Android* लक्ष्याच्या कार्यप्रदर्शनाचे विश्लेषण करण्यासाठी, यापैकी एक पायरी करा:
- VTune Pro चालवाfileलक्ष्य म्हणून निर्दिष्ट केलेल्या रिमोट सिस्टमसह मॅकओएस सिस्टमवरील विश्लेषण. जेव्हा विश्लेषण सुरू होते, VTune Profiler डेटा संकलित करण्यासाठी रिमोट सिस्टमशी कनेक्ट करतो, नंतर परिणाम macOS होस्टकडे परत आणतो viewing
- स्थानिक पातळीवर लक्ष्य प्रणालीवर विश्लेषण चालवा आणि परिणामांची macOS प्रणालीवर कॉपी करा viewVTune Pro मध्येfiler.
या दस्तऐवजातील पायऱ्या रिमोट लिनक्स टार्गेट सिस्टम गृहीत करतात आणि VTune Pro वरून SSH ऍक्सेस वापरून परफॉर्मन्स डेटा गोळा करतात.filer macOS होस्ट सिस्टमवर.
आपण सुरू करण्यापूर्वी
- Intel® VTune™ Pro इंस्टॉल कराfiler तुमच्या macOS* सिस्टीमवर.
- तुमचा लिनक्स अॅप्लिकेशन प्रतीक माहितीसह आणि सर्व ऑप्टिमायझेशन सक्षम करून रिलीझ मोडमध्ये तयार करा. तपशीलवार माहितीसाठी, VTune Pro मधील कंपाइलर सेटिंग्ज पहाfiler मदत.
- पासवर्ड-लेस मोडमध्ये काम करण्यासाठी होस्ट macOS प्रणालीवरून लक्ष्य Linux प्रणालीवर SSH प्रवेश सेट करा.
पायरी 1: VTune Pro सुरू कराfiler
- VTune Pro लाँच कराfilevtune-gui कमांडसह r.
डीफॉल्टनुसार, द /opt/intel/oneapi/ आहे. - जेव्हा GUI उघडेल, तेव्हा स्वागत स्क्रीनमध्ये नवीन प्रकल्प क्लिक करा.
- प्रोजेक्ट तयार करा डायलॉग बॉक्समध्ये, प्रोजेक्टचे नाव आणि स्थान निर्दिष्ट करा.
- प्रोजेक्ट तयार करा वर क्लिक करा.
पायरी 2: विश्लेषण कॉन्फिगर करा आणि चालवा
तुम्ही नवीन प्रोजेक्ट तयार केल्यानंतर, कॉन्फिगर विश्लेषण विंडो परफॉर्मन्स स्नॅपशॉट विश्लेषण प्रकारासह उघडेल.
हे विश्लेषण एक ओव्हर सादर करतेview लक्ष्य प्रणालीवरील आपल्या अनुप्रयोगाच्या कार्यक्षमतेवर परिणाम करणार्या समस्यांचे.
- WHERE उपखंडात, Remote Linux (SSH) निवडा आणि username@ hostname[:port] वापरून लक्ष्य लिनक्स प्रणाली निर्दिष्ट करा.
व्हीट्यून प्रोfiler लिनक्स प्रणालीशी जोडते आणि लक्ष्य पॅकेज स्थापित करते. - WHAT उपखंडात, लक्ष्य लिनक्स प्रणालीवर तुमच्या अनुप्रयोगाचा मार्ग प्रदान करा.
- ऍप्लिकेशनवर परफॉर्मन्स स्नॅपशॉट रन करण्यासाठी स्टार्ट बटणावर क्लिक करा.
पायरी 3: View आणि कार्यप्रदर्शन डेटाचे विश्लेषण करा
डेटा संकलन पूर्ण झाल्यावर, VTune Profiler macOS प्रणालीवर विश्लेषण परिणाम प्रदर्शित करते. सारांश विंडोमध्ये तुमचे विश्लेषण सुरू करा. येथे, तुम्हाला एक परफॉर्मन्स दिसलाview आपल्या अर्ज
ओव्हरview सामान्यत: त्यांच्या वर्णनांसह अनेक मेट्रिक्स समाविष्ट करतात.
- A योगदान देणाऱ्या घटकांबद्दल तपशीलवार माहितीसाठी प्रत्येक मेट्रिक विस्तृत करा.
- B ध्वजांकित मेट्रिक स्वीकार्य/सामान्य ऑपरेटिंग श्रेणीबाहेरील मूल्य दर्शवते. फ्लॅग केलेला मेट्रिक कसा सुधारायचा हे समजून घेण्यासाठी टूल टिप्स वापरा.
- C तुम्ही पुढे धावण्याचा विचार करावा अशा इतर विश्लेषणांबद्दल मार्गदर्शन पहा. विश्लेषण वृक्ष या शिफारसी हायलाइट करते.
पुढील पायऱ्या
VTune Pro सह ऍप्लिकेशनच्या कार्यक्षमतेचे एकूण मूल्यमापन करण्यासाठी परफॉर्मन्स स्नॅपशॉट हा एक चांगला प्रारंभ बिंदू आहेfiler.
पुढे, तुमच्या अल्गोरिदमला ट्यूनिंग आवश्यक आहे का ते तपासा.
- तुमच्या अर्जावर Hotspots Analysis चालवा.
- हॉटस्पॉट ट्यूटोरियल फॉलो करा. तुमच्या हॉटस्पॉट विश्लेषणाचा जास्तीत जास्त फायदा घेण्यासाठी तंत्रे जाणून घ्या.
- एकदा तुमचा अल्गोरिदम चांगला ट्यून झाल्यानंतर, परिणाम कॅलिब्रेट करण्यासाठी आणि इतर क्षेत्रातील संभाव्य कामगिरी सुधारणा ओळखण्यासाठी पुन्हा परफॉर्मन्स स्नॅपशॉट चालवा.
हे देखील पहा
मायक्रोआर्किटेक्चर एक्सप्लोरेशन
व्हीट्यून प्रोfiler मदत दौरा
अधिक जाणून घ्या
दस्तऐवज / वर्णन
- वापरकर्ता मार्गदर्शक
VTune Pro साठी वापरकर्ता मार्गदर्शक हे प्राथमिक दस्तऐवजीकरण आहेfiler.
टीप
तुम्ही VTune Pro ची ऑफलाइन आवृत्ती देखील डाउनलोड करू शकताfileआर दस्तऐवजीकरण. - ऑनलाइन प्रशिक्षण
VTune Pro च्या मूलभूत गोष्टी जाणून घेण्यासाठी ऑनलाइन प्रशिक्षण साइट एक उत्कृष्ट संसाधन आहेfileप्रारंभ करण्यासाठी मार्गदर्शक, व्हिडिओ, ट्यूटोरियल, webinars, आणि तांत्रिक लेख. - कुकबुक
कार्यप्रदर्शन विश्लेषण कूकबुक ज्यामध्ये VTune Pro मधील विश्लेषण प्रकार वापरून लोकप्रिय कार्यप्रदर्शन समस्या ओळखण्यासाठी आणि सोडवण्यासाठी पाककृती आहेतfiler. - Windows साठी स्थापना मार्गदर्शक | लिनक्स | macOS होस्ट
इंस्टॉलेशन गाइडमध्ये VTune Pro साठी मूलभूत इंस्टॉलेशन सूचना आहेतfiler आणि विविध ड्रायव्हर्स आणि संग्राहकांसाठी पोस्ट-इंस्टॉलेशन कॉन्फिगरेशन सूचना. - शिकवण्या
व्हीट्यून प्रोfiler ट्यूटोरियल नवीन वापरकर्त्याला लहान s सह मूलभूत वैशिष्ट्यांद्वारे मार्गदर्शन करतातample अर्ज. - रिलीझ नोट्स
VTune Pro च्या नवीनतम आवृत्तीबद्दल माहिती मिळवाfiler, नवीन वैशिष्ट्ये, सिस्टम आवश्यकता आणि निराकरण केलेल्या तांत्रिक समस्यांचे सर्वसमावेशक वर्णन समाविष्ट आहे.
VTune Pro च्या स्टँडअलोन आणि टूलकिट आवृत्त्यांसाठीfiler, सध्याच्या सिस्टम आवश्यकता समजून घ्या.
सूचना आणि अस्वीकरण
इंटेल तंत्रज्ञानास सक्षम हार्डवेअर, सॉफ्टवेअर किंवा सेवा सक्रियण आवश्यक असू शकते.
कोणतेही उत्पादन किंवा घटक पूर्णपणे सुरक्षित असू शकत नाही.
तुमची किंमत आणि परिणाम भिन्न असू शकतात.
© इंटेल कॉर्पोरेशन. इंटेल, इंटेल लोगो आणि इतर इंटेल चिन्ह हे इंटेल कॉर्पोरेशन किंवा त्याच्या उपकंपन्यांचे ट्रेडमार्क आहेत. इतर नावे आणि ब्रँडवर इतरांची मालमत्ता म्हणून दावा केला जाऊ शकतो.
Intel, Intel लोगो, Intel Atom, Intel Core, Intel Xeon Phi, VTune आणि Xeon हे यूएस आणि/किंवा इतर देशांमध्ये इंटेल कॉर्पोरेशनचे ट्रेडमार्क आहेत.
*इतर नावे आणि ब्रँडवर इतरांची मालमत्ता म्हणून दावा केला जाऊ शकतो.
Microsoft, Windows आणि Windows लोगो हे युनायटेड स्टेट्स आणि/किंवा इतर देशांमध्ये Microsoft Corporation चे ट्रेडमार्क किंवा नोंदणीकृत ट्रेडमार्क आहेत.
जावा हा ओरॅकल आणि / किंवा त्याच्याशी संबंधित एक नोंदणीकृत ट्रेडमार्क आहे.
OpenCL आणि OpenCL लोगो हे Apple Inc. चे ट्रेडमार्क आहेत जे Khronos च्या परवानगीने वापरले जातात.
इंटेल तंत्रज्ञानास सक्षम हार्डवेअर, सॉफ्टवेअर किंवा सेवा सक्रियण आवश्यक असू शकते.
कोणतेही उत्पादन किंवा घटक पूर्णपणे सुरक्षित असू शकत नाही.
तुमची किंमत आणि परिणाम भिन्न असू शकतात.
© इंटेल कॉर्पोरेशन. इंटेल, इंटेल लोगो आणि इतर इंटेल चिन्ह हे इंटेल कॉर्पोरेशन किंवा त्याच्या उपकंपन्यांचे ट्रेडमार्क आहेत. इतर नावे आणि ब्रँडवर इतरांची मालमत्ता म्हणून दावा केला जाऊ शकतो.
Intel, Intel लोगो, Intel Atom, Intel Core, Intel Xeon Phi, VTune आणि Xeon हे यूएस आणि/किंवा इतर देशांमध्ये इंटेल कॉर्पोरेशनचे ट्रेडमार्क आहेत.
*इतर नावे आणि ब्रँडवर इतरांची मालमत्ता म्हणून दावा केला जाऊ शकतो.
Microsoft, Windows आणि Windows लोगो हे युनायटेड स्टेट्स आणि/किंवा इतर देशांमध्ये Microsoft Corporation चे ट्रेडमार्क किंवा नोंदणीकृत ट्रेडमार्क आहेत.
जावा हा ओरॅकल आणि / किंवा त्याच्याशी संबंधित एक नोंदणीकृत ट्रेडमार्क आहे.
OpenCL आणि OpenCL लोगो हे Apple Inc. चे ट्रेडमार्क आहेत जे Khronos च्या परवानगीने वापरले जातात.
कागदपत्रे / संसाधने
![]() |
इंटेल VTune Pro सह प्रारंभ कराfiler [pdf] वापरकर्ता मार्गदर्शक VTune Pro सह प्रारंभ कराfiler, VTune Pro सह प्रारंभ कराfiler, VTune Profiler |