इंटेल-गेट-स्टार्टेड-विथ-वीट्यून-प्रोfiler-लोगो

इंटेल वीट्यून प्रो के साथ आरंभ करेंfiler

Intel® VTune™ प्रो के साथ आरंभ करेंfiler

इंटेल वीट्यून प्रो का प्रयोग करेंfiler Windows*, macOS*, और Linux* होस्ट से स्थानीय और दूरस्थ लक्ष्य सिस्टम का विश्लेषण करने के लिए। इन कार्यों के माध्यम से एप्लिकेशन और सिस्टम के प्रदर्शन में सुधार करें:

  • एल्गोरिदम विकल्पों का विश्लेषण करें।
  • सीरियल और समांतर कोड बाधाओं का पता लगाएं।
  • समझें कि आपका एप्लिकेशन कहां और कैसे उपलब्ध हार्डवेयर संसाधनों से लाभान्वित हो सकता है।
  • अपने आवेदन के निष्पादन में तेजी लाएं।
    इंटेल वीट्यून प्रो डाउनलोड करेंfileइनमें से किसी एक तरीके से आपके सिस्टम पर r:
  • स्टैंडअलोन संस्करण डाउनलोड करें।
  • इंटेल वीट्यून प्रो प्राप्त करेंfiler Intel® oneAPI बेस टूलकिट के हिस्से के रूप में।
    वीट्यून प्रो देखेंfileआर वीडियो के लिए प्रशिक्षण पृष्ठ, webआरंभ करने में आपकी मदद करने के लिए inars, और अधिक सामग्री।

टिप्पणी
Intel® VTune™ Pro के संस्करणों के लिए दस्तावेज़ीकरणfiler 2021 रिलीज़ से पहले केवल डाउनलोड के लिए उपलब्ध हैं। उत्पाद संस्करण द्वारा उपलब्ध दस्तावेज डाउनलोड की सूची के लिए, इन पृष्ठों को देखें:

  • Intel Parallel Studio XE के लिए दस्तावेज़ीकरण डाउनलोड करें
  • इंटेल सिस्टम स्टूडियो के लिए दस्तावेज़ीकरण डाउनलोड करें

वर्कफ़्लो को समझें
इंटेल वीट्यून प्रो का प्रयोग करेंfileआर टू प्रोfile एक आवेदन और प्रदर्शन में सुधार के लिए परिणामों का विश्लेषण।

सामान्य वर्कफ़्लो में ये चरण होते हैं:

इंटेल-गेट-स्टार्टेड-विथ-वीट्यून-प्रोfileआर-01

आरंभ करने के लिए अपना होस्ट सिस्टम चुनें
Windows*, Linux*, या macOS* के लिए सिस्टम-विशिष्ट वर्कफ़्लोज़ के बारे में अधिक जानें।

इंटेल-गेट-स्टार्टेड-विथ-वीट्यून-प्रोfileआर-02

Intel® VTune™ प्रो के साथ आरंभ करेंfiler विंडोज* ओएस के लिए

आरंभ करने से पहले

  1. Intel® VTune™ प्रो इंस्टॉल करेंfiler आपके विंडोज* सिस्टम पर।
  2. अपने एप्लिकेशन को प्रतीक जानकारी और रिलीज़ मोड में सक्षम सभी अनुकूलन के साथ बनाएँ। कंपाइलर सेटिंग्स पर विस्तृत जानकारी के लिए वीट्यून प्रो देखेंfileआर ऑनलाइन उपयोगकर्ता गाइड।
    आप मैट्रिक्स एस का भी उपयोग कर सकते हैंampले आवेदन में उपलब्ध है \VTune\Sampलेस \ मैट्रिक्स। आप संबंधित एस देख सकते हैंampले परिणाम \VTune\Projects\sampले (मैट्रिक्स)।
  3. परिवेश चर सेट करें: चलाएँ \setvars.bat स्क्रिप्ट।
    डिफ़ॉल्ट रूप से, oneAPI घटकों के लिए Program Fileएस (x86)\Intel\oneAPI.
    टिप्पणी Intel® VTune™ Pro का उपयोग करते समय आपको setvars.bat चलाने की आवश्यकता नहीं हैfiler माइक्रोसॉफ्ट * विजुअल स्टूडियो * के भीतर।

चरण 1: Intel® VTune™ Pro प्रारंभ करेंfiler
इंटेल वीट्यून प्रो प्रारंभ करेंfileइन तरीकों में से किसी एक के माध्यम से आर और एक परियोजना स्थापित करें। एक प्रोजेक्ट उस एप्लिकेशन के लिए एक कंटेनर है जिसका आप विश्लेषण करना चाहते हैं, विश्लेषण का प्रकार और डेटा संग्रह परिणाम।

स्रोत / वीट्यून प्रो शुरू करेंfiler

स्टैंडअलोन (जीयूआई)

  1. vtune-gui कमांड चलाएँ या Intel® VTune™ Pro चलाएँfileआर प्रारंभ मेनू से।
  2. जीयूआई खुलने पर, वेलकम स्क्रीन में क्लिक करें।
  3. प्रोजेक्ट बनाएँ संवाद बॉक्स में, प्रोजेक्ट का नाम और स्थान निर्दिष्ट करें।
  4. प्रोजेक्ट बनाएं पर क्लिक करें।

स्टैंडअलोन (कमांड लाइन)
वीट्यून कमांड चलाएँ।

माइक्रोसॉफ्ट * विजुअल स्टूडियो * आईडीई
विजुअल स्टूडियो में अपना समाधान खोलें। वीट्यून प्रोfiler टूलबार स्वचालित रूप से सक्षम हो जाता है और आपका विज़ुअल स्टूडियो प्रोजेक्ट एक विश्लेषण लक्ष्य के रूप में सेट हो जाता है।

टिप्पणी
Intel® VTune™ Pro चलाते समय आपको कोई प्रोजेक्ट बनाने की आवश्यकता नहीं हैfiler कमांड लाइन से या Microsoft* Visual Studio के भीतर।

चरण 2: विश्लेषण को कॉन्फ़िगर करें और चलाएं
एक नया प्रोजेक्ट बनाने के बाद, कॉन्फ़िगर विश्लेषण विंडो इन डिफ़ॉल्ट मानों के साथ खुलती है:

इंटेल-गेट-स्टार्टेड-विथ-वीट्यून-प्रोfileआर-03

  1. लॉन्च एप्लिकेशन अनुभाग में, अपने एप्लिकेशन के निष्पादन योग्य स्थान पर ब्राउज़ करें file.
  2. अपने एप्लिकेशन पर प्रदर्शन स्नैपशॉट चलाने के लिए स्टार्ट पर क्लिक करें। यह विश्लेषण एक सामान्य ओवर प्रस्तुत करता हैview लक्ष्य सिस्टम पर आपके एप्लिकेशन के प्रदर्शन को प्रभावित करने वाले मुद्दों के बारे में।

स्टेप 3: View और प्रदर्शन डेटा का विश्लेषण करें
जब डेटा संग्रह पूरा हो जाता है, तो वीट्यून प्रोfileआर सारांश विंडो में विश्लेषण परिणाम प्रदर्शित करता है। यहाँ, आप एक प्रदर्शन खत्म देखते हैंview आपके आवेदन की
ओवरview आम तौर पर उनके विवरण के साथ कई मेट्रिक्स शामिल होते हैं।

इंटेल-गेट-स्टार्टेड-विथ-वीट्यून-प्रोfileआर-04

  • A योगदान करने वाले कारकों के बारे में विस्तृत जानकारी के लिए प्रत्येक मीट्रिक को विस्तृत करें.
  • B फ़्लैग किया गया मीट्रिक स्वीकार्य/सामान्य परिचालन सीमा से बाहर का मान दर्शाता है। फ़्लैग की गई मेट्रिक को बेहतर बनाने के तरीके को समझने के लिए टूल टिप्स का इस्तेमाल करें.
  • C अन्य विश्लेषणों पर मार्गदर्शन देखें, जिन पर आपको आगे चलने पर विचार करना चाहिए। एनालिसिस ट्री इन सुझावों पर प्रकाश डालता है।

अगले कदम
वीट्यून प्रो के साथ एप्लिकेशन प्रदर्शन का समग्र मूल्यांकन प्राप्त करने के लिए प्रदर्शन स्नैपशॉट एक अच्छा प्रारंभिक बिंदु हैfileआर। अगला, जांचें कि क्या आपके एल्गोरिथ्म को ट्यूनिंग की आवश्यकता है।

  1. सामान्य प्रदर्शन बाधाओं का विश्लेषण करने के लिए एक ट्यूटोरियल का अनुसरण करें।
  2. एक बार जब आपका एल्गोरिथ्म अच्छी तरह से ट्यून हो जाए, तो परिणामों को कैलिब्रेट करने और अन्य क्षेत्रों में संभावित प्रदर्शन सुधारों की पहचान करने के लिए प्रदर्शन स्नैपशॉट को फिर से चलाएँ।

यह भी देखें
माइक्रोआर्किटेक्चर अन्वेषण

वीट्यून प्रोfileआर हेल्प टूर

Exampपर: प्रोfile विंडोज़ पर एक ओपनएमपी* एप्लीकेशन*
इंटेल वीट्यून प्रो का प्रयोग करेंfileप्रो करने के लिए एक विंडोज मशीन पर आरfile जैसाampiso3dfd_omp_offload OpenMP एप्लिकेशन को Intel GPU पर ऑफ़लोड किया गया। GPU विश्लेषण चलाना और परिणामों की जांच करना सीखें।

आवश्यक शर्तें

  • सुनिश्चित करें कि आपका सिस्टम Microsoft* Windows 10 या एक नया संस्करण चला रहा है।
  • Intel प्रोसेसर ग्राफ़िक्स के इन संस्करणों में से किसी एक का उपयोग करें:
    • जनरल 8
    • जनरल 9
    • जनरल 11
  • आपका सिस्टम इनमें से किसी एक इंटेल प्रोसेसर पर चलना चाहिए:
    • 7वीं पीढ़ी Intel® Core™ i7 प्रोसेसर (कोड नाम केबी लेक)
    • 8वीं पीढ़ी Intel® Core™ i7 प्रोसेसर (कोड नाम कॉफी लेक)
    • 10वीं पीढ़ी के Intel® Core™ i7 प्रोसेसर (कोड नाम Ice Lake)
  • इंटेल वीट्यून प्रो स्थापित करेंfiler इन स्रोतों में से एक से:
    • स्टैंडअलोन उत्पाद डाउनलोड करें
    • Intel® oneAPI बेस टूलकिट
    • Intel® सिस्टम ब्रिंग-अप टूलकिट
  • Intel® oneAPI HPC टूलकिट डाउनलोड करें जिसमें Intel® oneAPI DPC++/C++ कंपाइलर (icx/icpx) शामिल है जिसे आपको प्रो करने की आवश्यकता हैfile ओपनएमपी अनुप्रयोग।
  • पर्यावरण चर सेट करें। में स्थित vars.bat स्क्रिप्ट निष्पादित करें \env निर्देशिका।
  • GPU विश्लेषण के लिए अपना सिस्टम सेट करें।

टिप्पणी
Intel VTune Profiler Microsoft* Visual Studio वातावरण में, VTune Pro देखेंfileआर उपयोगकर्ता गाइड।

ओपनएमपी ऑफलोड एप्लिकेशन बनाएं और संकलित करें

  1. iso3dfd_omp_offload OpenMP ऑफलोड डाउनलोड करेंampले.
  2. एस के लिए खोलेंampले निर्देशिका।
    सीडी <एसample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload
  3. ओपनएमपी ऑफलोड एप्लिकेशन को संकलित करें।

mkdir बिल्ड
सीडी निर्माण
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-targets:
स्पिर64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp

ओपनएमपी ऑफलोड एप्लिकेशन पर जीपीयू विश्लेषण चलाएं
अब आप संकलित OpenMP एप्लिकेशन पर GPU ऑफ़लोड विश्लेषण चलाने के लिए तैयार हैं।

  1. वीट्यून प्रो खोलेंfiler और प्रोजेक्ट बनाने के लिए न्यू प्रोजेक्ट पर क्लिक करें।
  2. स्वागत पृष्ठ पर, अपना विश्लेषण स्थापित करने के लिए विश्लेषण कॉन्फ़िगर करें पर क्लिक करें।
  3. अपने विश्लेषण के लिए इन सेटिंग्स को चुनें।
    • WHERE फलक में, स्थानीय होस्ट का चयन करें।
    • WHAT फलक में, लॉन्च एप्लिकेशन का चयन करें और iso3dfd_omp_offload बाइनरी को प्रो के लिए एप्लिकेशन के रूप में निर्दिष्ट करेंfile.
    • कैसे फलक में, विश्लेषण ट्री में त्वरक समूह से GPU ऑफ़लोड विश्लेषण प्रकार का चयन करें।
      इंटेल-गेट-स्टार्टेड-विथ-वीट्यून-प्रोfileआर-05
  4. विश्लेषण चलाने के लिए स्टार्ट बटन पर क्लिक करें।

वीट्यून प्रोfiler डेटा एकत्र करता है और GPU ऑफलोड में विश्लेषण परिणाम प्रदर्शित करता है viewबिंदु।

  • सारांश विंडो में, सीपीयू और जीपीयू संसाधन उपयोग के आंकड़े देखें। यह निर्धारित करने के लिए कि आपका आवेदन है या नहीं, इस डेटा का उपयोग करें:
    • जीपीयू-बाध्य
    • सीपीयू बाध्य
    • आपके सिस्टम के कंप्यूट संसाधनों का अक्षमता से उपयोग करना
  • बुनियादी सीपीयू और जीपीयू मेट्रिक्स देखने के लिए प्लेटफॉर्म विंडो में जानकारी का उपयोग करें।
  • ग्राफ़िक्स विंडो में विशिष्ट कंप्यूटिंग कार्यों की जाँच करें।

गहन विश्लेषण के लिए, वीट्यून प्रो में संबंधित नुस्खा देखेंfileआर प्रदर्शन विश्लेषण कुकबुक। आप GPU कंप्यूट/मीडिया हॉटस्पॉट विश्लेषण के साथ अपनी प्रोफ़ाइलिंग भी जारी रख सकते हैं।

Exampले: प्रोfile एक SYCL* विंडोज पर एप्लीकेशन*
प्रोfile जैसाampइंटेल® वीट्यून™ प्रो के साथ मैट्रिक्स_मल्टीप्ली एसवाईसीएल एप्लिकेशनfileआर। उत्पाद से परिचित हों और जीपीयू-बाध्य अनुप्रयोगों के लिए एकत्र किए गए आंकड़ों को समझें।

आवश्यक शर्तें

  • सुनिश्चित करें कि आपके सिस्टम पर Microsoft* Visual Studio (v2017 या नया) स्थापित है।
  • इंटेल वीट्यून प्रो स्थापित करेंfiler Intel® oneAPI बेस टूलकिट या Intel® सिस्टम ब्रिंग-अप टूलकिट से। इन टूलकिट में प्रोफाइलिंग प्रक्रिया के लिए आवश्यक Intel® oneAPI DPC++/C++ Compiler(icpx -fsycl) कंपाइलर होता है।
  • पर्यावरण चर सेट करें। में स्थित vars.bat स्क्रिप्ट निष्पादित करें \env निर्देशिका।
  • सुनिश्चित करें कि Intel oneAPI DPC++ कंपाइलर (Intel oneAPI बेस टूलकिट के साथ स्थापित) Microsoft Visual Studio में एकीकृत है।
  • Intel oneAPI DPC++ कंपाइलर के लिए -gline-tables-only और -fdebug-info-for-profileing विकल्पों का उपयोग करके कोड संकलित करें।
  • GPU विश्लेषण के लिए अपना सिस्टम सेट करें।

इंटेल वीट्यून प्रो स्थापित करने के बारे में जानकारी के लिएfiler Microsoft* Visual Studio वातावरण में, VTune Pro देखेंfileआर उपयोगकर्ता गाइड।

मैट्रिक्स ऐप बनाएं
मेट्रिक्स_मल्टीप्ली_वीट्यून कोड एस डाउनलोड करेंampIntel oneAPI टूलकिट के लिए le पैकेज। इसमें एस शामिल हैampले जिसे आप बनाने और प्रो करने के लिए उपयोग कर सकते हैंfile एक एसवाईसीएल आवेदन।

  1. Microsoft* विज़ुअल स्टूडियो खोलें।
  2. क्लिक File > खुला > परियोजना/समाधान। मैट्रिक्स_मल्टीप्ली_वीट्यून फोल्डर को खोजें और मैट्रिक्स_मल्टीप्ली.एसएलएन को चुनें।
  3. इस कॉन्फ़िगरेशन को बनाएं (प्रोजेक्ट> बिल्ड)।
  4. प्रोग्राम चलाएँ (डीबग> डिबगिंग के बिना प्रारंभ करें)।
  5. DPC++ या s का थ्रेडेड संस्करण चुनने के लिएampले, प्रीप्रोसेसर परिभाषाओं का उपयोग करें।
    1. प्रोजेक्ट प्रॉपर्टीज> डीपीसी ++> प्रीप्रोसेसर> प्रीप्रोसेसर डेफिनिशन पर जाएं।
    2. icpx -fsycl या USE_THR परिभाषित करें।

जीपीयू विश्लेषण चलाएं
मैट्रिक्स एस पर जीपीयू विश्लेषण चलाएंampले.

  1. विजुअल स्टूडियो टूलबार से, कॉन्फिगर एनालिसिस बटन पर क्लिक करें।
    कॉन्फ़िगर विश्लेषण विंडो खुलती है। डिफ़ॉल्ट रूप से, यह आपके वीएस प्रोजेक्ट सेटिंग्स को इनहेरिट करता है और मैट्रिक्स_मल्टीप्ली.exe को प्रो के लिए एक एप्लिकेशन के रूप में निर्दिष्ट करता हैfile.
  2. कॉन्फ़िगर विश्लेषण विंडो में, क्लिक करेंइंटेल-गेट-स्टार्टेड-विथ-वीट्यून-प्रोfileआर-06 कैसे फलक में ब्राउज़ करें बटन।
  3. विश्लेषण ट्री में त्वरक समूह से GPU कंप्यूट/मीडिया हॉटस्पॉट विश्लेषण प्रकार का चयन करें।
    इंटेल-गेट-स्टार्टेड-विथ-वीट्यून-प्रोfileआर-06
  4. पूर्वनिर्धारित विकल्पों के साथ विश्लेषण शुरू करने के लिए स्टार्ट बटन पर क्लिक करें।

कमांड लाइन से जीपीयू विश्लेषण चलाएं:

  1. एस खोलेंampले निर्देशिका:
    <sample_dir>\VtuneProfiler\मैट्रिक्स_मल्टीप्लाई_vtune
  2. इस निर्देशिका में, एक Visual Studio* प्रोजेक्ट खोलें file मैट्रिक्स_multiply.sln नाम दिया गया
  3. गुणा.सीपीपी file मैट्रिक्स गुणा के कई संस्करण शामिल हैं। Multiply.hpp में संबंधित #define MULTIPLY लाइन को संपादित करके एक संस्करण का चयन करें
  4. संपूर्ण प्रोजेक्ट को रिलीज़ कॉन्फ़िगरेशन के साथ बनाएँ।
    यह एक निष्पादन योग्य बनाता है जिसे matrix_multiply.exe कहा जाता है।
  5. GPU विश्लेषण चलाने के लिए सिस्टम तैयार करें। GPU विश्लेषण के लिए सेट अप सिस्टम देखें।
  6. वीट्यून प्रो सेट करेंfiler पर्यावरण चर बैच चलाकर file: निर्यात \env\vars.bat
  7. विश्लेषण आदेश चलाएँ:
    vtune.exe - जीपीयू-ऑफलोड इकट्ठा करें - मैट्रिक्स_multiply.exe

वीट्यून प्रोfiler डेटा एकत्र करता है और GPU कंप्यूट/मीडिया हॉटस्पॉट में विश्लेषण परिणाम प्रदर्शित करता है viewबिंदु। सारांश विंडो में, यह समझने के लिए कि आपका एप्लिकेशन GPU-बाध्य है, CPU और GPU संसाधन उपयोग पर आँकड़े देखें। समय के साथ कोड निष्पादन का प्रतिनिधित्व करने वाले बुनियादी सीपीयू और जीपीयू मेट्रिक्स देखने के लिए ग्राफिक्स विंडो पर स्विच करें।

Intel® VTune™ प्रो के साथ आरंभ करेंfiler लिनक्स* ओएस के लिए

आरंभ करने से पहले

  1. Intel® VTune™ प्रो इंस्टॉल करेंfiler आपके Linux* सिस्टम पर।
  2. अपने एप्लिकेशन को प्रतीक जानकारी और रिलीज़ मोड में सक्षम सभी अनुकूलन के साथ बनाएँ। कंपाइलर सेटिंग्स पर विस्तृत जानकारी के लिए वीट्यून प्रो देखेंfileआर ऑनलाइन उपयोगकर्ता गाइड।
    आप मैट्रिक्स एस का भी उपयोग कर सकते हैंampले आवेदन में उपलब्ध है \एसampले \ मैट्रिक्स। आप देख सकते हैं एसampले परिणाम \एसampले (मैट्रिक्स)।
  3. पर्यावरण चर सेट करें: स्रोत /setvars.sh
    डिफ़ॉल्ट रूप से, है:
    • $ HOME/Intel/oneapi/ जब उपयोगकर्ता अनुमतियों के साथ स्थापित किया गया हो;
    • /opt/intel/oneapi/ रूट अनुमतियों के साथ स्थापित होने पर।

चरण 1: वीट्यून प्रो शुरू करेंfiler
वीट्यून प्रो शुरू करेंfileइनमें से किसी एक तरीके से:

स्रोत / वीट्यून प्रो शुरू करेंfiler
स्टैंडअलोन/आईडीई (जीयूआई)

  1. vtunegui कमांड चलाएँ। वीट्यून प्रो शुरू करने के लिएfileइंटेल सिस्टम स्टूडियो आईडीई से, टूल्स > वीट्यून प्रो चुनेंfileआर > वीट्यून प्रो लॉन्च करेंfileआर। यह सभी उपयुक्त पर्यावरण चर सेट करता है और उत्पाद का एक स्टैंडअलोन इंटरफ़ेस लॉन्च करता है।
  2. जीयूआई खुलने पर, स्वागत स्क्रीन में नई परियोजना पर क्लिक करें।
  3. प्रोजेक्ट बनाएँ संवाद बॉक्स में, प्रोजेक्ट का नाम और स्थान निर्दिष्ट करें।
  4. प्रोजेक्ट बनाएं पर क्लिक करें।

स्टैंडअलोन (कमांड लाइन)

  • वीट्यून कमांड चलाएँ।

चरण 2: विश्लेषण को कॉन्फ़िगर करें और चलाएं
एक नया प्रोजेक्ट बनाने के बाद, कॉन्फ़िगर विश्लेषण विंडो इन डिफ़ॉल्ट मानों के साथ खुलती है:

इंटेल-गेट-स्टार्टेड-विथ-वीट्यून-प्रोfileआर-07

  1. लॉन्च एप्लिकेशन अनुभाग में, अपने एप्लिकेशन के स्थान पर ब्राउज़ करें।
  2. अपने एप्लिकेशन पर प्रदर्शन स्नैपशॉट चलाने के लिए स्टार्ट पर क्लिक करें। यह विश्लेषण एक सामान्य ओवर प्रस्तुत करता हैview लक्ष्य सिस्टम पर आपके एप्लिकेशन के प्रदर्शन को प्रभावित करने वाले मुद्दों के बारे में।

स्टेप 3: View और प्रदर्शन डेटा का विश्लेषण करें
जब डेटा संग्रह पूरा हो जाता है, तो वीट्यून प्रोfileआर सारांश विंडो में विश्लेषण परिणाम प्रदर्शित करता है। यहाँ, आप एक प्रदर्शन खत्म देखते हैंview आपके आवेदन की
ओवरview आम तौर पर उनके विवरण के साथ कई मेट्रिक्स शामिल होते हैं।

इंटेल-गेट-स्टार्टेड-विथ-वीट्यून-प्रोfileआर-08

  • A योगदान करने वाले कारकों के बारे में विस्तृत जानकारी के लिए प्रत्येक मीट्रिक को विस्तृत करें.
  • B फ़्लैग किया गया मीट्रिक स्वीकार्य/सामान्य परिचालन सीमा से बाहर का मान दर्शाता है। फ़्लैग की गई मेट्रिक को बेहतर बनाने के तरीके को समझने के लिए टूल टिप्स का इस्तेमाल करें.
  • C अन्य विश्लेषणों पर मार्गदर्शन देखें, जिन पर आपको आगे चलने पर विचार करना चाहिए। एनालिसिस ट्री इन सुझावों पर प्रकाश डालता है।

अगले कदम
वीट्यून प्रो के साथ एप्लिकेशन प्रदर्शन का समग्र मूल्यांकन प्राप्त करने के लिए प्रदर्शन स्नैपशॉट एक अच्छा प्रारंभिक बिंदु हैfileआर। अगला, जांचें कि क्या आपके एल्गोरिथ्म को ट्यूनिंग की आवश्यकता है।

  1. सामान्य प्रदर्शन बाधाओं का विश्लेषण करने के लिए एक ट्यूटोरियल का अनुसरण करें।
  2. एक बार जब आपका एल्गोरिथ्म अच्छी तरह से ट्यून हो जाए, तो परिणामों को कैलिब्रेट करने और अन्य क्षेत्रों में संभावित प्रदर्शन सुधारों की पहचान करने के लिए प्रदर्शन स्नैपशॉट को फिर से चलाएँ।

यह भी देखें
माइक्रोआर्किटेक्चर अन्वेषण

वीट्यून प्रोfileआर हेल्प टूर

Exampले: प्रोfile Linux पर एक OpenMP अनुप्रयोग*
इंटेल वीट्यून प्रो का प्रयोग करेंfileप्रो करने के लिए एक लिनक्स मशीन पर आरfile जैसाampiso3dfd_omp_offload OpenMP एप्लिकेशन को Intel GPU पर ऑफ़लोड किया गया। GPU विश्लेषण चलाना और परिणामों की जांच करना सीखें।

आवश्यक शर्तें

  • सुनिश्चित करें कि आपका सिस्टम Linux* OS कर्नेल 4.14 या एक नया संस्करण चला रहा है।
  • Intel प्रोसेसर ग्राफ़िक्स के इन संस्करणों में से किसी एक का उपयोग करें:
    • जनरल 8
    • जनरल 9
    • जनरल 11
  • आपका सिस्टम इनमें से किसी एक इंटेल प्रोसेसर पर चलना चाहिए:
    • 7वीं पीढ़ी Intel® Core™ i7 प्रोसेसर (कोड नाम केबी लेक)
    • 8वीं पीढ़ी Intel® Core™ i7 प्रोसेसर (कोड नाम कॉफी लेक)
    • 10वीं पीढ़ी के Intel® Core™ i7 प्रोसेसर (कोड नाम Ice Lake)
  • Linux GUI के लिए, उपयोग करें:
    • GTK+ संस्करण 2.10 या नया (2.18 और नए संस्करण अनुशंसित हैं)
    • पैंगो संस्करण 1.14 या नया
    • X.Org संस्करण 1.0 या नया (1.7 और नए संस्करण अनुशंसित हैं)
  • इंटेल वीट्यून प्रो स्थापित करेंfiler इन स्रोतों में से एक से:
    • स्टैंडअलोन उत्पाद डाउनलोड करें
    • Intel® oneAPI बेस टूलकिट
    • Intel® सिस्टम ब्रिंग-अप टूलकिट
  • Intel® oneAPI HPC टूलकिट डाउनलोड करें जिसमें Intel® oneAPI DPC++/C++ कंपाइलर (icx/icpx) शामिल है जिसे आपको प्रो करने की आवश्यकता हैfile ओपनएमपी अनुप्रयोग।
  • पर्यावरण चर सेट करें। vars.sh स्क्रिप्ट निष्पादित करें।
  • GPU विश्लेषण के लिए अपना सिस्टम सेट करें।

ओपनएमपी ऑफलोड एप्लिकेशन बनाएं और संकलित करें

  1. iso3dfd_omp_offload OpenMP ऑफलोड डाउनलोड करेंampले.
  2. एस के लिए खोलेंampले निर्देशिका।
    सीडी <एसample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload
  3. ओपनएमपी ऑफलोड एप्लिकेशन को संकलित करें।

एमकेडीआईआर बिल्ड;
सेमेक -DVERIFY_RESULTS = 0 ..
मेक -जो

यह एक src/iso3dfd निष्पादन योग्य उत्पन्न करता है।

प्रोग्राम को हटाने के लिए, टाइप करें:
साफ करना

यह निष्पादन योग्य और वस्तु को हटा देता है fileजिसे आपने मेक कमांड से बनाया है।

ओपनएमपी ऑफलोड एप्लिकेशन पर जीपीयू विश्लेषण चलाएं
अब आप संकलित OpenMP एप्लिकेशन पर GPU ऑफ़लोड विश्लेषण चलाने के लिए तैयार हैं।

  1. वीट्यून प्रो खोलेंfiler और प्रोजेक्ट बनाने के लिए न्यू प्रोजेक्ट पर क्लिक करें।
  2. स्वागत पृष्ठ पर, अपना विश्लेषण स्थापित करने के लिए विश्लेषण कॉन्फ़िगर करें पर क्लिक करें।
  3. अपने विश्लेषण के लिए इन सेटिंग्स को चुनें।
    • WHERE फलक में, स्थानीय होस्ट का चयन करें।
    • WHAT फलक में, लॉन्च एप्लिकेशन का चयन करें और iso3dfd_omp_offload बाइनरी को प्रो के लिए एप्लिकेशन के रूप में निर्दिष्ट करेंfile.
    • कैसे फलक में, विश्लेषण ट्री में त्वरक समूह से GPU ऑफ़लोड विश्लेषण प्रकार का चयन करें।
      इंटेल-गेट-स्टार्टेड-विथ-वीट्यून-प्रोfileआर-09
  4. विश्लेषण चलाने के लिए स्टार्ट बटन पर क्लिक करें।

वीट्यून प्रोfiler डेटा एकत्र करता है और GPU ऑफलोड में विश्लेषण परिणाम प्रदर्शित करता है viewबिंदु।

  • सारांश विंडो में, सीपीयू और जीपीयू संसाधन उपयोग के आंकड़े देखें। यह निर्धारित करने के लिए कि आपका आवेदन है या नहीं, इस डेटा का उपयोग करें:
    • जीपीयू-बाध्य
    • सीपीयू बाध्य
    • आपके सिस्टम के कंप्यूट संसाधनों का अक्षमता से उपयोग करना
  • बुनियादी सीपीयू और जीपीयू मेट्रिक्स देखने के लिए प्लेटफॉर्म विंडो में जानकारी का उपयोग करें।
  • ग्राफ़िक्स विंडो में विशिष्ट कंप्यूटिंग कार्यों की जाँच करें।

गहन विश्लेषण के लिए, वीट्यून प्रो में संबंधित नुस्खा देखेंfileआर प्रदर्शन विश्लेषण कुकबुक। आप GPU कंप्यूट/मीडिया हॉटस्पॉट विश्लेषण के साथ अपनी प्रोफ़ाइलिंग भी जारी रख सकते हैं।

Exampले: प्रोfile एक एसवाईसीएल * लिनक्स पर आवेदन *
वीट्यून प्रो का प्रयोग करेंfileआर के रूप मेंampली मैट्रिक्स_मल्टीप्ली एसवाईसीएल एप्लिकेशन उत्पाद और जीपीयू-बाध्य अनुप्रयोगों के लिए एकत्रित आंकड़ों से जल्दी से परिचित होने के लिए।

आवश्यक शर्तें

  • वीट्यून प्रो इंस्टॉल करेंfiler और Intel® oneAPI DPC++/C++ कंपाइलर Intel® oneAPI बेस टूलकिट या Intel® सिस्टम ब्रिंग-अप टूलकिट से।
  • vars.sh स्क्रिप्ट निष्पादित करके पर्यावरण चर सेट अप करें।
  • GPU विश्लेषण के लिए अपना सिस्टम सेट करें।

मैट्रिक्स एप्लिकेशन बनाएं
मेट्रिक्स_मल्टीप्ली_वीट्यून कोड एस डाउनलोड करेंampIntel oneAPI टूलकिट के लिए le पैकेज। इसमें एस शामिल हैampले जिसे आप बनाने और प्रो करने के लिए उपयोग कर सकते हैंfile एक एसवाईसीएल आवेदन।

समर्थकfile एक SYCL एप्लिकेशन, -gline-tables-only और -fdebug-info-for-Profiling Intel oneAPI DPC++ कंपाइलर विकल्पों का उपयोग करके कोड को संकलित करना सुनिश्चित करें।

इसे संकलित करने के लिए एसampले आवेदन, निम्न कार्य करें:

  1. s . पर जाएँampले निर्देशिका।
    सीडी <एसampले_डिर/वीट्यूनप्रोfileआर/मैट्रिक्स_मल्टीप्ली>
  2. गुणा.सीपीपी file src फ़ोल्डर में मैट्रिक्स गुणन के कई संस्करण हैं। संबंधित #define MULTIPLY लाइन को गुणा.एच में संपादित करके एक संस्करण का चयन करें।
  3. मौजूदा मेक का उपयोग करके ऐप बनाएंfile:
    सीएमके .
    बनाना
    यह एक matrix.icpx -fsycl निष्पादन योग्य उत्पन्न करना चाहिए।
    प्रोग्राम को हटाने के लिए, टाइप करें:
    साफ करना
    यह निष्पादन योग्य और वस्तु को हटा देता है files जो मेक कमांड द्वारा बनाए गए थे।

जीपीयू विश्लेषण चलाएं
मैट्रिक्स एस पर जीपीयू विश्लेषण चलाएंampले.

  1. वीट्यून प्रो लॉन्च करेंfiler vtune-gui कमांड के साथ।
  2. वेलकम पेज से न्यू प्रोजेक्ट पर क्लिक करें।
  3. अपने एस के लिए एक नाम और स्थान निर्दिष्ट करेंample प्रोजेक्ट और क्रिएट प्रोजेक्ट पर क्लिक करें।
  4. WHAT फलक में, matrix.icpx-fsycl पर ब्राउज़ करें file.
  5. कैसे फलक में, क्लिक करें इंटेल-गेट-स्टार्टेड-विथ-वीट्यून-प्रोfileआर-06 ब्राउज बटन और विश्लेषण ट्री में त्वरक समूह से जीपीयू कंप्यूट/मीडिया हॉटस्पॉट विश्लेषण का चयन करें।
    इंटेल-गेट-स्टार्टेड-विथ-वीट्यून-प्रोfileआर-10
  6. पूर्व-चयनित विकल्पों के साथ विश्लेषण शुरू करने के लिए नीचे दिए गए स्टार्ट बटन पर क्लिक करें।

कमांड लाइन से जीपीयू विश्लेषण चलाएं:

  1. GPU विश्लेषण चलाने के लिए सिस्टम तैयार करें। GPU विश्लेषण के लिए सेट अप सिस्टम देखें।
  2. Intel सॉफ़्टवेयर टूल के लिए परिवेश चर सेट करें:
    स्रोत $ONEAPI_ROOT/setvars.sh
  3. GPU कंप्यूट/मीडिया हॉटस्पॉट विश्लेषण चलाएँ:
    वीट्यून-कलेक्ट जीपीयू-हॉटस्पॉट -r ./result_gpu-हॉटस्पॉट - ./matrix.icpx -fsycl
    सारांश रिपोर्ट देखने के लिए टाइप करें:
    vtune -रिपोर्ट सारांश -r ./result_gpu-hotspots

वीट्यून प्रोfiler डेटा एकत्र करता है और GPU कंप्यूट/मीडिया हॉटस्पॉट में विश्लेषण परिणाम प्रदर्शित करता है viewबिंदु। सारांश विंडो में, यह समझने के लिए कि आपका एप्लिकेशन GPU-बाध्य है, CPU और GPU संसाधन उपयोग पर आँकड़े देखें। समय के साथ कोड निष्पादन का प्रतिनिधित्व करने वाले बुनियादी सीपीयू और जीपीयू मेट्रिक्स देखने के लिए ग्राफिक्स विंडो पर स्विच करें।

Intel® VTune™ प्रो के साथ आरंभ करेंfiler macOS* के लिए

वीट्यून प्रो का प्रयोग करेंfiler एक गैर-macOS सिस्टम (Linux* या Android* केवल) पर दूरस्थ लक्ष्य विश्लेषण करने के लिए एक macOS सिस्टम पर।

आप वीट्यून प्रो का उपयोग नहीं कर सकतेfiler macOS वातावरण में इन उद्देश्यों के लिए:

  • प्रोfile macOS सिस्टम जिस पर यह स्थापित है।
  • दूरस्थ macOS सिस्टम पर डेटा एकत्र करें।

MacOS होस्ट से दूरस्थ Linux* या Android* लक्ष्य के प्रदर्शन का विश्लेषण करने के लिए, इनमें से कोई एक चरण करें:

  • वीट्यून प्रो चलाएंfileलक्ष्य के रूप में निर्दिष्ट रिमोट सिस्टम के साथ macOS सिस्टम पर r विश्लेषण। जब विश्लेषण शुरू होता है, वीट्यून प्रोfiler डेटा एकत्र करने के लिए रिमोट सिस्टम से जुड़ता है, फिर परिणामों को macOS होस्ट के लिए वापस लाता है viewआईएनजी.
  • लक्ष्य सिस्टम पर स्थानीय रूप से एक विश्लेषण चलाएँ और इसके लिए macOS सिस्टम में परिणामों की प्रतिलिपि बनाएँ viewवीट्यून प्रो मेंfiler.

इस दस्तावेज़ के चरण एक दूरस्थ लिनक्स लक्ष्य प्रणाली को मानते हैं और वीट्यून प्रो से एसएसएच एक्सेस का उपयोग करके प्रदर्शन डेटा एकत्र करते हैंfiler macOS होस्ट सिस्टम पर।

आरंभ करने से पहले

  1. Intel® VTune™ प्रो इंस्टॉल करेंfiler आपके macOS* सिस्टम पर।
  2. अपने लिनक्स एप्लिकेशन को प्रतीक जानकारी के साथ और रिलीज मोड में सभी अनुकूलन सक्षम के साथ बनाएं। विस्तृत जानकारी के लिए, वीट्यून प्रो में कंपाइलर सेटिंग्स देखेंfileआर मदद.
  3. पासवर्ड-रहित मोड में काम करने के लिए होस्ट macOS सिस्टम से लक्ष्य Linux सिस्टम पर SSH एक्सेस सेट अप करें।

चरण 1: वीट्यून प्रो शुरू करेंfiler

  1. वीट्यून प्रो लॉन्च करेंfiler vtune-gui कमांड के साथ।
    डिफ़ॉल्ट रूप से, है /ऑप्ट/इंटेल/oneapi/.
  2. जीयूआई खुलने पर, स्वागत स्क्रीन में नई परियोजना पर क्लिक करें।
  3. प्रोजेक्ट बनाएँ संवाद बॉक्स में, प्रोजेक्ट का नाम और स्थान निर्दिष्ट करें।
  4. प्रोजेक्ट बनाएं पर क्लिक करें।

चरण 2: विश्लेषण को कॉन्फ़िगर करें और चलाएं
आपके द्वारा एक नया प्रोजेक्ट बनाने के बाद, प्रदर्शन स्नैपशॉट विश्लेषण प्रकार के साथ कॉन्फ़िगर विश्लेषण विंडो खुलती है।
यह विश्लेषण एक ओवर प्रस्तुत करता हैview लक्ष्य सिस्टम पर आपके एप्लिकेशन के प्रदर्शन को प्रभावित करने वाली समस्याओं के बारे में।

इंटेल-गेट-स्टार्टेड-विथ-वीट्यून-प्रोfileआर-11

  1. WHERE पेन में, Remote Linux (SSH) चुनें और यूज़रनेम @ होस्टनाम [:port] का उपयोग करके लक्ष्य Linux सिस्टम निर्दिष्ट करें।
    वीट्यून प्रोfiler लिनक्स सिस्टम से जुड़ता है और लक्ष्य पैकेज स्थापित करता है।
  2. WHAT फलक में, लक्ष्य Linux सिस्टम पर अपने एप्लिकेशन को पथ प्रदान करें।
  3. एप्लिकेशन पर प्रदर्शन स्नैपशॉट चलाने के लिए स्टार्ट बटन पर क्लिक करें।

स्टेप 3: View और प्रदर्शन डेटा का विश्लेषण करें
जब डेटा संग्रह पूरा हो जाता है, तो वीट्यून प्रोfiler macOS सिस्टम पर विश्लेषण परिणाम प्रदर्शित करता है। सारांश विंडो में अपना विश्लेषण प्रारंभ करें। यहाँ, आप एक प्रदर्शन खत्म देखते हैंview आपके आवेदन की

ओवरview आम तौर पर उनके विवरण के साथ कई मेट्रिक्स शामिल होते हैं।

इंटेल-गेट-स्टार्टेड-विथ-वीट्यून-प्रोfileआर-12

  • A योगदान करने वाले कारकों के बारे में विस्तृत जानकारी के लिए प्रत्येक मीट्रिक को विस्तृत करें.
  • B फ़्लैग किया गया मीट्रिक स्वीकार्य/सामान्य परिचालन सीमा से बाहर का मान दर्शाता है। फ़्लैग की गई मेट्रिक को बेहतर बनाने के तरीके को समझने के लिए टूल टिप्स का इस्तेमाल करें.
  • C अन्य विश्लेषणों पर मार्गदर्शन देखें, जिन पर आपको आगे चलने पर विचार करना चाहिए। एनालिसिस ट्री इन सुझावों पर प्रकाश डालता है।

अगले कदम
वीट्यून प्रो के साथ एप्लिकेशन प्रदर्शन का समग्र मूल्यांकन प्राप्त करने के लिए प्रदर्शन स्नैपशॉट एक अच्छा प्रारंभिक बिंदु हैfiler.
अगला, जांचें कि क्या आपके एल्गोरिथ्म को ट्यूनिंग की आवश्यकता है।

  1. अपने एप्लिकेशन पर हॉटस्पॉट विश्लेषण चलाएँ।
  2. एक हॉटस्पॉट ट्यूटोरियल का पालन करें। अपने हॉटस्पॉट विश्लेषण का अधिकतम लाभ उठाने की तकनीक सीखें।
  3. एक बार जब आपका एल्गोरिथ्म अच्छी तरह से ट्यून हो जाए, तो परिणामों को कैलिब्रेट करने और अन्य क्षेत्रों में संभावित प्रदर्शन सुधारों की पहचान करने के लिए प्रदर्शन स्नैपशॉट को फिर से चलाएँ।

यह भी देखें
माइक्रोआर्किटेक्चर अन्वेषण

वीट्यून प्रोfileआर हेल्प टूर

और अधिक जानें
दस्तावेज़ / विवरण

  • उपयोगकर्ता गाइड
    वीट्यून प्रो के लिए यूजर गाइड प्राथमिक दस्तावेज हैfiler.
    टिप्पणी
    आप वीट्यून प्रो का ऑफलाइन संस्करण भी डाउनलोड कर सकते हैंfileआर दस्तावेज़ीकरण.
  • ऑनलाइन प्रशिक्षण
    वीट्यून प्रो की मूल बातें सीखने के लिए ऑनलाइन प्रशिक्षण साइट एक उत्कृष्ट संसाधन हैfiler आरंभ करने के लिए मार्गदर्शिकाएँ, वीडियो, ट्यूटोरियल, webinars, और तकनीकी लेख।
  • रसोई की किताब
    प्रदर्शन विश्लेषण रसोई की किताब जिसमें वीट्यून प्रो में विश्लेषण प्रकारों का उपयोग करके लोकप्रिय प्रदर्शन समस्याओं को पहचानने और हल करने के लिए व्यंजन शामिल हैंfiler.
  • विंडोज के लिए इंस्टालेशन गाइड | लिनक्स | macOS होस्ट करता है
    इंस्टॉलेशन गाइड में वीट्यून प्रो के लिए बुनियादी इंस्टॉलेशन निर्देश शामिल हैंfileविभिन्न ड्राइवरों और संग्राहकों के लिए r और पोस्ट-इंस्टॉलेशन कॉन्फ़िगरेशन निर्देश।
  • ट्यूटोरियल
    वीट्यून प्रोfiler ट्यूटोरियल एक छोटे एस के साथ बुनियादी सुविधाओं के माध्यम से एक नए उपयोगकर्ता का मार्गदर्शन करते हैंampले आवेदन।
  • रिलीज नोट्स
    वीट्यून प्रो के नवीनतम संस्करण के बारे में जानकारी प्राप्त करेंfiler, जिसमें नई सुविधाओं, सिस्टम आवश्यकताओं और हल की गई तकनीकी समस्याओं का व्यापक विवरण शामिल है।
    वीट्यून प्रो के स्टैंडअलोन और टूलकिट संस्करणों के लिएfiler, वर्तमान सिस्टम आवश्यकताएँ समझें।

नोटिस और अस्वीकरण
इंटेल प्रौद्योगिकियों को सक्षम हार्डवेयर, सॉफ़्टवेयर या सेवा सक्रियण की आवश्यकता हो सकती है।
कोई भी उत्पाद या घटक पूर्णतः सुरक्षित नहीं हो सकता।
आपकी लागत और परिणाम भिन्न हो सकते हैं.
© इंटेल कॉर्पोरेशन। Intel, Intel लोगो और अन्य Intel चिह्न Intel Corporation या उसकी सहायक कंपनियों के ट्रेडमार्क हैं। अन्य नामों और ब्रांडों पर दूसरों की संपत्ति के रूप में दावा किया जा सकता है।
Intel, Intel लोगो, Intel Atom, Intel Core, Intel Xeon Phi, VTune और Xeon अमेरिका और/या अन्य देशों में Intel Corporation के ट्रेडमार्क हैं।
*अन्य नामों और ब्रांडों पर दूसरों की संपत्ति होने का दावा किया जा सकता है।
Microsoft, Windows और Windows लोगो ट्रेडमार्क हैं, या संयुक्त राज्य अमेरिका और/या अन्य देशों में Microsoft Corporation के पंजीकृत ट्रेडमार्क हैं।
जावा Oracle और/या उसके सहयोगियों का एक पंजीकृत ट्रेडमार्क है।
ओपनसीएल और ओपनसीएल लोगो एप्पल इंक के ट्रेडमार्क हैं, जिनका उपयोग क्रोनोस की अनुमति से किया जाता है।

इंटेल प्रौद्योगिकियों को सक्षम हार्डवेयर, सॉफ़्टवेयर या सेवा सक्रियण की आवश्यकता हो सकती है।
कोई भी उत्पाद या घटक पूर्णतः सुरक्षित नहीं हो सकता।
आपकी लागत और परिणाम भिन्न हो सकते हैं.
© इंटेल कॉर्पोरेशन। Intel, Intel लोगो और अन्य Intel चिह्न Intel Corporation या उसकी सहायक कंपनियों के ट्रेडमार्क हैं। अन्य नामों और ब्रांडों पर दूसरों की संपत्ति के रूप में दावा किया जा सकता है।
Intel, Intel लोगो, Intel Atom, Intel Core, Intel Xeon Phi, VTune और Xeon अमेरिका और/या अन्य देशों में Intel Corporation के ट्रेडमार्क हैं।
*अन्य नामों और ब्रांडों पर दूसरों की संपत्ति होने का दावा किया जा सकता है।
Microsoft, Windows और Windows लोगो ट्रेडमार्क हैं, या संयुक्त राज्य अमेरिका और/या अन्य देशों में Microsoft Corporation के पंजीकृत ट्रेडमार्क हैं।
जावा Oracle और/या उसके सहयोगियों का एक पंजीकृत ट्रेडमार्क है।
ओपनसीएल और ओपनसीएल लोगो एप्पल इंक के ट्रेडमार्क हैं, जिनका उपयोग क्रोनोस की अनुमति से किया जाता है।

दस्तावेज़ / संसाधन

इंटेल वीट्यून प्रो के साथ आरंभ करेंfiler [पीडीएफ] उपयोगकर्ता गाइड
वीट्यून प्रो के साथ शुरुआत करेंfileआर, वीट्यून प्रो के साथ आरंभ करेंfileआर, वीट्यून प्रोfiler

संदर्भ

एक टिप्पणी छोड़ें

आपकी ईमेल आईडी प्रकाशित नहीं की जाएगी। आवश्यक फ़ील्ड चिह्नित हैं *