intel ابدأ مع VTune Profiler
ابدأ مع Intel® VTune ™ Profiler
استخدم Intel VTune Profiler لتحليل أنظمة الهدف المحلية والبعيدة من مضيفي Windows * و macOS * و Linux *. تحسين أداء التطبيق والنظام من خلال هذه العمليات:
- تحليل اختيارات الخوارزمية.
- العثور على الاختناقات التسلسلية والمتوازية رمز.
- افهم أين وكيف يمكن لتطبيقك الاستفادة من موارد الأجهزة المتاحة.
- تسريع تنفيذ التطبيق الخاص بك.
قم بتنزيل Intel VTune Profiler على نظامك من خلال إحدى الطرق التالية: - قم بتنزيل الإصدار المستقل.
- احصل على Intel VTune Profiler كجزء من مجموعة أدوات قاعدة Intel® oneAPI.
شاهد VTune Profileصفحة تدريب لمقاطع الفيديو ، webinars والمزيد من المواد لمساعدتك على البدء.
ملحوظة
وثائق لإصدارات Intel® VTune ™ Profiler قبل إصدار 2021 متاحة للتنزيل فقط. للحصول على قائمة تنزيلات الوثائق المتوفرة حسب إصدار المنتج ، راجع هذه الصفحات:
- قم بتنزيل الوثائق الخاصة بـ Intel Parallel Studio XE
- قم بتنزيل الوثائق الخاصة بـ Intel System Studio
افهم سير العمل
استخدم Intel VTune Profileص إلى المواليةfile تطبيق وتحليل النتائج لتحسين الأداء.
يحتوي سير العمل العام على الخطوات التالية:
حدد نظامك المضيف للبدء
تعرف على المزيد حول مهام سير العمل الخاصة بالنظام لأنظمة Windows * أو Linux * أو macOS *.
ابدأ مع Intel® VTune ™ Profiler لنظام التشغيل Windows * OS
قبل أن تبدأ
- قم بتثبيت Intel® VTune ™ Profiler على نظام Windows * الخاص بك.
- أنشئ تطبيقك بمعلومات الرمز وفي وضع الإصدار مع تمكين جميع التحسينات. للحصول على معلومات مفصلة حول إعدادات المترجم ، راجع VTune Profiler دليل المستخدم عبر الإنترنت.
يمكنك أيضًا استخدام المصفوفة sampالتطبيق متاح في \ VTune \ S.ampليه \ ماتريكس. يمكنك ان ترى المقابلة sampلو النتائج \ VTune \ المشاريع \ قampلو (مصفوفة). - قم بإعداد متغيرات البيئة: قم بتشغيل ملف \ البرنامج النصي setvars.bat.
بشكل افتراضي ، فإن ملف لمكونات API واحد هو البرنامج Fileالصورة (x86) \ Intel \ oneAPI.
ملحوظة لا تحتاج إلى تشغيل setvars.bat عند استخدام Intel® VTune ™ Profiler داخل Microsoft * Visual Studio *.
الخطوة 1: ابدأ تشغيل Intel® VTune ™ Profiler
ابدأ تشغيل Intel VTune Profileص من خلال إحدى هذه الطرق وإنشاء مشروع. المشروع عبارة عن حاوية للتطبيق الذي تريد تحليله ونوع التحليل ونتائج جمع البيانات.
المصدر / ابدأ برنامج VTune Profiler
مستقل (GUI)
- قم بتشغيل الأمر vtune-gui أو قم بتشغيل Intel® VTune ™ Profiler من قائمة ابدأ.
- عندما تفتح واجهة المستخدم الرسومية ، انقر في شاشة الترحيب.
- في مربع الحوار "إنشاء مشروع" ، حدد اسم المشروع وموقعه.
- انقر فوق إنشاء مشروع.
مستقل (سطر الأوامر)
قم بتشغيل الأمر vtune.
Microsoft * Visual Studio * IDE
افتح الحل الخاص بك في Visual Studio. برنامج VTune Profileيتم تمكين شريط الأدوات r تلقائيًا ويتم تعيين مشروع Visual Studio كهدف تحليل.
ملحوظة
لست بحاجة إلى إنشاء مشروع عند تشغيل Intel® VTune ™ Profiler من سطر الأوامر أو داخل Microsoft * Visual Studio.
الخطوة 2: تكوين التحليل وتشغيله
بعد إنشاء مشروع جديد ، تفتح نافذة تكوين التحليل بهذه القيم الافتراضية:
- في قسم Launch Application ، استعرض للوصول إلى موقع تطبيقك القابل للتنفيذ file.
- انقر فوق "ابدأ" لتشغيل "لقطة الأداء" على التطبيق الخاص بك. يقدم هذا التحليل أكثر من عامةview من القضايا التي تؤثر على أداء التطبيق الخاص بك على النظام الهدف.
الخطوة 3: View وتحليل بيانات الأداء
عند اكتمال جمع البيانات ، يقوم برنامج VTune Profiler يعرض نتائج التحليل في نافذة الملخص. هنا ، ترى الأداء انتهىview من التطبيق الخاص بك.
انتهىview عادةً ما يتضمن العديد من المقاييس مع أوصافها.
- A قم بتوسيع كل مقياس للحصول على معلومات مفصلة حول العوامل المساهمة.
- B يشير المقياس المحدد بعلامة إلى قيمة خارج نطاق التشغيل المقبول / العادي. استخدم تلميحات الأدوات لفهم كيفية تحسين مقياس تم الإبلاغ عنه.
- C اطلع على إرشادات حول التحليلات الأخرى التي يجب أن تفكر في تشغيلها بعد ذلك. تسلط شجرة التحليل الضوء على هذه التوصيات.
الخطوات التالية
تعتبر لقطة الأداء نقطة انطلاق جيدة للحصول على تقييم شامل لأداء التطبيق باستخدام VTune Profileص. بعد ذلك ، تحقق مما إذا كانت الخوارزمية الخاصة بك تتطلب الضبط.
- اتبع البرنامج التعليمي لتحليل الاختناقات الشائعة في الأداء.
- بمجرد ضبط الخوارزمية جيدًا ، قم بتشغيل Performance Snapshot مرة أخرى لمعايرة النتائج وتحديد تحسينات الأداء المحتملة في المجالات الأخرى.
انظر أيضا
استكشاف العمارة الدقيقة
برنامج VTune Profiler جولة المساعدة
Exampعلى: محترفfile تطبيق OpenMP * على نظام Windows *
استخدم Intel VTune Profileص على جهاز ويندوز للمحترفينfile مثلample iso3dfd_omp_offload تطبيق OpenMP تم إلغاء تحميله على وحدة معالجة رسومات Intel. تعرف على كيفية إجراء تحليل GPU وفحص النتائج.
المتطلبات الأساسية
- تأكد من أن نظامك يعمل بنظام Microsoft * Windows 10 أو إصدار أحدث.
- استخدم أحد هذه الإصدارات من Intel Processor Graphics:
- الجيل الخامس
- الجيل الخامس
- الجيل الخامس
- يجب أن يعمل نظامك على أحد معالجات Intel التالية:
- معالجات Intel® Core ™ i7 من الجيل السابع (الاسم الرمزي Kaby Lake)
- معالجات Intel® Core ™ i8 من الجيل الثامن (الاسم الرمزي Coffee Lake)
- معالجات Intel® Core ™ i10 من الجيل العاشر (الاسم الرمزي Ice Lake)
- قم بتثبيت Intel VTune Profiler من أحد هذه المصادر:
- تنزيل منتج مستقل
- مجموعة أدوات قاعدة Intel® oneAPI
- مجموعة أدوات عرض نظام Intel®
- قم بتنزيل مجموعة أدوات Intel® oneAPI HPC التي تحتوي على مترجم Intel® oneAPI DPC ++ / C ++ (icx / icpx) الذي تحتاج إلى احترافهfile تطبيقات OpenMP.
- قم بإعداد متغيرات البيئة. قم بتنفيذ البرنامج النصي vars.bat الموجود في ملف \ دليل EN.
- قم بإعداد نظامك لتحليل GPU.
ملحوظة
لتثبيت Intel VTune Profiler في بيئة Microsoft * Visual Studio ، راجع VTune Profiler دليل المستخدم.
بناء وترجمة تطبيق OpenMP Offload
- قم بتنزيل ملف iso3dfd_omp_offload OpenMP Offload sampليه.
- فتح على sampدليل لو.
قرص مضغوطample_dir> / DirectProgramming / C ++ / StructuredGrids / iso3dfd_omp_offload - تجميع تطبيق OpenMP Offload.
بناء mkdir
بناء القرص المضغوط
icx / الأمراض المنقولة جنسياً: c ++ 17 / EHsc / Qiopenmp / I .. / تضمين \ / أهداف Qopenmp:
spir64 / DUSE_BASELINE / DEBUG .. \ src \ iso3dfd.cpp .. \ src \ iso3dfd_verify.cpp .. \ src \ utils.cpp
قم بتشغيل تحليل GPU في تطبيق OpenMP Offload
أنت الآن جاهز لتشغيل تحليل إلغاء تحميل GPU على تطبيق OpenMP الذي جمعته.
- افتح برنامج VTune Profiler وانقر على مشروع جديد لإنشاء مشروع.
- في صفحة الترحيب ، انقر فوق تكوين التحليل لإعداد التحليل الخاص بك.
- حدد هذه الإعدادات لتحليلك.
- في الجزء WHERE ، حدد Local Host.
- في جزء WHAT ، حدد Launch Application وحدد ثنائي iso3dfd_omp_offload كتطبيق للمحترفينfile.
- في جزء "كيفية" ، حدد نوع تحليل إلغاء تحميل GPU من مجموعة المسرعات في شجرة التحليل.
- انقر فوق الزر "ابدأ" لتشغيل التحليل.
برنامج VTune Profileيجمع r البيانات ويعرض نتائج التحليل في GPU Offload viewنقطة.
- في نافذة الملخص ، راجع إحصائيات استخدام موارد وحدة المعالجة المركزية ووحدة معالجة الرسومات. استخدم هذه البيانات لتحديد ما إذا كان التطبيق الخاص بك:
- GPU ملزمة
- مرتبط بوحدة المعالجة المركزية
- استخدام موارد الحوسبة لنظامك بشكل غير فعال
- استخدم المعلومات الموجودة في نافذة النظام الأساسي للاطلاع على مقاييس وحدة المعالجة المركزية ووحدة معالجة الرسومات الأساسية.
- تحقق من مهام الحوسبة المحددة في نافذة الرسومات.
للحصول على تحليل أعمق ، راجع الوصفة ذات الصلة في VTune Profiler كتاب طبخ تحليل الأداء. يمكنك أيضًا متابعة التوصيف من خلال تحليل GPU Compute / Media Hotspots.
Exampلو: بروfile تطبيق SYCL * على نظام Windows *
محترفfile مثلample matrix_multiply SYCL مع Intel® VTune ™ Profileص. تعرف على المنتج وافهم الإحصائيات التي تم جمعها للتطبيقات المرتبطة بوحدة معالجة الرسومات.
المتطلبات الأساسية
- تأكد من تثبيت Microsoft * Visual Studio (v2017 أو أحدث) على نظامك.
- قم بتثبيت Intel VTune Profiler من مجموعة أدوات Intel® oneAPI Base Toolkit أو مجموعة أدوات إحضار نظام Intel®. تحتوي مجموعات الأدوات هذه على برنامج التحويل البرمجي Intel® oneAPI DPC ++ / C ++ (icpx -fsycl) المطلوب لعملية التشكيل الجانبي.
- قم بإعداد متغيرات البيئة. قم بتنفيذ البرنامج النصي vars.bat الموجود في ملف \ دليل EN.
- تأكد من دمج مترجم Intel oneAPI DPC ++ (المثبت مع مجموعة أدوات Intel oneAPI Base) في Microsoft Visual Studio.
- قم بترجمة التعليمات البرمجية باستخدام خيارات -gline-table-only و -fdebug-info-for-Profiling لـ Intel oneAPI DPC ++ Compiler.
- قم بإعداد نظامك لتحليل GPU.
للحصول على معلومات حول تثبيت Intel VTune Profiler في بيئة Microsoft * Visual Studio ، راجع VTune Profiler دليل المستخدم.
بناء تطبيق ماتريكس
قم بتنزيل كود matrix_multiply_vtune sampحزمة لو لمجموعات أدوات Intel oneAPI. هذا يحتوي على sample الذي يمكنك استخدامه لبناء وإحترافيةfile تطبيق SYCL.
- افتح Microsoft * Visual Studio.
- انقر File > فتح> مشروع / حل. ابحث عن المجلد matrix_multiply_vtune وحدد matrix_multiply.sln.
- قم ببناء هذا التكوين (مشروع> بناء).
- قم بتشغيل البرنامج (تصحيح> ابدأ بدون تصحيح).
- لاختيار DPC ++ أو إصدار مترابط من sample ، استخدم تعريفات المعالج المسبق.
- انتقل إلى Project Properties> DPC ++> Preprocessor> Preprocessor Definition.
- حدد icpx -fsycl أو USE_THR.
قم بتشغيل تحليل GPU
قم بتشغيل تحليل GPU على Matrix sampليه.
- من شريط أدوات Visual Studio ، انقر فوق الزر تكوين التحليل.
تفتح نافذة تكوين التحليل. بشكل افتراضي ، يرث إعدادات مشروع VS ويحدد matrix_multiply.exe كتطبيق للمحترفينfile. - في نافذة تكوين التحليل ، انقر على ملف
الزر "استعراض" في جزء "كيف".
- حدد نوع تحليل GPU Compute / Media Hotspots من مجموعة Accelerators في شجرة التحليل.
- انقر فوق الزر "ابدأ" لبدء التحليل بالخيارات المحددة مسبقًا.
قم بتشغيل تحليل GPU من سطر الأوامر:
- افتح السampدليل le:
<sample_dir> \ VtuneProfiler \ matrix_multiply_vtune - في هذا الدليل ، افتح مشروع Visual Studio * file اسمه matrix_multiply.sln
- يتضاعف. cpp file يحتوي على عدة إصدارات من ضرب المصفوفة. حدد إصدارًا عن طريق تحرير سطر #define MULTIPLY المقابل في multiply.hpp
- بناء المشروع بأكمله مع تكوين الإصدار.
يؤدي هذا إلى إنشاء ملف تنفيذي يسمى matrix_multiply.exe. - قم بإعداد النظام لتشغيل تحليل GPU. راجع إعداد النظام لتحليل وحدة معالجة الرسومات.
- اضبط VTune Profiler متغيرات البيئة عن طريق تشغيل الدفعة file: يصدّر \ env \ vars.bat
- قم بتشغيل أمر التحليل:
vtune.exe - جمع gpu-offload - matrix_multiply.exe
برنامج VTune Profileيجمع r البيانات ويعرض نتائج التحليل في GPU Compute / Media Hotspots viewنقطة. في نافذة الملخص ، راجع إحصائيات استخدام موارد وحدة المعالجة المركزية ووحدة معالجة الرسومات لمعرفة ما إذا كان تطبيقك مرتبطًا بوحدة معالجة الرسومات. قم بالتبديل إلى نافذة الرسومات لرؤية مقاييس وحدة المعالجة المركزية ووحدة معالجة الرسومات الأساسية التي تمثل تنفيذ الكود بمرور الوقت.
ابدأ مع Intel® VTune ™ Profiler لنظام التشغيل Linux * OS
قبل أن تبدأ
- قم بتثبيت Intel® VTune ™ Profiler على نظام Linux * الخاص بك.
- أنشئ تطبيقك بمعلومات الرمز وفي وضع الإصدار مع تمكين جميع التحسينات. للحصول على معلومات مفصلة حول إعدادات المترجم ، راجع VTune Profiler دليل المستخدم عبر الإنترنت.
يمكنك أيضًا استخدام المصفوفة sampالتطبيق متاح في \سampلو \ مصفوفة. يمكنك ان ترى sampلو النتائج \سampلو (مصفوفة). - قم بإعداد متغيرات البيئة: المصدر /setvars.sh
بشكل افتراضي ، فإن ملف يكون:- $ HOME / intel / oneapi / عند التثبيت بأذونات المستخدم ؛
- / opt / intel / oneapi / عند التثبيت بأذونات الجذر.
الخطوة 1: ابدأ تشغيل VTune Profiler
ابدأ تشغيل VTune Profiler بإحدى الطرق التالية:
المصدر / ابدأ برنامج VTune Profiler
مستقل / IDE (GUI)
- قم بتشغيل الأمر vtunegui. لبدء VTune Profiler من Intel System Studio IDE ، حدد أدوات> VTune Profiler> قم بتشغيل VTune Profileص. يقوم هذا بتعيين جميع متغيرات البيئة المناسبة وتشغيل واجهة مستقلة للمنتج.
- عند فتح واجهة المستخدم الرسومية ، انقر فوق مشروع جديد في شاشة الترحيب.
- في مربع الحوار "إنشاء مشروع" ، حدد اسم المشروع وموقعه.
- انقر فوق إنشاء مشروع.
مستقل (سطر الأوامر)
- قم بتشغيل الأمر vtune.
الخطوة 2: تكوين التحليل وتشغيله
بعد إنشاء مشروع جديد ، تفتح نافذة تكوين التحليل بهذه القيم الافتراضية:
- في قسم Launch Application ، استعرض للوصول إلى موقع التطبيق الخاص بك.
- انقر فوق Start (ابدأ) لتشغيل Performance Snapshot على تطبيقك. يقدم هذا التحليل أكثر من عامview من القضايا التي تؤثر على أداء التطبيق الخاص بك على النظام الهدف.
الخطوة 3: View وتحليل بيانات الأداء
عند اكتمال جمع البيانات ، يقوم برنامج VTune Profiler يعرض نتائج التحليل في نافذة الملخص. هنا ، ترى الأداء انتهىview من التطبيق الخاص بك.
انتهىview عادةً ما يتضمن العديد من المقاييس مع أوصافها.
- A قم بتوسيع كل مقياس للحصول على معلومات مفصلة حول العوامل المساهمة.
- B يشير المقياس المحدد بعلامة إلى قيمة خارج نطاق التشغيل المقبول / العادي. استخدم تلميحات الأدوات لفهم كيفية تحسين مقياس تم الإبلاغ عنه.
- C اطلع على إرشادات حول التحليلات الأخرى التي يجب أن تفكر في تشغيلها بعد ذلك. تسلط شجرة التحليل الضوء على هذه التوصيات.
الخطوات التالية
تعتبر لقطة الأداء نقطة انطلاق جيدة للحصول على تقييم شامل لأداء التطبيق باستخدام VTune Profileص. بعد ذلك ، تحقق مما إذا كانت الخوارزمية الخاصة بك تتطلب الضبط.
- اتبع البرنامج التعليمي لتحليل الاختناقات الشائعة في الأداء.
- بمجرد ضبط الخوارزمية جيدًا ، قم بتشغيل Performance Snapshot مرة أخرى لمعايرة النتائج وتحديد تحسينات الأداء المحتملة في المجالات الأخرى.
انظر أيضا
استكشاف العمارة الدقيقة
برنامج VTune Profiler جولة المساعدة
Exampلو: بروfile تطبيق OpenMP على Linux *
استخدم Intel VTune Profiler على جهاز Linux للمحترفينfile مثلample iso3dfd_omp_offload تطبيق OpenMP تم إلغاء تحميله على وحدة معالجة رسومات Intel. تعرف على كيفية إجراء تحليل GPU وفحص النتائج.
المتطلبات الأساسية
- تأكد من أن نظامك يعمل بنظام Linux * OS kernel 4.14 أو إصدار أحدث.
- استخدم أحد هذه الإصدارات من Intel Processor Graphics:
- الجيل الخامس
- الجيل الخامس
- الجيل الخامس
- يجب أن يعمل نظامك على أحد معالجات Intel التالية:
- معالجات Intel® Core ™ i7 من الجيل السابع (الاسم الرمزي Kaby Lake)
- معالجات Intel® Core ™ i8 من الجيل الثامن (الاسم الرمزي Coffee Lake)
- معالجات Intel® Core ™ i10 من الجيل العاشر (الاسم الرمزي Ice Lake)
- بالنسبة إلى Linux GUI ، استخدم:
- GTK + الإصدار 2.10 أو أحدث (يوصى باستخدام 2.18 والإصدارات الأحدث)
- إصدار Pango 1.14 أو أحدث
- X.Org الإصدار 1.0 أو أحدث (يوصى باستخدام 1.7 والإصدارات الأحدث)
- قم بتثبيت Intel VTune Profiler من أحد هذه المصادر:
- تنزيل منتج مستقل
- مجموعة أدوات قاعدة Intel® oneAPI
- مجموعة أدوات عرض نظام Intel®
- قم بتنزيل مجموعة أدوات Intel® oneAPI HPC التي تحتوي على مترجم Intel® oneAPI DPC ++ / C ++ (icx / icpx) الذي تحتاج إلى احترافهfile تطبيقات OpenMP.
- قم بإعداد متغيرات البيئة. قم بتنفيذ البرنامج النصي vars.sh.
- قم بإعداد نظامك لتحليل GPU.
بناء وترجمة تطبيق OpenMP Offload
- قم بتنزيل ملف iso3dfd_omp_offload OpenMP Offload sampليه.
- فتح على sampدليل لو.
قرص مضغوطample_dir> / DirectProgramming / C ++ / StructuredGrids / iso3dfd_omp_offload - تجميع تطبيق OpenMP Offload.
بناء مكدير
cmake -DVERIFY_RESULTS = 0 ..
جعل-ي
يؤدي هذا إلى إنشاء ملف src / iso3dfd القابل للتنفيذ.
لحذف البرنامج ، اكتب:
جعل نظيفا
هذا يزيل الملف القابل للتنفيذ والكائن files التي قمت بإنشائها باستخدام الأمر make.
قم بتشغيل تحليل GPU في تطبيق OpenMP Offload
أنت الآن جاهز لتشغيل تحليل إلغاء تحميل GPU على تطبيق OpenMP الذي جمعته.
- افتح برنامج VTune Profiler وانقر على مشروع جديد لإنشاء مشروع.
- في صفحة الترحيب ، انقر فوق تكوين التحليل لإعداد التحليل الخاص بك.
- حدد هذه الإعدادات لتحليلك.
- في الجزء WHERE ، حدد Local Host.
- في جزء WHAT ، حدد Launch Application وحدد ثنائي iso3dfd_omp_offload كتطبيق للمحترفينfile.
- في جزء "كيفية" ، حدد نوع تحليل إلغاء تحميل GPU من مجموعة المسرعات في شجرة التحليل.
- انقر فوق الزر "ابدأ" لتشغيل التحليل.
برنامج VTune Profileيجمع r البيانات ويعرض نتائج التحليل في GPU Offload viewنقطة.
- في نافذة الملخص ، راجع إحصائيات استخدام موارد وحدة المعالجة المركزية ووحدة معالجة الرسومات. استخدم هذه البيانات لتحديد ما إذا كان التطبيق الخاص بك:
- GPU ملزمة
- مرتبط بوحدة المعالجة المركزية
- استخدام موارد الحوسبة لنظامك بشكل غير فعال
- استخدم المعلومات الموجودة في نافذة النظام الأساسي للاطلاع على مقاييس وحدة المعالجة المركزية ووحدة معالجة الرسومات الأساسية.
- تحقق من مهام الحوسبة المحددة في نافذة الرسومات.
للحصول على تحليل أعمق ، راجع الوصفة ذات الصلة في VTune Profiler كتاب طبخ تحليل الأداء. يمكنك أيضًا متابعة التوصيف من خلال تحليل GPU Compute / Media Hotspots.
Exampلو: بروfile تطبيق SYCL * على Linux *
استخدم VTune Profileص معample matrix_multiply SYCL للتعرف سريعًا على المنتج والإحصاءات التي تم جمعها للتطبيقات المرتبطة بوحدة معالجة الرسومات.
المتطلبات الأساسية
- قم بتثبيت VTune Profiler و Intel® oneAPI DPC ++ / C ++ Compiler من Intel® oneAPI Base Toolkit أو Intel® System Bring-up Toolkit.
- قم بإعداد متغيرات البيئة عن طريق تنفيذ البرنامج النصي vars.sh.
- قم بإعداد نظامك لتحليل GPU.
بناء تطبيق ماتريكس
قم بتنزيل كود matrix_multiply_vtune sampحزمة لو لمجموعات أدوات Intel oneAPI. هذا يحتوي على sample الذي يمكنك استخدامه لبناء وإحترافيةfile تطبيق SYCL.
للمحترفينfile تطبيق SYCL ، تأكد من ترجمة التعليمات البرمجية باستخدام خيارات مترجم -gline-Tab-only و -fdebug-info-for-Profiling Intel oneAPI DPC ++ Compiler.
لتجميع هذا sampفي التطبيق ، قم بما يلي:
- انتقل إلى sampدليل لو.
قرص مضغوطample_dir / VtuneProfileص / matrix_multiply> - يتضاعف. cpp file في المجلد src العديد من إصدارات ضرب المصفوفة. حدد إصدارًا عن طريق تحرير سطر #define MULTIPLY المقابل في الضرب.
- أنشئ التطبيق باستخدام الطراز الحاليfile:
سي ماك .
يصنع
هذا يجب أن يولد matrix.icpx -fsycl قابل للتنفيذ.
لحذف البرنامج ، اكتب:
جعل نظيفا
هذا يزيل الملف القابل للتنفيذ والكائن files التي تم إنشاؤها بواسطة أمر make.
قم بتشغيل تحليل GPU
قم بتشغيل تحليل GPU على Matrix sampليه.
- قم بتشغيل VTune Profiler باستخدام الأمر vtune-gui.
- انقر فوق مشروع جديد من صفحة الترحيب.
- حدد اسمًا وموقعًا لملفاتكample project وانقر فوق إنشاء مشروع.
- في جزء WHAT ، استعرض للوصول إلى matrix.icpx-fsycl file.
- في جزء "كيفية" ، انقر فوق ملف
زر تصفح وحدد تحليل GPU Compute / Media Hotspots من مجموعة Accelerators في شجرة التحليل.
- انقر فوق الزر "ابدأ" في الجزء السفلي لبدء التحليل بالخيارات المحددة مسبقًا.
قم بتشغيل تحليل GPU من سطر الأوامر:
- قم بإعداد النظام لتشغيل تحليل GPU. راجع إعداد النظام لتحليل وحدة معالجة الرسومات.
- إعداد متغيرات البيئة لأدوات برامج Intel:
المصدر $ ONEAPI_ROOT / setvars.sh - قم بتشغيل تحليل GPU Compute / Media Hotspots:
vtune -collect gpu-hotspots -r ./result_gpu-hotspots - ./matrix.icpx -fsycl
لمشاهدة تقرير الملخص ، اكتب:
vtune -موجز التقرير -r ./result_gpu-hotspots
برنامج VTune Profileيجمع r البيانات ويعرض نتائج التحليل في GPU Compute / Media Hotspots viewنقطة. في نافذة الملخص ، راجع إحصائيات استخدام موارد وحدة المعالجة المركزية ووحدة معالجة الرسومات لمعرفة ما إذا كان تطبيقك مرتبطًا بوحدة معالجة الرسومات. قم بالتبديل إلى نافذة الرسومات لرؤية مقاييس وحدة المعالجة المركزية ووحدة معالجة الرسومات الأساسية التي تمثل تنفيذ الكود بمرور الوقت.
ابدأ مع Intel® VTune ™ Profiler لـ macOS *
استخدم VTune Profiler على نظام macOS لإجراء تحليل الهدف عن بُعد على نظام بخلاف نظام macOS (Linux * أو Android * فقط).
لا يمكنك استخدام VTune Profiler في بيئة macOS للأغراض التالية:
- محترفfile نظام macOS المثبت عليه.
- اجمع البيانات على نظام macOS بعيد.
لتحليل أداء هدف Linux * أو Android * بعيد من مضيف macOS ، قم بإحدى الخطوات التالية:
- قم بتشغيل برنامج VTune Profiler على نظام macOS باستخدام نظام بعيد محدد كهدف. عندما يبدأ التحليل ، VTune Profiler يتصل بالنظام البعيد لجمع البيانات ، ثم يعيد النتائج إلى مضيف macOS لـ viewعمل.
- قم بإجراء تحليل على النظام المستهدف محليًا وانسخ النتائج إلى نظام macOS لـ viewجي في VTune Profiler.
تفترض الخطوات الواردة في هذا المستند وجود نظام مستهدف Linux بعيد وتجمع بيانات الأداء باستخدام وصول SSH من VTune Profiler على نظام مضيف macOS.
قبل أن تبدأ
- قم بتثبيت Intel® VTune ™ Profiler على نظام macOS * الخاص بك.
- قم ببناء تطبيق Linux الخاص بك بمعلومات الرمز وفي وضع الإصدار مع تمكين جميع التحسينات. للحصول على معلومات مفصلة ، راجع إعدادات المترجم في VTune Profileر المساعدة.
- قم بإعداد وصول SSH من نظام macOS المضيف إلى نظام Linux المستهدف للعمل في وضع بدون كلمة مرور.
الخطوة 1: ابدأ تشغيل VTune Profiler
- قم بتشغيل VTune Profiler باستخدام الأمر vtune-gui.
بشكل افتراضي ، فإن ملف هو / opt / intel / oneapi /. - عند فتح واجهة المستخدم الرسومية ، انقر فوق مشروع جديد في شاشة الترحيب.
- في مربع الحوار "إنشاء مشروع" ، حدد اسم المشروع وموقعه.
- انقر فوق إنشاء مشروع.
الخطوة 2: تكوين التحليل وتشغيله
بعد إنشاء مشروع جديد ، يتم فتح نافذة تكوين التحليل بنوع تحليل لقطة الأداء.
يقدم هذا التحليل أكثر منview من القضايا التي تؤثر على أداء التطبيق الخاص بك على النظام الهدف.
- في الجزء WHERE ، حدد Remote Linux (SSH) وحدد نظام Linux الهدف باستخدام username @ hostname [: port].
برنامج VTune Profiler يتصل بنظام Linux ويقوم بتثبيت الحزمة المستهدفة. - في جزء WHAT ، قم بتوفير المسار إلى التطبيق الخاص بك على نظام Linux الهدف.
- انقر فوق الزر "ابدأ" لتشغيل "لقطة الأداء" في التطبيق.
الخطوة 3: View وتحليل بيانات الأداء
عند اكتمال جمع البيانات ، يقوم برنامج VTune Profileيعرض r نتائج التحليل على نظام macOS. ابدأ تحليلك في نافذة الملخص. هنا ، ترى الأداء انتهىview من التطبيق الخاص بك.
انتهىview عادةً ما يتضمن العديد من المقاييس مع أوصافها.
- A قم بتوسيع كل مقياس للحصول على معلومات مفصلة حول العوامل المساهمة.
- B يشير المقياس المحدد بعلامة إلى قيمة خارج نطاق التشغيل المقبول / العادي. استخدم تلميحات الأدوات لفهم كيفية تحسين مقياس تم الإبلاغ عنه.
- C اطلع على إرشادات حول التحليلات الأخرى التي يجب أن تفكر في تشغيلها بعد ذلك. تسلط شجرة التحليل الضوء على هذه التوصيات.
الخطوات التالية
تعتبر لقطة الأداء نقطة انطلاق جيدة للحصول على تقييم شامل لأداء التطبيق باستخدام VTune Profiler.
بعد ذلك ، تحقق مما إذا كانت الخوارزمية الخاصة بك تتطلب الضبط.
- قم بتشغيل Hotspots Analysis على تطبيقك.
- اتبع البرنامج التعليمي Hotspots. تعرف على تقنيات لتحقيق أقصى استفادة من تحليل النقاط الفعالة.
- بمجرد ضبط الخوارزمية جيدًا ، قم بتشغيل Performance Snapshot مرة أخرى لمعايرة النتائج وتحديد تحسينات الأداء المحتملة في المجالات الأخرى.
انظر أيضا
استكشاف العمارة الدقيقة
برنامج VTune Profiler جولة المساعدة
يتعلم أكثر
وصف المستند
- دليل المستخدم
دليل المستخدم هو التوثيق الأساسي لبرنامج VTune Profiler.
ملحوظة
يمكنك أيضًا تنزيل إصدار غير متصل بالإنترنت من VTune Profileص الوثائق. - التدريب عبر الإنترنت
يعد موقع التدريب عبر الإنترنت مصدرًا ممتازًا لتعلم أساسيات VTune Profiler مع أدلة البدء ومقاطع الفيديو والبرامج التعليمية ، webinars والمقالات التقنية. - كتاب الطبخ
كتاب طهي لتحليل الأداء يحتوي على وصفات لتحديد مشاكل الأداء الشائعة وحلها باستخدام أنواع التحليل في VTune Profiler. - دليل التثبيت لنظام التشغيل Windows | لينكس | تستضيف macOS
يحتوي دليل التثبيت على إرشادات التثبيت الأساسية لبرنامج VTune Profiler وإرشادات التكوين بعد التثبيت لمختلف السائقين والمجمعين. - دروس تعليمية
برنامج VTune Profileترشد البرامج التعليمية مستخدمًا جديدًا من خلال الميزات الأساسية بإيجاز قصيرampتطبيق le. - ملاحظات الإصدار
اعثر على معلومات حول أحدث إصدار من VTune Profiler ، بما في ذلك وصف شامل للميزات الجديدة ومتطلبات النظام والمشكلات الفنية التي تم حلها.
للإصدارات المستقلة ومجموعة الأدوات من VTune Profiler ، فهم متطلبات النظام الحالية.
الإخطارات وإخلاء المسؤولية
قد تتطلب تقنيات Intel تفعيل الأجهزة أو البرامج أو تفعيل الخدمة.
لا يمكن أن يكون أي منتج أو مكون آمنًا تمامًا.
قد تختلف التكاليف والنتائج الخاصة بك.
© شركة إنتل. تعد Intel وشعار Intel وعلامات Intel الأخرى علامات تجارية لشركة Intel Corporation أو الشركات التابعة لها. قد تكون الأسماء والعلامات التجارية الأخرى مملوكة لآخرين.
تعد Intel وشعار Intel و Intel Atom و Intel Core و Intel Xeon Phi و VTune و Xeon علامات تجارية لشركة Intel Corporation في الولايات المتحدة و / أو دول أخرى.
*قد يتم المطالبة بأسماء وعلامات تجارية أخرى باعتبارها ملكًا للآخرين.
Microsoft و Windows وشعار Windows هي علامات تجارية أو علامات تجارية مسجلة لشركة Microsoft Corporation في الولايات المتحدة و / أو دول أخرى.
Java هي علامة تجارية مسجلة لشركة Oracle و / أو الشركات التابعة لها.
OpenCL وشعار OpenCL هما علامتان تجاريتان لشركة Apple Inc. وتستخدمان بإذن من Khronos.
قد تتطلب تقنيات Intel تفعيل الأجهزة أو البرامج أو تفعيل الخدمة.
لا يمكن أن يكون أي منتج أو مكون آمنًا تمامًا.
قد تختلف التكاليف والنتائج الخاصة بك.
© شركة إنتل. تعد Intel وشعار Intel وعلامات Intel الأخرى علامات تجارية لشركة Intel Corporation أو الشركات التابعة لها. قد تكون الأسماء والعلامات التجارية الأخرى مملوكة لآخرين.
تعد Intel وشعار Intel و Intel Atom و Intel Core و Intel Xeon Phi و VTune و Xeon علامات تجارية لشركة Intel Corporation في الولايات المتحدة و / أو دول أخرى.
*قد يتم المطالبة بأسماء وعلامات تجارية أخرى باعتبارها ملكًا للآخرين.
Microsoft و Windows وشعار Windows هي علامات تجارية أو علامات تجارية مسجلة لشركة Microsoft Corporation في الولايات المتحدة و / أو دول أخرى.
Java هي علامة تجارية مسجلة لشركة Oracle و / أو الشركات التابعة لها.
OpenCL وشعار OpenCL هما علامتان تجاريتان لشركة Apple Inc. وتستخدمان بإذن من Khronos.
المستندات / الموارد
![]() |
intel ابدأ مع VTune Profiler [بي دي اف] دليل المستخدم ابدأ مع VTune Profiler ، ابدأ ، مع VTune Profileص ، VTune Profiler |