Intel เริ่มต้นด้วย VTune Profiler
เริ่มต้นใช้งาน Intel® VTune™ Profiler
ใช้ Intel VTune Profiler เพื่อวิเคราะห์ระบบเป้าหมายแบบโลคัลและรีโมตจากโฮสต์ Windows*, macOS* และ Linux* ปรับปรุงประสิทธิภาพของแอปพลิเคชันและระบบผ่านการดำเนินการเหล่านี้:
- วิเคราะห์ตัวเลือกอัลกอริทึม
- ค้นหาคอขวดของรหัสซีเรียลและขนาน
- ทำความเข้าใจว่าแอปพลิเคชันของคุณจะได้รับประโยชน์จากทรัพยากรฮาร์ดแวร์ที่มีอยู่ได้อย่างไรและอย่างไร
- เพิ่มความเร็วในการดำเนินการแอปพลิเคชันของคุณ
ดาวน์โหลด Intel VTune Profiler บนระบบของคุณด้วยวิธีใดวิธีหนึ่งต่อไปนี้: - ดาวน์โหลดเวอร์ชันสแตนด์อโลน
- รับ Intel VTune Profiler เป็นส่วนหนึ่งของ Intel® oneAPI Base Toolkit
ดู VTune Profileหน้าการฝึกอบรมสำหรับวิดีโอ webinars และเนื้อหาอื่น ๆ เพื่อช่วยให้คุณเริ่มต้น
บันทึก
เอกสารประกอบสำหรับเวอร์ชันของ Intel® VTune™ Profileก่อนรุ่นปี 2021 มีให้ดาวน์โหลดเท่านั้น สำหรับรายการดาวน์โหลดเอกสารที่มีตามรุ่นของผลิตภัณฑ์ โปรดดูหน้าเหล่านี้:
- ดาวน์โหลดเอกสารสำหรับ Intel Parallel Studio XE
- ดาวน์โหลดเอกสารประกอบสำหรับ Intel System Studio
ทำความเข้าใจเวิร์กโฟลว์
ใช้ Intel VTune Profiler ถึงมือโปรfile แอปพลิเคชันและวิเคราะห์ผลลัพธ์เพื่อปรับปรุงประสิทธิภาพ
เวิร์กโฟลว์ทั่วไปประกอบด้วยขั้นตอนเหล่านี้:
เลือกระบบโฮสต์ของคุณเพื่อเริ่มต้น
เรียนรู้เพิ่มเติมเกี่ยวกับเวิร์กโฟลว์เฉพาะระบบสำหรับ Windows*, Linux* หรือ macOS*
เริ่มต้นใช้งาน Intel® VTune™ Profiler สำหรับระบบปฏิบัติการ Windows*
ก่อนที่คุณจะเริ่มต้น
- ติดตั้ง Intel® VTune™ Profiler บนระบบ Windows* ของคุณ
- สร้างแอปพลิเคชันของคุณด้วยข้อมูลสัญลักษณ์และในโหมดรีลีสโดยเปิดใช้งานการเพิ่มประสิทธิภาพทั้งหมด สำหรับข้อมูลโดยละเอียดเกี่ยวกับการตั้งค่าคอมไพเลอร์ โปรดดูที่ VTune Profileคู่มือผู้ใช้ออนไลน์
คุณยังสามารถใช้เมทริกซ์ample แอปพลิเคชันที่มีอยู่ใน \VTune\Sampเลส\เมทริกซ์ คุณสามารถดูที่เกี่ยวข้องampผลลัพธ์ที่ได้คือ \VTune\Projects\sampเลอ (เมทริกซ์) - ตั้งค่าตัวแปรสภาพแวดล้อม: เรียกใช้ สคริปต์ \setvars.bat
โดยค่าเริ่มต้น สำหรับส่วนประกอบ oneAPI คือโปรแกรม Files (x86)\Intel\oneAPI
บันทึก คุณไม่จำเป็นต้องเรียกใช้ setvars.bat เมื่อใช้ Intel® VTune™ Profiler ภายใน Microsoft* Visual Studio*
ขั้นตอนที่ 1: เริ่ม Intel® VTune™ Profiler
เริ่ม Intel VTune Profileด้วยวิธีใดวิธีหนึ่งเหล่านี้และจัดทำโครงการ โครงการคือคอนเทนเนอร์สำหรับแอปพลิเคชันที่คุณต้องการวิเคราะห์ ประเภทของการวิเคราะห์ และผลการรวบรวมข้อมูล
ที่มา / เริ่ม VTune Profiler
แบบสแตนด์อโลน (GUI)
- เรียกใช้คำสั่ง vtune-gui หรือเรียกใช้ Intel® VTune™ Profiler จากเมนูเริ่ม
- เมื่อ GUI เปิดขึ้น ให้คลิกในหน้าจอต้อนรับ
- ในกล่องโต้ตอบ สร้างโครงการ ให้ระบุชื่อโครงการและตำแหน่งที่ตั้ง
- คลิกสร้างโครงการ
แบบสแตนด์อโลน (บรรทัดคำสั่ง)
เรียกใช้คำสั่ง vtune
ไมโครซอฟต์* วิชวล สตูดิโอ* IDE
เปิดโซลูชันของคุณใน Visual Studio วีทูน โปรfileแถบเครื่องมือ r จะเปิดใช้งานโดยอัตโนมัติ และโครงการ Visual Studio ของคุณถูกกำหนดเป็นเป้าหมายการวิเคราะห์
บันทึก
คุณไม่จำเป็นต้องสร้างโครงการเมื่อใช้งาน Intel® VTune™ Profiler จากบรรทัดคำสั่งหรือภายใน Microsoft* Visual Studio
ขั้นตอนที่ 2: กำหนดค่าและเรียกใช้การวิเคราะห์
หลังจากสร้างโครงการใหม่ หน้าต่าง Configure Analysis จะเปิดขึ้นพร้อมกับค่าเริ่มต้นเหล่านี้:
- ในส่วน Launch Application ให้เรียกดูตำแหน่งที่ตั้งของโปรแกรมเรียกทำงานของคุณ file.
- คลิก เริ่ม เพื่อเรียกใช้ Performance Snapshot บนแอปพลิเคชันของคุณ การวิเคราะห์นี้นำเสนอโดยทั่วไปview ของปัญหาที่ส่งผลต่อประสิทธิภาพของแอปพลิเคชันของคุณบนระบบเป้าหมาย
ขั้นตอนที่ 3: View และวิเคราะห์ข้อมูลประสิทธิภาพ
เมื่อรวบรวมข้อมูลเสร็จ VTune Profiler แสดงผลการวิเคราะห์ในหน้าต่างสรุป ที่นี่คุณเห็นการแสดงจบลงview ของใบสมัครของคุณ
เกินview โดยทั่วไปจะมีเมตริกหลายรายการพร้อมกับคำอธิบาย
- A ขยายเมตริกแต่ละรายการเพื่อดูข้อมูลโดยละเอียดเกี่ยวกับปัจจัยที่มีส่วนร่วม
- B เมตริกที่ถูกตั้งค่าสถานะจะระบุค่าที่อยู่นอกช่วงการทำงานที่ยอมรับได้/ปกติ ใช้เคล็ดลับเครื่องมือเพื่อทำความเข้าใจวิธีปรับปรุงเมตริกที่ถูกตั้งค่าสถานะ
- C ดูคำแนะนำเกี่ยวกับการวิเคราะห์อื่นๆ ที่คุณควรพิจารณาดำเนินการต่อไป โครงสร้างการวิเคราะห์เน้นคำแนะนำเหล่านี้
ขั้นตอนต่อไป
Performance Snapshot เป็นจุดเริ่มต้นที่ดีในการประเมินประสิทธิภาพของแอปพลิเคชันโดยรวมด้วย VTune Profileร. ต่อไป ให้ตรวจสอบว่าอัลกอริทึมของคุณต้องการการปรับแต่งหรือไม่
- ทำตามบทช่วยสอนเพื่อวิเคราะห์ปัญหาคอขวดของประสิทธิภาพทั่วไป
- เมื่ออัลกอริทึมของคุณได้รับการปรับแต่งอย่างดีแล้ว ให้รัน Performance Snapshot อีกครั้งเพื่อปรับเทียบผลลัพธ์และระบุการปรับปรุงประสิทธิภาพที่อาจเกิดขึ้นในด้านอื่นๆ
ดูเพิ่มเติม
การสำรวจสถาปัตยกรรมไมโคร
วีทูน โปรfiler ทัวร์ช่วยเหลือ
Exampเลอ: โปรfile แอปพลิเคชัน OpenMP* บน Windows*
ใช้ Intel VTune Profiler บนเครื่อง Windows ไปจนถึงมือโปรfile เช่นampแอปพลิเคชั่น le iso3dfd_omp_offload OpenMP ถูกโหลดไปยัง Intel GPU เรียนรู้วิธีเรียกใช้การวิเคราะห์ GPU และตรวจสอบผลลัพธ์
ข้อกำหนดเบื้องต้น
- ตรวจสอบให้แน่ใจว่าระบบของคุณใช้ Microsoft* Windows 10 หรือเวอร์ชันที่ใหม่กว่า
- ใช้กราฟิกโปรเซสเซอร์ Intel รุ่นใดรุ่นหนึ่งต่อไปนี้:
- เจเนอเรชั่น 8
- เจเนอเรชั่น 9
- เจเนอเรชั่น 11
- ระบบของคุณควรทำงานบนโปรเซสเซอร์ Intel ตัวใดตัวหนึ่งต่อไปนี้:
- โปรเซสเซอร์ Intel® Core™ i7 เจนเนอเรชั่น 7 (ชื่อรหัส Kaby Lake)
- โปรเซสเซอร์ Intel® Core™ i8 เจนเนอเรชั่น 7 (ชื่อรหัส Coffee Lake)
- โปรเซสเซอร์ Intel® Core™ i10 เจนเนอเรชั่น 7 (ชื่อรหัส Ice Lake)
- ติดตั้ง Intel VTune Profiler จากแหล่งใดแหล่งหนึ่งเหล่านี้:
- ดาวน์โหลดผลิตภัณฑ์แบบสแตนด์อโลน
- ชุดเครื่องมือพื้นฐาน Intel® oneAPI
- ชุดเครื่องมือแนะนำระบบ Intel®
- ดาวน์โหลดชุดเครื่องมือ Intel® oneAPI HPC ซึ่งมีคอมไพเลอร์ Intel® oneAPI DPC++/C++(icx/icpx) ที่คุณต้องการสำหรับมืออาชีพfile แอปพลิเคชั่น OpenMP
- ตั้งค่าตัวแปรสภาพแวดล้อม ดำเนินการสคริปต์ vars.bat ที่อยู่ในไฟล์ ไดเร็กทอรี \env
- ตั้งค่าระบบของคุณสำหรับการวิเคราะห์ GPU
บันทึก
ในการติดตั้ง Intel VTune Profiler ในสภาพแวดล้อม Microsoft* Visual Studio โปรดดู VTune Profileคู่มือการใช้งาน
สร้างและคอมไพล์แอปพลิเคชัน OpenMP Offload
- ดาวน์โหลด iso3dfd_omp_offload OpenMP Offload sampเล.
- เปิดให้สampไดเรกทอรี่
ซีดี <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - รวบรวมแอปพลิเคชัน OpenMP Offload
สร้าง mkdir
สร้างซีดี
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-เป้าหมาย:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp
เรียกใช้การวิเคราะห์ GPU บนแอปพลิเคชัน OpenMP Offload
ตอนนี้คุณพร้อมที่จะรัน GPU Offload Analysis บนแอปพลิเคชัน OpenMP ที่คุณคอมไพล์แล้ว
- เปิด VTune Profiler และคลิกที่โครงการใหม่เพื่อสร้างโครงการ
- ในหน้าต้อนรับ ให้คลิกกำหนดค่าการวิเคราะห์เพื่อตั้งค่าการวิเคราะห์ของคุณ
- เลือกการตั้งค่าเหล่านี้สำหรับการวิเคราะห์ของคุณ
- ในบานหน้าต่าง WHERE เลือก Local Host
- ในบานหน้าต่าง WHAT เลือก Launch Application และระบุไบนารี iso3dfd_omp_offload เป็นแอปพลิเคชันสำหรับมืออาชีพfile.
- ในบานหน้าต่าง HOW ให้เลือกประเภทการวิเคราะห์ GPU Offload จากกลุ่ม Accelerators ในแผนผังการวิเคราะห์
- คลิกปุ่มเริ่มเพื่อเรียกใช้การวิเคราะห์
วีทูน โปรfiler รวบรวมข้อมูลและแสดงผลการวิเคราะห์ใน GPU Offload viewจุด.
- ในหน้าต่างสรุป ดูสถิติการใช้ทรัพยากร CPU และ GPU ใช้ข้อมูลนี้เพื่อตรวจสอบว่าใบสมัครของคุณคือ:
- GPU ที่ผูกไว้
- CPU ผูกพัน
- ใช้ทรัพยากรการคำนวณของระบบของคุณอย่างไม่มีประสิทธิภาพ
- ใช้ข้อมูลในหน้าต่างแพลตฟอร์มเพื่อดูเมตริก CPU และ GPU พื้นฐาน
- ตรวจสอบงานคอมพิวเตอร์เฉพาะในหน้าต่างกราฟิก
สำหรับการวิเคราะห์เชิงลึก ดูสูตรที่เกี่ยวข้องใน VTune Profiler ตำราวิเคราะห์ประสิทธิภาพ คุณยังสามารถดำเนินการสร้างโปรไฟล์ของคุณด้วยการวิเคราะห์ GPU Compute/Media Hotspots
Exampเลอ: โปรfile แอปพลิเคชัน SYCL* บน Windows*
โปรfile เช่นampแอปพลิเคชัน le matrix_multiply SYCL พร้อม Intel® VTune™ Profileร. ทำความคุ้นเคยกับผลิตภัณฑ์และทำความเข้าใจสถิติที่รวบรวมสำหรับแอปพลิเคชันที่เชื่อมต่อกับ GPU
ข้อกำหนดเบื้องต้น
- ตรวจสอบให้แน่ใจว่าคุณได้ติดตั้ง Microsoft* Visual Studio (v2017 หรือใหม่กว่า) บนระบบของคุณ
- ติดตั้ง Intel VTune Profiler จาก Intel® oneAPI Base Toolkit หรือ Intel® System Bring-up Toolkit ชุดเครื่องมือเหล่านี้ประกอบด้วยคอมไพเลอร์ Intel® oneAPI DPC++/C++ (icpx -fsycl) ที่จำเป็นสำหรับกระบวนการทำโปรไฟล์
- ตั้งค่าตัวแปรสภาพแวดล้อม ดำเนินการสคริปต์ vars.bat ที่อยู่ในไฟล์ ไดเร็กทอรี \env
- ตรวจสอบให้แน่ใจว่าคอมไพเลอร์ Intel oneAPI DPC++ (ติดตั้งด้วยชุดเครื่องมือ Intel oneAPI Base) รวมอยู่ใน Microsoft Visual Studio
- คอมไพล์โค้ดโดยใช้ตัวเลือก -gline-tables-only และ -fdebug-info-for-profiling สำหรับ Intel oneAPI DPC++ Compiler
- ตั้งค่าระบบของคุณสำหรับการวิเคราะห์ GPU
สำหรับข้อมูลเกี่ยวกับการติดตั้ง Intel VTune Profiler ในสภาพแวดล้อม Microsoft* Visual Studio โปรดดู VTune Profileคู่มือการใช้งาน
สร้างแอป Matrix
ดาวน์โหลดรหัส matrix_multiply_vtune sampแพ็คเกจสำหรับชุดเครื่องมือ Intel oneAPI นี้ประกอบด้วย sampซึ่งคุณสามารถใช้เพื่อสร้างและโปรfile แอปพลิเคชัน SYCL
- เปิด Microsoft* Visual Studio
- คลิก File > เปิด > โครงการ/โซลูชัน ค้นหาโฟลเดอร์ matrix_multiply_vtune และเลือก matrix_multiply.sln
- สร้างการกำหนดค่านี้ (โครงการ > สร้าง)
- เรียกใช้โปรแกรม (Debug > Start Without Debugging)
- หากต้องการเลือกเวอร์ชัน DPC++ หรือเธรดของ sample ใช้คำจำกัดความของตัวประมวลผลล่วงหน้า
- ไปที่คุณสมบัติของโปรเจ็กต์ > DPC++ > ตัวประมวลผลล่วงหน้า > คำนิยามตัวประมวลผลล่วงหน้า
- กำหนด icpx -fsycl หรือ USE_THR
เรียกใช้การวิเคราะห์ GPU
เรียกใช้การวิเคราะห์ GPU บน Matrix sampเล.
- จากแถบเครื่องมือ Visual Studio ให้คลิกปุ่มกำหนดค่าการวิเคราะห์
หน้าต่างกำหนดค่าการวิเคราะห์จะเปิดขึ้น ตามค่าเริ่มต้น จะสืบทอดการตั้งค่าโครงการ VS ของคุณและระบุ matrix_multiply.exe เป็นแอปพลิเคชันสำหรับมืออาชีพfile. - ในหน้าต่าง Configure Analysis ให้คลิก
ปุ่มเรียกดูในบานหน้าต่างวิธี
- เลือกประเภทการวิเคราะห์ GPU Compute/Media Hotspot จากกลุ่ม Accelerators ในแผนผังการวิเคราะห์
- คลิกปุ่มเริ่มเพื่อเริ่มการวิเคราะห์ด้วยตัวเลือกที่กำหนดไว้ล่วงหน้า
เรียกใช้การวิเคราะห์ GPU จากบรรทัดคำสั่ง:
- เปิดสampไดเรกทอรีไฟล์:
<sample_dir>\VtuneProfiler\matrix_multiply_vtune - ในไดเร็กทอรีนี้ ให้เปิดโปรเจ็กต์ Visual Studio* file ชื่อ matrix_multiply.sln
- ตัวคูณ.cpp file มีการคูณเมทริกซ์หลายเวอร์ชัน เลือกเวอร์ชันโดยแก้ไขบรรทัด #define MULTIPLY ที่สอดคล้องกันใน multiply.hpp
- สร้างโครงการทั้งหมดด้วยการกำหนดค่า Release
สิ่งนี้สร้างไฟล์ปฏิบัติการที่เรียกว่า matrix_multiply.exe - เตรียมระบบเพื่อเรียกใช้การวิเคราะห์ GPU ดูการตั้งค่าระบบสำหรับการวิเคราะห์ GPU
- ตั้งค่า VTune Profiler ตัวแปรสภาพแวดล้อมโดยการรันแบทช์ file: ส่งออก \env\vars.bat
- เรียกใช้คำสั่งการวิเคราะห์:
vtune.exe - รวบรวม GPU-offload — matrix_multiply.exe
วีทูน โปรfiler รวบรวมข้อมูลและแสดงผลการวิเคราะห์ใน GPU Compute/Media Hotspots viewจุด. ในหน้าต่างสรุป ดูสถิติเกี่ยวกับการใช้ทรัพยากร CPU และ GPU เพื่อทำความเข้าใจว่าแอปพลิเคชันของคุณเชื่อมโยงกับ GPU หรือไม่ สลับไปที่หน้าต่างกราฟิกเพื่อดูเมตริก CPU และ GPU พื้นฐานที่แสดงถึงการดำเนินการโค้ดเมื่อเวลาผ่านไป
เริ่มต้นใช้งาน Intel® VTune™ Profiler สำหรับระบบปฏิบัติการ Linux*
ก่อนที่คุณจะเริ่มต้น
- ติดตั้ง Intel® VTune™ Profiler บนระบบ Linux* ของคุณ
- สร้างแอปพลิเคชันของคุณด้วยข้อมูลสัญลักษณ์และในโหมดรีลีสโดยเปิดใช้งานการเพิ่มประสิทธิภาพทั้งหมด สำหรับข้อมูลโดยละเอียดเกี่ยวกับการตั้งค่าคอมไพเลอร์ โปรดดูที่ VTune Profileคู่มือผู้ใช้ออนไลน์
คุณยังสามารถใช้เมทริกซ์ample แอปพลิเคชันที่มีอยู่ใน \sampเลอ \ เมทริกซ์ คุณสามารถเห็นampผลลัพธ์ที่ได้คือ \sampเลอ (เมทริกซ์) - ตั้งค่าตัวแปรสภาพแวดล้อม: แหล่งที่มา /setvars.sh
โดยค่าเริ่มต้น เป็น:- $HOME/intel/oneapi/ เมื่อติดตั้งโดยได้รับอนุญาตจากผู้ใช้;
- /opt/intel/oneapi/ เมื่อติดตั้งด้วยการอนุญาตรูท
ขั้นตอนที่ 1: เริ่ม VTune Profiler
เริ่ม VTune Profileด้วยวิธีใดวิธีหนึ่งต่อไปนี้:
ที่มา / เริ่ม VTune Profiler
สแตนด์อโลน/IDE (GUI)
- เรียกใช้คำสั่ง vtunegui เพื่อเริ่ม VTune Profiler จาก Intel System Studio IDE เลือก Tools > VTune Profiler > เปิด VTune Profileร. ซึ่งจะตั้งค่าตัวแปรสภาพแวดล้อมที่เหมาะสมทั้งหมดและเรียกใช้อินเทอร์เฟซแบบสแตนด์อโลนของผลิตภัณฑ์
- เมื่อ GUI เปิดขึ้น ให้คลิก NEW PROJECT ในหน้าจอต้อนรับ
- ในกล่องโต้ตอบ สร้างโครงการ ให้ระบุชื่อโครงการและตำแหน่งที่ตั้ง
- คลิกสร้างโครงการ
แบบสแตนด์อโลน (บรรทัดคำสั่ง)
- เรียกใช้คำสั่ง vtune
ขั้นตอนที่ 2: กำหนดค่าและเรียกใช้การวิเคราะห์
หลังจากสร้างโครงการใหม่ หน้าต่าง Configure Analysis จะเปิดขึ้นพร้อมกับค่าเริ่มต้นเหล่านี้:
- ในส่วน Launch Application ให้เรียกดูตำแหน่งของแอปพลิเคชันของคุณ
- คลิกที่ Start เพื่อเรียกใช้ Performance Snapshot บนแอปพลิเคชันของคุณ การวิเคราะห์นี้นำเสนอโดยทั่วไปview ของปัญหาที่ส่งผลต่อประสิทธิภาพของแอปพลิเคชันของคุณบนระบบเป้าหมาย
ขั้นตอนที่ 3: View และวิเคราะห์ข้อมูลประสิทธิภาพ
เมื่อรวบรวมข้อมูลเสร็จ VTune Profiler แสดงผลการวิเคราะห์ในหน้าต่างสรุป ที่นี่คุณเห็นการแสดงจบลงview ของใบสมัครของคุณ
เกินview โดยทั่วไปจะมีเมตริกหลายรายการพร้อมกับคำอธิบาย
- A ขยายเมตริกแต่ละรายการเพื่อดูข้อมูลโดยละเอียดเกี่ยวกับปัจจัยที่มีส่วนร่วม
- B เมตริกที่ถูกตั้งค่าสถานะจะระบุค่าที่อยู่นอกช่วงการทำงานที่ยอมรับได้/ปกติ ใช้เคล็ดลับเครื่องมือเพื่อทำความเข้าใจวิธีปรับปรุงเมตริกที่ถูกตั้งค่าสถานะ
- C ดูคำแนะนำเกี่ยวกับการวิเคราะห์อื่นๆ ที่คุณควรพิจารณาดำเนินการต่อไป โครงสร้างการวิเคราะห์เน้นคำแนะนำเหล่านี้
ขั้นตอนต่อไป
Performance Snapshot เป็นจุดเริ่มต้นที่ดีในการประเมินประสิทธิภาพของแอปพลิเคชันโดยรวมด้วย VTune Profileร. ต่อไป ให้ตรวจสอบว่าอัลกอริทึมของคุณต้องการการปรับแต่งหรือไม่
- ทำตามบทช่วยสอนเพื่อวิเคราะห์ปัญหาคอขวดของประสิทธิภาพทั่วไป
- เมื่ออัลกอริทึมของคุณได้รับการปรับแต่งอย่างดีแล้ว ให้รัน Performance Snapshot อีกครั้งเพื่อปรับเทียบผลลัพธ์และระบุการปรับปรุงประสิทธิภาพที่อาจเกิดขึ้นในด้านอื่นๆ
ดูเพิ่มเติม
การสำรวจสถาปัตยกรรมไมโคร
วีทูน โปรfiler ทัวร์ช่วยเหลือ
Exampเลอ: โปรfile แอปพลิเคชัน OpenMP บน Linux*
ใช้ Intel VTune Profiler บนเครื่อง Linux ไปจนถึงมือโปรfile เช่นampแอปพลิเคชั่น le iso3dfd_omp_offload OpenMP ถูกโหลดไปยัง Intel GPU เรียนรู้วิธีเรียกใช้การวิเคราะห์ GPU และตรวจสอบผลลัพธ์
ข้อกำหนดเบื้องต้น
- ตรวจสอบให้แน่ใจว่าระบบของคุณใช้ Linux* OS kernel 4.14 หรือเวอร์ชันที่ใหม่กว่า
- ใช้กราฟิกโปรเซสเซอร์ Intel รุ่นใดรุ่นหนึ่งต่อไปนี้:
- เจเนอเรชั่น 8
- เจเนอเรชั่น 9
- เจเนอเรชั่น 11
- ระบบของคุณควรทำงานบนโปรเซสเซอร์ Intel ตัวใดตัวหนึ่งต่อไปนี้:
- โปรเซสเซอร์ Intel® Core™ i7 เจนเนอเรชั่น 7 (ชื่อรหัส Kaby Lake)
- โปรเซสเซอร์ Intel® Core™ i8 เจนเนอเรชั่น 7 (ชื่อรหัส Coffee Lake)
- โปรเซสเซอร์ Intel® Core™ i10 เจนเนอเรชั่น 7 (ชื่อรหัส Ice Lake)
- สำหรับ Linux GUI ให้ใช้:
- GTK+ เวอร์ชัน 2.10 หรือใหม่กว่า (แนะนำให้ใช้เวอร์ชัน 2.18 และใหม่กว่า)
- Pango รุ่น 1.14 หรือใหม่กว่า
- X.Org เวอร์ชัน 1.0 หรือใหม่กว่า (แนะนำให้ใช้เวอร์ชัน 1.7 และใหม่กว่า)
- ติดตั้ง Intel VTune Profiler จากแหล่งใดแหล่งหนึ่งเหล่านี้:
- ดาวน์โหลดผลิตภัณฑ์แบบสแตนด์อโลน
- ชุดเครื่องมือพื้นฐาน Intel® oneAPI
- ชุดเครื่องมือแนะนำระบบ Intel®
- ดาวน์โหลดชุดเครื่องมือ Intel® oneAPI HPC ซึ่งมีคอมไพเลอร์ Intel® oneAPI DPC++/C++(icx/icpx) ที่คุณต้องการสำหรับมืออาชีพfile แอปพลิเคชั่น OpenMP
- ตั้งค่าตัวแปรสภาพแวดล้อม ดำเนินการสคริปต์ vars.sh
- ตั้งค่าระบบของคุณสำหรับการวิเคราะห์ GPU
สร้างและคอมไพล์แอปพลิเคชัน OpenMP Offload
- ดาวน์โหลด iso3dfd_omp_offload OpenMP Offload sampเล.
- เปิดให้สampไดเรกทอรี่
ซีดี <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - รวบรวมแอปพลิเคชัน OpenMP Offload
สร้าง mkdir;
cmake -DVERIFY_RESULTS=0 ..
ทำ -j
สิ่งนี้สร้างไฟล์ปฏิบัติการ src/iso3dfd
หากต้องการลบโปรแกรม ให้พิมพ์:
ทำให้สะอาด
สิ่งนี้จะลบไฟล์ปฏิบัติการและวัตถุ fileที่คุณสร้างด้วยคำสั่ง make
เรียกใช้การวิเคราะห์ GPU บนแอปพลิเคชัน OpenMP Offload
ตอนนี้คุณพร้อมที่จะรัน GPU Offload Analysis บนแอปพลิเคชัน OpenMP ที่คุณคอมไพล์แล้ว
- เปิด VTune Profiler และคลิกที่โครงการใหม่เพื่อสร้างโครงการ
- ในหน้าต้อนรับ ให้คลิกกำหนดค่าการวิเคราะห์เพื่อตั้งค่าการวิเคราะห์ของคุณ
- เลือกการตั้งค่าเหล่านี้สำหรับการวิเคราะห์ของคุณ
- ในบานหน้าต่าง WHERE เลือก Local Host
- ในบานหน้าต่าง WHAT เลือก Launch Application และระบุไบนารี iso3dfd_omp_offload เป็นแอปพลิเคชันสำหรับมืออาชีพfile.
- ในบานหน้าต่าง HOW ให้เลือกประเภทการวิเคราะห์ GPU Offload จากกลุ่ม Accelerators ในแผนผังการวิเคราะห์
- คลิกปุ่มเริ่มเพื่อเรียกใช้การวิเคราะห์
วีทูน โปรfiler รวบรวมข้อมูลและแสดงผลการวิเคราะห์ใน GPU Offload viewจุด.
- ในหน้าต่างสรุป ดูสถิติการใช้ทรัพยากร CPU และ GPU ใช้ข้อมูลนี้เพื่อตรวจสอบว่าใบสมัครของคุณคือ:
- GPU ที่ผูกไว้
- CPU ผูกพัน
- ใช้ทรัพยากรการคำนวณของระบบของคุณอย่างไม่มีประสิทธิภาพ
- ใช้ข้อมูลในหน้าต่างแพลตฟอร์มเพื่อดูเมตริก CPU และ GPU พื้นฐาน
- ตรวจสอบงานคอมพิวเตอร์เฉพาะในหน้าต่างกราฟิก
สำหรับการวิเคราะห์เชิงลึก ดูสูตรที่เกี่ยวข้องใน VTune Profiler ตำราวิเคราะห์ประสิทธิภาพ คุณยังสามารถดำเนินการสร้างโปรไฟล์ของคุณด้วยการวิเคราะห์ GPU Compute/Media Hotspots
Exampเลอ: โปรfile แอปพลิเคชัน SYCL* บน Linux*
ใช้ VTune Profiler กับ asampแอปพลิเคชัน le matrix_multiply SYCL เพื่อทำความคุ้นเคยกับผลิตภัณฑ์และสถิติที่รวบรวมไว้สำหรับแอปพลิเคชันที่ใช้ GPU ได้อย่างรวดเร็ว
ข้อกำหนดเบื้องต้น
- ติดตั้ง VTune Profiler และคอมไพเลอร์ Intel® oneAPI DPC++/C++ จาก Intel® oneAPI Base Toolkit หรือ Intel® System Bring-up Toolkit
- ตั้งค่าตัวแปรสภาพแวดล้อมโดยเรียกใช้สคริปต์ vars.sh
- ตั้งค่าระบบของคุณสำหรับการวิเคราะห์ GPU
สร้างแอปพลิเคชันเมทริกซ์
ดาวน์โหลดรหัส matrix_multiply_vtune sampแพ็คเกจสำหรับชุดเครื่องมือ Intel oneAPI นี้ประกอบด้วย sampซึ่งคุณสามารถใช้เพื่อสร้างและโปรfile แอปพลิเคชัน SYCL
เพื่อโปรfile แอปพลิเคชัน SYCL ตรวจสอบให้แน่ใจว่าได้คอมไพล์โค้ดโดยใช้ตัวเลือก -gline-tables-only และ -fdebug-info-for-profiling Intel oneAPI DPC++ Compiler
ในการรวบรวมสิ่งนี้ampใบสมัคร ให้ทำดังต่อไปนี้:
- ไปที่ sampไดเรกทอรี่
ซีดี <sample_dir/VtuneProfiler/matrix_multiply> - ตัวคูณ.cpp file ในโฟลเดอร์ src มีการคูณเมทริกซ์หลายเวอร์ชัน เลือกเวอร์ชันโดยแก้ไขบรรทัด #define MULTIPLY ที่สอดคล้องกันใน multiply.h
- สร้างแอปโดยใช้ Make ที่มีอยู่file:
ซีเมค .
ทำ
สิ่งนี้ควรสร้างไฟล์ปฏิบัติการ matrix.icpx -fsycl
หากต้องการลบโปรแกรม ให้พิมพ์:
ทำให้สะอาด
สิ่งนี้จะลบไฟล์ปฏิบัติการและวัตถุ fileที่สร้างโดยคำสั่ง make
เรียกใช้การวิเคราะห์ GPU
เรียกใช้การวิเคราะห์ GPU บน Matrix sampเล.
- เปิด VTune Profiler ด้วยคำสั่ง vtune-gui
- คลิก New Project จากหน้ายินดีต้อนรับ
- ระบุชื่อและตำแหน่งสำหรับ s ของคุณampโครงการและคลิกสร้างโครงการ
- ในบานหน้าต่าง WHAT ให้เรียกดู matrix.icpx-fsycl file.
- ในบานหน้าต่าง HOW คลิก
ปุ่มเรียกดู และเลือกการวิเคราะห์ GPU Compute/Media Hotspots จากกลุ่ม Accelerators ในแผนผังการวิเคราะห์
- คลิกปุ่มเริ่มที่ด้านล่างเพื่อเริ่มการวิเคราะห์ด้วยตัวเลือกที่เลือกไว้ล่วงหน้า
เรียกใช้การวิเคราะห์ GPU จากบรรทัดคำสั่ง:
- เตรียมระบบเพื่อเรียกใช้การวิเคราะห์ GPU ดูการตั้งค่าระบบสำหรับการวิเคราะห์ GPU
- ตั้งค่าตัวแปรสภาพแวดล้อมสำหรับเครื่องมือซอฟต์แวร์ของ Intel:
ที่มา $ONEAPI_ROOT/setvars.sh - เรียกใช้การวิเคราะห์ GPU Compute/Media Hotspots:
vtune - รวบรวม GPU-ฮอตสปอต -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
หากต้องการดูรายงานสรุป ให้พิมพ์:
vtune -รายงานสรุป -r ./result_gpu-hotspots
วีทูน โปรfiler รวบรวมข้อมูลและแสดงผลการวิเคราะห์ใน GPU Compute/Media Hotspots viewจุด. ในหน้าต่างสรุป ดูสถิติเกี่ยวกับการใช้ทรัพยากร CPU และ GPU เพื่อทำความเข้าใจว่าแอปพลิเคชันของคุณเชื่อมโยงกับ GPU หรือไม่ สลับไปที่หน้าต่างกราฟิกเพื่อดูเมตริก CPU และ GPU พื้นฐานที่แสดงถึงการดำเนินการโค้ดเมื่อเวลาผ่านไป
เริ่มต้นใช้งาน Intel® VTune™ Profiler สำหรับ macOS*
ใช้ VTune Profiler บนระบบ macOS เพื่อทำการวิเคราะห์เป้าหมายระยะไกลบนระบบที่ไม่ใช่ macOS (Linux* หรือ Android* เท่านั้น)
คุณไม่สามารถใช้ VTune Profiler ในสภาพแวดล้อม macOS เพื่อวัตถุประสงค์เหล่านี้:
- โปรfile ระบบ macOS ที่ติดตั้ง
- รวบรวมข้อมูลบนระบบ macOS ระยะไกล
ในการวิเคราะห์ประสิทธิภาพของเป้าหมาย Linux* หรือ Android* ระยะไกลจากโฮสต์ macOS ให้ทำตามขั้นตอนใดขั้นตอนหนึ่งต่อไปนี้:
- เรียกใช้ VTune Profileการวิเคราะห์บนระบบ macOS โดยระบุระบบระยะไกลเป็นเป้าหมาย เมื่อการวิเคราะห์เริ่มต้นขึ้น VTune Profiler เชื่อมต่อกับระบบระยะไกลเพื่อรวบรวมข้อมูล จากนั้นนำผลลัพธ์กลับไปยังโฮสต์ macOS สำหรับ viewการไอเอ็นจี
- เรียกใช้การวิเคราะห์บนระบบเป้าหมายในเครื่องและคัดลอกผลลัพธ์ไปยังระบบ macOS สำหรับ viewอยู่ใน VTune Profiler.
ขั้นตอนในเอกสารนี้ถือว่าระบบเป้าหมาย Linux ระยะไกลและรวบรวมข้อมูลประสิทธิภาพโดยใช้การเข้าถึง SSH จาก VTune Profiler บนระบบโฮสต์ macOS
ก่อนที่คุณจะเริ่มต้น
- ติดตั้ง Intel® VTune™ Profiler บนระบบ macOS* ของคุณ
- สร้างแอปพลิเคชัน Linux ของคุณด้วยข้อมูลสัญลักษณ์และในโหมดรีลีสโดยเปิดใช้งานการปรับให้เหมาะสมทั้งหมด สำหรับข้อมูลโดยละเอียด โปรดดูที่การตั้งค่าคอมไพเลอร์ใน VTune Profileช่วยด้วย.
- ตั้งค่าการเข้าถึง SSH จากระบบ macOS ของโฮสต์ไปยังระบบ Linux เป้าหมายเพื่อให้ทำงานในโหมดไม่ต้องใช้รหัสผ่าน
ขั้นตอนที่ 1: เริ่ม VTune Profiler
- เปิด VTune Profiler ด้วยคำสั่ง vtune-gui
โดยค่าเริ่มต้น คือ /opt/intel/oneapi/ - เมื่อ GUI เปิดขึ้น ให้คลิก NEW PROJECT ในหน้าจอต้อนรับ
- ในกล่องโต้ตอบ สร้างโครงการ ให้ระบุชื่อโครงการและตำแหน่งที่ตั้ง
- คลิกสร้างโครงการ
ขั้นตอนที่ 2: กำหนดค่าและเรียกใช้การวิเคราะห์
หลังจากที่คุณสร้างโปรเจ็กต์ใหม่ หน้าต่าง Configure Analysis จะเปิดขึ้นพร้อมกับประเภทการวิเคราะห์ Performance Snapshot
การวิเคราะห์นี้นำเสนอมากกว่าview ของปัญหาที่ส่งผลต่อประสิทธิภาพการทำงานของแอปพลิเคชันของคุณบนระบบเป้าหมาย
- ในบานหน้าต่าง WHERE เลือก Remote Linux (SSH) และระบุระบบ Linux เป้าหมายโดยใช้ username@ hostname[:port]
วีทูน โปรfiler เชื่อมต่อกับระบบ Linux และติดตั้งแพ็คเกจเป้าหมาย - ในบานหน้าต่าง WHAT ให้ระบุเส้นทางไปยังแอปพลิเคชันของคุณบนระบบ Linux เป้าหมาย
- คลิกปุ่มเริ่มเพื่อเรียกใช้ Performance Snapshot บนแอปพลิเคชัน
ขั้นตอนที่ 3: View และวิเคราะห์ข้อมูลประสิทธิภาพ
เมื่อรวบรวมข้อมูลเสร็จ VTune Profiler แสดงผลการวิเคราะห์บนระบบ macOS เริ่มการวิเคราะห์ของคุณในหน้าต่างสรุป ที่นี่คุณเห็นการแสดงจบลงview ของใบสมัครของคุณ
เกินview โดยทั่วไปจะมีเมตริกหลายรายการพร้อมกับคำอธิบาย
- A ขยายเมตริกแต่ละรายการเพื่อดูข้อมูลโดยละเอียดเกี่ยวกับปัจจัยที่มีส่วนร่วม
- B เมตริกที่ถูกตั้งค่าสถานะจะระบุค่าที่อยู่นอกช่วงการทำงานที่ยอมรับได้/ปกติ ใช้เคล็ดลับเครื่องมือเพื่อทำความเข้าใจวิธีปรับปรุงเมตริกที่ถูกตั้งค่าสถานะ
- C ดูคำแนะนำเกี่ยวกับการวิเคราะห์อื่นๆ ที่คุณควรพิจารณาดำเนินการต่อไป โครงสร้างการวิเคราะห์เน้นคำแนะนำเหล่านี้
ขั้นตอนต่อไป
Performance Snapshot เป็นจุดเริ่มต้นที่ดีในการประเมินประสิทธิภาพของแอปพลิเคชันโดยรวมด้วย VTune Profiler.
ต่อไป ให้ตรวจสอบว่าอัลกอริทึมของคุณต้องการการปรับแต่งหรือไม่
- เรียกใช้ Hotspots Analysis บนแอปพลิเคชันของคุณ
- ทำตามบทช่วยสอนเกี่ยวกับฮอตสปอต เรียนรู้เทคนิคเพื่อให้ได้ประโยชน์สูงสุดจากการวิเคราะห์ฮอตสปอตของคุณ
- เมื่ออัลกอริทึมของคุณได้รับการปรับแต่งอย่างดีแล้ว ให้รัน Performance Snapshot อีกครั้งเพื่อปรับเทียบผลลัพธ์และระบุการปรับปรุงประสิทธิภาพที่อาจเกิดขึ้นในด้านอื่นๆ
ดูเพิ่มเติม
การสำรวจสถาปัตยกรรมไมโคร
วีทูน โปรfiler ทัวร์ช่วยเหลือ
เรียนรู้เพิ่มเติม
เอกสาร/คำอธิบาย
- คู่มือการใช้งาน
คู่มือผู้ใช้เป็นเอกสารหลักสำหรับ VTune Profiler.
บันทึก
คุณยังสามารถดาวน์โหลด VTune Pro เวอร์ชันออฟไลน์ได้อีกด้วยfileเอกสารร. - การฝึกอบรมออนไลน์
ไซต์การฝึกอบรมออนไลน์เป็นแหล่งข้อมูลที่ดีเยี่ยมในการเรียนรู้พื้นฐานของ VTune Profiler พร้อมคู่มือเริ่มต้นใช้งาน วิดีโอ บทช่วยสอน webinars และบทความทางเทคนิค - หนังสือตำราอาหาร
ตำราการวิเคราะห์ประสิทธิภาพที่มีสูตรอาหารเพื่อระบุและแก้ปัญหาประสิทธิภาพยอดนิยมโดยใช้ประเภทการวิเคราะห์ใน VTune Profiler. - คู่มือการติดตั้งสำหรับ Windows | ลินุกซ์ | โฮสต์ macOS
คู่มือการติดตั้งมีคำแนะนำในการติดตั้งพื้นฐานสำหรับ VTune Profiler และคำแนะนำการกำหนดค่าหลังการติดตั้งสำหรับไดรเวอร์และตัวสะสมต่างๆ - บทช่วยสอน
วีทูน โปรfiler แบบฝึกหัดแนะนำผู้ใช้ใหม่ผ่านคุณสมบัติพื้นฐานด้วย s สั้น ๆampแอปพลิเคชัน - หมายเหตุการเปิดตัว
ค้นหาข้อมูลเกี่ยวกับ VTune Pro เวอร์ชันล่าสุดfiler รวมถึงคำอธิบายที่ครอบคลุมของคุณสมบัติใหม่ ความต้องการของระบบ และปัญหาทางเทคนิคที่ได้รับการแก้ไข
สำหรับ VTune Pro เวอร์ชันสแตนด์อโลนและชุดเครื่องมือfiler เข้าใจความต้องการของระบบในปัจจุบัน
ประกาศและข้อจำกัดความรับผิดชอบ
เทคโนโลยีของ Intel อาจต้องเปิดใช้งานฮาร์ดแวร์ซอฟต์แวร์หรือการเปิดใช้งานบริการ
ไม่มีผลิตภัณฑ์หรือส่วนประกอบใดที่จะปลอดภัยได้อย่างแน่นอน
ค่าใช้จ่ายและผลลัพธ์ของคุณอาจแตกต่างกันไป
© อินเทล คอร์ปอเรชั่น Intel, โลโก้ Intel และเครื่องหมายอื่นๆ ของ Intel เป็นเครื่องหมายการค้าของ Intel Corporation หรือบริษัทในเครือ ชื่อและตราสินค้าอื่น ๆ อาจเป็นทรัพย์สินของผู้อื่น
Intel, โลโก้ Intel, Intel Atom, Intel Core, Intel Xeon Phi, VTune และ Xeon เป็นเครื่องหมายการค้าของ Intel Corporation ในสหรัฐอเมริกาและ/หรือประเทศอื่นๆ
*ชื่อและยี่ห้ออื่น ๆ อาจถูกอ้างสิทธิ์โดยถือเป็นทรัพย์สินของผู้อื่น
Microsoft, Windows และโลโก้ Windows เป็นเครื่องหมายการค้าหรือเครื่องหมายการค้าจดทะเบียนของ Microsoft Corporation ในสหรัฐอเมริกาและ/หรือประเทศอื่นๆ
Java เป็นเครื่องหมายการค้าจดทะเบียนของ Oracle และ/หรือบริษัทในเครือ
OpenCL และโลโก้ OpenCL เป็นเครื่องหมายการค้าของ Apple Inc. ซึ่งใช้งานโดยได้รับอนุญาตจาก Khronos
เทคโนโลยีของ Intel อาจต้องเปิดใช้งานฮาร์ดแวร์ซอฟต์แวร์หรือการเปิดใช้งานบริการ
ไม่มีผลิตภัณฑ์หรือส่วนประกอบใดที่จะปลอดภัยได้อย่างแน่นอน
ค่าใช้จ่ายและผลลัพธ์ของคุณอาจแตกต่างกันไป
© อินเทล คอร์ปอเรชั่น Intel, โลโก้ Intel และเครื่องหมายอื่นๆ ของ Intel เป็นเครื่องหมายการค้าของ Intel Corporation หรือบริษัทในเครือ ชื่อและตราสินค้าอื่น ๆ อาจเป็นทรัพย์สินของผู้อื่น
Intel, โลโก้ Intel, Intel Atom, Intel Core, Intel Xeon Phi, VTune และ Xeon เป็นเครื่องหมายการค้าของ Intel Corporation ในสหรัฐอเมริกาและ/หรือประเทศอื่นๆ
*ชื่อและยี่ห้ออื่น ๆ อาจถูกอ้างสิทธิ์โดยถือเป็นทรัพย์สินของผู้อื่น
Microsoft, Windows และโลโก้ Windows เป็นเครื่องหมายการค้าหรือเครื่องหมายการค้าจดทะเบียนของ Microsoft Corporation ในสหรัฐอเมริกาและ/หรือประเทศอื่นๆ
Java เป็นเครื่องหมายการค้าจดทะเบียนของ Oracle และ/หรือบริษัทในเครือ
OpenCL และโลโก้ OpenCL เป็นเครื่องหมายการค้าของ Apple Inc. ซึ่งใช้งานโดยได้รับอนุญาตจาก Khronos
เอกสาร / แหล่งข้อมูล
![]() |
Intel เริ่มต้นด้วย VTune Profiler [พีดีเอฟ] คู่มือการใช้งาน เริ่มต้นใช้งาน VTune Profiler เริ่มต้นด้วย VTune Profiler, VTune Profiler |