Intel-เริ่มต้นใช้งานด้วย-VTune-Profiler-โลโก้

Intel เริ่มต้นด้วย VTune Profiler

เริ่มต้นใช้งาน Intel® VTune™ Profiler

ใช้ Intel VTune Profiler เพื่อวิเคราะห์ระบบเป้าหมายแบบโลคัลและรีโมตจากโฮสต์ Windows*, macOS* และ Linux* ปรับปรุงประสิทธิภาพของแอปพลิเคชันและระบบผ่านการดำเนินการเหล่านี้:

  • วิเคราะห์ตัวเลือกอัลกอริทึม
  • ค้นหาคอขวดของรหัสซีเรียลและขนาน
  • ทำความเข้าใจว่าแอปพลิเคชันของคุณจะได้รับประโยชน์จากทรัพยากรฮาร์ดแวร์ที่มีอยู่ได้อย่างไรและอย่างไร
  • เพิ่มความเร็วในการดำเนินการแอปพลิเคชันของคุณ
    ดาวน์โหลด Intel VTune Profiler บนระบบของคุณด้วยวิธีใดวิธีหนึ่งต่อไปนี้:
  • ดาวน์โหลดเวอร์ชันสแตนด์อโลน
  • รับ Intel VTune Profiler เป็นส่วนหนึ่งของ Intel® oneAPI Base Toolkit
    ดู VTune Profileหน้าการฝึกอบรมสำหรับวิดีโอ webinars และเนื้อหาอื่น ๆ เพื่อช่วยให้คุณเริ่มต้น

บันทึก
เอกสารประกอบสำหรับเวอร์ชันของ Intel® VTune™ Profileก่อนรุ่นปี 2021 มีให้ดาวน์โหลดเท่านั้น สำหรับรายการดาวน์โหลดเอกสารที่มีตามรุ่นของผลิตภัณฑ์ โปรดดูหน้าเหล่านี้:

  • ดาวน์โหลดเอกสารสำหรับ Intel Parallel Studio XE
  • ดาวน์โหลดเอกสารประกอบสำหรับ Intel System Studio

ทำความเข้าใจเวิร์กโฟลว์
ใช้ Intel VTune Profiler ถึงมือโปรfile แอปพลิเคชันและวิเคราะห์ผลลัพธ์เพื่อปรับปรุงประสิทธิภาพ

เวิร์กโฟลว์ทั่วไปประกอบด้วยขั้นตอนเหล่านี้:

Intel-เริ่มต้นใช้งานด้วย-VTune-Profileอาร์-01

เลือกระบบโฮสต์ของคุณเพื่อเริ่มต้น
เรียนรู้เพิ่มเติมเกี่ยวกับเวิร์กโฟลว์เฉพาะระบบสำหรับ Windows*, Linux* หรือ macOS*

Intel-เริ่มต้นใช้งานด้วย-VTune-Profileอาร์-02

เริ่มต้นใช้งาน Intel® VTune™ Profiler สำหรับระบบปฏิบัติการ Windows*

ก่อนที่คุณจะเริ่มต้น

  1. ติดตั้ง Intel® VTune™ Profiler บนระบบ Windows* ของคุณ
  2. สร้างแอปพลิเคชันของคุณด้วยข้อมูลสัญลักษณ์และในโหมดรีลีสโดยเปิดใช้งานการเพิ่มประสิทธิภาพทั้งหมด สำหรับข้อมูลโดยละเอียดเกี่ยวกับการตั้งค่าคอมไพเลอร์ โปรดดูที่ VTune Profileคู่มือผู้ใช้ออนไลน์
    คุณยังสามารถใช้เมทริกซ์ample แอปพลิเคชันที่มีอยู่ใน \VTune\Sampเลส\เมทริกซ์ คุณสามารถดูที่เกี่ยวข้องampผลลัพธ์ที่ได้คือ \VTune\Projects\sampเลอ (เมทริกซ์)
  3. ตั้งค่าตัวแปรสภาพแวดล้อม: เรียกใช้ สคริปต์ \setvars.bat
    โดยค่าเริ่มต้น สำหรับส่วนประกอบ oneAPI คือโปรแกรม Files (x86)\Intel\oneAPI
    บันทึก คุณไม่จำเป็นต้องเรียกใช้ setvars.bat เมื่อใช้ Intel® VTune™ Profiler ภายใน Microsoft* Visual Studio*

ขั้นตอนที่ 1: เริ่ม Intel® VTune™ Profiler
เริ่ม Intel VTune Profileด้วยวิธีใดวิธีหนึ่งเหล่านี้และจัดทำโครงการ โครงการคือคอนเทนเนอร์สำหรับแอปพลิเคชันที่คุณต้องการวิเคราะห์ ประเภทของการวิเคราะห์ และผลการรวบรวมข้อมูล

ที่มา / เริ่ม VTune Profiler

แบบสแตนด์อโลน (GUI)

  1. เรียกใช้คำสั่ง vtune-gui หรือเรียกใช้ Intel® VTune™ Profiler จากเมนูเริ่ม
  2. เมื่อ GUI เปิดขึ้น ให้คลิกในหน้าจอต้อนรับ
  3. ในกล่องโต้ตอบ สร้างโครงการ ให้ระบุชื่อโครงการและตำแหน่งที่ตั้ง
  4. คลิกสร้างโครงการ

แบบสแตนด์อโลน (บรรทัดคำสั่ง)
เรียกใช้คำสั่ง vtune

ไมโครซอฟต์* วิชวล สตูดิโอ* IDE
เปิดโซลูชันของคุณใน Visual Studio วีทูน โปรfileแถบเครื่องมือ r จะเปิดใช้งานโดยอัตโนมัติ และโครงการ Visual Studio ของคุณถูกกำหนดเป็นเป้าหมายการวิเคราะห์

บันทึก
คุณไม่จำเป็นต้องสร้างโครงการเมื่อใช้งาน Intel® VTune™ Profiler จากบรรทัดคำสั่งหรือภายใน Microsoft* Visual Studio

ขั้นตอนที่ 2: กำหนดค่าและเรียกใช้การวิเคราะห์
หลังจากสร้างโครงการใหม่ หน้าต่าง Configure Analysis จะเปิดขึ้นพร้อมกับค่าเริ่มต้นเหล่านี้:

Intel-เริ่มต้นใช้งานด้วย-VTune-Profileอาร์-03

  1. ในส่วน Launch Application ให้เรียกดูตำแหน่งที่ตั้งของโปรแกรมเรียกทำงานของคุณ file.
  2. คลิก เริ่ม เพื่อเรียกใช้ Performance Snapshot บนแอปพลิเคชันของคุณ การวิเคราะห์นี้นำเสนอโดยทั่วไปview ของปัญหาที่ส่งผลต่อประสิทธิภาพของแอปพลิเคชันของคุณบนระบบเป้าหมาย

ขั้นตอนที่ 3: View และวิเคราะห์ข้อมูลประสิทธิภาพ
เมื่อรวบรวมข้อมูลเสร็จ VTune Profiler แสดงผลการวิเคราะห์ในหน้าต่างสรุป ที่นี่คุณเห็นการแสดงจบลงview ของใบสมัครของคุณ
เกินview โดยทั่วไปจะมีเมตริกหลายรายการพร้อมกับคำอธิบาย

Intel-เริ่มต้นใช้งานด้วย-VTune-Profileอาร์-04

  • A ขยายเมตริกแต่ละรายการเพื่อดูข้อมูลโดยละเอียดเกี่ยวกับปัจจัยที่มีส่วนร่วม
  • B เมตริกที่ถูกตั้งค่าสถานะจะระบุค่าที่อยู่นอกช่วงการทำงานที่ยอมรับได้/ปกติ ใช้เคล็ดลับเครื่องมือเพื่อทำความเข้าใจวิธีปรับปรุงเมตริกที่ถูกตั้งค่าสถานะ
  • C ดูคำแนะนำเกี่ยวกับการวิเคราะห์อื่นๆ ที่คุณควรพิจารณาดำเนินการต่อไป โครงสร้างการวิเคราะห์เน้นคำแนะนำเหล่านี้

ขั้นตอนต่อไป
Performance Snapshot เป็นจุดเริ่มต้นที่ดีในการประเมินประสิทธิภาพของแอปพลิเคชันโดยรวมด้วย VTune Profileร. ต่อไป ให้ตรวจสอบว่าอัลกอริทึมของคุณต้องการการปรับแต่งหรือไม่

  1. ทำตามบทช่วยสอนเพื่อวิเคราะห์ปัญหาคอขวดของประสิทธิภาพทั่วไป
  2. เมื่ออัลกอริทึมของคุณได้รับการปรับแต่งอย่างดีแล้ว ให้รัน Performance Snapshot อีกครั้งเพื่อปรับเทียบผลลัพธ์และระบุการปรับปรุงประสิทธิภาพที่อาจเกิดขึ้นในด้านอื่นๆ

ดูเพิ่มเติม
การสำรวจสถาปัตยกรรมไมโคร

วีทูน โปรfiler ทัวร์ช่วยเหลือ

Exampเลอ: โปรfile แอปพลิเคชัน OpenMP* บน Windows*
ใช้ Intel VTune Profiler บนเครื่อง Windows ไปจนถึงมือโปรfile เช่นampแอปพลิเคชั่น le iso3dfd_omp_offload OpenMP ถูกโหลดไปยัง Intel GPU เรียนรู้วิธีเรียกใช้การวิเคราะห์ GPU และตรวจสอบผลลัพธ์

ข้อกำหนดเบื้องต้น

  • ตรวจสอบให้แน่ใจว่าระบบของคุณใช้ Microsoft* Windows 10 หรือเวอร์ชันที่ใหม่กว่า
  • ใช้กราฟิกโปรเซสเซอร์ Intel รุ่นใดรุ่นหนึ่งต่อไปนี้:
    • เจเนอเรชั่น 8
    • เจเนอเรชั่น 9
    • เจเนอเรชั่น 11
  • ระบบของคุณควรทำงานบนโปรเซสเซอร์ Intel ตัวใดตัวหนึ่งต่อไปนี้:
    • โปรเซสเซอร์ Intel® Core™ i7 เจนเนอเรชั่น 7 (ชื่อรหัส Kaby Lake)
    • โปรเซสเซอร์ Intel® Core™ i8 เจนเนอเรชั่น 7 (ชื่อรหัส Coffee Lake)
    • โปรเซสเซอร์ Intel® Core™ i10 เจนเนอเรชั่น 7 (ชื่อรหัส Ice Lake)
  • ติดตั้ง Intel VTune Profiler จากแหล่งใดแหล่งหนึ่งเหล่านี้:
    • ดาวน์โหลดผลิตภัณฑ์แบบสแตนด์อโลน
    • ชุดเครื่องมือพื้นฐาน Intel® oneAPI
    • ชุดเครื่องมือแนะนำระบบ Intel®
  • ดาวน์โหลดชุดเครื่องมือ Intel® oneAPI HPC ซึ่งมีคอมไพเลอร์ Intel® oneAPI DPC++/C++(icx/icpx) ที่คุณต้องการสำหรับมืออาชีพfile แอปพลิเคชั่น OpenMP
  • ตั้งค่าตัวแปรสภาพแวดล้อม ดำเนินการสคริปต์ vars.bat ที่อยู่ในไฟล์ ไดเร็กทอรี \env
  • ตั้งค่าระบบของคุณสำหรับการวิเคราะห์ GPU

บันทึก
ในการติดตั้ง Intel VTune Profiler ในสภาพแวดล้อม Microsoft* Visual Studio โปรดดู VTune Profileคู่มือการใช้งาน

สร้างและคอมไพล์แอปพลิเคชัน OpenMP Offload

  1. ดาวน์โหลด iso3dfd_omp_offload OpenMP Offload sampเล.
  2. เปิดให้สampไดเรกทอรี่
    ซีดี <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload
  3. รวบรวมแอปพลิเคชัน OpenMP Offload

สร้าง mkdir
สร้างซีดี
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-เป้าหมาย:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp

เรียกใช้การวิเคราะห์ GPU บนแอปพลิเคชัน OpenMP Offload
ตอนนี้คุณพร้อมที่จะรัน GPU Offload Analysis บนแอปพลิเคชัน OpenMP ที่คุณคอมไพล์แล้ว

  1. เปิด VTune Profiler และคลิกที่โครงการใหม่เพื่อสร้างโครงการ
  2. ในหน้าต้อนรับ ให้คลิกกำหนดค่าการวิเคราะห์เพื่อตั้งค่าการวิเคราะห์ของคุณ
  3. เลือกการตั้งค่าเหล่านี้สำหรับการวิเคราะห์ของคุณ
    • ในบานหน้าต่าง WHERE เลือก Local Host
    • ในบานหน้าต่าง WHAT เลือก Launch Application และระบุไบนารี iso3dfd_omp_offload เป็นแอปพลิเคชันสำหรับมืออาชีพfile.
    • ในบานหน้าต่าง HOW ให้เลือกประเภทการวิเคราะห์ GPU Offload จากกลุ่ม Accelerators ในแผนผังการวิเคราะห์
      Intel-เริ่มต้นใช้งานด้วย-VTune-Profileอาร์-05
  4. คลิกปุ่มเริ่มเพื่อเรียกใช้การวิเคราะห์

วีทูน โปรfiler รวบรวมข้อมูลและแสดงผลการวิเคราะห์ใน GPU Offload viewจุด.

  • ในหน้าต่างสรุป ดูสถิติการใช้ทรัพยากร CPU และ GPU ใช้ข้อมูลนี้เพื่อตรวจสอบว่าใบสมัครของคุณคือ:
    • GPU ที่ผูกไว้
    • CPU ผูกพัน
    • ใช้ทรัพยากรการคำนวณของระบบของคุณอย่างไม่มีประสิทธิภาพ
  • ใช้ข้อมูลในหน้าต่างแพลตฟอร์มเพื่อดูเมตริก CPU และ GPU พื้นฐาน
  • ตรวจสอบงานคอมพิวเตอร์เฉพาะในหน้าต่างกราฟิก

สำหรับการวิเคราะห์เชิงลึก ดูสูตรที่เกี่ยวข้องใน VTune Profiler ตำราวิเคราะห์ประสิทธิภาพ คุณยังสามารถดำเนินการสร้างโปรไฟล์ของคุณด้วยการวิเคราะห์ GPU Compute/Media Hotspots

Exampเลอ: โปรfile แอปพลิเคชัน SYCL* บน Windows*
โปรfile เช่นampแอปพลิเคชัน le matrix_multiply SYCL พร้อม Intel® VTune™ Profileร. ทำความคุ้นเคยกับผลิตภัณฑ์และทำความเข้าใจสถิติที่รวบรวมสำหรับแอปพลิเคชันที่เชื่อมต่อกับ GPU

ข้อกำหนดเบื้องต้น

  • ตรวจสอบให้แน่ใจว่าคุณได้ติดตั้ง Microsoft* Visual Studio (v2017 หรือใหม่กว่า) บนระบบของคุณ
  • ติดตั้ง Intel VTune Profiler จาก Intel® oneAPI Base Toolkit หรือ Intel® System Bring-up Toolkit ชุดเครื่องมือเหล่านี้ประกอบด้วยคอมไพเลอร์ Intel® oneAPI DPC++/C++ (icpx -fsycl) ที่จำเป็นสำหรับกระบวนการทำโปรไฟล์
  • ตั้งค่าตัวแปรสภาพแวดล้อม ดำเนินการสคริปต์ vars.bat ที่อยู่ในไฟล์ ไดเร็กทอรี \env
  • ตรวจสอบให้แน่ใจว่าคอมไพเลอร์ Intel oneAPI DPC++ (ติดตั้งด้วยชุดเครื่องมือ Intel oneAPI Base) รวมอยู่ใน Microsoft Visual Studio
  • คอมไพล์โค้ดโดยใช้ตัวเลือก -gline-tables-only และ -fdebug-info-for-profiling สำหรับ Intel oneAPI DPC++ Compiler
  • ตั้งค่าระบบของคุณสำหรับการวิเคราะห์ GPU

สำหรับข้อมูลเกี่ยวกับการติดตั้ง Intel VTune Profiler ในสภาพแวดล้อม Microsoft* Visual Studio โปรดดู VTune Profileคู่มือการใช้งาน

สร้างแอป Matrix
ดาวน์โหลดรหัส matrix_multiply_vtune sampแพ็คเกจสำหรับชุดเครื่องมือ Intel oneAPI นี้ประกอบด้วย sampซึ่งคุณสามารถใช้เพื่อสร้างและโปรfile แอปพลิเคชัน SYCL

  1. เปิด Microsoft* Visual Studio
  2. คลิก File > เปิด > โครงการ/โซลูชัน ค้นหาโฟลเดอร์ matrix_multiply_vtune และเลือก matrix_multiply.sln
  3. สร้างการกำหนดค่านี้ (โครงการ > สร้าง)
  4. เรียกใช้โปรแกรม (Debug > Start Without Debugging)
  5. หากต้องการเลือกเวอร์ชัน DPC++ หรือเธรดของ sample ใช้คำจำกัดความของตัวประมวลผลล่วงหน้า
    1. ไปที่คุณสมบัติของโปรเจ็กต์ > DPC++ > ตัวประมวลผลล่วงหน้า > คำนิยามตัวประมวลผลล่วงหน้า
    2. กำหนด icpx -fsycl หรือ USE_THR

เรียกใช้การวิเคราะห์ GPU
เรียกใช้การวิเคราะห์ GPU บน Matrix sampเล.

  1. จากแถบเครื่องมือ Visual Studio ให้คลิกปุ่มกำหนดค่าการวิเคราะห์
    หน้าต่างกำหนดค่าการวิเคราะห์จะเปิดขึ้น ตามค่าเริ่มต้น จะสืบทอดการตั้งค่าโครงการ VS ของคุณและระบุ matrix_multiply.exe เป็นแอปพลิเคชันสำหรับมืออาชีพfile.
  2. ในหน้าต่าง Configure Analysis ให้คลิกIntel-เริ่มต้นใช้งานด้วย-VTune-Profileอาร์-06 ปุ่มเรียกดูในบานหน้าต่างวิธี
  3. เลือกประเภทการวิเคราะห์ GPU Compute/Media Hotspot จากกลุ่ม Accelerators ในแผนผังการวิเคราะห์
    Intel-เริ่มต้นใช้งานด้วย-VTune-Profileอาร์-06
  4. คลิกปุ่มเริ่มเพื่อเริ่มการวิเคราะห์ด้วยตัวเลือกที่กำหนดไว้ล่วงหน้า

เรียกใช้การวิเคราะห์ GPU จากบรรทัดคำสั่ง:

  1. เปิดสampไดเรกทอรีไฟล์:
    <sample_dir>\VtuneProfiler\matrix_multiply_vtune
  2. ในไดเร็กทอรีนี้ ให้เปิดโปรเจ็กต์ Visual Studio* file ชื่อ matrix_multiply.sln
  3. ตัวคูณ.cpp file มีการคูณเมทริกซ์หลายเวอร์ชัน เลือกเวอร์ชันโดยแก้ไขบรรทัด #define MULTIPLY ที่สอดคล้องกันใน multiply.hpp
  4. สร้างโครงการทั้งหมดด้วยการกำหนดค่า Release
    สิ่งนี้สร้างไฟล์ปฏิบัติการที่เรียกว่า matrix_multiply.exe
  5. เตรียมระบบเพื่อเรียกใช้การวิเคราะห์ GPU ดูการตั้งค่าระบบสำหรับการวิเคราะห์ GPU
  6. ตั้งค่า VTune Profiler ตัวแปรสภาพแวดล้อมโดยการรันแบทช์ file: ส่งออก \env\vars.bat
  7. เรียกใช้คำสั่งการวิเคราะห์:
    vtune.exe - รวบรวม GPU-offload — matrix_multiply.exe

วีทูน โปรfiler รวบรวมข้อมูลและแสดงผลการวิเคราะห์ใน GPU Compute/Media Hotspots viewจุด. ในหน้าต่างสรุป ดูสถิติเกี่ยวกับการใช้ทรัพยากร CPU และ GPU เพื่อทำความเข้าใจว่าแอปพลิเคชันของคุณเชื่อมโยงกับ GPU หรือไม่ สลับไปที่หน้าต่างกราฟิกเพื่อดูเมตริก CPU และ GPU พื้นฐานที่แสดงถึงการดำเนินการโค้ดเมื่อเวลาผ่านไป

เริ่มต้นใช้งาน Intel® VTune™ Profiler สำหรับระบบปฏิบัติการ Linux*

ก่อนที่คุณจะเริ่มต้น

  1. ติดตั้ง Intel® VTune™ Profiler บนระบบ Linux* ของคุณ
  2. สร้างแอปพลิเคชันของคุณด้วยข้อมูลสัญลักษณ์และในโหมดรีลีสโดยเปิดใช้งานการเพิ่มประสิทธิภาพทั้งหมด สำหรับข้อมูลโดยละเอียดเกี่ยวกับการตั้งค่าคอมไพเลอร์ โปรดดูที่ VTune Profileคู่มือผู้ใช้ออนไลน์
    คุณยังสามารถใช้เมทริกซ์ample แอปพลิเคชันที่มีอยู่ใน \sampเลอ \ เมทริกซ์ คุณสามารถเห็นampผลลัพธ์ที่ได้คือ \sampเลอ (เมทริกซ์)
  3. ตั้งค่าตัวแปรสภาพแวดล้อม: แหล่งที่มา /setvars.sh
    โดยค่าเริ่มต้น เป็น:
    • $HOME/intel/oneapi/ เมื่อติดตั้งโดยได้รับอนุญาตจากผู้ใช้;
    • /opt/intel/oneapi/ เมื่อติดตั้งด้วยการอนุญาตรูท

ขั้นตอนที่ 1: เริ่ม VTune Profiler
เริ่ม VTune Profileด้วยวิธีใดวิธีหนึ่งต่อไปนี้:

ที่มา / เริ่ม VTune Profiler
สแตนด์อโลน/IDE (GUI)

  1. เรียกใช้คำสั่ง vtunegui เพื่อเริ่ม VTune Profiler จาก Intel System Studio IDE เลือก Tools > VTune Profiler > เปิด VTune Profileร. ซึ่งจะตั้งค่าตัวแปรสภาพแวดล้อมที่เหมาะสมทั้งหมดและเรียกใช้อินเทอร์เฟซแบบสแตนด์อโลนของผลิตภัณฑ์
  2. เมื่อ GUI เปิดขึ้น ให้คลิก NEW PROJECT ในหน้าจอต้อนรับ
  3. ในกล่องโต้ตอบ สร้างโครงการ ให้ระบุชื่อโครงการและตำแหน่งที่ตั้ง
  4. คลิกสร้างโครงการ

แบบสแตนด์อโลน (บรรทัดคำสั่ง)

  • เรียกใช้คำสั่ง vtune

ขั้นตอนที่ 2: กำหนดค่าและเรียกใช้การวิเคราะห์
หลังจากสร้างโครงการใหม่ หน้าต่าง Configure Analysis จะเปิดขึ้นพร้อมกับค่าเริ่มต้นเหล่านี้:

Intel-เริ่มต้นใช้งานด้วย-VTune-Profileอาร์-07

  1. ในส่วน Launch Application ให้เรียกดูตำแหน่งของแอปพลิเคชันของคุณ
  2. คลิกที่ Start เพื่อเรียกใช้ Performance Snapshot บนแอปพลิเคชันของคุณ การวิเคราะห์นี้นำเสนอโดยทั่วไปview ของปัญหาที่ส่งผลต่อประสิทธิภาพของแอปพลิเคชันของคุณบนระบบเป้าหมาย

ขั้นตอนที่ 3: View และวิเคราะห์ข้อมูลประสิทธิภาพ
เมื่อรวบรวมข้อมูลเสร็จ VTune Profiler แสดงผลการวิเคราะห์ในหน้าต่างสรุป ที่นี่คุณเห็นการแสดงจบลงview ของใบสมัครของคุณ
เกินview โดยทั่วไปจะมีเมตริกหลายรายการพร้อมกับคำอธิบาย

Intel-เริ่มต้นใช้งานด้วย-VTune-Profileอาร์-08

  • A ขยายเมตริกแต่ละรายการเพื่อดูข้อมูลโดยละเอียดเกี่ยวกับปัจจัยที่มีส่วนร่วม
  • B เมตริกที่ถูกตั้งค่าสถานะจะระบุค่าที่อยู่นอกช่วงการทำงานที่ยอมรับได้/ปกติ ใช้เคล็ดลับเครื่องมือเพื่อทำความเข้าใจวิธีปรับปรุงเมตริกที่ถูกตั้งค่าสถานะ
  • C ดูคำแนะนำเกี่ยวกับการวิเคราะห์อื่นๆ ที่คุณควรพิจารณาดำเนินการต่อไป โครงสร้างการวิเคราะห์เน้นคำแนะนำเหล่านี้

ขั้นตอนต่อไป
Performance Snapshot เป็นจุดเริ่มต้นที่ดีในการประเมินประสิทธิภาพของแอปพลิเคชันโดยรวมด้วย VTune Profileร. ต่อไป ให้ตรวจสอบว่าอัลกอริทึมของคุณต้องการการปรับแต่งหรือไม่

  1. ทำตามบทช่วยสอนเพื่อวิเคราะห์ปัญหาคอขวดของประสิทธิภาพทั่วไป
  2. เมื่ออัลกอริทึมของคุณได้รับการปรับแต่งอย่างดีแล้ว ให้รัน Performance Snapshot อีกครั้งเพื่อปรับเทียบผลลัพธ์และระบุการปรับปรุงประสิทธิภาพที่อาจเกิดขึ้นในด้านอื่นๆ

ดูเพิ่มเติม
การสำรวจสถาปัตยกรรมไมโคร

วีทูน โปรfiler ทัวร์ช่วยเหลือ

Exampเลอ: โปรfile แอปพลิเคชัน OpenMP บน Linux*
ใช้ Intel VTune Profiler บนเครื่อง Linux ไปจนถึงมือโปรfile เช่นampแอปพลิเคชั่น le iso3dfd_omp_offload OpenMP ถูกโหลดไปยัง Intel GPU เรียนรู้วิธีเรียกใช้การวิเคราะห์ GPU และตรวจสอบผลลัพธ์

ข้อกำหนดเบื้องต้น

  • ตรวจสอบให้แน่ใจว่าระบบของคุณใช้ Linux* OS kernel 4.14 หรือเวอร์ชันที่ใหม่กว่า
  • ใช้กราฟิกโปรเซสเซอร์ Intel รุ่นใดรุ่นหนึ่งต่อไปนี้:
    • เจเนอเรชั่น 8
    • เจเนอเรชั่น 9
    • เจเนอเรชั่น 11
  • ระบบของคุณควรทำงานบนโปรเซสเซอร์ Intel ตัวใดตัวหนึ่งต่อไปนี้:
    • โปรเซสเซอร์ Intel® Core™ i7 เจนเนอเรชั่น 7 (ชื่อรหัส Kaby Lake)
    • โปรเซสเซอร์ Intel® Core™ i8 เจนเนอเรชั่น 7 (ชื่อรหัส Coffee Lake)
    • โปรเซสเซอร์ Intel® Core™ i10 เจนเนอเรชั่น 7 (ชื่อรหัส Ice Lake)
  • สำหรับ Linux GUI ให้ใช้:
    • GTK+ เวอร์ชัน 2.10 หรือใหม่กว่า (แนะนำให้ใช้เวอร์ชัน 2.18 และใหม่กว่า)
    • Pango รุ่น 1.14 หรือใหม่กว่า
    • X.Org เวอร์ชัน 1.0 หรือใหม่กว่า (แนะนำให้ใช้เวอร์ชัน 1.7 และใหม่กว่า)
  • ติดตั้ง Intel VTune Profiler จากแหล่งใดแหล่งหนึ่งเหล่านี้:
    • ดาวน์โหลดผลิตภัณฑ์แบบสแตนด์อโลน
    • ชุดเครื่องมือพื้นฐาน Intel® oneAPI
    • ชุดเครื่องมือแนะนำระบบ Intel®
  • ดาวน์โหลดชุดเครื่องมือ Intel® oneAPI HPC ซึ่งมีคอมไพเลอร์ Intel® oneAPI DPC++/C++(icx/icpx) ที่คุณต้องการสำหรับมืออาชีพfile แอปพลิเคชั่น OpenMP
  • ตั้งค่าตัวแปรสภาพแวดล้อม ดำเนินการสคริปต์ vars.sh
  • ตั้งค่าระบบของคุณสำหรับการวิเคราะห์ GPU

สร้างและคอมไพล์แอปพลิเคชัน OpenMP Offload

  1. ดาวน์โหลด iso3dfd_omp_offload OpenMP Offload sampเล.
  2. เปิดให้สampไดเรกทอรี่
    ซีดี <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload
  3. รวบรวมแอปพลิเคชัน OpenMP Offload

สร้าง mkdir;
cmake -DVERIFY_RESULTS=0 ..
ทำ -j

สิ่งนี้สร้างไฟล์ปฏิบัติการ src/iso3dfd

หากต้องการลบโปรแกรม ให้พิมพ์:
ทำให้สะอาด

สิ่งนี้จะลบไฟล์ปฏิบัติการและวัตถุ fileที่คุณสร้างด้วยคำสั่ง make

เรียกใช้การวิเคราะห์ GPU บนแอปพลิเคชัน OpenMP Offload
ตอนนี้คุณพร้อมที่จะรัน GPU Offload Analysis บนแอปพลิเคชัน OpenMP ที่คุณคอมไพล์แล้ว

  1. เปิด VTune Profiler และคลิกที่โครงการใหม่เพื่อสร้างโครงการ
  2. ในหน้าต้อนรับ ให้คลิกกำหนดค่าการวิเคราะห์เพื่อตั้งค่าการวิเคราะห์ของคุณ
  3. เลือกการตั้งค่าเหล่านี้สำหรับการวิเคราะห์ของคุณ
    • ในบานหน้าต่าง WHERE เลือก Local Host
    • ในบานหน้าต่าง WHAT เลือก Launch Application และระบุไบนารี iso3dfd_omp_offload เป็นแอปพลิเคชันสำหรับมืออาชีพfile.
    • ในบานหน้าต่าง HOW ให้เลือกประเภทการวิเคราะห์ GPU Offload จากกลุ่ม Accelerators ในแผนผังการวิเคราะห์
      Intel-เริ่มต้นใช้งานด้วย-VTune-Profileอาร์-09
  4. คลิกปุ่มเริ่มเพื่อเรียกใช้การวิเคราะห์

วีทูน โปรfiler รวบรวมข้อมูลและแสดงผลการวิเคราะห์ใน GPU Offload viewจุด.

  • ในหน้าต่างสรุป ดูสถิติการใช้ทรัพยากร CPU และ GPU ใช้ข้อมูลนี้เพื่อตรวจสอบว่าใบสมัครของคุณคือ:
    • GPU ที่ผูกไว้
    • CPU ผูกพัน
    • ใช้ทรัพยากรการคำนวณของระบบของคุณอย่างไม่มีประสิทธิภาพ
  • ใช้ข้อมูลในหน้าต่างแพลตฟอร์มเพื่อดูเมตริก CPU และ GPU พื้นฐาน
  • ตรวจสอบงานคอมพิวเตอร์เฉพาะในหน้าต่างกราฟิก

สำหรับการวิเคราะห์เชิงลึก ดูสูตรที่เกี่ยวข้องใน VTune Profiler ตำราวิเคราะห์ประสิทธิภาพ คุณยังสามารถดำเนินการสร้างโปรไฟล์ของคุณด้วยการวิเคราะห์ GPU Compute/Media Hotspots

Exampเลอ: โปรfile แอปพลิเคชัน SYCL* บน Linux*
ใช้ VTune Profiler กับ asampแอปพลิเคชัน le matrix_multiply SYCL เพื่อทำความคุ้นเคยกับผลิตภัณฑ์และสถิติที่รวบรวมไว้สำหรับแอปพลิเคชันที่ใช้ GPU ได้อย่างรวดเร็ว

ข้อกำหนดเบื้องต้น

  • ติดตั้ง VTune Profiler และคอมไพเลอร์ Intel® oneAPI DPC++/C++ จาก Intel® oneAPI Base Toolkit หรือ Intel® System Bring-up Toolkit
  • ตั้งค่าตัวแปรสภาพแวดล้อมโดยเรียกใช้สคริปต์ vars.sh
  • ตั้งค่าระบบของคุณสำหรับการวิเคราะห์ GPU

สร้างแอปพลิเคชันเมทริกซ์
ดาวน์โหลดรหัส matrix_multiply_vtune sampแพ็คเกจสำหรับชุดเครื่องมือ Intel oneAPI นี้ประกอบด้วย sampซึ่งคุณสามารถใช้เพื่อสร้างและโปรfile แอปพลิเคชัน SYCL

เพื่อโปรfile แอปพลิเคชัน SYCL ตรวจสอบให้แน่ใจว่าได้คอมไพล์โค้ดโดยใช้ตัวเลือก -gline-tables-only และ -fdebug-info-for-profiling Intel oneAPI DPC++ Compiler

ในการรวบรวมสิ่งนี้ampใบสมัคร ให้ทำดังต่อไปนี้:

  1. ไปที่ sampไดเรกทอรี่
    ซีดี <sample_dir/VtuneProfiler/matrix_multiply>
  2. ตัวคูณ.cpp file ในโฟลเดอร์ src มีการคูณเมทริกซ์หลายเวอร์ชัน เลือกเวอร์ชันโดยแก้ไขบรรทัด #define MULTIPLY ที่สอดคล้องกันใน multiply.h
  3. สร้างแอปโดยใช้ Make ที่มีอยู่file:
    ซีเมค .
    ทำ
    สิ่งนี้ควรสร้างไฟล์ปฏิบัติการ matrix.icpx -fsycl
    หากต้องการลบโปรแกรม ให้พิมพ์:
    ทำให้สะอาด
    สิ่งนี้จะลบไฟล์ปฏิบัติการและวัตถุ fileที่สร้างโดยคำสั่ง make

เรียกใช้การวิเคราะห์ GPU
เรียกใช้การวิเคราะห์ GPU บน Matrix sampเล.

  1. เปิด VTune Profiler ด้วยคำสั่ง vtune-gui
  2. คลิก New Project จากหน้ายินดีต้อนรับ
  3. ระบุชื่อและตำแหน่งสำหรับ s ของคุณampโครงการและคลิกสร้างโครงการ
  4. ในบานหน้าต่าง WHAT ให้เรียกดู matrix.icpx-fsycl file.
  5. ในบานหน้าต่าง HOW คลิก Intel-เริ่มต้นใช้งานด้วย-VTune-Profileอาร์-06 ปุ่มเรียกดู และเลือกการวิเคราะห์ GPU Compute/Media Hotspots จากกลุ่ม Accelerators ในแผนผังการวิเคราะห์
    Intel-เริ่มต้นใช้งานด้วย-VTune-Profileอาร์-10
  6. คลิกปุ่มเริ่มที่ด้านล่างเพื่อเริ่มการวิเคราะห์ด้วยตัวเลือกที่เลือกไว้ล่วงหน้า

เรียกใช้การวิเคราะห์ GPU จากบรรทัดคำสั่ง:

  1. เตรียมระบบเพื่อเรียกใช้การวิเคราะห์ GPU ดูการตั้งค่าระบบสำหรับการวิเคราะห์ GPU
  2. ตั้งค่าตัวแปรสภาพแวดล้อมสำหรับเครื่องมือซอฟต์แวร์ของ Intel:
    ที่มา $ONEAPI_ROOT/setvars.sh
  3. เรียกใช้การวิเคราะห์ GPU Compute/Media Hotspots:
    vtune - รวบรวม GPU-ฮอตสปอต -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
    หากต้องการดูรายงานสรุป ให้พิมพ์:
    vtune -รายงานสรุป -r ./result_gpu-hotspots

วีทูน โปรfiler รวบรวมข้อมูลและแสดงผลการวิเคราะห์ใน GPU Compute/Media Hotspots viewจุด. ในหน้าต่างสรุป ดูสถิติเกี่ยวกับการใช้ทรัพยากร CPU และ GPU เพื่อทำความเข้าใจว่าแอปพลิเคชันของคุณเชื่อมโยงกับ GPU หรือไม่ สลับไปที่หน้าต่างกราฟิกเพื่อดูเมตริก CPU และ GPU พื้นฐานที่แสดงถึงการดำเนินการโค้ดเมื่อเวลาผ่านไป

เริ่มต้นใช้งาน Intel® VTune™ Profiler สำหรับ macOS*

ใช้ VTune Profiler บนระบบ macOS เพื่อทำการวิเคราะห์เป้าหมายระยะไกลบนระบบที่ไม่ใช่ macOS (Linux* หรือ Android* เท่านั้น)

คุณไม่สามารถใช้ VTune Profiler ในสภาพแวดล้อม macOS เพื่อวัตถุประสงค์เหล่านี้:

  • โปรfile ระบบ macOS ที่ติดตั้ง
  • รวบรวมข้อมูลบนระบบ macOS ระยะไกล

ในการวิเคราะห์ประสิทธิภาพของเป้าหมาย Linux* หรือ Android* ระยะไกลจากโฮสต์ macOS ให้ทำตามขั้นตอนใดขั้นตอนหนึ่งต่อไปนี้:

  • เรียกใช้ VTune Profileการวิเคราะห์บนระบบ macOS โดยระบุระบบระยะไกลเป็นเป้าหมาย เมื่อการวิเคราะห์เริ่มต้นขึ้น VTune Profiler เชื่อมต่อกับระบบระยะไกลเพื่อรวบรวมข้อมูล จากนั้นนำผลลัพธ์กลับไปยังโฮสต์ macOS สำหรับ viewการไอเอ็นจี
  • เรียกใช้การวิเคราะห์บนระบบเป้าหมายในเครื่องและคัดลอกผลลัพธ์ไปยังระบบ macOS สำหรับ viewอยู่ใน VTune Profiler.

ขั้นตอนในเอกสารนี้ถือว่าระบบเป้าหมาย Linux ระยะไกลและรวบรวมข้อมูลประสิทธิภาพโดยใช้การเข้าถึง SSH จาก VTune Profiler บนระบบโฮสต์ macOS

ก่อนที่คุณจะเริ่มต้น

  1. ติดตั้ง Intel® VTune™ Profiler บนระบบ macOS* ของคุณ
  2. สร้างแอปพลิเคชัน Linux ของคุณด้วยข้อมูลสัญลักษณ์และในโหมดรีลีสโดยเปิดใช้งานการปรับให้เหมาะสมทั้งหมด สำหรับข้อมูลโดยละเอียด โปรดดูที่การตั้งค่าคอมไพเลอร์ใน VTune Profileช่วยด้วย.
  3. ตั้งค่าการเข้าถึง SSH จากระบบ macOS ของโฮสต์ไปยังระบบ Linux เป้าหมายเพื่อให้ทำงานในโหมดไม่ต้องใช้รหัสผ่าน

ขั้นตอนที่ 1: เริ่ม VTune Profiler

  1. เปิด VTune Profiler ด้วยคำสั่ง vtune-gui
    โดยค่าเริ่มต้น คือ /opt/intel/oneapi/
  2. เมื่อ GUI เปิดขึ้น ให้คลิก NEW PROJECT ในหน้าจอต้อนรับ
  3. ในกล่องโต้ตอบ สร้างโครงการ ให้ระบุชื่อโครงการและตำแหน่งที่ตั้ง
  4. คลิกสร้างโครงการ

ขั้นตอนที่ 2: กำหนดค่าและเรียกใช้การวิเคราะห์
หลังจากที่คุณสร้างโปรเจ็กต์ใหม่ หน้าต่าง Configure Analysis จะเปิดขึ้นพร้อมกับประเภทการวิเคราะห์ Performance Snapshot
การวิเคราะห์นี้นำเสนอมากกว่าview ของปัญหาที่ส่งผลต่อประสิทธิภาพการทำงานของแอปพลิเคชันของคุณบนระบบเป้าหมาย

Intel-เริ่มต้นใช้งานด้วย-VTune-Profileอาร์-11

  1. ในบานหน้าต่าง WHERE เลือก Remote Linux (SSH) และระบุระบบ Linux เป้าหมายโดยใช้ username@ hostname[:port]
    วีทูน โปรfiler เชื่อมต่อกับระบบ Linux และติดตั้งแพ็คเกจเป้าหมาย
  2. ในบานหน้าต่าง WHAT ให้ระบุเส้นทางไปยังแอปพลิเคชันของคุณบนระบบ Linux เป้าหมาย
  3. คลิกปุ่มเริ่มเพื่อเรียกใช้ Performance Snapshot บนแอปพลิเคชัน

ขั้นตอนที่ 3: View และวิเคราะห์ข้อมูลประสิทธิภาพ
เมื่อรวบรวมข้อมูลเสร็จ VTune Profiler แสดงผลการวิเคราะห์บนระบบ macOS เริ่มการวิเคราะห์ของคุณในหน้าต่างสรุป ที่นี่คุณเห็นการแสดงจบลงview ของใบสมัครของคุณ

เกินview โดยทั่วไปจะมีเมตริกหลายรายการพร้อมกับคำอธิบาย

Intel-เริ่มต้นใช้งานด้วย-VTune-Profileอาร์-12

  • A ขยายเมตริกแต่ละรายการเพื่อดูข้อมูลโดยละเอียดเกี่ยวกับปัจจัยที่มีส่วนร่วม
  • B เมตริกที่ถูกตั้งค่าสถานะจะระบุค่าที่อยู่นอกช่วงการทำงานที่ยอมรับได้/ปกติ ใช้เคล็ดลับเครื่องมือเพื่อทำความเข้าใจวิธีปรับปรุงเมตริกที่ถูกตั้งค่าสถานะ
  • C ดูคำแนะนำเกี่ยวกับการวิเคราะห์อื่นๆ ที่คุณควรพิจารณาดำเนินการต่อไป โครงสร้างการวิเคราะห์เน้นคำแนะนำเหล่านี้

ขั้นตอนต่อไป
Performance Snapshot เป็นจุดเริ่มต้นที่ดีในการประเมินประสิทธิภาพของแอปพลิเคชันโดยรวมด้วย VTune Profiler.
ต่อไป ให้ตรวจสอบว่าอัลกอริทึมของคุณต้องการการปรับแต่งหรือไม่

  1. เรียกใช้ Hotspots Analysis บนแอปพลิเคชันของคุณ
  2. ทำตามบทช่วยสอนเกี่ยวกับฮอตสปอต เรียนรู้เทคนิคเพื่อให้ได้ประโยชน์สูงสุดจากการวิเคราะห์ฮอตสปอตของคุณ
  3. เมื่ออัลกอริทึมของคุณได้รับการปรับแต่งอย่างดีแล้ว ให้รัน Performance Snapshot อีกครั้งเพื่อปรับเทียบผลลัพธ์และระบุการปรับปรุงประสิทธิภาพที่อาจเกิดขึ้นในด้านอื่นๆ

ดูเพิ่มเติม
การสำรวจสถาปัตยกรรมไมโคร

วีทูน โปรfiler ทัวร์ช่วยเหลือ

เรียนรู้เพิ่มเติม
เอกสาร/คำอธิบาย

  • คู่มือการใช้งาน
    คู่มือผู้ใช้เป็นเอกสารหลักสำหรับ VTune Profiler.
    บันทึก
    คุณยังสามารถดาวน์โหลด VTune Pro เวอร์ชันออฟไลน์ได้อีกด้วยfileเอกสารร.
  • การฝึกอบรมออนไลน์
    ไซต์การฝึกอบรมออนไลน์เป็นแหล่งข้อมูลที่ดีเยี่ยมในการเรียนรู้พื้นฐานของ VTune Profiler พร้อมคู่มือเริ่มต้นใช้งาน วิดีโอ บทช่วยสอน webinars และบทความทางเทคนิค
  • หนังสือตำราอาหาร
    ตำราการวิเคราะห์ประสิทธิภาพที่มีสูตรอาหารเพื่อระบุและแก้ปัญหาประสิทธิภาพยอดนิยมโดยใช้ประเภทการวิเคราะห์ใน VTune Profiler.
  • คู่มือการติดตั้งสำหรับ Windows | ลินุกซ์ | โฮสต์ macOS
    คู่มือการติดตั้งมีคำแนะนำในการติดตั้งพื้นฐานสำหรับ VTune Profiler และคำแนะนำการกำหนดค่าหลังการติดตั้งสำหรับไดรเวอร์และตัวสะสมต่างๆ
  • บทช่วยสอน
    วีทูน โปรfiler แบบฝึกหัดแนะนำผู้ใช้ใหม่ผ่านคุณสมบัติพื้นฐานด้วย s สั้น ๆampแอปพลิเคชัน
  • หมายเหตุการเปิดตัว
    ค้นหาข้อมูลเกี่ยวกับ VTune Pro เวอร์ชันล่าสุดfiler รวมถึงคำอธิบายที่ครอบคลุมของคุณสมบัติใหม่ ความต้องการของระบบ และปัญหาทางเทคนิคที่ได้รับการแก้ไข
    สำหรับ VTune Pro เวอร์ชันสแตนด์อโลนและชุดเครื่องมือfiler เข้าใจความต้องการของระบบในปัจจุบัน

ประกาศและข้อจำกัดความรับผิดชอบ
เทคโนโลยีของ Intel อาจต้องเปิดใช้งานฮาร์ดแวร์ซอฟต์แวร์หรือการเปิดใช้งานบริการ
ไม่มีผลิตภัณฑ์หรือส่วนประกอบใดที่จะปลอดภัยได้อย่างแน่นอน
ค่าใช้จ่ายและผลลัพธ์ของคุณอาจแตกต่างกันไป
© อินเทล คอร์ปอเรชั่น Intel, โลโก้ Intel และเครื่องหมายอื่นๆ ของ Intel เป็นเครื่องหมายการค้าของ Intel Corporation หรือบริษัทในเครือ ชื่อและตราสินค้าอื่น ๆ อาจเป็นทรัพย์สินของผู้อื่น
Intel, โลโก้ Intel, Intel Atom, Intel Core, Intel Xeon Phi, VTune และ Xeon เป็นเครื่องหมายการค้าของ Intel Corporation ในสหรัฐอเมริกาและ/หรือประเทศอื่นๆ
*ชื่อและยี่ห้ออื่น ๆ อาจถูกอ้างสิทธิ์โดยถือเป็นทรัพย์สินของผู้อื่น
Microsoft, Windows และโลโก้ Windows เป็นเครื่องหมายการค้าหรือเครื่องหมายการค้าจดทะเบียนของ Microsoft Corporation ในสหรัฐอเมริกาและ/หรือประเทศอื่นๆ
Java เป็นเครื่องหมายการค้าจดทะเบียนของ Oracle และ/หรือบริษัทในเครือ
OpenCL และโลโก้ OpenCL เป็นเครื่องหมายการค้าของ Apple Inc. ซึ่งใช้งานโดยได้รับอนุญาตจาก Khronos

เทคโนโลยีของ Intel อาจต้องเปิดใช้งานฮาร์ดแวร์ซอฟต์แวร์หรือการเปิดใช้งานบริการ
ไม่มีผลิตภัณฑ์หรือส่วนประกอบใดที่จะปลอดภัยได้อย่างแน่นอน
ค่าใช้จ่ายและผลลัพธ์ของคุณอาจแตกต่างกันไป
© อินเทล คอร์ปอเรชั่น Intel, โลโก้ Intel และเครื่องหมายอื่นๆ ของ Intel เป็นเครื่องหมายการค้าของ Intel Corporation หรือบริษัทในเครือ ชื่อและตราสินค้าอื่น ๆ อาจเป็นทรัพย์สินของผู้อื่น
Intel, โลโก้ Intel, Intel Atom, Intel Core, Intel Xeon Phi, VTune และ Xeon เป็นเครื่องหมายการค้าของ Intel Corporation ในสหรัฐอเมริกาและ/หรือประเทศอื่นๆ
*ชื่อและยี่ห้ออื่น ๆ อาจถูกอ้างสิทธิ์โดยถือเป็นทรัพย์สินของผู้อื่น
Microsoft, Windows และโลโก้ Windows เป็นเครื่องหมายการค้าหรือเครื่องหมายการค้าจดทะเบียนของ Microsoft Corporation ในสหรัฐอเมริกาและ/หรือประเทศอื่นๆ
Java เป็นเครื่องหมายการค้าจดทะเบียนของ Oracle และ/หรือบริษัทในเครือ
OpenCL และโลโก้ OpenCL เป็นเครื่องหมายการค้าของ Apple Inc. ซึ่งใช้งานโดยได้รับอนุญาตจาก Khronos

เอกสาร / แหล่งข้อมูล

Intel เริ่มต้นด้วย VTune Profiler [พีดีเอฟ] คู่มือการใช้งาน
เริ่มต้นใช้งาน VTune Profiler เริ่มต้นด้วย VTune Profiler, VTune Profiler

อ้างอิง

ฝากความคิดเห็น

ที่อยู่อีเมลของคุณจะไม่ถูกเผยแพร่ ช่องที่ต้องกรอกข้อมูลมีเครื่องหมาย *