intel Bắt đầu với VTune Profiler
Bắt đầu với Intel® VTune™ Profiler
Sử dụng Intel VTune Profiler để phân tích các hệ thống mục tiêu cục bộ và từ xa từ các máy chủ Windows*, macOS* và Linux*. Cải thiện hiệu suất của ứng dụng và hệ thống thông qua các hoạt động này:
- Phân tích các lựa chọn thuật toán.
- Tìm các tắc nghẽn mã nối tiếp và song song.
- Hiểu vị trí và cách ứng dụng của bạn có thể hưởng lợi từ các tài nguyên phần cứng có sẵn.
- Tăng tốc độ thực thi ứng dụng của bạn.
Tải xuống Intel VTune Profiler trên hệ thống của bạn thông qua một trong những cách sau: - Tải xuống phiên bản Độc lập.
- Nhận Intel VTune Profiler như một phần của Bộ công cụ cơ sở Intel® oneAPI.
Xem VTune Profiler trang đào tạo cho video, webinars và nhiều tài liệu khác để giúp bạn bắt đầu.
GHI CHÚ
Tài liệu dành cho các phiên bản Intel® VTune™ Profiler trước khi phát hành năm 2021 chỉ có sẵn để tải xuống. Để biết danh sách tải xuống tài liệu có sẵn theo phiên bản sản phẩm, hãy xem các trang sau:
- Tải xuống tài liệu cho Intel Parallel Studio XE
- Tải xuống tài liệu cho Intel System Studio
Hiểu quy trình làm việc
Sử dụng Intel VTune Profiler để chuyên nghiệpfile một ứng dụng và phân tích kết quả để cải thiện hiệu suất.
Quy trình làm việc chung bao gồm các bước sau:
Chọn Hệ thống Máy chủ của Bạn để Bắt đầu
Tìm hiểu thêm về quy trình công việc dành riêng cho hệ thống dành cho Windows*, Linux* hoặc macOS*.
Bắt đầu với Intel® VTune™ Profiler cho hệ điều hành Windows*
Trước khi bạn bắt đầu
- Cài đặt Intel® VTune™ Profiler trên hệ thống Windows* của bạn.
- Xây dựng ứng dụng của bạn với thông tin biểu tượng và ở chế độ Phát hành với tất cả các tối ưu hóa được bật. Để biết thông tin chi tiết về cài đặt trình biên dịch, hãy xem VTune Profiler hướng dẫn sử dụng trực tuyến.
Bạn cũng có thể sử dụng ma trận sampứng dụng le có sẵn trong \VTune\Samples\ma trận. Bạn có thể thấy s tương ứngample kết quả trong \VTune\Projects\sample (ma trận). - Thiết lập các biến môi trường: Chạy tập lệnh \setvars.bat.
Theo mặc định, các đối với các thành phần oneAPI là Chương trình Files (x86)\Intel\oneAPI.
GHI CHÚ Bạn không cần chạy setvars.bat khi sử dụng Intel® VTune™ Profiler trong Microsoft* Visual Studio*.
Bước 1: Khởi động Intel® VTune™ Profiler
Khởi động Intel VTune Profiler thông qua một trong những cách này và thiết lập một dự án. Dự án là nơi chứa ứng dụng bạn muốn phân tích, loại phân tích và kết quả thu thập dữ liệu.
Nguồn / Bắt đầu VTune Profiler
Độc lập (GUI)
- Chạy lệnh vtune-gui hoặc chạy Intel® VTune™ Profiler từ menu Bắt đầu.
- Khi GUI mở ra, nhấp vào màn hình Chào mừng.
- Trong hộp thoại Tạo dự án, chỉ định tên và vị trí dự án.
- Nhấp vào Tạo dự án.
Độc lập (Dòng lệnh)
Chạy lệnh vtune.
Microsoft* Visual Studio* IDE
Mở giải pháp của bạn trong Visual Studio. VTune Profiler được bật tự động và dự án Visual Studio của bạn được đặt làm mục tiêu phân tích.
GHI CHÚ
Bạn không cần tạo dự án khi chạy Intel® VTune™ Profiler từ dòng lệnh hoặc trong Microsoft* Visual Studio.
Bước 2: Định cấu hình và Chạy Phân tích
Sau khi tạo một dự án mới, cửa sổ Cấu hình Phân tích sẽ mở ra với các giá trị mặc định sau:
- Trong phần Khởi chạy ứng dụng, duyệt đến vị trí thực thi ứng dụng của bạn file.
- Nhấp vào Bắt đầu để chạy Ảnh chụp nhanh hiệu suất trên ứng dụng của bạn. Phân tích này trình bày một cách tổng quát vềview các vấn đề ảnh hưởng đến hiệu suất của ứng dụng của bạn trên hệ thống đích.
Bước 3: View và Phân tích Dữ liệu Hiệu suất
Khi việc thu thập dữ liệu hoàn tất, VTune Profiler hiển thị kết quả phân tích trong cửa sổ Tóm tắt. Ở đây, bạn thấy một hiệu suất trênview của ứng dụng của bạn.
Cái trênview thường bao gồm một số chỉ số cùng với mô tả của chúng.
- A Mở rộng từng số liệu để biết thông tin chi tiết về các yếu tố góp phần.
- B Số liệu được gắn cờ cho biết giá trị nằm ngoài phạm vi hoạt động bình thường/được chấp nhận. Sử dụng mẹo công cụ để hiểu cách cải thiện chỉ số được gắn cờ.
- C Xem hướng dẫn về các phân tích khác mà bạn nên cân nhắc chạy tiếp theo. Cây phân tích nêu bật những khuyến nghị này.
Các bước tiếp theo
Ảnh chụp hiệu suất là một điểm khởi đầu tốt để có được đánh giá tổng thể về hiệu suất của ứng dụng với VTune Profiler. Tiếp theo, hãy kiểm tra xem thuật toán của bạn có cần điều chỉnh không.
- Thực hiện theo hướng dẫn để phân tích các tắc nghẽn hiệu suất phổ biến.
- Sau khi thuật toán của bạn được điều chỉnh tốt, hãy chạy lại Ảnh chụp nhanh hiệu suất để hiệu chỉnh kết quả và xác định các cải tiến hiệu suất tiềm năng trong các lĩnh vực khác.
Xem thêm
Khám phá kiến trúc vi mô
VTune Profiler Tham quan Trợ giúp
Examplê: Chuyên nghiệpfile một Ứng dụng OpenMP* trên Windows*
Sử dụng Intel VTune Profiler trên máy Windows thành chuyên nghiệpfile BẰNGample iso3dfd_omp_offload Ứng dụng OpenMP được giảm tải trên GPU Intel. Tìm hiểu cách chạy phân tích GPU và kiểm tra kết quả.
Điều kiện tiên quyết
- Đảm bảo hệ thống của bạn đang chạy Microsoft* Windows 10 hoặc phiên bản mới hơn.
- Sử dụng một trong các phiên bản Đồ họa bộ xử lý Intel sau:
- Thế hệ 8
- Thế hệ 9
- Thế hệ 11
- Hệ thống của bạn sẽ chạy trên một trong những bộ xử lý Intel sau:
- Bộ xử lý Intel® Core™ i7 thế hệ thứ 7 (tên mã Kaby Lake)
- Bộ xử lý Intel® Core™ i8 thế hệ thứ 7 (tên mã Coffee Lake)
- Bộ xử lý Intel® Core™ i10 thế hệ thứ 7 (tên mã Ice Lake)
- Cài đặt Intel VTune Profiler từ một trong những nguồn sau:
- Tải xuống sản phẩm độc lập
- Bộ công cụ cơ sở Intel® oneAPI
- Bộ công cụ nâng cấp hệ thống Intel®
- Tải xuống Bộ công cụ HPC Intel® oneAPI chứa Trình biên dịch Intel® oneAPI DPC++/C++(icx/icpx) mà bạn cần để nâng caofile Các ứng dụng OpenMP.
- Thiết lập các biến môi trường. Thực thi tập lệnh vars.bat nằm trong thư mục \env.
- Thiết lập hệ thống của bạn để phân tích GPU.
GHI CHÚ
Để cài đặt Intel VTune Profiler trong môi trường Microsoft* Visual Studio, xem VTune ProfilerHướng dẫn sử dụng.
Xây dựng và biên dịch ứng dụng giảm tải OpenMP
- Tải xuống iso3dfd_omp_offload OpenMP Offload samplà.
- mở cửa cho sampthư mục le.
cd < sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - Biên dịch ứng dụng OpenMP Offload.
xây dựng mkdir
xây dựng cd
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-target:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp
Chạy Phân tích GPU trên Ứng dụng Giảm tải OpenMP
Bây giờ bạn đã sẵn sàng chạy Phân tích giảm tải GPU trên ứng dụng OpenMP mà bạn đã biên dịch.
- Mở VTune Profiler và nhấp vào Dự án mới để tạo dự án.
- Trên trang chào mừng, nhấp vào Định cấu hình phân tích để thiết lập phân tích của bạn.
- Chọn các cài đặt này cho phân tích của bạn.
- Trong ngăn WHERE, chọn Máy chủ lưu trữ cục bộ.
- Trong ngăn CÁI GÌ, hãy chọn Khởi chạy Ứng dụng và chỉ định tệp nhị phân iso3dfd_omp_offload làm ứng dụng chuyên nghiệpfile.
- Trong ngăn CÁCH, chọn loại phân tích Giảm tải GPU từ nhóm Máy gia tốc trong Cây phân tích.
- Nhấp vào nút Bắt đầu để chạy phân tích.
VTune Profiler thu thập dữ liệu và hiển thị kết quả phân tích trong GPU Offload viewđiểm.
- Trong cửa sổ Tóm tắt, hãy xem số liệu thống kê về việc sử dụng tài nguyên CPU và GPU. Sử dụng dữ liệu này để xác định xem ứng dụng của bạn có:
- giới hạn GPU
- Ràng buộc CPU
- Sử dụng tài nguyên điện toán của hệ thống của bạn không hiệu quả
- Sử dụng thông tin trong cửa sổ Nền tảng để xem các số liệu cơ bản về CPU và GPU.
- Điều tra các tác vụ tính toán cụ thể trong cửa sổ Đồ họa.
Để phân tích sâu hơn, hãy xem công thức liên quan trong VTune Profiler Sổ tay phân tích hiệu suất. Bạn cũng có thể tiếp tục lập hồ sơ của mình bằng phân tích GPU Compute/Media Hotspots.
Example: Chuyên nghiệpfile ứng dụng SYCL* trên Windows*
Chuyên nghiệpfile BẰNGample matrix_multiply ứng dụng SYCL với Intel® VTune™ Profiler. Làm quen với sản phẩm và hiểu số liệu thống kê được thu thập cho các ứng dụng gắn với GPU.
Điều kiện tiên quyết
- Đảm bảo bạn đã cài đặt Microsoft* Visual Studio (v2017 trở lên) trên hệ thống của mình.
- Cài đặt Intel VTune Profiler từ Bộ công cụ cơ sở Intel® oneAPI hoặc Bộ công cụ khởi động hệ thống Intel®. Các bộ công cụ này chứa trình biên dịch Intel® oneAPI DPC++/C++ Compiler(icpx -fsycl) cần thiết cho quy trình định hình.
- Thiết lập các biến môi trường. Thực thi tập lệnh vars.bat nằm trong thư mục \env.
- Đảm bảo rằng Trình biên dịch Intel oneAPI DPC++ (được cài đặt với bộ công cụ Intel oneAPI Base) được tích hợp vào Microsoft Visual Studio.
- Biên dịch mã bằng các tùy chọn -gline-tables-only và -fdebug-info-for-profiling cho Trình biên dịch Intel oneAPI DPC++.
- Thiết lập hệ thống của bạn để phân tích GPU.
Để biết thông tin về cài đặt Intel VTune Profiler trong môi trường Microsoft* Visual Studio, xem VTune ProfilerHướng dẫn sử dụng.
Xây dựng ứng dụng ma trận
Tải xuống mã matrix_multiply_vtune sample cho bộ công cụ oneAPI của Intel. cái này chứa samptập tin mà bạn có thể sử dụng để xây dựng và chuyên nghiệpfile một ứng dụng SYCL.
- Mở Microsoft* Visual Studio.
- Nhấp chuột File > Mở > Dự án/Giải pháp. Tìm thư mục matrix_multiply_vtune và chọn matrix_multiply.sln.
- Xây dựng cấu hình này (Dự án > Xây dựng).
- Chạy chương trình (Gỡ lỗi> Bắt đầu mà không cần gỡ lỗi).
- Để chọn phiên bản DPC++ hoặc luồng của sample, hãy sử dụng các định nghĩa tiền xử lý.
- Chuyển đến Thuộc tính dự án > DPC++ > Bộ tiền xử lý > Định nghĩa bộ tiền xử lý.
- Xác định icpx -fsycl hoặc USE_THR.
Chạy phân tích GPU
Chạy phân tích GPU trên Matrix samplà.
- Từ thanh công cụ Visual Studio, nhấp vào nút Cấu hình phân tích.
Cửa sổ Cấu hình Phân tích sẽ mở ra. Theo mặc định, nó kế thừa cài đặt dự án VS của bạn và chỉ định matrix_multiply.exe làm ứng dụng cho chuyên nghiệpfile. - Trong cửa sổ Cấu hình Phân tích, nhấp vào nút
Duyệt nút trong ngăn CÁCH.
- Chọn loại phân tích GPU Compute/Media Hotspots từ nhóm Accelerators trong Cây phân tích.
- Nhấp vào nút Bắt đầu để khởi chạy phân tích với các tùy chọn được xác định trước.
Chạy Phân tích GPU từ Dòng lệnh:
- Mở sampthư mục:
<sample_dir>\VtuneProfiler\matrix_multiply_vtune - Trong thư mục này, hãy mở một dự án Visual Studio* file có tên matrix_multiply.sln
- nhân.cpp file chứa một số phiên bản của phép nhân ma trận. Chọn một phiên bản bằng cách chỉnh sửa dòng #define MULTIPLY tương ứng trong multi.hpp
- Xây dựng toàn bộ dự án với cấu hình Phát hành.
Điều này tạo ra một tệp thực thi được gọi là matrix_multiply.exe. - Chuẩn bị hệ thống để chạy phân tích GPU. Xem Thiết lập hệ thống để phân tích GPU.
- Đặt VTune Profilebiến môi trường r bằng cách chạy lô file: xuất khẩu \env\vars.bat
- Chạy lệnh phân tích:
vtune.exe -collect gpu-offload — ma trận_multiply.exe
VTune Profiler thu thập dữ liệu và hiển thị kết quả phân tích trong GPU Compute/Media Hotspots viewđiểm. Trong cửa sổ Tóm tắt, hãy xem số liệu thống kê về mức sử dụng tài nguyên CPU và GPU để biết liệu ứng dụng của bạn có bị ràng buộc bởi GPU hay không. Chuyển sang cửa sổ Đồ họa để xem các chỉ số CPU và GPU cơ bản thể hiện việc thực thi mã theo thời gian.
Bắt đầu với Intel® VTune™ Profiler cho hệ điều hành Linux*
Trước khi bạn bắt đầu
- Cài đặt Intel® VTune™ Profiler trên hệ thống Linux* của bạn.
- Xây dựng ứng dụng của bạn với thông tin biểu tượng và ở chế độ Phát hành với tất cả các tối ưu hóa được bật. Để biết thông tin chi tiết về cài đặt trình biên dịch, hãy xem VTune Profiler hướng dẫn sử dụng trực tuyến.
Bạn cũng có thể sử dụng ma trận sampứng dụng le có sẵn trong \Sample\matrix. Bạn có thể thấy sample kết quả trong \Sample (ma trận). - Thiết lập các biến môi trường: nguồn /setvars.sh
Theo mặc định, các là:- $HOME/intel/oneapi/ khi được cài đặt với quyền của người dùng;
- /opt/intel/oneapi/ khi được cài đặt với quyền root.
Bước 1: Khởi động VTune Profiler
Bắt đầu VTune Profiler thông qua một trong những cách sau:
Nguồn / Bắt đầu VTune Profiler
Độc lập/IDE (GUI)
- Chạy lệnh vtunegui. Để bắt đầu VTune Profiler từ Intel System Studio IDE, chọn Tools > VTune Profiler > Chạy VTune Profiler. Thao tác này đặt tất cả các biến môi trường phù hợp và khởi chạy giao diện độc lập của sản phẩm.
- Khi GUI mở ra, nhấp vào DỰ ÁN MỚI trong màn hình Chào mừng.
- Trong hộp thoại Tạo dự án, chỉ định tên và vị trí dự án.
- Nhấp vào Tạo dự án.
Độc lập (Dòng lệnh)
- Chạy lệnh vtune.
Bước 2: Định cấu hình và Chạy Phân tích
Sau khi tạo một dự án mới, cửa sổ Cấu hình Phân tích sẽ mở ra với các giá trị mặc định sau:
- Trong phần Khởi chạy ứng dụng, duyệt đến vị trí của ứng dụng của bạn.
- Nhấp vào Bắt đầu để chạy Ảnh chụp nhanh hiệu suất trên ứng dụng của bạn. Phân tích này trình bày một cách tổng quát vềview các vấn đề ảnh hưởng đến hiệu suất của ứng dụng của bạn trên hệ thống đích.
Bước 3: View và Phân tích Dữ liệu Hiệu suất
Khi việc thu thập dữ liệu hoàn tất, VTune Profiler hiển thị kết quả phân tích trong cửa sổ Tóm tắt. Ở đây, bạn thấy một hiệu suất trênview của ứng dụng của bạn.
Cái trênview thường bao gồm một số chỉ số cùng với mô tả của chúng.
- A Mở rộng từng số liệu để biết thông tin chi tiết về các yếu tố góp phần.
- B Số liệu được gắn cờ cho biết giá trị nằm ngoài phạm vi hoạt động bình thường/được chấp nhận. Sử dụng mẹo công cụ để hiểu cách cải thiện chỉ số được gắn cờ.
- C Xem hướng dẫn về các phân tích khác mà bạn nên cân nhắc chạy tiếp theo. Cây phân tích nêu bật những khuyến nghị này.
Các bước tiếp theo
Ảnh chụp hiệu suất là một điểm khởi đầu tốt để có được đánh giá tổng thể về hiệu suất của ứng dụng với VTune Profiler. Tiếp theo, hãy kiểm tra xem thuật toán của bạn có cần điều chỉnh không.
- Thực hiện theo hướng dẫn để phân tích các tắc nghẽn hiệu suất phổ biến.
- Sau khi thuật toán của bạn được điều chỉnh tốt, hãy chạy lại Ảnh chụp nhanh hiệu suất để hiệu chỉnh kết quả và xác định các cải tiến hiệu suất tiềm năng trong các lĩnh vực khác.
Xem thêm
Khám phá kiến trúc vi mô
VTune Profiler Tham quan Trợ giúp
Example: Chuyên nghiệpfile một ứng dụng OpenMP trên Linux*
Sử dụng Intel VTune Profiler trên máy Linux thành chuyên nghiệpfile BẰNGample iso3dfd_omp_offload Ứng dụng OpenMP được giảm tải trên GPU Intel. Tìm hiểu cách chạy phân tích GPU và kiểm tra kết quả.
Điều kiện tiên quyết
- Đảm bảo hệ thống của bạn đang chạy Linux* OS kernel 4.14 hoặc phiên bản mới hơn.
- Sử dụng một trong các phiên bản Đồ họa bộ xử lý Intel sau:
- Thế hệ 8
- Thế hệ 9
- Thế hệ 11
- Hệ thống của bạn sẽ chạy trên một trong những bộ xử lý Intel sau:
- Bộ xử lý Intel® Core™ i7 thế hệ thứ 7 (tên mã Kaby Lake)
- Bộ xử lý Intel® Core™ i8 thế hệ thứ 7 (tên mã Coffee Lake)
- Bộ xử lý Intel® Core™ i10 thế hệ thứ 7 (tên mã Ice Lake)
- Đối với GUI Linux, hãy sử dụng:
- GTK+ phiên bản 2.10 trở lên (khuyên dùng phiên bản 2.18 trở lên)
- Phiên bản Pango 1.14 trở lên
- X.Org phiên bản 1.0 trở lên (khuyên dùng phiên bản 1.7 trở lên)
- Cài đặt Intel VTune Profiler từ một trong những nguồn sau:
- Tải xuống sản phẩm độc lập
- Bộ công cụ cơ sở Intel® oneAPI
- Bộ công cụ nâng cấp hệ thống Intel®
- Tải xuống Bộ công cụ HPC Intel® oneAPI chứa Trình biên dịch Intel® oneAPI DPC++/C++(icx/icpx) mà bạn cần để nâng caofile Các ứng dụng OpenMP.
- Thiết lập các biến môi trường. Thực thi tập lệnh vars.sh.
- Thiết lập hệ thống của bạn để phân tích GPU.
Xây dựng và biên dịch ứng dụng giảm tải OpenMP
- Tải xuống iso3dfd_omp_offload OpenMP Offload samplà.
- mở cửa cho sampthư mục le.
cd < sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - Biên dịch ứng dụng OpenMP Offload.
bản dựng mkdir;
cmake -DVERIFY_RESULTS=0 ..
làm -j
Điều này tạo ra một tệp thực thi src/iso3dfd.
Để xóa chương trình, gõ:
làm sạch
Điều này loại bỏ tệp thực thi và đối tượng files mà bạn đã tạo bằng lệnh make.
Chạy Phân tích GPU trên Ứng dụng Giảm tải OpenMP
Bây giờ bạn đã sẵn sàng chạy Phân tích giảm tải GPU trên ứng dụng OpenMP mà bạn đã biên dịch.
- Mở VTune Profiler và nhấp vào Dự án mới để tạo dự án.
- Trên trang chào mừng, nhấp vào Định cấu hình phân tích để thiết lập phân tích của bạn.
- Chọn các cài đặt này cho phân tích của bạn.
- Trong ngăn WHERE, chọn Máy chủ lưu trữ cục bộ.
- Trong ngăn CÁI GÌ, hãy chọn Khởi chạy Ứng dụng và chỉ định tệp nhị phân iso3dfd_omp_offload làm ứng dụng chuyên nghiệpfile.
- Trong ngăn CÁCH, chọn loại phân tích Giảm tải GPU từ nhóm Máy gia tốc trong Cây phân tích.
- Nhấp vào nút Bắt đầu để chạy phân tích.
VTune Profiler thu thập dữ liệu và hiển thị kết quả phân tích trong GPU Offload viewđiểm.
- Trong cửa sổ Tóm tắt, hãy xem số liệu thống kê về việc sử dụng tài nguyên CPU và GPU. Sử dụng dữ liệu này để xác định xem ứng dụng của bạn có:
- giới hạn GPU
- Ràng buộc CPU
- Sử dụng tài nguyên điện toán của hệ thống của bạn không hiệu quả
- Sử dụng thông tin trong cửa sổ Nền tảng để xem các số liệu cơ bản về CPU và GPU.
- Điều tra các tác vụ tính toán cụ thể trong cửa sổ Đồ họa.
Để phân tích sâu hơn, hãy xem công thức liên quan trong VTune Profiler Sổ tay phân tích hiệu suất. Bạn cũng có thể tiếp tục lập hồ sơ của mình bằng phân tích GPU Compute/Media Hotspots.
Example: Chuyên nghiệpfile một ứng dụng SYCL* trên Linux*
Sử dụng VTune Profiler với nhưample matrix_multiply SYCL để nhanh chóng làm quen với sản phẩm và số liệu thống kê được thu thập cho các ứng dụng gắn với GPU.
Điều kiện tiên quyết
- Cài đặt VTune Profiler và Trình biên dịch Intel® oneAPI DPC++/C++ từ Bộ công cụ cơ sở Intel® oneAPI hoặc Bộ công cụ khởi động hệ thống Intel®.
- Thiết lập các biến môi trường bằng cách thực thi tập lệnh vars.sh.
- Thiết lập hệ thống của bạn để phân tích GPU.
Xây dựng ứng dụng ma trận
Tải xuống mã matrix_multiply_vtune sample cho bộ công cụ oneAPI của Intel. cái này chứa samptập tin mà bạn có thể sử dụng để xây dựng và chuyên nghiệpfile một ứng dụng SYCL.
để chuyên nghiệpfile ứng dụng SYCL, hãy đảm bảo biên dịch mã bằng các tùy chọn -gline-tables-only và -fdebug-info-for-profiling Trình biên dịch Intel oneAPI DPC++.
Để biên dịch này sampứng dụng le, hãy làm như sau:
- Đi đến sampthư mục le.
cd < sample_dir/VtuneProfiler/matrix_multiply> - nhân.cpp file trong thư mục src chứa một số phiên bản của phép nhân ma trận. Chọn một phiên bản bằng cách chỉnh sửa dòng #define MULTIPLY tương ứng trong multi.h.
- Xây dựng ứng dụng bằng Make hiện cófile:
cmake .
làm
Điều này sẽ tạo ra một tệp thực thi matrix.icpx -fsycl.
Để xóa chương trình, gõ:
làm sạch
Điều này loại bỏ tệp thực thi và đối tượng files được tạo bởi lệnh make.
Chạy phân tích GPU
Chạy phân tích GPU trên Matrix samplà.
- Khởi chạy VTune Profiler bằng lệnh vtune-gui.
- Nhấp vào Dự án mới từ trang Chào mừng.
- Chỉ định tên và vị trí cho s của bạnampcủa dự án và nhấp vào Tạo dự án.
- Trong ngăn CÁI GÌ, duyệt đến matrix.icpx-fsycl file.
- Trong ngăn CÁCH, nhấp vào
Duyệt nút và chọn phân tích GPU Compute/Media Hotspots từ nhóm Máy gia tốc trong Cây phân tích.
- Nhấp vào nút Bắt đầu ở dưới cùng để khởi chạy phân tích với các tùy chọn được chọn trước.
Chạy Phân tích GPU từ Dòng lệnh:
- Chuẩn bị hệ thống để chạy phân tích GPU. Xem Thiết lập hệ thống để phân tích GPU.
- Thiết lập các biến môi trường cho các công cụ phần mềm của Intel:
nguồn $ONEAPI_ROOT/setvars.sh - Chạy phân tích GPU Compute/Media Hotspots:
vtune -collect gpu-hotspots -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
Để xem báo cáo tóm tắt, gõ:
vtune -tóm tắt báo cáo -r ./result_gpu-hotspots
VTune Profiler thu thập dữ liệu và hiển thị kết quả phân tích trong GPU Compute/Media Hotspots viewđiểm. Trong cửa sổ Tóm tắt, hãy xem số liệu thống kê về mức sử dụng tài nguyên CPU và GPU để biết liệu ứng dụng của bạn có bị ràng buộc bởi GPU hay không. Chuyển sang cửa sổ Đồ họa để xem các chỉ số CPU và GPU cơ bản thể hiện việc thực thi mã theo thời gian.
Bắt đầu với Intel® VTune™ Profiler cho macOS*
Sử dụng VTune Profiler trên hệ thống macOS để thực hiện phân tích mục tiêu từ xa trên hệ thống không phải macOS (chỉ dành cho Linux* hoặc Android*).
Bạn không thể sử dụng VTune Profiler trong môi trường macOS cho các mục đích sau:
- Chuyên nghiệpfile hệ thống macOS mà nó được cài đặt.
- Thu thập dữ liệu trên hệ thống macOS từ xa.
Để phân tích hiệu suất của mục tiêu Linux* hoặc Android* từ xa từ máy chủ macOS, hãy thực hiện một trong các bước sau:
- Chạy một VTune Profilephân tích r trên hệ thống macOS với một hệ thống từ xa được chỉ định làm mục tiêu. Khi bắt đầu phân tích, VTune Profiler kết nối với hệ thống từ xa để thu thập dữ liệu, sau đó đưa kết quả trở lại máy chủ macOS để viewđang.
- Chạy phân tích cục bộ trên hệ thống đích và sao chép kết quả vào hệ thống macOS để viewtham gia VTune Profiler.
Các bước trong tài liệu này giả sử hệ thống đích Linux từ xa và thu thập dữ liệu hiệu suất bằng quyền truy cập SSH từ VTune Profiler trên hệ thống máy chủ macOS.
Trước khi bạn bắt đầu
- Cài đặt Intel® VTune™ Profiler trên hệ thống macOS* của bạn.
- Xây dựng ứng dụng Linux của bạn với thông tin biểu tượng và ở chế độ Phát hành với tất cả các tối ưu hóa được bật. Để biết thông tin chi tiết, hãy xem cài đặt trình biên dịch trong VTune Profiler giúp đỡ.
- Thiết lập quyền truy cập SSH từ hệ thống macOS máy chủ đến hệ thống Linux mục tiêu để hoạt động ở chế độ không cần mật khẩu.
Bước 1: Khởi động VTune Profiler
- Khởi chạy VTune Profiler bằng lệnh vtune-gui.
Theo mặc định, các là /opt/intel/oneapi/. - Khi GUI mở ra, nhấp vào DỰ ÁN MỚI trong màn hình Chào mừng.
- Trong hộp thoại Tạo dự án, chỉ định tên và vị trí dự án.
- Nhấp vào Tạo dự án.
Bước 2: Định cấu hình và Chạy Phân tích
Sau khi bạn tạo một dự án mới, cửa sổ Cấu hình Phân tích sẽ mở ra với loại phân tích Ảnh chụp nhanh Hiệu suất.
Phân tích này trình bày một hơnview các vấn đề ảnh hưởng đến hiệu suất của ứng dụng của bạn trên hệ thống đích.
- Trong khung WHERE, chọn Remote Linux (SSH) và chỉ định hệ thống Linux đích bằng tên người dùng@ tên máy chủ[:port].
VTune Profiler kết nối với hệ thống Linux và cài đặt gói mục tiêu. - Trong ngăn CÁI GÌ, cung cấp đường dẫn đến ứng dụng của bạn trên hệ thống Linux đích.
- Nhấp vào nút Bắt đầu để chạy Ảnh chụp nhanh Hiệu suất trên ứng dụng.
Bước 3: View và Phân tích Dữ liệu Hiệu suất
Khi việc thu thập dữ liệu hoàn tất, VTune Profiler hiển thị kết quả phân tích trên hệ thống macOS. Bắt đầu phân tích của bạn trong cửa sổ Tóm tắt. Ở đây, bạn thấy một hiệu suất trênview của ứng dụng của bạn.
Cái trênview thường bao gồm một số chỉ số cùng với mô tả của chúng.
- A Mở rộng từng số liệu để biết thông tin chi tiết về các yếu tố góp phần.
- B Số liệu được gắn cờ cho biết giá trị nằm ngoài phạm vi hoạt động bình thường/được chấp nhận. Sử dụng mẹo công cụ để hiểu cách cải thiện chỉ số được gắn cờ.
- C Xem hướng dẫn về các phân tích khác mà bạn nên cân nhắc chạy tiếp theo. Cây phân tích nêu bật những khuyến nghị này.
Các bước tiếp theo
Ảnh chụp hiệu suất là một điểm khởi đầu tốt để có được đánh giá tổng thể về hiệu suất của ứng dụng với VTune Profiler.
Tiếp theo, hãy kiểm tra xem thuật toán của bạn có cần điều chỉnh không.
- Chạy Phân tích điểm nóng trên ứng dụng của bạn.
- Thực hiện theo hướng dẫn Hotspots. Tìm hiểu các kỹ thuật để tận dụng tối đa phân tích Điểm phát sóng của bạn.
- Sau khi thuật toán của bạn được điều chỉnh tốt, hãy chạy lại Ảnh chụp nhanh hiệu suất để hiệu chỉnh kết quả và xác định các cải tiến hiệu suất tiềm năng trong các lĩnh vực khác.
Xem thêm
Khám phá kiến trúc vi mô
VTune Profiler Tham quan Trợ giúp
Tìm hiểu thêm
Mô tả tài liệu
- Hướng dẫn sử dụng
Hướng dẫn sử dụng là tài liệu chính cho VTune Profiler.
GHI CHÚ
Bạn cũng có thể tải xuống phiên bản ngoại tuyến của VTune Profiler tài liệu. - Đào tạo trực tuyến
Trang web đào tạo trực tuyến là một nguồn tài nguyên tuyệt vời để tìm hiểu những kiến thức cơ bản về VTune Profiler với hướng dẫn Bắt đầu, video, hướng dẫn, webinars, và các bài báo kỹ thuật. - Sách dạy nấu ăn
Sách hướng dẫn phân tích hiệu suất chứa các công thức để xác định và giải quyết các vấn đề hiệu suất phổ biến bằng cách sử dụng các loại phân tích trong VTune Profiler. - Hướng Dẫn Cài Đặt Windows | Linux | máy chủ macOS
Hướng dẫn cài đặt chứa các hướng dẫn cài đặt cơ bản cho VTune Profiler và hướng dẫn cấu hình sau khi cài đặt cho các trình điều khiển và trình thu thập khác nhau. - Hướng dẫn
VTune Profiler hướng dẫn hướng dẫn người dùng mới thông qua các tính năng cơ bản với một đoạn ngắn sampứng dụng le. - Ghi chú phát hành
Tìm thông tin về phiên bản VTune Pro mới nhấtfiler, bao gồm mô tả toàn diện về các tính năng mới, yêu cầu hệ thống và các vấn đề kỹ thuật đã được giải quyết.
Đối với phiên bản độc lập và bộ công cụ của VTune Profiler, hiểu Yêu cầu hệ thống hiện tại.
Thông báo và Tuyên bố từ chối
Các công nghệ của Intel có thể yêu cầu kích hoạt phần cứng, phần mềm hoặc dịch vụ.
Không có sản phẩm hoặc thành phần nào có thể an toàn tuyệt đối.
Chi phí và kết quả của bạn có thể khác nhau.
© Tập đoàn Intel. Intel, logo Intel và các nhãn hiệu khác của Intel là nhãn hiệu của Intel Corporation hoặc các công ty con của Intel. Các tên và thương hiệu khác có thể được coi là tài sản của người khác.
Intel, logo Intel, Intel Atom, Intel Core, Intel Xeon Phi, VTune và Xeon là các thương hiệu của Tập đoàn Intel tại Hoa Kỳ và/hoặc các quốc gia khác.
*Các tên và thương hiệu khác có thể được coi là tài sản của người khác.
Microsoft, Windows và logo Windows là các nhãn hiệu hoặc nhãn hiệu đã đăng ký của Tập đoàn Microsoft tại Hoa Kỳ và/hoặc các quốc gia khác.
Java là nhãn hiệu đã đăng ký của Oracle và / hoặc các chi nhánh của Oracle.
OpenCL và logo OpenCL là thương hiệu của Apple Inc. được Khronos sử dụng với sự cho phép.
Các công nghệ của Intel có thể yêu cầu kích hoạt phần cứng, phần mềm hoặc dịch vụ.
Không có sản phẩm hoặc thành phần nào có thể an toàn tuyệt đối.
Chi phí và kết quả của bạn có thể khác nhau.
© Tập đoàn Intel. Intel, logo Intel và các nhãn hiệu khác của Intel là nhãn hiệu của Intel Corporation hoặc các công ty con của Intel. Các tên và thương hiệu khác có thể được coi là tài sản của người khác.
Intel, logo Intel, Intel Atom, Intel Core, Intel Xeon Phi, VTune và Xeon là các thương hiệu của Tập đoàn Intel tại Hoa Kỳ và/hoặc các quốc gia khác.
*Các tên và thương hiệu khác có thể được coi là tài sản của người khác.
Microsoft, Windows và logo Windows là các nhãn hiệu hoặc nhãn hiệu đã đăng ký của Tập đoàn Microsoft tại Hoa Kỳ và/hoặc các quốc gia khác.
Java là nhãn hiệu đã đăng ký của Oracle và / hoặc các chi nhánh của Oracle.
OpenCL và logo OpenCL là thương hiệu của Apple Inc. được Khronos sử dụng với sự cho phép.
Tài liệu / Tài nguyên
![]() |
intel Bắt đầu với VTune Profiler [tập tin pdf] Hướng dẫn sử dụng Bắt đầu với VTune Profiler, Bắt đầu, với VTune Profiler, VTune Profiler |