intel Ξεκινήστε με το VTune Profiler
Ξεκινήστε με το Intel® VTune™ Profiler
Χρησιμοποιήστε το Intel VTune Profiler για ανάλυση τοπικών και απομακρυσμένων συστημάτων στόχων από κεντρικούς υπολογιστές Windows*, macOS* και Linux*. Βελτιώστε την απόδοση της εφαρμογής και του συστήματος μέσω αυτών των λειτουργιών:
- Αναλύστε τις επιλογές αλγορίθμων.
- Βρείτε σημεία συμφόρησης σειριακού και παράλληλου κώδικα.
- Κατανοήστε πού και πώς η εφαρμογή σας μπορεί να επωφεληθεί από τους διαθέσιμους πόρους υλικού.
- Επιταχύνετε την εκτέλεση της αίτησής σας.
Κατεβάστε το Intel VTune Profiler στο σύστημά σας με έναν από τους παρακάτω τρόπους: - Κατεβάστε την αυτόνομη έκδοση.
- Αποκτήστε το Intel VTune Profiler ως μέρος του Intel® oneAPI Base Toolkit.
Δείτε το VTune Profiler εκπαιδευτική σελίδα για βίντεο, webinars και περισσότερο υλικό που θα σας βοηθήσει να ξεκινήσετε.
ΣΗΜΕΙΩΜΑ
Τεκμηρίωση για εκδόσεις του Intel® VTune™ Profiler πριν από την κυκλοφορία του 2021 είναι διαθέσιμα μόνο για λήψη. Για μια λίστα με τις διαθέσιμες λήψεις τεκμηρίωσης ανά έκδοση προϊόντος, δείτε αυτές τις σελίδες:
- Λήψη τεκμηρίωσης για το Intel Parallel Studio XE
- Λήψη τεκμηρίωσης για το Intel System Studio
Κατανοήστε τη ροή εργασίας
Χρησιμοποιήστε το Intel VTune Profiler σε profile μια εφαρμογή και ανάλυση αποτελεσμάτων για βελτιώσεις απόδοσης.
Η γενική ροή εργασίας περιλαμβάνει τα εξής βήματα:
Επιλέξτε το σύστημα κεντρικού υπολογιστή σας για να ξεκινήσετε
Μάθετε περισσότερα σχετικά με τις ροές εργασίας ειδικά για το σύστημα για Windows*, Linux* ή macOS*.
Ξεκινήστε με το Intel® VTune™ Profiler για λειτουργικό σύστημα Windows*
Πριν ξεκινήσετε
- Εγκαταστήστε το Intel® VTune™ Profiler στο σύστημά σας Windows*.
- Δημιουργήστε την εφαρμογή σας με πληροφορίες συμβόλων και σε λειτουργία έκδοσης με όλες τις βελτιστοποιήσεις ενεργοποιημένες. Για λεπτομερείς πληροφορίες σχετικά με τις ρυθμίσεις του μεταγλωττιστή, ανατρέξτε στο VTune Profiler ηλεκτρονικός οδηγός χρήστη.
Μπορείτε επίσης να χρησιμοποιήσετε τον πίνακα sampη εφαρμογή είναι διαθέσιμη στο \VTune\Samples\matrix. Μπορείτε να δείτε τα αντίστοιχα sampκαταλήγει σε \VTune\Projects\sample (μήτρα). - Ρύθμιση των μεταβλητών περιβάλλοντος: Εκτελέστε το Σενάριο \setvars.bat.
Από προεπιλογή, το για τα στοιχεία του oneAPI είναι Πρόγραμμα Files (x86)\Intel\oneAPI.
ΣΗΜΕΙΩΜΑ Δεν χρειάζεται να εκτελέσετε το setvars.bat όταν χρησιμοποιείτε το Intel® VTune™ Profiler εντός του Microsoft* Visual Studio*.
Βήμα 1: Εκκινήστε το Intel® VTune™ Profiler
Εκκινήστε το Intel VTune Profiler μέσω ενός από αυτούς τους τρόπους και δημιουργήστε ένα έργο. Ένα έργο είναι ένα κοντέινερ για την εφαρμογή που θέλετε να αναλύσετε, τον τύπο της ανάλυσης και τα αποτελέσματα συλλογής δεδομένων.
Πηγή / Εκκίνηση VTune Profiler
Αυτόνομο (GUI)
- Εκτελέστε την εντολή vtune-gui ή εκτελέστε το Intel® VTune™ Profiler από το μενού Έναρξη.
- Όταν ανοίξει το GUI, κάντε κλικ στην οθόνη υποδοχής.
- Στο παράθυρο διαλόγου Δημιουργία έργου, καθορίστε το όνομα και τη θέση του έργου.
- Κάντε κλικ στην επιλογή Δημιουργία έργου.
Αυτόνομο (γραμμή εντολών)
Εκτελέστε την εντολή vtune.
Microsoft* Visual Studio* IDE
Ανοίξτε τη λύση σας στο Visual Studio. Το VTune ProfileΗ γραμμή εργαλείων r ενεργοποιείται αυτόματα και το έργο του Visual Studio ορίζεται ως στόχος ανάλυσης.
ΣΗΜΕΙΩΜΑ
Δεν χρειάζεται να δημιουργήσετε έργο όταν εκτελείτε το Intel® VTune™ Profiler από τη γραμμή εντολών ή μέσα στο Microsoft* Visual Studio.
Βήμα 2: Διαμόρφωση και εκτέλεση ανάλυσης
Μετά τη δημιουργία ενός νέου έργου, ανοίγει το παράθυρο Configure Analysis με αυτές τις προεπιλεγμένες τιμές:
- Στην ενότητα Εκκίνηση εφαρμογής, περιηγηθείτε στη θέση του εκτελέσιμου αρχείου της εφαρμογής σας file.
- Κάντε κλικ στο Start για να εκτελέσετε το Performance Snapshot στην εφαρμογή σας. Αυτή η ανάλυση παρουσιάζει ένα γενικό overview ζητημάτων που επηρεάζουν την απόδοση της εφαρμογής σας στο σύστημα προορισμού.
Βήμα 3: View και Ανάλυση δεδομένων απόδοσης
Όταν ολοκληρωθεί η συλλογή δεδομένων, VTune ProfileΤο r εμφανίζει τα αποτελέσματα της ανάλυσης στο παράθυρο Σύνοψη. Εδώ, βλέπετε μια παράσταση να τελειώνειview της αίτησής σας.
Το πάνωview περιλαμβάνει συνήθως πολλές μετρήσεις μαζί με τις περιγραφές τους.
- A Αναπτύξτε κάθε μέτρηση για λεπτομερείς πληροφορίες σχετικά με τους παράγοντες που συμβάλλουν.
- B Μια επισημασμένη μέτρηση υποδεικνύει μια τιμή εκτός αποδεκτού/κανονικού εύρους λειτουργίας. Χρησιμοποιήστε συμβουλές εργαλείων για να κατανοήσετε πώς να βελτιώσετε μια επισημασμένη μέτρηση.
- C Δείτε οδηγίες για άλλες αναλύσεις που θα πρέπει να εξετάσετε το ενδεχόμενο εκτέλεσης στη συνέχεια. Το δέντρο ανάλυσης επισημαίνει αυτές τις συστάσεις.
Επόμενα Βήματα
Το Performance Snapshot είναι ένα καλό σημείο εκκίνησης για να λάβετε μια συνολική αξιολόγηση της απόδοσης της εφαρμογής με το VTune Profiler. Στη συνέχεια, ελέγξτε εάν ο αλγόριθμός σας απαιτεί συντονισμό.
- Ακολουθήστε ένα σεμινάριο για να αναλύσετε κοινά σημεία συμφόρησης απόδοσης.
- Όταν ο αλγόριθμός σας είναι καλά συντονισμένος, εκτελέστε ξανά το Performance Snapshot για να βαθμονομήσετε τα αποτελέσματα και να εντοπίσετε πιθανές βελτιώσεις απόδοσης σε άλλους τομείς.
Δείτε επίσης
Εξερεύνηση μικροαρχιτεκτονικής
VTune Profiler Περιήγηση βοήθειας
Example: Profile μια εφαρμογή OpenMP* στα Windows*
Χρησιμοποιήστε το Intel VTune Profiler σε ένα μηχάνημα με Windows σε profile ωςample iso3dfd_omp_offload Η εφαρμογή OpenMP μεταφορτώθηκε σε μια GPU Intel. Μάθετε πώς να εκτελείτε μια ανάλυση GPU και να εξετάσετε τα αποτελέσματα.
Προαπαιτούμενα
- Βεβαιωθείτε ότι το σύστημά σας εκτελεί Microsoft* Windows 10 ή νεότερη έκδοση.
- Χρησιμοποιήστε μία από αυτές τις εκδόσεις του Intel Processor Graphics:
- Γεν. 8
- Γεν. 9
- Γεν. 11
- Το σύστημά σας θα πρέπει να λειτουργεί σε έναν από αυτούς τους επεξεργαστές Intel:
- Επεξεργαστές Intel® Core™ i7 7ης γενιάς (κωδικό όνομα Kaby Lake)
- Επεξεργαστές Intel® Core™ i8 7ης γενιάς (κωδική ονομασία Coffee Lake)
- Επεξεργαστές Intel® Core™ i10 7ης γενιάς (κωδική ονομασία Ice Lake)
- Εγκαταστήστε το Intel VTune Profiler από μία από αυτές τις πηγές:
- Λήψη αυτόνομου προϊόντος
- Intel® oneAPI Base Toolkit
- Εργαλειοθήκη Intel® System Bring-up
- Κάντε λήψη του Intel® oneAPI HPC Toolkit που περιέχει τον μεταγλωττιστή Intel® oneAPI DPC++/C++ (icx/icpx) που πρέπει να επεξεργαστείτεfile Εφαρμογές OpenMP.
- Ρύθμιση μεταβλητών περιβάλλοντος. Εκτελέστε το σενάριο vars.bat που βρίσκεται στο \env κατάλογος.
- Ρυθμίστε το σύστημά σας για ανάλυση GPU.
ΣΗΜΕΙΩΜΑ
Για να εγκαταστήσετε το Intel VTune Profiler στο περιβάλλον Microsoft* Visual Studio, ανατρέξτε στο VTune Profiler Οδηγός χρήσης.
Δημιουργήστε και μεταγλωττίστε την εφαρμογή εκφόρτωσης OpenMP
- Κατεβάστε το iso3dfd_omp_offload OpenMP Offload sample.
- Ανοιχτό στο sample κατάλογο.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - Μεταγλωττίστε την εφαρμογή OpenMP Offload.
mkdir κατασκευή
κατασκευή cd
icx /std:c++17 /EHsc /Qiopenmp /I../include\ /Qopenmp-targets:
spir64 /DUSE_BASELINE /DEBUG ..\src\iso3dfd.cpp ..\src\iso3dfd_verify.cpp ..\src\utils.cpp
Εκτελέστε μια ανάλυση GPU στην εφαρμογή εκφόρτωσης OpenMP
Είστε πλέον έτοιμοι να εκτελέσετε την ανάλυση εκφόρτωσης GPU στην εφαρμογή OpenMP που μεταγλωττίσατε.
- Ανοίξτε το VTune Profiler και κάντε κλικ στο Νέο Έργο για να δημιουργήσετε ένα έργο.
- Στη σελίδα καλωσορίσματος, κάντε κλικ στο Configure Analysis για να ρυθμίσετε την ανάλυσή σας.
- Επιλέξτε αυτές τις ρυθμίσεις για την ανάλυσή σας.
- Στο παράθυρο WHERE, επιλέξτε Τοπικός κεντρικός υπολογιστής.
- Στο παράθυρο WHAT, επιλέξτε Εκκίνηση εφαρμογής και καθορίστε το δυαδικό αρχείο iso3dfd_omp_offload ως την εφαρμογή για profile.
- Στο παράθυρο HOW, επιλέξτε τον τύπο ανάλυσης εκτόνωσης GPU από την ομάδα Accelerators στη Δέντρο ανάλυσης.
- Κάντε κλικ στο κουμπί Έναρξη για να εκτελέσετε την ανάλυση.
VTune Profiler συλλέγει δεδομένα και εμφανίζει αποτελέσματα ανάλυσης στο GPU Offload viewσημείο.
- Στο παράθυρο Σύνοψη, δείτε στατιστικά στοιχεία σχετικά με τη χρήση πόρων CPU και GPU. Χρησιμοποιήστε αυτά τα δεδομένα για να προσδιορίσετε εάν η αίτησή σας είναι:
- συνδεδεμένο με GPU
- συνδεδεμένο με CPU
- Χρησιμοποιώντας τους υπολογιστικούς πόρους του συστήματός σας αναποτελεσματική
- Χρησιμοποιήστε τις πληροφορίες στο παράθυρο της πλατφόρμας για να δείτε βασικές μετρήσεις CPU και GPU.
- Διερευνήστε συγκεκριμένες εργασίες υπολογιστών στο παράθυρο Γραφικά.
Για μια βαθύτερη ανάλυση, δείτε μια σχετική συνταγή στο VTune Profiler Βιβλίο μαγειρικής ανάλυσης απόδοσης. Μπορείτε επίσης να συνεχίσετε το προφίλ σας με την ανάλυση GPU Compute/Media Hotspots.
Example: Profile μια εφαρμογή SYCL* στα Windows*
Profile ωςample matrix_multiply SYCL εφαρμογή με Intel® VTune™ Profiler. Εξοικειωθείτε με το προϊόν και κατανοήστε τα στατιστικά στοιχεία που συλλέγονται για εφαρμογές που συνδέονται με GPU.
Προαπαιτούμενα
- Βεβαιωθείτε ότι έχετε εγκατεστημένο το Microsoft* Visual Studio (έκδοση 2017 ή νεότερη έκδοση) στο σύστημά σας.
- Εγκαταστήστε το Intel VTune Profiler από το Intel® OneAPI Base Toolkit ή το Intel® System Bring-up Toolkit. Αυτές οι εργαλειοθήκες περιέχουν τον μεταγλωττιστή Intel® oneAPI DPC++/C++ Compiler(icpx -fsycl) που απαιτείται για τη διαδικασία δημιουργίας προφίλ.
- Ρύθμιση μεταβλητών περιβάλλοντος. Εκτελέστε το σενάριο vars.bat που βρίσκεται στο \env κατάλογος.
- Βεβαιωθείτε ότι ο μεταγλωττιστής Intel oneAPI DPC++ (εγκατεστημένος με το κιτ εργαλείων Intel oneAPI Base) είναι ενσωματωμένος στο Microsoft Visual Studio.
- Μεταγλωττίστε τον κώδικα χρησιμοποιώντας τις επιλογές -gline-tables-only και -fdebug-info-for-profiling για τον μεταγλωττιστή Intel oneAPI DPC++.
- Ρυθμίστε το σύστημά σας για ανάλυση GPU.
Για πληροφορίες σχετικά με την εγκατάσταση του Intel VTune Profiler στο περιβάλλον Microsoft* Visual Studio, ανατρέξτε στο VTune Profiler Οδηγός χρήσης.
Δημιουργήστε την εφαρμογή Matrix
Κάντε λήψη του κώδικα matrix_multiply_vtune sample πακέτο για εργαλειοθήκες Intel oneAPI. Αυτό περιέχει το sample που μπορείτε να χρησιμοποιήσετε για να δημιουργήσετε και profile μια εφαρμογή SYCL.
- Ανοίξτε το Microsoft* Visual Studio.
- Κλικ File > Άνοιγμα > Έργο/Λύση. Βρείτε το φάκελο matrix_multiply_vtune και επιλέξτε matrix_multiply.sln.
- Δημιουργήστε αυτήν τη διαμόρφωση (Project > Build).
- Εκτελέστε το πρόγραμμα (Εντοπισμός σφαλμάτων > Έναρξη χωρίς διόρθωση σφαλμάτων).
- Για να επιλέξετε μια έκδοση DPC++ ή με σπείρωμα του sample, χρησιμοποιήστε ορισμούς προεπεξεργαστή.
- Μεταβείτε στις Ιδιότητες έργου > DPC++ > Προεπεξεργαστής > Ορισμός προεπεξεργαστή.
- Ορίστε icpx -fsycl ή USE_THR.
Εκτελέστε την ανάλυση GPU
Εκτελέστε μια ανάλυση GPU στο Matrix sample.
- Από τη γραμμή εργαλείων του Visual Studio, κάντε κλικ στο κουμπί Ρύθμιση παραμέτρων ανάλυσης.
Ανοίγει το παράθυρο Configure Analysis. Από προεπιλογή, κληρονομεί τις ρυθμίσεις του έργου σας VS και καθορίζει το matrix_multiply.exe ως εφαρμογή για profile. - Στο παράθυρο Ρύθμιση παραμέτρων ανάλυσης, κάντε κλικ στο
Κουμπί περιήγησης στο παράθυρο HOW.
- Επιλέξτε τον τύπο ανάλυσης GPU Compute/Media Hotspots από την ομάδα Accelerators στο Analysis Tree.
- Κάντε κλικ στο κουμπί Έναρξη για να ξεκινήσει η ανάλυση με τις προκαθορισμένες επιλογές.
Εκτελέστε την ανάλυση GPU από τη γραμμή εντολών:
- Ανοίξτε το sampο κατάλογος:
<sample_dir>\VtuneProfiler\matrix_multiply_vtune - Σε αυτόν τον κατάλογο, ανοίξτε ένα έργο Visual Studio* file με το όνομα matrix_multiply.sln
- Το πολλαπλασιάζω.cpp file περιέχει πολλές εκδόσεις πολλαπλασιασμού μήτρας. Επιλέξτε μια έκδοση επεξεργάζοντας την αντίστοιχη γραμμή #define MULTIPLY στο multiply.hpp
- Δημιουργήστε ολόκληρο το έργο με μια διαμόρφωση Release.
Αυτό δημιουργεί ένα εκτελέσιμο αρχείο που ονομάζεται matrix_multiply.exe. - Προετοιμάστε το σύστημα για την εκτέλεση ανάλυσης GPU. Δείτε Ρύθμιση συστήματος για ανάλυση GPU.
- Ρυθμίστε το VTune Profiler μεταβλητές περιβάλλοντος εκτελώντας την παρτίδα file: εξαγωγή \env\vars.bat
- Εκτελέστε την εντολή ανάλυσης:
vtune.exe -συλλογή gpu-offload — matrix_multiply.exe
VTune Profiler συλλέγει δεδομένα και εμφανίζει αποτελέσματα ανάλυσης στα σημεία πρόσβασης GPU Compute/Media Hotspot viewσημείο. Στο παράθυρο Σύνοψη, δείτε στατιστικά στοιχεία σχετικά με τη χρήση πόρων CPU και GPU για να καταλάβετε εάν η εφαρμογή σας είναι συνδεδεμένη με GPU. Μεταβείτε στο παράθυρο Γραφικών για να δείτε βασικές μετρήσεις CPU και GPU που αντιπροσωπεύουν την εκτέλεση κώδικα με την πάροδο του χρόνου.
Ξεκινήστε με το Intel® VTune™ Profiler για λειτουργικό σύστημα Linux*
Πριν ξεκινήσετε
- Εγκαταστήστε το Intel® VTune™ Profiler στο σύστημά σας Linux*.
- Δημιουργήστε την εφαρμογή σας με πληροφορίες συμβόλων και σε λειτουργία έκδοσης με όλες τις βελτιστοποιήσεις ενεργοποιημένες. Για λεπτομερείς πληροφορίες σχετικά με τις ρυθμίσεις του μεταγλωττιστή, ανατρέξτε στο VTune Profiler ηλεκτρονικός οδηγός χρήστη.
Μπορείτε επίσης να χρησιμοποιήσετε τον πίνακα sampη εφαρμογή είναι διαθέσιμη στο \μικρόample\matrix. Μπορείτε να δείτε το sampκαταλήγει σε \μικρόample (μήτρα). - Ρύθμιση των μεταβλητών περιβάλλοντος: πηγή /setvars.sh
Από προεπιλογή, το είναι:- $HOME/intel/oneapi/ όταν εγκατασταθεί με δικαιώματα χρήστη.
- /opt/intel/oneapi/ όταν εγκαθίσταται με δικαιώματα root.
Βήμα 1: Ξεκινήστε το VTune Profiler
Εκκινήστε το VTune Profiler μέσω ενός από αυτούς τους τρόπους:
Πηγή / Εκκίνηση VTune Profiler
Αυτόνομο/IDE (GUI)
- Εκτελέστε την εντολή vtunegui. Για να ξεκινήσετε το VTune Profiler από το Intel System Studio IDE, επιλέξτε Εργαλεία > VTune Profiler > Εκκινήστε το VTune Profiler. Αυτό ορίζει όλες τις κατάλληλες μεταβλητές περιβάλλοντος και εκκινεί μια αυτόνομη διεπαφή του προϊόντος.
- Όταν ανοίξει το GUI, κάντε κλικ στο ΝΕΟ ΕΡΓΟ στην οθόνη υποδοχής.
- Στο παράθυρο διαλόγου Δημιουργία έργου, καθορίστε το όνομα και τη θέση του έργου.
- Κάντε κλικ στην επιλογή Δημιουργία έργου.
Αυτόνομο (γραμμή εντολών)
- Εκτελέστε την εντολή vtune.
Βήμα 2: Διαμόρφωση και εκτέλεση ανάλυσης
Μετά τη δημιουργία ενός νέου έργου, ανοίγει το παράθυρο Configure Analysis με αυτές τις προεπιλεγμένες τιμές:
- Στην ενότητα Εκκίνηση εφαρμογής, περιηγηθείτε στη θέση της εφαρμογής σας.
- Κάντε κλικ στο Start για να εκτελέσετε το Performance Snapshot στην εφαρμογή σας. Αυτή η ανάλυση παρουσιάζει ένα γενικό overview ζητημάτων που επηρεάζουν την απόδοση της εφαρμογής σας στο σύστημα προορισμού.
Βήμα 3: View και Ανάλυση δεδομένων απόδοσης
Όταν ολοκληρωθεί η συλλογή δεδομένων, VTune ProfileΤο r εμφανίζει τα αποτελέσματα της ανάλυσης στο παράθυρο Σύνοψη. Εδώ, βλέπετε μια παράσταση να τελειώνειview της αίτησής σας.
Το πάνωview περιλαμβάνει συνήθως πολλές μετρήσεις μαζί με τις περιγραφές τους.
- A Αναπτύξτε κάθε μέτρηση για λεπτομερείς πληροφορίες σχετικά με τους παράγοντες που συμβάλλουν.
- B Μια επισημασμένη μέτρηση υποδεικνύει μια τιμή εκτός αποδεκτού/κανονικού εύρους λειτουργίας. Χρησιμοποιήστε συμβουλές εργαλείων για να κατανοήσετε πώς να βελτιώσετε μια επισημασμένη μέτρηση.
- C Δείτε οδηγίες για άλλες αναλύσεις που θα πρέπει να εξετάσετε το ενδεχόμενο εκτέλεσης στη συνέχεια. Το δέντρο ανάλυσης επισημαίνει αυτές τις συστάσεις.
Επόμενα Βήματα
Το Performance Snapshot είναι ένα καλό σημείο εκκίνησης για να λάβετε μια συνολική αξιολόγηση της απόδοσης της εφαρμογής με το VTune Profiler. Στη συνέχεια, ελέγξτε εάν ο αλγόριθμός σας απαιτεί συντονισμό.
- Ακολουθήστε ένα σεμινάριο για να αναλύσετε κοινά σημεία συμφόρησης απόδοσης.
- Όταν ο αλγόριθμός σας είναι καλά συντονισμένος, εκτελέστε ξανά το Performance Snapshot για να βαθμονομήσετε τα αποτελέσματα και να εντοπίσετε πιθανές βελτιώσεις απόδοσης σε άλλους τομείς.
Δείτε επίσης
Εξερεύνηση μικροαρχιτεκτονικής
VTune Profiler Περιήγηση βοήθειας
Example: Profile μια εφαρμογή OpenMP σε Linux*
Χρησιμοποιήστε το Intel VTune Profiler σε μια μηχανή Linux σε επαγγελματίαfile ωςample iso3dfd_omp_offload Η εφαρμογή OpenMP μεταφορτώθηκε σε μια GPU Intel. Μάθετε πώς να εκτελείτε μια ανάλυση GPU και να εξετάσετε τα αποτελέσματα.
Προαπαιτούμενα
- Βεβαιωθείτε ότι το σύστημά σας εκτελεί πυρήνα Linux* OS 4.14 ή νεότερη έκδοση.
- Χρησιμοποιήστε μία από αυτές τις εκδόσεις του Intel Processor Graphics:
- Γεν. 8
- Γεν. 9
- Γεν. 11
- Το σύστημά σας θα πρέπει να λειτουργεί σε έναν από αυτούς τους επεξεργαστές Intel:
- Επεξεργαστές Intel® Core™ i7 7ης γενιάς (κωδικό όνομα Kaby Lake)
- Επεξεργαστές Intel® Core™ i8 7ης γενιάς (κωδική ονομασία Coffee Lake)
- Επεξεργαστές Intel® Core™ i10 7ης γενιάς (κωδική ονομασία Ice Lake)
- Για το Linux GUI, χρησιμοποιήστε:
- GTK+ έκδοση 2.10 ή νεότερη (συνιστώνται 2.18 και νεότερες εκδόσεις)
- Pango έκδοση 1.14 ή νεότερη
- X.Org έκδοση 1.0 ή νεότερη (συνιστώνται εκδόσεις 1.7 και νεότερες)
- Εγκαταστήστε το Intel VTune Profiler από μία από αυτές τις πηγές:
- Λήψη αυτόνομου προϊόντος
- Intel® oneAPI Base Toolkit
- Εργαλειοθήκη Intel® System Bring-up
- Κάντε λήψη του Intel® oneAPI HPC Toolkit που περιέχει τον μεταγλωττιστή Intel® oneAPI DPC++/C++ (icx/icpx) που πρέπει να επεξεργαστείτεfile Εφαρμογές OpenMP.
- Ρύθμιση μεταβλητών περιβάλλοντος. Εκτελέστε το σενάριο vars.sh.
- Ρυθμίστε το σύστημά σας για ανάλυση GPU.
Δημιουργήστε και μεταγλωττίστε την εφαρμογή εκφόρτωσης OpenMP
- Κατεβάστε το iso3dfd_omp_offload OpenMP Offload sample.
- Ανοιχτό στο sample κατάλογο.
cd <sample_dir>/DirectProgramming/C++/StructuredGrids/iso3dfd_omp_offload - Μεταγλωττίστε την εφαρμογή OpenMP Offload.
mkdir build?
cmake -DVERIFY_RESULTS=0 ..
κάνω -j
Αυτό δημιουργεί ένα εκτελέσιμο αρχείο src/iso3dfd.
Για να διαγράψετε το πρόγραμμα, πληκτρολογήστε:
καθαρίζω
Αυτό αφαιρεί το εκτελέσιμο αρχείο και το αντικείμενο files που δημιουργήσατε με την εντολή make.
Εκτελέστε μια ανάλυση GPU στην εφαρμογή εκφόρτωσης OpenMP
Είστε πλέον έτοιμοι να εκτελέσετε την ανάλυση εκφόρτωσης GPU στην εφαρμογή OpenMP που μεταγλωττίσατε.
- Ανοίξτε το VTune Profiler και κάντε κλικ στο Νέο Έργο για να δημιουργήσετε ένα έργο.
- Στη σελίδα καλωσορίσματος, κάντε κλικ στο Configure Analysis για να ρυθμίσετε την ανάλυσή σας.
- Επιλέξτε αυτές τις ρυθμίσεις για την ανάλυσή σας.
- Στο παράθυρο WHERE, επιλέξτε Τοπικός κεντρικός υπολογιστής.
- Στο παράθυρο WHAT, επιλέξτε Εκκίνηση εφαρμογής και καθορίστε το δυαδικό αρχείο iso3dfd_omp_offload ως την εφαρμογή για profile.
- Στο παράθυρο HOW, επιλέξτε τον τύπο ανάλυσης εκτόνωσης GPU από την ομάδα Accelerators στη Δέντρο ανάλυσης.
- Κάντε κλικ στο κουμπί Έναρξη για να εκτελέσετε την ανάλυση.
VTune Profiler συλλέγει δεδομένα και εμφανίζει αποτελέσματα ανάλυσης στο GPU Offload viewσημείο.
- Στο παράθυρο Σύνοψη, δείτε στατιστικά στοιχεία σχετικά με τη χρήση πόρων CPU και GPU. Χρησιμοποιήστε αυτά τα δεδομένα για να προσδιορίσετε εάν η αίτησή σας είναι:
- συνδεδεμένο με GPU
- συνδεδεμένο με CPU
- Χρησιμοποιώντας τους υπολογιστικούς πόρους του συστήματός σας αναποτελεσματική
- Χρησιμοποιήστε τις πληροφορίες στο παράθυρο της πλατφόρμας για να δείτε βασικές μετρήσεις CPU και GPU.
- Διερευνήστε συγκεκριμένες εργασίες υπολογιστών στο παράθυρο Γραφικά.
Για μια βαθύτερη ανάλυση, δείτε μια σχετική συνταγή στο VTune Profiler Βιβλίο μαγειρικής ανάλυσης απόδοσης. Μπορείτε επίσης να συνεχίσετε το προφίλ σας με την ανάλυση GPU Compute/Media Hotspots.
Example: Profile μια εφαρμογή SYCL* σε Linux*
Χρησιμοποιήστε το VTune Profiler με ωςample matrix_multiply SYCL για να εξοικειωθείτε γρήγορα με το προϊόν και τα στατιστικά στοιχεία που συλλέγονται για εφαρμογές που συνδέονται με GPU.
Προαπαιτούμενα
- Εγκαταστήστε το VTune Profiler και Intel® oneAPI DPC++/C++ Compiler από το Intel® OneAPI Base Toolkit ή το Intel® System Bring-up Toolkit.
- Ρυθμίστε μεταβλητές περιβάλλοντος εκτελώντας το σενάριο vars.sh.
- Ρυθμίστε το σύστημά σας για ανάλυση GPU.
Δημιουργήστε την εφαρμογή Matrix
Κάντε λήψη του κώδικα matrix_multiply_vtune sample πακέτο για εργαλειοθήκες Intel oneAPI. Αυτό περιέχει το sample που μπορείτε να χρησιμοποιήσετε για να δημιουργήσετε και profile μια εφαρμογή SYCL.
Προς επαγγελματίαfile μια εφαρμογή SYCL, φροντίστε να μεταγλωττίσετε τον κώδικα χρησιμοποιώντας τις επιλογές -gline-tables-only και -fdebug-info-for-profiling Intel oneAPI DPC++ Compiler.
Για να συντάξετε αυτό το sampστην εφαρμογή, κάντε τα εξής:
- Πηγαίνετε στο sample κατάλογο.
cd <sample_dir/VtuneProfiler/matrix_multiply> - Το πολλαπλασιάζω.cpp file στον φάκελο src περιέχει πολλές εκδόσεις πολλαπλασιασμού μήτρας. Επιλέξτε μια έκδοση επεξεργάζοντας την αντίστοιχη γραμμή #define MULTIPLY σε multiply.h.
- Δημιουργήστε την εφαρμογή χρησιμοποιώντας την υπάρχουσα Makefile:
cmake .
μάρκα
Αυτό θα πρέπει να δημιουργήσει ένα εκτελέσιμο αρχείο matrix.icpx -fsycl.
Για να διαγράψετε το πρόγραμμα, πληκτρολογήστε:
καθαρίζω
Αυτό αφαιρεί το εκτελέσιμο αρχείο και το αντικείμενο files που δημιουργήθηκαν από την εντολή make.
Εκτελέστε την ανάλυση GPU
Εκτελέστε μια ανάλυση GPU στο Matrix sample.
- Εκκινήστε το VTune Profiler με την εντολή vtune-gui.
- Κάντε κλικ στο Νέο Έργο από τη σελίδα υποδοχής.
- Καθορίστε ένα όνομα και τοποθεσία για το sample project και κάντε κλικ στο Create Project.
- Στο παράθυρο WHAT, περιηγηθείτε στο matrix.icpx-fsycl file.
- Στο παράθυρο ΠΩΣ, κάντε κλικ στο
Κουμπί αναζήτησης και επιλέξτε Ανάλυση GPU Compute/Media Hotspots από την ομάδα Accelerators στο Analysis Tree.
- Κάντε κλικ στο κουμπί Έναρξη στο κάτω μέρος για να ξεκινήσει η ανάλυση με τις προεπιλεγμένες επιλογές.
Εκτελέστε την ανάλυση GPU από τη γραμμή εντολών:
- Προετοιμάστε το σύστημα για την εκτέλεση ανάλυσης GPU. Δείτε Ρύθμιση συστήματος για ανάλυση GPU.
- Ρύθμιση μεταβλητών περιβάλλοντος για εργαλεία λογισμικού Intel:
πηγή $ONEAPI_ROOT/setvars.sh - Εκτελέστε την ανάλυση GPU Compute/Media Hotspots:
vtune -collect gpu-hotspots -r ./result_gpu-hotspots — ./matrix.icpx -fsycl
Για να δείτε τη συνοπτική αναφορά, πληκτρολογήστε:
vtune -σύνοψη αναφοράς -r ./result_gpu-hotspots
VTune Profiler συλλέγει δεδομένα και εμφανίζει αποτελέσματα ανάλυσης στα σημεία πρόσβασης GPU Compute/Media Hotspot viewσημείο. Στο παράθυρο Σύνοψη, δείτε στατιστικά στοιχεία σχετικά με τη χρήση πόρων CPU και GPU για να καταλάβετε εάν η εφαρμογή σας είναι συνδεδεμένη με GPU. Μεταβείτε στο παράθυρο Γραφικών για να δείτε βασικές μετρήσεις CPU και GPU που αντιπροσωπεύουν την εκτέλεση κώδικα με την πάροδο του χρόνου.
Ξεκινήστε με το Intel® VTune™ Profiler για macOS*
Χρησιμοποιήστε το VTune Profiler σε σύστημα macOS για την εκτέλεση απομακρυσμένης ανάλυσης στόχου σε σύστημα που δεν είναι macOS (μόνο Linux* ή Android*) .
Δεν μπορείτε να χρησιμοποιήσετε το VTune Profiler σε περιβάλλον macOS για τους εξής σκοπούς:
- Profile το σύστημα macOS στο οποίο είναι εγκατεστημένο.
- Συλλέξτε δεδομένα σε ένα απομακρυσμένο σύστημα macOS.
Για να αναλύσετε την απόδοση ενός απομακρυσμένου στόχου Linux* ή Android* από τον κεντρικό υπολογιστή macOS, κάντε ένα από τα παρακάτω βήματα:
- Εκτελέστε ένα VTune Profiler ανάλυση στο σύστημα macOS με ένα απομακρυσμένο σύστημα που καθορίζεται ως στόχος. Όταν ξεκινήσει η ανάλυση, το VTune ProfileΤο r συνδέεται στο απομακρυσμένο σύστημα για τη συλλογή δεδομένων και, στη συνέχεια, επαναφέρει τα αποτελέσματα στον κεντρικό υπολογιστή macOS για viewing.
- Εκτελέστε μια ανάλυση στο σύστημα προορισμού τοπικά και αντιγράψτε τα αποτελέσματα σε ένα σύστημα macOS για viewστο VTune Profiler.
Τα βήματα σε αυτό το έγγραφο προϋποθέτουν ένα απομακρυσμένο σύστημα στόχου Linux και συλλέγουν δεδομένα απόδοσης χρησιμοποιώντας πρόσβαση SSH από το VTune Profiler σε ένα σύστημα κεντρικού υπολογιστή macOS.
Πριν ξεκινήσετε
- Εγκαταστήστε το Intel® VTune™ Profiler στο macOS* σύστημά σας.
- Δημιουργήστε την εφαρμογή Linux με πληροφορίες συμβόλων και σε λειτουργία έκδοσης με όλες τις βελτιστοποιήσεις ενεργοποιημένες. Για λεπτομερείς πληροφορίες, ανατρέξτε στις ρυθμίσεις του μεταγλωττιστή στο VTune Profiler βοήθεια.
- Ρυθμίστε την πρόσβαση SSH από το κεντρικό σύστημα macOS στο σύστημα προορισμού Linux για να λειτουργεί σε λειτουργία χωρίς κωδικό πρόσβασης.
Βήμα 1: Ξεκινήστε το VTune Profiler
- Εκκινήστε το VTune Profiler με την εντολή vtune-gui.
Από προεπιλογή, το είναι /opt/intel/oneapi/. - Όταν ανοίξει το GUI, κάντε κλικ στο ΝΕΟ ΕΡΓΟ στην οθόνη υποδοχής.
- Στο παράθυρο διαλόγου Δημιουργία έργου, καθορίστε το όνομα και τη θέση του έργου.
- Κάντε κλικ στην επιλογή Δημιουργία έργου.
Βήμα 2: Διαμόρφωση και εκτέλεση ανάλυσης
Αφού δημιουργήσετε ένα νέο έργο, ανοίγει το παράθυρο Ρύθμιση παραμέτρων ανάλυσης με τον τύπο ανάλυσης στιγμιότυπου απόδοσης.
Αυτή η ανάλυση παρουσιάζει ένα τέλοςview ζητημάτων που επηρεάζουν την απόδοση της εφαρμογής σας στο σύστημα προορισμού.
- Στο παράθυρο WHERE, επιλέξτε Απομακρυσμένο Linux (SSH) και καθορίστε το σύστημα προορισμού Linux χρησιμοποιώντας όνομα χρήστη@ όνομα κεντρικού υπολογιστή[:port].
VTune ProfileΤο r συνδέεται στο σύστημα Linux και εγκαθιστά το πακέτο προορισμού. - Στο παράθυρο WHAT, δώστε τη διαδρομή προς την εφαρμογή σας στο σύστημα Linux-στόχου.
- Κάντε κλικ στο κουμπί Έναρξη για να εκτελέσετε το Στιγμιότυπο απόδοσης στην εφαρμογή.
Βήμα 3: View και Ανάλυση δεδομένων απόδοσης
Όταν ολοκληρωθεί η συλλογή δεδομένων, VTune ProfileΤο r εμφανίζει αποτελέσματα ανάλυσης στο σύστημα macOS. Ξεκινήστε την ανάλυσή σας στο παράθυρο Σύνοψη. Εδώ, βλέπετε μια παράσταση να τελειώνειview της αίτησής σας.
Το πάνωview περιλαμβάνει συνήθως πολλές μετρήσεις μαζί με τις περιγραφές τους.
- A Αναπτύξτε κάθε μέτρηση για λεπτομερείς πληροφορίες σχετικά με τους παράγοντες που συμβάλλουν.
- B Μια επισημασμένη μέτρηση υποδεικνύει μια τιμή εκτός αποδεκτού/κανονικού εύρους λειτουργίας. Χρησιμοποιήστε συμβουλές εργαλείων για να κατανοήσετε πώς να βελτιώσετε μια επισημασμένη μέτρηση.
- C Δείτε οδηγίες για άλλες αναλύσεις που θα πρέπει να εξετάσετε το ενδεχόμενο εκτέλεσης στη συνέχεια. Το δέντρο ανάλυσης επισημαίνει αυτές τις συστάσεις.
Επόμενα Βήματα
Το Performance Snapshot είναι ένα καλό σημείο εκκίνησης για να λάβετε μια συνολική αξιολόγηση της απόδοσης της εφαρμογής με το VTune Profiler.
Στη συνέχεια, ελέγξτε εάν ο αλγόριθμός σας απαιτεί συντονισμό.
- Εκτελέστε Hotspots Analysis στην εφαρμογή σας.
- Ακολουθήστε έναν οδηγό Hotspots. Μάθετε τεχνικές για να αξιοποιήσετε στο έπακρο την ανάλυση Hotspots.
- Όταν ο αλγόριθμός σας είναι καλά συντονισμένος, εκτελέστε ξανά το Performance Snapshot για να βαθμονομήσετε τα αποτελέσματα και να εντοπίσετε πιθανές βελτιώσεις απόδοσης σε άλλους τομείς.
Δείτε επίσης
Εξερεύνηση μικροαρχιτεκτονικής
VTune Profiler Περιήγηση βοήθειας
Μάθετε περισσότερα
Έγγραφο / Περιγραφή
- Οδηγός χρήσης
Ο Οδηγός χρήσης είναι η κύρια τεκμηρίωση για το VTune Profiler.
ΣΗΜΕΙΩΜΑ
Μπορείτε επίσης να κάνετε λήψη μιας έκδοσης εκτός σύνδεσης του VTune Profiler τεκμηρίωση. - Online Εκπαίδευση
Ο διαδικτυακός ιστότοπος εκπαίδευσης είναι μια εξαιρετική πηγή για να μάθετε τα βασικά του VTune Profiler με οδηγούς Ξεκινώντας, βίντεο, σεμινάρια, webinars, και τεχνικά είδη. - Βιβλίο μαγειρικής
Βιβλίο μαγειρικής ανάλυσης απόδοσης που περιέχει συνταγές για τον εντοπισμό και την επίλυση δημοφιλών προβλημάτων απόδοσης χρησιμοποιώντας τύπους ανάλυσης στο VTune Profiler. - Οδηγός εγκατάστασης για Windows | Linux | οικοδεσπότες macOS
Ο Οδηγός εγκατάστασης περιέχει βασικές οδηγίες εγκατάστασης για το VTune Profiler και οδηγίες διαμόρφωσης μετά την εγκατάσταση για τα διάφορα προγράμματα οδήγησης και συλλέκτες. - Φροντιστήρια
VTune ProfileΤα σεμινάρια r καθοδηγούν έναν νέο χρήστη στις βασικές λειτουργίες με ένα σύντομο sampη εφαρμογή. - Σημειώσεις Έκδοσης
Βρείτε πληροφορίες σχετικά με την πιο πρόσφατη έκδοση του VTune Profiler, συμπεριλαμβανομένης μιας περιεκτικής περιγραφής νέων δυνατοτήτων, απαιτήσεων συστήματος και τεχνικών ζητημάτων που επιλύθηκαν.
Για τις αυτόνομες εκδόσεις και τις εργαλειοθήκες του VTune Profiler, κατανοήστε τις τρέχουσες απαιτήσεις συστήματος.
Ειδοποιήσεις και αποποιήσεις ευθυνών
Οι τεχνολογίες Intel ενδέχεται να απαιτούν ενεργοποίηση υλικού, λογισμικού ή υπηρεσίας.
Κανένα προϊόν ή συστατικό δεν μπορεί να είναι απολύτως ασφαλές.
Το κόστος και τα αποτελέσματά σας ενδέχεται να διαφέρουν.
© Intel Corporation. Η ονομασία Intel, το λογότυπο Intel και άλλα σήματα Intel είναι εμπορικά σήματα της Intel Corporation ή των θυγατρικών της. Άλλα ονόματα και επωνυμίες μπορούν να διεκδικηθούν ως ιδιοκτησία άλλων.
Οι επωνυμίες Intel, το λογότυπο Intel, Intel Atom, Intel Core, Intel Xeon Phi, VTune και Xeon είναι εμπορικά σήματα της Intel Corporation στις ΗΠΑ ή/και σε άλλες χώρες.
*Άλλα ονόματα και επωνυμίες μπορούν να διεκδικηθούν ως ιδιοκτησία τρίτων.
Τα Microsoft, Windows και το λογότυπο των Windows είναι εμπορικά σήματα ή σήματα κατατεθέντα της Microsoft Corporation στις Ηνωμένες Πολιτείες ή/και σε άλλες χώρες.
Το Java είναι σήμα κατατεθέν της Oracle ή/και των θυγατρικών της.
Το OpenCL και το λογότυπο OpenCL είναι εμπορικά σήματα της Apple Inc. που χρησιμοποιούνται κατόπιν άδειας από την Khronos.
Οι τεχνολογίες Intel ενδέχεται να απαιτούν ενεργοποίηση υλικού, λογισμικού ή υπηρεσίας.
Κανένα προϊόν ή συστατικό δεν μπορεί να είναι απολύτως ασφαλές.
Το κόστος και τα αποτελέσματά σας ενδέχεται να διαφέρουν.
© Intel Corporation. Η ονομασία Intel, το λογότυπο Intel και άλλα σήματα Intel είναι εμπορικά σήματα της Intel Corporation ή των θυγατρικών της. Άλλα ονόματα και επωνυμίες μπορούν να διεκδικηθούν ως ιδιοκτησία άλλων.
Οι επωνυμίες Intel, το λογότυπο Intel, Intel Atom, Intel Core, Intel Xeon Phi, VTune και Xeon είναι εμπορικά σήματα της Intel Corporation στις ΗΠΑ ή/και σε άλλες χώρες.
*Άλλα ονόματα και επωνυμίες μπορούν να διεκδικηθούν ως ιδιοκτησία τρίτων.
Τα Microsoft, Windows και το λογότυπο των Windows είναι εμπορικά σήματα ή σήματα κατατεθέντα της Microsoft Corporation στις Ηνωμένες Πολιτείες ή/και σε άλλες χώρες.
Το Java είναι σήμα κατατεθέν της Oracle ή/και των θυγατρικών της.
Το OpenCL και το λογότυπο OpenCL είναι εμπορικά σήματα της Apple Inc. που χρησιμοποιούνται κατόπιν άδειας από την Khronos.
Έγγραφα / Πόροι
![]() |
intel Ξεκινήστε με το VTune Profiler [pdf] Οδηγός χρήστη Ξεκινήστε με το VTune Profiler, Ξεκινήστε, με το VTune Profiler, VTune Profiler |