Hanwha Vision SPS-A100M AI Sound Classification and Sound Direction Detection សៀវភៅណែនាំរបស់ម្ចាស់

មាតិកា លាក់

1 Hanwha Vision SPS-A100M AI Sound Classification and Sound Direction Detection

2 សេចក្តីផ្តើម

3 បច្ចេកវិទ្យាវិភាគសំឡេងផ្អែកលើ AI

4 ការដំឡើង និងបរិស្ថាន៖ ការណែនាំអំពីដំណើរការល្អបំផុត

5 សេចក្តីសន្និដ្ឋាន

6 ឯកសារ/ធនធាន

6.1 ឯកសារយោង

Hanwha Vision SPS-A100M AI Sound Classification and Sound Direction Detection

សេចក្តីផ្តើម

សំឡេងជាញឹកញាប់ជាឧបករណ៍ឃ្លាំមើលដ៏មានឥទ្ធិពលដែលគេមើលរំលងចំពេលមានការគំរាមកំហែងមើលមិនឃើញ។ ខណៈពេលដែលប្រព័ន្ធឃ្លាំមើលវីដេអូធម្មតាបានផ្តោតលើការចាប់យកអ្វីដែលកំពុងកើតឡើងដោយមើលឃើញ បរិយាកាសសុវត្ថិភាពនាពេលបច្ចុប្បន្ននេះបានវិវត្តដើម្បីទទួលស្គាល់មិនត្រឹមតែប្រភេទនៃព្រឹត្តិការណ៍សំឡេងប៉ុណ្ណោះទេ ប៉ុន្តែក៏មានប្រភពពិតប្រាកដរបស់វាផងដែរ។ នៅពេលដែលព្រំដែននៃសុវត្ថិភាពសាធារណៈ និងការការពារទ្រព្យសម្បត្តិត្រូវបានពង្រីក បច្ចេកវិទ្យាវិភាគសំឡេងមានសក្តានុពលក្នុងការរួមចំណែកលើសពីជំនួយសាមញ្ញដល់ការទប់ស្កាត់ឧក្រិដ្ឋកម្ម និងការឆ្លើយតបនឹងឧបទ្ទវហេតុយ៉ាងឆាប់រហ័ស។
នៅក្នុងបរិបទនេះ បច្ចេកវិទ្យាចំណាត់ថ្នាក់សំឡេងផ្អែកលើការសិក្សាយ៉ាងស៊ីជម្រៅរបស់ Hanwha Vision ផ្តល់នូវមុខងារឆ្លាតវៃដែលទទួលស្គាល់យ៉ាងត្រឹមត្រូវនូវព្រឹត្តិការណ៍សំឡេងជាក់លាក់ ដូចជាការស្រែកដែលបានហ្វឹកហាត់ជាមុន និងការបំបែកកញ្ចក់ដែលបង្កឱ្យមានការជូនដំណឹងភ្លាមៗ។ លើសពីនេះ បច្ចេកវិជ្ជាកំណត់ទិសដៅសំឡេងកំណត់ទីតាំងនៃប្រភពសំឡេង ដោយផ្តល់ព័ត៌មានយ៉ាងច្បាស់លាស់លើមិនត្រឹមតែ 'អ្វីជាសំឡេង' ប៉ុណ្ណោះទេ ថែមទាំង 'កន្លែងដែលសំឡេងមានប្រភពមក' ផងដែរ។ បច្ចេកវិទ្យាទាំងពីរនេះធ្វើការរួមគ្នា ដើម្បីបង្កើនសមត្ថភាពយល់ដឹងពីស្ថានភាពរួមបញ្ចូលគ្នា ដោយកំណត់ស្តង់ដារថ្មីសម្រាប់ប្រព័ន្ធសុវត្ថិភាពជំនាន់ក្រោយ។
ក្រដាសសនេះពិចារណាលើបច្ចេកវិទ្យាទាំងនេះ ដោយផ្តល់នូវការណែនាំជាក់ស្តែងសម្រាប់ការអនុវត្តដ៏ល្អប្រសើរ និងការប្រើប្រាស់ក្នុងបរិយាកាសចម្រុះ។

បច្ចេកវិទ្យាវិភាគសំឡេងផ្អែកលើ AI

ចំណាត់ថ្នាក់សំឡេង
បច្ចេកវិទ្យាចំណាត់ថ្នាក់សំឡេងរបស់ Hanwha Vision ត្រូវបានបង្កើតឡើងនៅលើគំរូសិក្សាជ្រៅជ្រះស្នូល៖ បណ្តាញសរសៃប្រសាទ Convolutional (CNN) ។ បច្ចេកវិទ្យានេះចាប់ផ្តើមដោយការបំប្លែងព័ត៌មានសំឡេងអរូបីទៅជាទម្រង់មើលឃើញដែលគេស្គាល់ថាជា spectrogram1។
វិសាលគមដើរតួនាទីជាសូរស័ព្ទ "ស្នាមម្រាមដៃ" ដែលបង្ហាញយ៉ាងច្បាស់នូវគំរូនៃសំឡេងជាក់លាក់មួយ។ CNN ពូកែក្នុងការរៀនដោយស្វ័យប្រវត្តិ និងទទួលស្គាល់នូវលក្ខណៈពិសេស និងលំនាំសូរស័ព្ទដ៏ស្រទន់នៅក្នុងរូបភាព spectrogram ទាំងនេះ ដែលជារឿយៗពិបាកសម្រាប់ត្រចៀកមនុស្សក្នុងការបែងចែក។ ដំណើរការនេះអនុញ្ញាតឱ្យកំណត់អត្តសញ្ញាណត្រឹមត្រូវ និងចាត់ថ្នាក់នៃព្រឹត្តិការណ៍សំឡេងជាច្រើន រួមទាំងការស្រែក ការបែកកញ្ចក់ ស្នែងរថយន្ត និងការរអិលកង់រថយន្ត។
នៅពេលដែលសំឡេងត្រូវបានរកឃើញ និងចាត់ថ្នាក់ ប្រព័ន្ធនឹងទាញយកទិន្នន័យដោយស្វ័យប្រវត្តិចេញពីស្ទ្រីមអូឌីយ៉ូ។ ចាប់តាំងពីទិន្នន័យអូឌីយ៉ូត្រូវបានដំណើរការជាមុនហើយ sampដឹកនាំ សំឡេងដែលបានចាត់ថ្នាក់ត្រូវបានបង្កើតជាឈុតអូឌីយ៉ូ fileពេញលេញជាមួយនឹងទិន្នន័យមេតាសម្រាប់ការទាញយកងាយស្រួល និងឡើងវិញview.
បច្ចេកវិទ្យានេះមាននៅលើផលិតផល Hanwha Vision ដែលជ្រើសរើស។
ការរកឃើញទិសដៅសំឡេង
បច្ចេកវិទ្យាស្វែងរកទិសដៅសំឡេងរបស់ Hanwha Vision គាំទ្រការឆ្លើយតបយ៉ាងរហ័សដោយកំណត់អត្តសញ្ញាណ និងជូនដំណឹងដល់អ្នកប្រើប្រាស់អំពីទិសដៅនៃព្រឹត្តិការណ៍សំឡេងដែលបានបញ្ជាក់។ បច្ចេកវិទ្យាកំណត់ទិសដៅនេះដោយវាស់ភាពខុសគ្នានៃពេលវេលានៃការមកដល់
(TDoA) នៃសញ្ញាសំឡេង នៅពេលដែលវាទៅដល់មីក្រូហ្វូនដែលបំបែកដោយរាងកាយច្រើន។
ក្បួនដោះស្រាយ TDoA ដំណើរការដោយការវិភាគភាពខុសគ្នានៃដំណាក់កាលនៅក្នុងពេលវេលាដែលវាត្រូវការសម្រាប់សំឡេងដើម្បីទៅដល់មីក្រូហ្វូននីមួយៗ ដោយហេតុនេះការប៉ាន់ប្រមាណពីចម្ងាយពិតប្រាកដទៅប្រភព។ បន្ទាប់មកព័ត៌មាននេះត្រូវបានប្រើដើម្បីគណនាមុំនៃប្រភពសំឡេង។ ដូចដែលបានបង្ហាញក្នុងរូបភាពទី 1 ប្រព័ន្ធពហុមីក្រូដែលមានមីក្រូហ្វូន (MIC1, MIC2, MIC3, MIC4) ដែលរៀបចំជារង្វង់អាចកំណត់ភាពខុសគ្នានៃចម្ងាយ (d1,d2,d3,d4) រវាងប្រភពសំឡេង និងមីក្រូហ្វូននីមួយៗ។ ការគណនាភាពខុសគ្នានៃពេលវេលានៃការមកដល់ដោយផ្អែកលើភាពខុសគ្នានៃចម្ងាយទាំងនេះគឺជាស្នូលនៃក្បួនដោះស្រាយ TDoA ។

រូបភាពទី 2 បង្ហាញឱ្យឃើញពីភាពខុសគ្នានៃពេលវេលា (τij) ក្នុងការមកដល់នៃសញ្ញាសំឡេងនៅមីក្រូហ្វូនពីរ (ទម្រង់រលកពណ៌ត្នោត និងពណ៌ខៀវ)។ តាមរយៈការវាស់វែងយ៉ាងជាក់លាក់នូវភាពខុសគ្នានៃពេលវេលាមកដល់ទាំងនេះ ប្រព័ន្ធអាចកាត់តម្រឹមទិសនៃប្រភពសំឡេងបានយ៉ាងត្រឹមត្រូវ។

ដំណើរការរកឃើញទិសដៅសំឡេង ត្រូវបានបែងចែកជាបួនជំហានសំខាន់ៗ៖

ការប្រមូលសញ្ញា៖ ប្រមូលសញ្ញាសំឡេងក្នុងពេលដំណាលគ្នាតាមរយៈមីក្រូហ្វូនច្រើន។
ដំណើរការសញ្ញា៖ វិភាគសញ្ញាដែលប្រមូលបានដោយប្រើក្បួនដោះស្រាយឯកទេស។
ការប៉ាន់ប្រមាណទិសដៅ៖ ប៉ាន់ស្មានទិសដៅរបស់សំឡេងដោយផ្អែកលើសញ្ញាដែលបានដំណើរការ។

លទ្ធផលលទ្ធផល៖ បង្ហាញទិសដៅដែលបានរកឃើញចុងក្រោយជាមុំទ្រនាប់។

បច្ចេកវិទ្យានេះមាននៅលើផលិតផល Hanwha Vision ដែលគាំទ្រមីក្រូហ្វូនជាច្រើនដូចជា Audio Beacon (SPS-A100M) និងកាមេរ៉ា Wisenet 9 SoC មួយចំនួន។

ការដំឡើង និងបរិស្ថាន៖ ការណែនាំអំពីដំណើរការល្អបំផុត

ប្រសិទ្ធភាពនៃដំណោះស្រាយ AI Audio របស់ Hanwha Vision ត្រូវបានផ្សារភ្ជាប់យ៉ាងជិតស្និទ្ធទៅនឹងបរិយាកាសដំឡើងរបស់វា។ ដោយការពិចារណាយ៉ាងសកម្មនូវចំណុចខាងក្រោម អ្នកអាចពង្រីកសក្តានុពលនៃប្រព័ន្ធ និងធានាបាននូវដំណើរការប្រកបដោយស្ថេរភាព។

ការជ្រើសរើសទីតាំងដំឡើងល្អបំផុត
សម្រាប់ការអនុវត្តចំណាត់ថ្នាក់សំឡេង និងការកំណត់ទិសដៅដែលអាចទុកចិត្តបាន លក្ខខណ្ឌខាងក្រោមត្រូវបានណែនាំ៖
ចំណាត់ថ្នាក់សំឡេង៖ ប្រព័ន្ធដំណើរការដោយភាពជឿជាក់បំផុតនៅពេលដែលចម្ងាយរវាងផលិតផល និងប្រភពសំឡេងមានយ៉ាងហោចណាស់ 2 ម៉ែត្រ។ ចម្ងាយនេះគឺផ្អែកលើកម្ពស់នៃប្រភពសំឡេង។ ប្រសិនបើចម្ងាយនៅជិតពេក (ក្នុងរង្វង់ 2 ម៉ែត្រ) សូម្បីតែសំឡេងដែលហាក់ដូចជាសំឡេងទាបដូចជាការទះដៃក៏អាចឮខ្លាំងពេក ដែលនាំឱ្យមានភាពវិជ្ជមានមិនពិត។ ការដំឡើងពិដាននៅក្នុងការកំណត់ក្នុងផ្ទះគឺជាវិធីសាស្រ្តដ៏ល្អមួយសម្រាប់ចំណាត់ថ្នាក់សំឡេង ព្រោះវាកាត់បន្ថយការឆ្លុះបញ្ចាំងសូរស័ព្ទ និងអនុញ្ញាតឱ្យរកឃើញសំឡេងឯកសណ្ឋាននៅទូទាំងតំបន់ធំទូលាយ។

ការរកឃើញទិសដៅសំឡេង៖ សម្រាប់ការរកឃើញទិសដៅត្រឹមត្រូវ ចន្លោះអប្បបរមាយ៉ាងហោចណាស់ 6.0m ទទឹង 6.0m ត្រូវបានណែនាំ។ នេះកាត់បន្ថយផលប៉ះពាល់នៃការឆ្លុះបញ្ចាំងសំឡេង និងការបន្ទរឡើងវិញ ហើយធានានូវទំហំគ្រប់គ្រាន់សម្រាប់ការវិភាគសញ្ញារវាងមីក្រូហ្វូនច្រើន។

ការរក្សាចម្ងាយត្រឹមត្រូវ និងមុំឧប្បត្តិហេតុ៖ ចម្ងាយ និងមុំរវាងប្រភពសំឡេងព្រឹត្តិការណ៍ និងផលិតផលមានសារៈសំខាន់សម្រាប់ភាពត្រឹមត្រូវនៃការរកឃើញ។ ប្រសិនបើមុំឧប្បត្តិហេតុនៃសំឡេងព្រឹត្តិការណ៍ធំពេក (លើសពី 20 ∘) ឬចម្ងាយខ្លីពេក ភាពត្រឹមត្រូវនៃការរកឃើញអាចនឹងថយចុះ។ តារាងខាងក្រោមផ្តល់នូវចម្ងាយអប្បបរមាដែលបានណែនាំដោយផ្អែកលើកម្ពស់ការដំឡើងរបស់ផលិតផល។

កម្ពស់ការដំឡើងផលិតផល	ចម្ងាយស្វែងរកទិសដៅអប្បបរមា
2.3 ម។	≥ 2.2 ម។
2.5 ម។	≥ 2.7 ម។
2.7 ម។	≥ 3.3 ម។
2.9 ម។	≥ 3.8 ម។
3.1 ម។	≥ 4.4 ម។
3.3 ម។	≥ 4.9 ម។
3.5 ម។	≥ 5.5 ម។
3.8 ម។	≥ 6.3 ម។
4m	≥ 6.9 ម។
5m	≥ 9.6 ម។

ការធានាបាននូវផ្លូវសំឡេងច្បាស់៖ ឧបសគ្គខាងរូបវិទ្យាដូចជាជញ្ជាំង កញ្ចក់ ឬវាំងននក្រាស់រវាងប្រភពសំឡេង និងផលិតផលអាចចុះខ្សោយ ឬបង្ខូចសញ្ញា។ ដើម្បីសម្រេចបាននូវការអនុវត្តអតិបរមា ធានាបាននូវផ្លូវច្បាស់លាស់ និងច្បាស់លាស់សម្រាប់សំឡេង។

ការវិភាគបរិស្ថានសម្រាប់ការរកឃើញសំឡេង និងចំណាត់ថ្នាក់ប្រកបដោយប្រសិទ្ធភាព
សម្រាប់ការរកឃើញ និងការចាត់ថ្នាក់សំឡេងត្រឹមត្រូវ សូមពិចារណាលក្ខខណ្ឌសូរស័ព្ទខាងក្រោម និងកត្តាបរិស្ថានជុំវិញ។

ប្រភេទសំឡេង	កម្រិត dB	ចម្ងាយព្យាករណ៍
ស្រែក	> 70 dB	2m ~ 20m
បែកកញ្ចក់, ស្នែងរថយន្ត, សំបកកង់	> 80 dB	2m ~ 16m

សម្រាប់អតីតampដូច្នេះ សំឡេងស្រែកអាចត្រូវបានចាត់ថ្នាក់យ៉ាងត្រឹមត្រូវ និងកំណត់ទិសដៅនៅពេលកម្រិតសំឡេងរបស់វាលើសពី 70dB។ កម្រិតសំឡេងនៃព្រឹត្តិការណ៍ក៏ត្រូវតែខ្លាំងជាងសំឡេងរំខានជុំវិញផ្ទៃខាងក្រោយ (ត្រូវបានណែនាំ៖ យ៉ាងហោចណាស់ 30dB ខ្លាំងជាង)។ សម្រាប់ការវាស់វែង និងការចាត់ថ្នាក់ត្រឹមត្រូវ សំឡេងរំខានផ្ទៃខាងក្រោយមិនគួរលើសពី 60dB ដែលធានាបាននូវភាពខុសគ្នាច្បាស់លាស់រវាងព្រឹត្តិការណ៍ និងសំឡេងរំខានជុំវិញ។
ដោយសារសំឡេងរំខានជុំវិញអាចប៉ះពាល់ដល់ដំណើរការ វាជាការអនុវត្តល្អក្នុងការវិភាគដូចខាងក្រោមជាមុន៖

បរិស្ថានខាងក្រៅ៖ ត្រូវប្រុងប្រយ័ត្នចំពោះសំឡេងធម្មជាតិ (ខ្យល់ ភ្លៀង ផ្គរលាន់) និងសំឡេងសិប្បនិម្មិត (ចរាចរណ៍ ផលប៉ះពាល់ ការកន្ត្រាក់រថយន្ត)។ នៅក្នុងបរិយាកាសដែលមិនអាចទាយទុកជាមុនបាន ការវិភាគហ្មត់ចត់អាចជួយអ្នកជ្រើសរើសទីតាំងដំឡើងល្អបំផុត។

បរិយាកាសក្នុងផ្ទះ៖ ការឆ្លុះបញ្ចាំងសំឡេង និងការបន្ទរអាចមានសារៈសំខាន់ អាស្រ័យលើសម្ភារៈ (ជញ្ជាំង ពិដាន ជាន់) និងទំហំបន្ទប់។ សំឡេងដែលស្រដៀងទៅនឹងព្រឹត្តិការណ៍គោលដៅ ដូចជាប៉េងប៉ោងលោត ឬប្រអប់ធ្ងន់មួយត្រូវបានទម្លាក់ អាចបង្កើតសំឡេងរោទិ៍ដែលនាំទៅដល់ការជូនដំណឹងមិនពិត។ ការដំឡើងគួរតែគិតពីលក្ខណៈសម្បត្តិសូរស័ព្ទនៃលំហក្នុងផ្ទះ។

កំណត់រចនាសម្ព័ន្ធកម្រិតសំឡេង dB
ដើម្បីបង្កើនប្រសិទ្ធភាពមុខងារចំណាត់ថ្នាក់សំឡេង អ្នកអាចកំណត់រចនាសម្ព័ន្ធកម្រិត dB ឱ្យសមនឹងបរិយាកាសជាក់លាក់របស់អ្នក។

នៅក្នុងបរិយាកាសដែលមានសម្លេងរំខាន សូមកំណត់កម្រិតឱ្យខ្ពស់ជាងនេះ ដើម្បីកាត់បន្ថយការជូនដំណឹងមិនពិត។
នៅក្នុងបរិយាកាសស្ងប់ស្ងាត់ដែលព្រឹត្តិការណ៍មានភាពស្រពិចស្រពិល សូមកំណត់កម្រិតឱ្យទាបជាង ដើម្បីជៀសវាងការបាត់ការជូនដំណឹងសំខាន់ៗ។

បន្ទាប់ពីពិនិត្យមើលកម្រិតសំឡេងរំខានផ្ទៃខាងក្រោយជាមធ្យម dB វាត្រូវបានផ្ដល់អនុសាសន៍ឱ្យកំណត់កម្រិតសំឡេងយ៉ាងហោចណាស់ 55dB ខ្ពស់ជាងមធ្យមភាគនោះ។

ដូចដែលបានបង្ហាញក្នុងរូបភាពទី 6 កម្រិត dB អាចត្រូវបានកែតម្រូវដោយវិចារណញាណដោយប្រើគ្រាប់រំកិល ឬវាលបញ្ចូលលេខ ដែលជះឥទ្ធិពលដោយផ្ទាល់ទៅលើភាពរសើបនៃការរកឃើញក្នុងពេលជាក់ស្តែង។ ក្រាហ្វបង្ហាញឱ្យឃើញពីការផ្លាស់ប្តូរសំឡេង dB តាមពេលវេលា (បន្ទាត់ខ្មៅ) និងកម្រិតកំណត់ដែលបានកំណត់ (បន្ទាត់ពណ៌ប្រផេះ) ធ្វើឱ្យវាងាយស្រួលក្នុងការមើលឃើញនៅពេលដែលព្រឹត្តិការណ៍សំឡេង (កំពូលពណ៌ទឹកក្រូច) លើសពីកម្រិតកំណត់។

ការក្រិតតាមទិសសំឡេង និងការកំណត់រចនាសម្ព័ន្ធប្រព័ន្ធ
ផលិតផល Hanwha Vision ផ្តល់ព្រឹត្តិការណ៍ជាឈុតអូឌីយ៉ូ ដែលរួមមានទាំងចំណាត់ថ្នាក់សំឡេង និងលទ្ធផលស្វែងរកទិសដៅ។

ដូចដែលបានបង្ហាញក្នុងរូបភាពទី 7 លទ្ធផលចំណាត់ថ្នាក់សំឡេងត្រូវបានបង្ហាញជាមួយរូបតំណាងវិចារណញាណនៅខាងក្រោម រួមជាមួយនឹងលទ្ធផលស្វែងរកទិសដៅសំឡេង។ 'ទិសដៅ (N+301.8∘)' មានន័យថាប្រភពសំឡេងស្ថិតនៅ 301.8∘ ទ្រនិចនាឡិកាពីខាងជើង (N)។
តម្លៃ 'ទំនុកចិត្ត (0.74)' ដែលភ្ជាប់មកជាមួយបង្ហាញពីកម្រិតទំនុកចិត្ត 74% ។ នេះ រួមជាមួយនឹងកម្រិតសម្ពាធសំឡេង (52dB) ជួយអ្នកប្រើប្រាស់វាយតម្លៃស្ថានភាពបានត្រឹមត្រូវ និងឆ្លើយតបយ៉ាងរហ័ស។
ព័ត៌មានអំពីទិសដៅសំឡេងរបស់ប្រព័ន្ធអាចខុសពីការពិតខាងជើងតាមពេលវេលា ឬដោយសារការដំឡើង។ ដោយសារព័ត៌មានទិសដៅត្រឹមត្រូវគឺចាំបាច់ វាជារឿងសំខាន់ក្នុងការកំណត់ចំណុចយោងខាងជើងតាមតម្រូវការ។ នេះអាចត្រូវបានធ្វើដោយប្រើវិធីសាស្រ្តមួយក្នុងចំណោមវិធីសាស្រ្តបី:

ដំឡើងផលិតផលដើម្បីប្រឈមមុខនឹងខាងជើងពិតដូចត្រីវិស័យបង្ហាញ។
នៅក្នុងម៉ឺនុយផលិតផល សូមចូលទៅកាន់ [ប្រព័ន្ធ] > [ព័ត៌មានផលិតផល] > [របៀបម៉ោន] ហើយបញ្ចូលមុំដោយផ្ទាល់ដែលវាស់តាមទ្រនិចនាឡិកាពីត្រីវិស័យខាងជើងទៅចំណុចយោងរបស់កាមេរ៉ា។

ប្រើមុខងារត្រីវិស័យដែលមាននៅក្នុងឧបករណ៍ដំឡើង Wisenet សម្រាប់ការដំឡើងដំបូងដែលងាយស្រួល និងត្រឹមត្រូវជាងមុន។

គន្លឹះសម្រាប់បរិយាកាសស្មុគ្រស្មាញសូរស័ព្ទ

បរិយាកាសស្មុគ្រស្មាញ៖ នៅក្នុងបរិយាកាសដែលមានសំឡេងច្រើនដំណាលគ្នា គំរូ AI អាចចាត់ថ្នាក់ពួកវាជាសំឡេងតែមួយ ឬបែងចែកពួកវាខុស។ នេះគឺជាបាតុភូតធម្មជាតិ; ការវិភាគដ៏ទូលំទូលាយនៃព័ត៌មានដែលផ្តល់ដោយប្រព័ន្ធនឹងជួយធានាឱ្យមានការយល់ដឹងអំពីស្ថានភាពត្រឹមត្រូវ។
ការវិភាគបរិស្ថានសម្រាប់ការជូនដំណឹងត្រឹមត្រូវ៖ គំរូចំណាត់ថ្នាក់សំឡេងអាចបង្កើតសំឡេងរោទិ៍សម្រាប់សំឡេងដែលស្រដៀងនឹងសំឡេងព្រឹត្តិការណ៍ ប៉ុន្តែមិនមាននៅក្នុងប្រភេទការចាត់ថ្នាក់ទេ ដូចជាការកកិតនៃវត្ថុលោហៈ ការហៅសត្វ ឧបករណ៍តន្ត្រី ឬសំឡេងរំខានដ៏មានឥទ្ធិពលផ្សេងទៀត។ ការយល់ដឹងអំពីលក្ខណៈនៃគំរូនេះអនុញ្ញាតឱ្យអ្នកទន្ទឹងរង់ចាំ និងរៀបចំសម្រាប់ការជូនដំណឹងពីសំឡេងពិសេសទាំងនេះ ដោយមានប្រសិទ្ធភាពកាត់បន្ថយការភាន់ច្រឡំដែលមិនចាំបាច់។

សេចក្តីសន្និដ្ឋាន

តាមរយៈការផ្លាស់ប្តូរលើសពីដែនកំណត់នៃការសង្កេតដោយមើលឃើញ ដំណោះស្រាយ AI Audio របស់ Hanwha Vision បង្កើតប្រព័ន្ធព្រមានមុនដំបូងដ៏ទូលំទូលាយដែលវិភាគសំឡេងយ៉ាងឆ្លាតវៃ។
ក្រដាសសនេះដើរតួនាទីជាមគ្គុទ្ទេសក៍ជាក់ស្តែង ដែលផ្តល់សិទ្ធិអំណាចឱ្យអ្នកអនុវត្ត និងបង្កើនប្រសិទ្ធភាពបច្ចេកវិទ្យាសម្រាប់បរិយាកាសជាក់លាក់របស់អ្នក—ចាប់ពីការដំឡើងដំបូងរហូតដល់ការកែតម្រូវសម្រាប់ដំណើរការខ្ពស់បំផុត។
នៅពេលដែលបញ្ហាប្រឈមផ្នែកសន្តិសុខមានការវិវត្ត Hanwha Vision នៅតែប្តេជ្ញាចិត្តក្នុងការជំរុញសមត្ថភាពវិភាគសំឡេងរបស់ខ្លួន ដោយធានានូវបទពិសោធន៍សុវត្ថិភាពកាន់តែមានស្ថេរភាព ប្រសិទ្ធភាព និងសកម្មក្នុងស្ថានភាពណាមួយ។

Hanwha Vision

13488 Hanwha Vision R&D Center,
6 Pangyo-ro 319-gil, Bundang-gu, Seongnam-si, Gyeonggi-do, កូរ៉េ www.HanwhaVision.com

ឯកសារ/ធនធាន

Hanwha Vision SPS-A100M AI Sound Classification and Sound Direction Detection [pdf] សៀវភៅណែនាំរបស់ម្ចាស់
SPS-A100M AI Sound Classification and Sound Direction Detection, SPS-A100M, AI Sound Classification and Sound Direction Detection, Classification and Sound Direction Detection, Sound Direction Detection, Direction Detection, Detection

ឯកសារយោង

សៀវភៅណែនាំអ្នកប្រើប្រាស់