Hanwha-Vision-LOGO

Hanwha Vision SPS-A100M AI Sound Classification and Sound Direction Detection

Hanwha-Vision-SPS-A100M-AI-Sound-Classification-and-Sound-Direction-Detection-PRODUCT

ແນະນຳ

ສຽງມັກຈະເປັນເຄື່ອງມືເຝົ້າລະວັງແຕ່ມີພະລັງທີ່ມອງຂ້າມ ທ່າມກາງການຂົ່ມຂູ່ທີ່ເບິ່ງບໍ່ເຫັນ. ໃນຂະນະທີ່ລະບົບການເຝົ້າລະວັງວິດີໂອແບບດັ້ງເດີມໄດ້ສຸມໃສ່ການຈັບພາບໃນສິ່ງທີ່ເກີດຂຶ້ນ, ສະພາບແວດລ້ອມຄວາມປອດໄພຂອງມື້ນີ້ໄດ້ພັດທະນາເພື່ອຮັບຮູ້ບໍ່ພຽງແຕ່ປະເພດຂອງເຫດການສຽງເທົ່ານັ້ນແຕ່ຍັງມີແຫຼ່ງທີ່ແນ່ນອນຂອງເຂົາເຈົ້າ. ໃນຂະນະທີ່ຂອບເຂດຂອງຄວາມປອດໄພສາທາລະນະແລະການປົກປ້ອງຊັບສິນຂະຫຍາຍ, ເຕັກໂນໂລຢີການວິເຄາະສຽງຖືທ່າແຮງທີ່ຈະປະກອບສ່ວນນອກເຫນືອຈາກການຊ່ວຍເຫຼືອງ່າຍໆໃນການປ້ອງກັນອາດຊະຍາກໍາແລະການຕອບໂຕ້ເຫດການຢ່າງໄວວາ.
ໃນສະພາບການນີ້, ເທັກໂນໂລຍີການຈັດປະເພດສຽງທີ່ອີງໃສ່ການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງຂອງ Hanwha Vision ໃຫ້ຟັງຊັນອັດສະລິຍະທີ່ຮັບຮູ້ເຫດການສຽງສະເພາະໄດ້ຢ່າງຖືກຕ້ອງ ເຊັ່ນ: ສຽງຮ້ອງທີ່ຜ່ານການເຝິກອົບຮົມກ່ອນ ແລະ ການແຕກຂອງແກ້ວ- ເຮັດໃຫ້ເກີດການແຈ້ງເຕືອນໃນທັນທີ. ນອກຈາກນັ້ນ, ເທັກໂນໂລຍີການຊອກຄົ້ນຫາທິດທາງສຽງຈະລະບຸສະຖານທີ່ຂອງແຫຼ່ງສຽງ, ສະໜອງຂໍ້ມູນທີ່ຊັດເຈນວ່າບໍ່ພຽງແຕ່ 'ສຽງແມ່ນຫຍັງ' ແຕ່ຍັງ 'ບ່ອນທີ່ສຽງມາຈາກ.' ເທັກໂນໂລຍີທັງສອງນີ້ເຮັດວຽກຮ່ວມກັນເພື່ອເພີ່ມປະສິດທິພາບການຮັບຮູ້ສະຖານະການແບບປະສົມປະສານ, ກໍານົດມາດຕະຖານໃຫມ່ສໍາລັບລະບົບຄວາມປອດໄພຮຸ່ນຕໍ່ໄປ.
ກະດາດສີຂາວນີ້ອະທິບາຍກ່ຽວກັບເຕັກໂນໂລຢີເຫຼົ່ານີ້, ໃຫ້ຄໍາແນະນໍາພາກປະຕິບັດເພື່ອການປະຕິບັດທີ່ດີທີ່ສຸດແລະການນໍາໃຊ້ໃນສະພາບແວດລ້ອມທີ່ຫຼາກຫຼາຍ.

ເຕັກໂນໂລຍີການວິເຄາະສຽງທີ່ອີງໃສ່ AI

  1. ການຈັດປະເພດສຽງ
    ເທກໂນໂລຍີການຈັດປະເພດສຽງຂອງ Hanwha Vision ແມ່ນສ້າງຢູ່ໃນຮູບແບບການຮຽນຮູ້ທີ່ເລິກເຊິ່ງຄື: ເຄືອຂ່າຍ Neural Network (CNN). ເທກໂນໂລຍີນີ້ເລີ່ມຕົ້ນໂດຍການປ່ຽນຂໍ້ມູນສຽງທີ່ບໍ່ມີຕົວຕົນເຂົ້າໄປໃນຮູບແບບສາຍຕາທີ່ເອີ້ນວ່າ spectrogram1.
    spectrogram ເຮັດຫນ້າທີ່ເປັນ "ລາຍນິ້ວມື", ສະແດງໃຫ້ເຫັນຢ່າງຊັດເຈນຮູບແບບທີ່ເປັນເອກະລັກຂອງສຽງສະເພາະ. CNN ດີເລີດໃນການຮຽນຮູ້ອັດຕະໂນມັດແລະຮັບຮູ້ລັກສະນະແລະຮູບແບບສຽງທີ່ອ່ອນໂຍນພາຍໃນຮູບພາບ spectrogram ເຫຼົ່ານີ້ທີ່ມັກຈະເປັນການຍາກສໍາລັບຫູຂອງມະນຸດໃນການຈໍາແນກ. ຂະບວນການນີ້ເຮັດໃຫ້ການກໍານົດແລະການຈັດປະເພດທີ່ຖືກຕ້ອງຂອງລະດັບຄວາມກ້ວາງຂອງເຫດການສຽງ, ລວມທັງສຽງຮ້ອງ, ການແຕກແກ້ວ, horns ລົດ, ແລະ skids ຢາງ.
    ເມື່ອສຽງໄດ້ຖືກກວດພົບແລະຈັດປະເພດ, ລະບົບຈະສະກັດຂໍ້ມູນອັດຕະໂນມັດອອກຈາກກະແສສຽງ. ເນື່ອງຈາກວ່າຂໍ້ມູນສຽງໄດ້ຖືກປຸງແຕ່ງກ່ອນແລ້ວແລະ sampນໍາພາ, ສຽງທີ່ຖືກຈັດປະເພດຫຼັງຈາກນັ້ນຖືກສ້າງເປັນຄລິບສຽງ file, ສໍາເລັດດ້ວຍ metadata ສໍາລັບການດາວໂຫຼດງ່າຍແລະ review.
    ເຕັກໂນໂລຊີນີ້ມີຢູ່ໃນຜະລິດຕະພັນ Hanwha Vision ທີ່ເລືອກ.
  2. ການກວດຫາທິດທາງສຽງ
    ເທກໂນໂລຍີກວດຈັບທິດທາງສຽງຂອງ Hanwha Vision ສະຫນັບສະຫນູນການຕອບສະຫນອງຢ່າງໄວວາໂດຍການກໍານົດແລະແຈ້ງໃຫ້ຜູ້ໃຊ້ຮູ້ທິດທາງຂອງເຫດການສຽງທີ່ກໍານົດ. ເຕັກໂນໂລຢີກໍານົດທິດທາງນີ້ໂດຍການວັດແທກຄວາມແຕກຕ່າງຂອງເວລາມາຮອດ
    (TDoA) ຂອງສັນຍານສຽງຍ້ອນວ່າມັນໄປຮອດຫຼາຍໄມໂຄຣໂຟນທີ່ແຍກອອກທາງກາຍຍະພາບ.
    ສູດການຄິດໄລ່ TDoA ເຮັດວຽກໂດຍການວິເຄາະຄວາມແຕກຕ່າງຂອງໄລຍະໃນເວລາທີ່ມັນໃຊ້ເວລາສໍາລັບສຽງທີ່ຈະເຂົ້າຫາແຕ່ລະໄມໂຄຣໂຟນ, ດັ່ງນັ້ນການປະເມີນໄລຍະທາງທີ່ແທ້ຈິງກັບແຫຼ່ງ. ຫຼັງຈາກນັ້ນ, ຂໍ້ມູນນີ້ຖືກນໍາໃຊ້ເພື່ອຄິດໄລ່ມຸມຂອງແຫຼ່ງສຽງ. ດັ່ງທີ່ສະແດງຢູ່ໃນຮູບທີ 1, ລະບົບຫຼາຍໄມໂຄຣໂຟນທີ່ມີໄມໂຄຣໂຟນ (MIC1,MIC2,MIC3,MIC4) ຈັດຢູ່ໃນວົງມົນສາມາດກໍານົດຄວາມແຕກຕ່າງຂອງໄລຍະຫ່າງ (d1,d2,d3,d4) ລະຫວ່າງແຫຼ່ງສຽງ ແລະແຕ່ລະໄມໂຄຣໂຟນ. ການຄິດໄລ່ຄວາມແຕກຕ່າງຂອງເວລາມາຮອດໂດຍອີງໃສ່ຄວາມແຕກຕ່າງຂອງໄລຍະທາງເຫຼົ່ານີ້ແມ່ນຫຼັກຂອງສູດການຄິດໄລ່ TDoA.

2.1. ເທັກໂນໂລຍີການຈັດປະເພດສຽງຂອງ Hanwha Vision ແມ່ນສ້າງຂຶ້ນດ້ວຍຮູບແບບການຮຽນຮູ້ທີ່ເລິກເຊິ່ງຄື: Convolutional Neural Network (CNN). ເທກໂນໂລຍີນີ້ເລີ່ມຕົ້ນໂດຍການປ່ຽນຂໍ້ມູນສຽງທີ່ບໍ່ມີຕົວຕົນເຂົ້າໄປໃນຮູບແບບສາຍຕາທີ່ເອີ້ນວ່າ spectrogram1. spectrogram ເຮັດໜ້າທີ່ເປັນ "ລາຍນິ້ວມື", ສະແດງໃຫ້ເຫັນຢ່າງຈະແຈ້ງຮູບແບບທີ່ເປັນເອກະລັກຂອງສຽງສະເພາະ. CNN ດີເລີດໃນການຮຽນຮູ້ອັດຕະໂນມັດແລະຮັບຮູ້ລັກສະນະແລະຮູບແບບສຽງທີ່ອ່ອນໂຍນພາຍໃນຮູບພາບ spectrogram ເຫຼົ່ານີ້ທີ່ມັກຈະເປັນການຍາກສໍາລັບຫູຂອງມະນຸດໃນການຈໍາແນກ. ຂະບວນການນີ້ເຮັດໃຫ້ການກໍານົດແລະການຈັດປະເພດທີ່ຖືກຕ້ອງຂອງລະດັບຄວາມກ້ວາງຂອງເຫດການສຽງ, ລວມທັງສຽງຮ້ອງ, ການແຕກແກ້ວ, horns ລົດ, ແລະ skids ຢາງ. ເມື່ອສຽງໄດ້ຖືກກວດພົບແລະຈັດປະເພດ, ລະບົບຈະສະກັດຂໍ້ມູນອັດຕະໂນມັດອອກຈາກກະແສສຽງ. ເນື່ອງຈາກວ່າຂໍ້ມູນສຽງໄດ້ຖືກປຸງແຕ່ງກ່ອນແລ້ວແລະ sampນໍາພາ, ສຽງທີ່ຖືກຈັດປະເພດຫຼັງຈາກນັ້ນຖືກສ້າງເປັນຄລິບສຽງ file, ສໍາເລັດດ້ວຍ metadata ສໍາລັບການດາວໂຫຼດງ່າຍແລະ review. ເຕັກໂນໂລຊີນີ້ມີຢູ່ໃນຜະລິດຕະພັນ Hanwha Vision ທີ່ເລືອກ. 2.2. ເທັກໂນໂລຍີກວດຈັບທິດທາງສຽງຂອງ Hanwha Vision ສະຫນັບສະຫນູນການຕອບສະຫນອງຢ່າງໄວວາໂດຍການກໍານົດແລະແຈ້ງໃຫ້ຜູ້ໃຊ້ຮູ້ທິດທາງຂອງເຫດການສຽງທີ່ກໍານົດ. ເທກໂນໂລຍີກໍານົດທິດທາງນີ້ໂດຍການວັດແທກຄວາມແຕກຕ່າງຂອງເວລາມາຮອດ (TDoA) ຂອງສັນຍານສຽງຍ້ອນວ່າມັນໄປເຖິງໄມໂຄໂຟນທີ່ແຍກອອກຫຼາຍທາງ. ສູດການຄິດໄລ່ TDoA ເຮັດວຽກໂດຍການວິເຄາະຄວາມແຕກຕ່າງຂອງໄລຍະໃນເວລາທີ່ມັນໃຊ້ເວລາສໍາລັບສຽງທີ່ຈະເຂົ້າຫາແຕ່ລະໄມໂຄຣໂຟນ, ດັ່ງນັ້ນການປະເມີນໄລຍະທາງທີ່ແທ້ຈິງກັບແຫຼ່ງ. ຫຼັງຈາກນັ້ນ, ຂໍ້ມູນນີ້ຖືກນໍາໃຊ້ເພື່ອຄິດໄລ່ມຸມຂອງແຫຼ່ງສຽງ. ດັ່ງທີ່ສະແດງຢູ່ໃນຮູບທີ 1, ລະບົບຫຼາຍໄມໂຄຣໂຟນທີ່ມີໄມໂຄຣໂຟນ (MIC1,MIC2,MIC3,MIC4) ຈັດຢູ່ໃນວົງມົນສາມາດກໍານົດຄວາມແຕກຕ່າງຂອງໄລຍະຫ່າງ (d1,d2,d3,d4) ລະຫວ່າງແຫຼ່ງສຽງ ແລະແຕ່ລະໄມໂຄຣໂຟນ. ການຄິດໄລ່ຄວາມແຕກຕ່າງຂອງເວລາມາຮອດໂດຍອີງໃສ່ຄວາມແຕກຕ່າງຂອງໄລຍະທາງເຫຼົ່ານີ້ແມ່ນຫຼັກຂອງສູດການຄິດໄລ່ TDoA.ຮູບທີ 2 ສະແດງໃຫ້ເຫັນເຖິງຄວາມແຕກຕ່າງຂອງເວລາ (τij) ໃນການມາຂອງສັນຍານສຽງຢູ່ໄມໂຄຣໂຟນສອງໜ່ວຍ (ຮູບຄື້ນສີນ້ຳຕານ ແລະ ສີຟ້າ). ໂດຍການວັດແທກຄວາມແຕກຕ່າງຂອງເວລາມາຮອດເຫຼົ່ານີ້ຢ່າງຊັດເຈນ, ລະບົບສາມາດຕັດທິດທາງຂອງແຫຼ່ງສຽງໄດ້ຢ່າງຖືກຕ້ອງ. Hanwha-Vision-SPS-A100M-AI-Sound-Classification-and-Sound-Direction-Detection (3)

ຂະ​ບວນ​ການ​ກວດ​ສອບ​ທິດ​ທາງ​ສຽງ​ແມ່ນ​ແບ່ງ​ອອກ​ເປັນ​ສີ່​ຂັ້ນ​ຕອນ​ຕົ້ນ​ຕໍ​:

  1. ການ​ເກັບ​ກໍາ​ຂໍ້​ມູນ​: ການ​ເກັບ​ກໍາ​ສັນ​ຍານ​ສຽງ​ໃນ​ເວ​ລາ​ດຽວ​ກັນ​ໂດຍ​ຜ່ານ microphones ຫຼາຍ​.
  2. ການປະມວນຜົນສັນຍານ: ວິເຄາະສັນຍານທີ່ເກັບກໍາໂດຍໃຊ້ສູດການຄິດໄລ່ພິເສດ.
  3. ການ​ຄາດ​ຄະ​ເນ​ທິດ​ທາງ​: ການ​ຄາດ​ຄະ​ເນ​ທິດ​ທາງ​ຂອງ​ສຽງ​ໂດຍ​ອີງ​ໃສ່​ສັນ​ຍານ​ທີ່​ໄດ້​ຮັບ​ການ​ປຸງ​ແຕ່ງ​.
  4. ຜົນ​ໄດ້​ຮັບ​: ສະ​ແດງ​ໃຫ້​ເຫັນ​ທິດ​ທາງ​ທີ່​ກວດ​ພົບ​ສຸດ​ທ້າຍ​ເປັນ​ມຸມ bearing​.

ເທກໂນໂລຍີນີ້ມີຢູ່ໃນຜະລິດຕະພັນ Hanwha Vision ທີ່ຮອງຮັບໄມໂຄຣໂຟນຫຼາຍອັນ, ເຊັ່ນ: Audio Beacon (SPS-A100M) ແລະ ກ້ອງຖ່າຍຮູບ Wisenet 9 SoC ບາງອັນ.

Hanwha-Vision-SPS-A100M-AI-Sound-Classification-and-Sound-Direction-Detection (4)

ການຕິດຕັ້ງແລະສະພາບແວດລ້ອມ: ຄູ່ມືການປະຕິບັດທີ່ດີທີ່ສຸດ

ປະສິດທິພາບຂອງ AI Audio Solution ຂອງ Hanwha Vision ແມ່ນຕິດພັນກັບສະພາບແວດລ້ອມການຕິດຕັ້ງຂອງມັນ. ໂດຍການພິຈາລະນາຢ່າງຈິງຈັງຈຸດຕໍ່ໄປນີ້, ທ່ານສາມາດເພີ່ມທ່າແຮງຂອງລະບົບແລະຮັບປະກັນການປະຕິບັດທີ່ຫມັ້ນຄົງ.

ການເລືອກສະຖານທີ່ຕິດຕັ້ງທີ່ດີທີ່ສຸດ
ສໍາລັບການປະຕິບັດການຈັດປະເພດສຽງທີ່ເຊື່ອຖືໄດ້ແລະການກວດສອບທິດທາງ, ເງື່ອນໄຂຕໍ່ໄປນີ້ແມ່ນແນະນໍາ:
ການຈັດປະເພດສຽງ: ລະບົບເຮັດວຽກທີ່ມີຄວາມຫນ້າເຊື່ອຖືທີ່ສຸດໃນເວລາທີ່ໄລຍະຫ່າງລະຫວ່າງຜະລິດຕະພັນແລະແຫຼ່ງສຽງແມ່ນຢ່າງຫນ້ອຍ 2m. ໄລຍະນີ້ແມ່ນອີງໃສ່ຄວາມສູງຂອງແຫຼ່ງສຽງ. ຖ້າໄລຍະຫ່າງໃກ້ຊິດເກີນໄປ (ພາຍໃນ 2 ແມັດ), ເຖິງແມ່ນວ່າສຽງທີ່ເບິ່ງຄືວ່າມີສຽງຕ່ໍາເຊັ່ນການຕົບມືສາມາດກາຍເປັນສຽງດັງເກີນໄປ, ເຊິ່ງນໍາໄປສູ່ຜົນບວກທີ່ບໍ່ຖືກຕ້ອງ. ການຕິດຕັ້ງເພດານໃນການຕັ້ງຄ່າພາຍໃນເຮືອນແມ່ນເປັນວິທີການທີ່ເຫມາະສົມສໍາລັບການຈັດປະເພດສຽງຍ້ອນວ່າມັນຫຼຸດຜ່ອນການສະທ້ອນສຽງແລະອະນຸຍາດໃຫ້ກວດພົບສຽງທີ່ເປັນເອກະພາບໃນທົ່ວພື້ນທີ່ກວ້າງ.

Hanwha-Vision-SPS-A100M-AI-Sound-Classification-and-Sound-Direction-Detection (5)ການກວດສອບທິດທາງສຽງ: ສໍາລັບການກວດສອບທິດທາງທີ່ຖືກຕ້ອງ, ແນະນໍາໃຫ້ມີຊ່ອງຫວ່າງຢ່າງຫນ້ອຍ 6.0m ກວ້າງ 6.0m. ອັນນີ້ຊ່ວຍຫຼຸດຜ່ອນຜົນກະທົບຂອງການສະທ້ອນສຽງ ແລະສຽງສະທ້ອນ ແລະຮັບປະກັນພື້ນທີ່ພຽງພໍສໍາລັບການວິເຄາະສັນຍານລະຫວ່າງໄມໂຄຣໂຟນຫຼາຍອັນ. Hanwha-Vision-SPS-A100M-AI-Sound-Classification-and-Sound-Direction-Detection (6)

ການຮັກສາໄລຍະຫ່າງ ແລະມຸມສາກໃຫ້ເໝາະສົມ: ໄລຍະຫ່າງ ແລະມຸມລະຫວ່າງແຫຼ່ງສຽງເຫດການ ແລະຜະລິດຕະພັນແມ່ນສໍາຄັນຕໍ່ຄວາມຖືກຕ້ອງຂອງການກວດຫາ. ຖ້າມຸມສາກຂອງສຽງເຫດການໃຫຍ່ເກີນໄປ (ເກີນ 20 ∘) ຫຼືໄລຍະຫ່າງສັ້ນເກີນໄປ, ຄວາມຖືກຕ້ອງຂອງການກວດຫາອາດຈະຫຼຸດລົງ. ຕາຕະລາງຂ້າງລຸ່ມນີ້ໃຫ້ໄລຍະຫ່າງຕໍາ່ສຸດທີ່ແນະນໍາໂດຍອີງໃສ່ຄວາມສູງການຕິດຕັ້ງຂອງຜະລິດຕະພັນ.

ຄວາມສູງການຕິດຕັ້ງຜະລິດຕະພັນ ໄລຍະການກວດພົບທິດທາງຕໍາ່ສຸດທີ່
2.3ມ ≥ 2.2 ມ
2.5ມ ≥ 2.7 ມ
2.7ມ ≥ 3.3 ມ
2.9ມ ≥ 3.8 ມ
3.1ມ ≥ 4.4 ມ
3.3ມ ≥ 4.9 ມ
3.5ມ ≥ 5.5 ມ
3.8ມ ≥ 6.3 ມ
4m ≥ 6.9 ມ
5m ≥ 9.6 ມ

ຮັບປະກັນເສັ້ນທາງສຽງທີ່ຊັດເຈນ: ອຸປະສັກທາງກາຍຍະພາບເຊັ່ນ: ຝາ, ແກ້ວ, ຫຼືຜ້າມ່ານຫນາລະຫວ່າງແຫຼ່ງສຽງແລະຜະລິດຕະພັນສາມາດເຮັດໃຫ້ສັນຍານອ່ອນລົງຫຼືບິດເບືອນ. ເພື່ອບັນລຸປະສິດທິພາບສູງສຸດ, ຮັບປະກັນເສັ້ນທາງທີ່ຊັດເຈນ, ໂດຍກົງສໍາລັບສຽງ.

ການວິເຄາະດ້ານສິ່ງແວດລ້ອມສໍາລັບການກວດຫາສຽງທີ່ມີປະສິດທິພາບແລະການຈັດປະເພດ
ສໍາລັບການກວດຫາສຽງທີ່ຖືກຕ້ອງແລະການຈັດປະເພດ, ພິຈາລະນາເງື່ອນໄຂສຽງຕໍ່ໄປນີ້ແລະປັດໃຈສິ່ງແວດລ້ອມອ້ອມຂ້າງ.

ປະເພດສຽງ dB ເກນ ໄລຍະທາງທີ່ຄາດຄະເນ
ຮ້ອງ >70dB 2m~20m
ແກ້ວແຕກ, ແກວ່ງລົດ, ຢາງລົດກະບະ >80dB 2m~16m

ຕົວຢ່າງampດັ່ງນັ້ນ, ສຽງທີ່ຮ້ອງອອກມາສາມາດຖືກຈັດປະເພດຢ່າງຖືກຕ້ອງ ແລະກວດພົບທິດທາງເມື່ອລະດັບສຽງຂອງມັນສູງກວ່າ 70dB. ລະດັບສຽງຂອງເຫດການຕ້ອງດັງກວ່າສຽງລົບກວນໃນພື້ນຫຼັງຢ່າງຫຼວງຫຼາຍ (ແນະນຳ: ຢ່າງໜ້ອຍ 30dB ດັງກວ່າ). ສໍາລັບການວັດແທກແລະການຈັດປະເພດທີ່ຖືກຕ້ອງ, ສຽງລົບກວນໃນພື້ນຫລັງຄວນຈະບໍ່ເກີນ 60dB, ເຊິ່ງຮັບປະກັນຄວາມແຕກຕ່າງທີ່ຊັດເຈນລະຫວ່າງເຫດການແລະສິ່ງລົບກວນສະພາບແວດລ້ອມ.
ເນື່ອງຈາກສິ່ງລົບກວນສະພາບແວດລ້ອມສາມາດສົ່ງຜົນກະທົບຕໍ່ການປະຕິບັດ, ມັນເປັນການປະຕິບັດທີ່ດີທີ່ຈະວິເຄາະດັ່ງຕໍ່ໄປນີ້ລ່ວງຫນ້າ:

  • ສະພາບແວດລ້ອມກາງແຈ້ງ: ລະວັງສຽງທຳມະຊາດ (ລົມ, ຝົນ, ຟ້າຮ້ອງ) ແລະ ສຽງປອມ (ການສັນຈອນ, ຜົນກະທົບ, ລົດກະຕຸກ). ໃນສະພາບແວດລ້ອມທີ່ບໍ່ສາມາດຄາດເດົາໄດ້, ການວິເຄາະຢ່າງລະອຽດສາມາດຊ່ວຍທ່ານເລືອກສະຖານທີ່ຕິດຕັ້ງທີ່ດີທີ່ສຸດ.
  • ສະພາບແວດລ້ອມພາຍໃນເຮືອນ: ການສະທ້ອນສຽງ ແລະສຽງດັງສາມາດມີຄວາມສຳຄັນຂຶ້ນກັບວັດສະດຸ (ຝາ, ເພດານ, ຊັ້ນ) ແລະຂະໜາດຫ້ອງ. ສຽງທີ່ຄ້າຍກັບເຫດການເປົ້າໝາຍ, ເຊັ່ນ: ປູມເປົ້າແຕກ ຫຼື ກ່ອງໜັກຖືກຖິ້ມ, ສາມາດສ້າງສຽງດັງທີ່ນຳໄປສູ່ສັນຍານເຕືອນທີ່ບໍ່ຖືກຕ້ອງ. ການຕິດຕັ້ງຄວນກວມເອົາຄຸນສົມບັດສຽງຂອງພື້ນທີ່ພາຍໃນ.

ກຳນົດຄ່າການຈັດປະເພດສຽງ dB Thresholds
ເພື່ອເພີ່ມປະສິດທິພາບຂອງຟັງຊັນການຈັດປະເພດສຽງ, ທ່ານສາມາດກໍານົດຂອບເຂດ dB ໃຫ້ເຫມາະສົມກັບສະພາບແວດລ້ອມສະເພາະຂອງທ່ານ.

  • ໃນສະພາບແວດລ້ອມທີ່ມີສຽງດັງ, ຕັ້ງເກນໃຫ້ສູງຂຶ້ນເພື່ອຫຼຸດສັນຍານເຕືອນທີ່ບໍ່ຖືກຕ້ອງ.
  • ໃນສະພາບແວດລ້ອມທີ່ງຽບສະຫງົບທີ່ເຫດການເປັນເລື່ອງເລັກນ້ອຍ, ກຳນົດເກນໃຫ້ຕ່ຳລົງເພື່ອບໍ່ໃຫ້ມີການແຈ້ງເຕືອນທີ່ສຳຄັນ.
  • ຫຼັງຈາກກວດເບິ່ງສິ່ງລົບກວນພື້ນຖານໂດຍສະເລ່ຍ dB, ແນະນໍາໃຫ້ຕັ້ງເກນຢ່າງໜ້ອຍ 55dB ສູງກວ່າຄ່າສະເລ່ຍນັ້ນ.

Hanwha-Vision-SPS-A100M-AI-Sound-Classification-and-Sound-Direction-Detection (7)ດັ່ງທີ່ສະແດງຢູ່ໃນຮູບທີ 6, ຂອບເຂດ dB ສາມາດປັບໄດ້ດ້ວຍຕົວຕັ້ງຕົວຕີໂດຍໃຊ້ຕົວເລື່ອນຫຼືຊ່ອງປ້ອນຂໍ້ມູນຕົວເລກ, ສົ່ງຜົນກະທົບໂດຍກົງຕໍ່ຄວາມອ່ອນໄຫວຂອງການກວດຫາໃນເວລາຈິງ. ເສັ້ນສະແດງພາບສະແດງເຖິງການປ່ຽນແປງຂອງສຽງ dB ໃນໄລຍະເວລາ (ເສັ້ນສີດໍາ) ແລະຂອບເຂດທີ່ກໍານົດໄວ້ (ເສັ້ນສີຂີ້ເຖົ່າ), ເຮັດໃຫ້ມັນງ່າຍທີ່ຈະເຫັນເມື່ອເຫດການສຽງ (ຈຸດສູງສຸດສີສົ້ມ) ເກີນຂອບເຂດ.

ການປັບທິດທາງສຽງ ແລະການຕັ້ງຄ່າລະບົບ
ຜະ​ລິດ​ຕະ​ພັນ Hanwha Vision ໃຫ້​ເຫດ​ການ​ເປັນ​ຄລິບ​ສຽງ​, ເຊິ່ງ​ລວມ​ທັງ​ການ​ຈັດ​ປະ​ເພດ​ສຽງ​ແລະ​ຜົນ​ການ​ກວດ​ສອບ​ທິດ​ທາງ​.

Hanwha-Vision-SPS-A100M-AI-Sound-Classification-and-Sound-Direction-Detection (1)ດັ່ງທີ່ສະແດງຢູ່ໃນຮູບທີ 7, ຜົນໄດ້ຮັບການຈັດປະເພດສຽງຈະສະແດງດ້ວຍໄອຄອນທີ່ເຂົ້າໃຈໄດ້ຢູ່ທາງລຸ່ມ, ພ້ອມກັບຜົນການກວດສອບທິດທາງສຽງ. 'ທິດທາງ (N+301.8∘)' ໝາຍເຖິງແຫຼ່ງສຽງຕັ້ງຢູ່ 301.8∘ ຕາມເຂັມໂມງຈາກເໜືອ (N).
ມູນຄ່າ 'ຄວາມຫມັ້ນໃຈ (0.74)' ທີ່ມາພ້ອມກັບຊີ້ໃຫ້ເຫັນເຖິງລະດັບຄວາມຫມັ້ນໃຈ 74%. ນີ້, ຄຽງຄູ່ກັບລະດັບຄວາມກົດດັນສຽງ (52dB), ຊ່ວຍໃຫ້ຜູ້ໃຊ້ປະເມີນສະຖານະການຢ່າງຖືກຕ້ອງແລະຕອບສະຫນອງຢ່າງໄວວາ.
ຂໍ້​ມູນ​ທິດ​ທາງ​ສຽງ​ຂອງ​ລະ​ບົບ​ອາດ​ຈະ deviate ຈາກ​ພາກ​ເຫນືອ​ທີ່​ແທ້​ຈິງ​ໃນ​ໄລ​ຍະ​ຫຼື​ເນື່ອງ​ຈາກ​ການ​ຕິດ​ຕັ້ງ​. ເນື່ອງຈາກຂໍ້ມູນທິດທາງທີ່ຖືກຕ້ອງແມ່ນຈໍາເປັນ, ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະປັບຈຸດອ້າງອີງທາງເຫນືອຕາມຄວາມຕ້ອງການ. ນີ້ສາມາດເຮັດໄດ້ໂດຍໃຊ້ຫນຶ່ງໃນສາມວິທີ:

  1. ຕິດ​ຕັ້ງ​ຜະ​ລິດ​ຕະ​ພັນ​ເພື່ອ​ປະ​ເຊີນ​ຫນ້າ​ກັບ​ພາກ​ເຫນືອ​ທີ່​ແທ້​ຈິງ​ເປັນ​ເຂັມ​ຊີ້​ບອກ​.
  2. ໃນ​ເມ​ນູ​ຜະ​ລິດ​ຕະ​ພັນ, ທ່ອງ​ໄປ​ຫາ [ລະ​ບົບ​] > [ຂໍ້​ມູນ​ຜະ​ລິດ​ຕະ​ພັນ​] > [ຮູບ​ແບບ​ການ​ຕິດ​ຕັ້ງ​] ແລະ​ໂດຍ​ກົງ​ໃສ່​ມຸມ​ທີ່​ວັດ​ຕາມ​ເຂັມ​ໂມງ​ຈາກ​ເຂັມ​ທິດ​ເຫນືອ​ໄປ​ຫາ​ຈຸດ​ອ້າງ​ອີງ​ຂອງ​ກ້ອງ​ຖ່າຍ​ຮູບ​.
  3. ໃຊ້ຄຸນສົມບັດເຂັມທິດທີ່ລວມຢູ່ໃນເຄື່ອງມືການຕິດຕັ້ງ Wisenet ສໍາລັບການຕິດຕັ້ງເບື້ອງຕົ້ນທີ່ສະດວກ ແລະຖືກຕ້ອງກວ່າ.

 ຄໍາແນະນໍາສໍາລັບສະພາບແວດລ້ອມສຽງທີ່ສັບສົນ

  • ສະພາບແວດລ້ອມສຽງທີ່ສັບສົນ: ໃນສະພາບແວດລ້ອມທີ່ມີສຽງຫຼາຍສຽງພ້ອມໆກັນ, ຮູບແບບ AI ອາດຈະຈັດປະເພດພວກມັນເປັນສຽງດຽວ ຫຼືຈັດປະເພດພວກມັນຜິດ. ນີ້ແມ່ນປະກົດການທໍາມະຊາດ; ການວິເຄາະທີ່ສົມບູນແບບຂອງຂໍ້ມູນທີ່ສະຫນອງໃຫ້ໂດຍລະບົບຈະຊ່ວຍຮັບປະກັນການຮັບຮູ້ສະຖານະການທີ່ຖືກຕ້ອງ.
    ການວິເຄາະສິ່ງແວດລ້ອມສໍາລັບສັນຍານເຕືອນທີ່ຖືກຕ້ອງ: ຮູບແບບການຈັດປະເພດສຽງອາດຈະສ້າງສັນຍານເຕືອນສໍາລັບສຽງທີ່ຄ້າຍຄືກັນກັບສຽງເຫດການແຕ່ບໍ່ໄດ້ຢູ່ໃນປະເພດການຈັດປະເພດເຊັ່ນ: ການເສຍສະຫຼະຂອງວັດຖຸໂລຫະ, ການໂທຫາສັດ, ເຄື່ອງດົນຕີ, ຫຼືສຽງດັງທີ່ມີພະລັງຢ່າງກະທັນຫັນອື່ນໆ. ຄວາມເຂົ້າໃຈລັກສະນະຂອງຕົວແບບນີ້ຊ່ວຍໃຫ້ທ່ານສາມາດຄາດຄະເນແລະກຽມພ້ອມສໍາລັບສັນຍານເຕືອນຈາກສຽງພິເສດເຫຼົ່ານີ້, ປະສິດທິຜົນຫຼຸດຜ່ອນຄວາມສັບສົນທີ່ບໍ່ຈໍາເປັນ.

ສະຫຼຸບ

ໂດຍການເຄື່ອນຍ້າຍເກີນຂອບເຂດຈໍາກັດຂອງການສັງເກດການສາຍຕາ, Hanwha Vision's AI Audio Solution ສ້າງລະບົບເຕືອນໄພເບື້ອງຕົ້ນທີ່ສົມບູນແບບຢ່າງແທ້ຈິງທີ່ວິເຄາະສຽງຢ່າງສະຫຼາດ.
ກະດາດສີຂາວນີ້ເຮັດຫນ້າທີ່ເປັນຄູ່ມືພາກປະຕິບັດ, ສ້າງຄວາມເຂັ້ມແຂງໃຫ້ທ່ານປະຕິບັດແລະເພີ່ມປະສິດທິພາບເຕັກໂນໂລຢີສໍາລັບສະພາບແວດລ້ອມສະເພາະຂອງທ່ານ - ຈາກການຕິດຕັ້ງເບື້ອງຕົ້ນຈົນເຖິງການປັບລະອຽດສໍາລັບການປະຕິບັດສູງສຸດ.
ໃນຂະນະທີ່ສິ່ງທ້າທາຍດ້ານຄວາມປອດໄພພັດທະນາ, Hanwha Vision ຍັງຄົງມຸ່ງຫມັ້ນທີ່ຈະກ້າວຫນ້າຄວາມສາມາດໃນການວິເຄາະສຽງຂອງຕົນ, ຮັບປະກັນປະສົບການຄວາມປອດໄພທີ່ຫມັ້ນຄົງ, ມີປະສິດທິພາບ, ແລະກ້າວຫນ້າໃນທຸກສະຖານະການ.

Hanwha ວິໄສທັດ

  • 13488 Hanwha Vision R&D ສູນ,
  • 6 Pangyo-ro 319-gil, Bundang-gu, Seongnam-si, Gyeonggi-do, ເກົາຫຼີ www.HanwhaVision.com
  • ສະຫງວນລິຂະສິດ ⓒ 2025 Hanwha Vision. ສະຫງວນລິຂະສິດທັງໝົດ.

ເອກະສານ / ຊັບພະຍາກອນ

Hanwha Vision SPS-A100M AI Sound Classification and Sound Direction Detection [pdf] ຄູ່ມືເຈົ້າຂອງ
SPS-A100M AI Sound Classification and Sound Direction Detection, SPS-A100M, AI Sound Classification and Sound Direction Detection, Classification and Sound Direction Detection, Sound Direction Detection, Direction Detection, Detection

ເອກະສານອ້າງອີງ

ອອກຄໍາເຫັນ

ທີ່ຢູ່ອີເມວຂອງເຈົ້າຈະບໍ່ຖືກເຜີຍແຜ່. ຊ່ອງຂໍ້ມູນທີ່ຕ້ອງການຖືກໝາຍໄວ້ *