opentext 人工智慧與機器

opentext 人工智慧與機器

人工智慧 (AI) 正在改變我們與機器互動的方式以及機器與我們互動的方式。本指南詳細介紹了人工智慧的運作方式、各種類型機器學習的優點和局限性,以及這個不斷變化的研究領域的演變。它還探討了人工智慧支援的安全分析或使用者和實體行為分析 (UEBA) 的作用,以更好地保護企業免受當今複雜的網路安全威脅。

機器學習與人類學習

人工智慧 (AI) 無所不在,至少在 OpenText™ 看來,人工智慧的興起既令人興奮又充滿挑戰,但隨著我們與同行、客戶和合作夥伴的接觸,我們逐漸意識到,人工智慧的概念並不總是容易理解。

理解人工智慧最簡單的方法是將其映射到我們已經理解的東西——我們自己的智慧非人工的人類智慧是如何運作的?在最基本的層面上,我們的智力遵循一個簡單的進程:我們接收訊息,我們處理它,最終訊息幫助我們採取行動

讓我們把它分解成一個系統圖在下圖中,從左到右,人類智能的三個一般步驟:輸入,處理和輸出在人腦中,輸入以感知和感知事物的形式發生你的眼睛,鼻子、耳朵等,在左側接收原始輸入,例如光的光子或鬆樹的氣味,然後對其進行處理。接收到的原始輸入。

圖 1. 人類智能
機器學習與人類學習
非人工的人類智慧如何運作?在最基本的層面上,我們的智力遵循一個簡單的進程:我們接收訊息,我們處理它,最終訊息幫助我們採取行動。

停在道路交叉口的圖片 你的眼睛看到你前面的交通燈剛剛變綠 根據你從經驗(和駕駛員教育)中學到的知識,你知道綠燈表示你應該向前行駛 因此,你踩下油門綠燈是原始輸入,你的加速度是輸出;中間的一切都在處理中

為了聰明地駕馭我們周圍的世界——接聽電話、烘烤巧克力餅乾或遵守交通信號燈——我們需要處理我們收到的輸入這是人類智能處理的核心,它最終分為三個不同的方面:

  1. 知識和記憶。 我們透過吸收事實(例如,黑斯廷斯戰役發生於1066 年)和社會規範(例如,說「請」和「謝謝」被認為是禮貌的)來累積知識。來自過去到現在的情況 例如amp呃,愛德華記得簡沒有感謝他送她的生日禮物,所以他不指望簡送她聖誕禮物時簡會感謝他
  2. 決定與推理。 決策和推理是根據原始輸入結合知識和/或記憶做出的amp嗯,愛德華去年吃了一個墨西哥辣椒,但不喜歡它。
  3. 學習。 人類可以透過前任學習amp文件、觀察或演算法 在前學習中ample,我們被告知一種動物是狗,另一種是貓透過觀察學習,​​我們自己弄清楚狗會叫,貓會喵叫第三種學習方法——演算法——使我們能夠通過以下方式完成任務一系列步驟或特定演算法(例如,執行長除法)

人類智慧的這些面向與人工智慧類似,正如我們接收資訊、處理資訊並共享輸出一樣,機器也可以。

圖 2. 人工智慧
機器學習與人類學習

為了聰明地駕馭我們周圍的世界——接聽電話、烘焙巧克力餅乾或遵守交通號誌——我們需要處理我們收到的輸入。

在機器中,人工智慧的輸入部分有自然語言處理、語音識別、視覺識別等,這樣的技術和演算法隨處可見,從需要感知道路和障礙物的自動駕駛汽車,到Alexa或Siri當它識別出你的語音時隨後的輸出是機器與我們周圍的世界互動的方式這可能採取機器人、導航系統(引導那些自動駕駛汽車)、語音生成(例如Siri)等形式之間,我們進行了各種形式的處理

與我們累積知識和記憶類似,機器可以創建知識表示(例如,圖形資料庫、本體)來幫助它們儲存有關世界的信息,就像人類做出決策或得出推論一樣,機器可以做出預測、針對目標進行最佳化或結果,並確定實現特定目標的最佳後續步驟或決策

最後,正如我們從前任學到的那樣amp文件、觀察或演算法,可以使用類似的方法來教導機器監督機器學習很像透過前學習ample:給電腦一個資料集,其中資料集中帶有「標籤」作為答案,並最終學會區分不同標籤之間的區別(例如,該資料集包含標記為「狗」或「貓」的照片,並且有足夠的前任amp例如,電腦會注意到狗通常比貓有更長的尾巴和更尖的耳朵)

另一方面,無監督機器學習就像透過觀察進行學習電腦觀察模式(狗吠和貓喵喵),並透過這種方式學會自己區分群體和模式(例如,有兩組動物可以透過它們發出的聲音來區分;一組叫(狗),另一組喵叫(貓))無監督學習不需要標籤,因此當數據集有限且沒有標籤時可能更可取。指示計算機做什麼時會發生什麼。

一般來說,最準確和最有缺陷的人工智慧結果需要結合多種學習方法有監督和無監督的機器學習都是有用的方法——關鍵在於將正確的方法應用於正確的用例

接下來,我們將把機器學習放在顯微鏡下,以了解人工智慧的這一部分如何鏡像我們大腦中的神經元,將輸入轉化為最佳輸出。

理想情況下,最準確、最高效的人工智慧結果需要結合多種學習方法。有監督和無監督的機器學習都是有用的方法——關鍵在於將正確的方法應用於正確的用例。

神經網路和深度學習

機器學習只是人工智慧的一部分,儘管它包含大量演算法子集,今天您經常聽到的一種方法是“深度學習”,這種演算法近年來在新聞中受到了相當多的關注。世紀1980 年代流行的機器學習演算法的演變,您可能認識它:神經網路。

神經網路——一種訓練機器「學習」的程式設計範式——受到神經元或人體內特殊細胞的啟發,這些細胞構成了我們神經系統的基礎,特別是大腦。 ,觸發神經網路。

圖3。神經元如何接收和發送訊息
神經網路和深度學習

我們所認為的人類學習的大部分內容可以透過大腦中兩個神經元之間的連接強度以及突觸邊緣的強度來描述。

在本指南的第一部分中,我們討論了人類智能的基本過程:左側輸入,右側輸出神經元(如上圖所示)在這方面發揮著關鍵作用在神經元的左側,細胞體收集“輸入」一旦接收到足夠的輸入或刺激,軸突就會將訊息傳送到右側-突觸,然後「輸出」會傳送到其他神經元

在任何特定時刻,我們的神經元都在彼此之間傳遞訊息這些細胞負責我們感知周圍環境的能力當我們學習時,我們的神經元變得非常活躍事實上,我們所認為的人類學習的大部分內容都可以描述為我們大腦中兩個神經元之間的連結有多強,以及突觸邊緣的強度

神經網路是神經元細胞集合的數學模擬下圖表示具有 3 層和 12 個節點的基本神經網絡

每個圓形節點代表一個人工的、受生物學啟發的「神經元」。訊號沿著線條從左到右流動。啟發。

圖4。簡單的神經網絡
神經網路和深度學習

神經網路透過嘗試將提供給輸入層的資料集與輸出層中的期望結果相符來進行學習。數學方程式計算輸出,將模擬輸出與期望結果進行比較,然後根據所得差異對連接強度進行調整。

神經網路透過嘗試將提供給輸入層的資料集與輸出層中的期望結果相符來進行學習。會被迭代地修改,直到計算的輸出足夠接近期望的結果,此時我們說神經網路已經「學習」了

圖 5. 複雜神經網路
神經網路和深度學習

這些「更深」的神經網路可以進行更複雜的預測,可以有數千個節點和數百個層,這意味著數千種不同的計算深度學習模型已經變得非常擅長特定問題,例如語音或圖像識別。

然而,值得注意的是,深度學習並不是機器學習的靈丹妙藥——尤其是在網路安全領域,有時並沒有大量適合深度學習方法的乾淨數據,選擇正確的演算法很重要,數據和工作原則這是機器收集證據、連接點並得出結論的最佳方式

神經網路可能看起來像是未來的東西,但它已經存在了一段時間了。來了解神經網路和機器學習如何滲透到現代生活的許多方面。

神經網路可能看起來像是未來的東西,但它已經存在了一段時間了。事實上,神經網路是基於 1940 世紀 XNUMX 年代開始流行的想法。

人工智能簡史

對某些人來說,人工智慧 (AI) 一詞可能會讓人聯想到擁有飛行汽車和家用機器人的未來城市,但人工智慧並不是一個未來概念,至少不再是這樣了。希臘神赫菲斯托斯會說話的機械女僕) 1930 自XNUMX 世紀XNUMX 年代以來,科學家和數學家一直渴望探索創造獨立於人類的真正智能

20 世紀中葉人工智慧的決定性時刻是數學和生物學的完美融合,諾伯特·維納(Norbert Wiener)、克勞德·香農(Claude Shannon) 和艾倫·圖靈(Alan Turing) 等研究人員已經在電信號和計算的交叉點上取得了進展。世界鋪平了道路,並且在1943 年,人工智慧研究領域正式確立為一門學科

70世紀後半葉是人工智慧研究和進步的激動人心的時期,偶爾會被80年代中期和XNUMX年代末的「人工智慧寒冬」打斷,人工智慧未能滿足公眾的期望,對該領域的投資有所減少。

故事是這樣的:

1980年代,鋼筆tag決定使用神經網路來識別偽裝坦克僅使用一台主機(請記住,從1980 年代開始),神經網路就用200 張圖片進行訓練- 100 輛坦克和100 棵樹儘管神經網路相對較小(由於1980世紀100 年代)由於計算和內存的限制),實驗室訓練的準確率達到了 XNUMX%。

圖6。實驗室與現場圖片(資料來源:Neural Network Follies,Neil Fraser,1998 年 XNUMX 月)
人工智慧簡史

隨著 1980 世紀 XNUMX 年代難以想像的大量運算資源的出現,深度神經網路迅速成為熱門的研究領域。深度學習使系統能夠透過數十億次組合和觀察自動“學習”,從而減少對人力資源的依賴。

為什麼神經網路在實驗室的照片上表現得如此出色,但在野外卻完全失敗了?原來,非坦克照片都是在天空多雲的日子裡拍攝的;所有樹木的照片都是在陽光明媚的日子拍攝的神經網路經過訓練可以識別陽光,而不是坦克

但最終,透過深度學習進行視覺識別——由比筆複雜得多的神經網路促進tag1980 年,史丹佛大學教授 Andrew Ng 和 Google 研究員 Jef Dean 使用 2012 台每台 1000 核計算機創建了第一個深度神經網絡,任務:分析 16 萬個 YouTube 視頻 結果:它發現了貓² 得益於其“深度學習」演算法,網路能夠隨著時間的推移識別出貓,並且準確度非常高

隨著 1980 世紀 XNUMX 年代難以想像的大量計算資源的出現,深度神經網絡迅速成為熱門研究領域。 深度學習使系統能夠通過數十億種組合和觀察自動“學習”,從而減少對網絡的依賴。網路安全領域,該方法對於檢測惡意軟體特別有前景——在這種情況下,我們擁有包含許多前任的大型資料集。amp網路可以學習的惡意軟體文件

不幸的是,深度學習方法目前在某些用例(例如內部威脅)方面效果較差,因為我們根本沒有所需數量的有關這些類型攻擊的正確資料類型,最常見的是,我們擁有的資訊關於內部威脅的傳聞都是軼事,這些類型的神經網路無法有效地利用這些軼事。

在我們能夠收集更有效的資料集(並降低深度學習系統的成本和複雜性)之前,深度學習並不是所有用例的正確選擇,沒關係深度學習只是許多機器學習演算法中的一種,這些方法可以是就像不是更有價值一樣——這一切都取決於手邊的工作

自從人工智慧技術正式「誕生」以來的六十年裡,我們已經看到了人工智慧技術的巨大潛力,而我們僅僅觸及了表面,特別是在安全方面。和分析的潛在應用,以改變人們的生活。

預測分析只是一個更大難題的一小部分,它可以為我們的安全團隊提供更有用的見解。

自從人工智慧技術正式「誕生」以來的六年裡,我們已經看到了人工智慧技術的巨大潛力,但我們僅僅觸及了表面,尤其是在安全方面。

安全分析的新願景

到目前為止,本指南已經仔細研究了機器學習,了解其局限性和優勢機器學習在促進人工智慧方面具有巨大的潛力,但值得注意的是,更廣泛的威脅檢測遊戲不僅僅涉及深度學習或機器學習正如我們今天所知,新的分析方法與新的資料類型相結合可以為我們提供全新的框架來分析安全威脅並採取行動。

新方法 自適應分析 不確定性下的持續分析最佳化 回應環境 回應本地變化/回饋 量化或減輕風險
傳統的 最佳化 預測建模 模擬 預測警報 查詢/深入分析 特別報告 標準報告 決策複雜性、解決速度隨意性、機率性、置信度高保真度、遊戲、資料耕作更大的資料集、非線性回歸規則/觸發器、情境敏感、複雜事件記憶體資料、模糊搜尋、地理空間前查詢amp文件、使用者防護報告 即時、視覺化、使用者交互
新數據 實體解析關係式、特徵提取註解和標記化 人、角色、位置、事物 規則、語意推理、配對 自動化、眾包

我們已經看到了分析可以為其他行業做些什麼,並且分析也有可能對網路安全產生深遠的影響,我們看到這種情況正在一個我們稱為安全分析的新領域中形成,該領域本質上是經過實戰檢驗的我們已經討論過(以及更多)並應用它們的演算法和方法有助於解決安全中真正困難的問題

我們今天在安全領域看到的最常見的分析涉及預測模型,它使我們能夠識別大量數據中可能存在風險的地方(這就是異常檢測的作用)簡而言之,預測建模將歷史數據與實時行為結合起來理解或預測未來的行為有了這個,我們可以回答這個問題:“接下來會發生什麼?”

但我們對安全分析的願景不止於此預測分析只是一個更大難題的一小部分,它可以為我們的安全團隊提供更有用的見解理想的分析範式結合了智慧感測器和無所不在的資料來源(桌面和伺服器、行動裝置) 、雲端、社交網路、開放資料等-採用多種先進的行為和威脅分析方法,包括取證分析、風險建模、異常偵測、行為和回應最佳化等

這意味著我們可以做的不僅僅是預測或識別威脅,它使我們能夠更進一步,不僅提供高級檢測,還提供深入了解如何最有效地響應的安全分析使我們有能力回答其他關鍵問題,例如“如何有很多威脅嗎?以及“最好的反應是什麼?”

我們還沒有看到其他類別的分析,例如應用於網路安全的最佳化方法,但它們具有巨大的潛力這些技術著眼於對安全風險的所有可能反應並確定最佳響應是的,有一些方法可以用數學來做到這一點

對於前amp例如,當您遇到問題致電手機服務供應商時,會使用最佳化方法。他們不會隨機建議是否以折扣價升級您的服務方案;他們依賴後台的一組數學,查看您的通話記錄、斷線次數、您的歷史記錄與其他用戶的比較情況等,它甚至計算您可能切換到另一個服務提供者的機率然後,在所有可能在的後續步驟中,它會計算最佳的下一步,以最大限度地提高客戶保留率

安全團隊可以應用相同的數學來識別風險,提供多種反應方式,並從數學上確定最佳回應,以最大限度地遏制該特定風險

安全威脅的迅速崛起和演變使得此類回應效率變得至關重要今天我們擁有比以往任何時候都多的數據值得慶幸的是,我們還擁有更強的計算能力、更好的演算法以及更廣泛的研究和技術投資來幫助我們理解這些數據通過數學 總而言之,我們相信安全分析才剛開始。

今天我們擁有的數據比以往任何時候都多。值得慶幸的是,我們還擁有更強的計算能力、更好的演算法以及更廣泛的研究和技術投資,以幫助我們透過數學理解這些數據。無論如何,我們相信安全分析才剛開始。

客戶支援

與我們聯繫
www.opentext.com
符號OpenText Cyber​​security 為各種規模的公司和合作夥伴提供全面的安全解決方案從預防、偵測和回應到復原、調查和合規性,我們統一的端到端平台可協助客戶透過整體安全產品組合建立網路彈性由我們的可行見解提供支援即時和情境威脅情報,OpenText Cyber​​security 客戶受益於高效產品、合規體驗和簡化的安全性,以幫助管理業務風險
762-000016-003 |哦| 01/24 | © 2024 開放文本

標識

標識

文件/資源

opentext 人工智慧和機器學習 [pdf] 指示
人工智慧與機器學習、智慧與機器學習、機器學習

參考

發表評論

您的電子郵件地址不會被公開。 必填欄位已標記 *