opentext 人工知能とマシン
人工知能 (AI) は、人間と機械のやり取りの方法、および機械と人間のやり取りの方法を変えています。このガイドでは、AI の機能、さまざまな種類の機械学習の長所と限界、そして常に変化するこの研究分野の進化について詳しく説明します。また、今日の複雑なサイバーセキュリティの脅威から企業をより適切に保護するための、AI 対応のセキュリティ分析またはユーザーとエンティティの行動分析 (UEBA) の役割についても説明します。
機械と人間の学習
人工知能 (AI) はどこにでもあります。少なくとも、そのように見えます。OpenText™ にとって、AI の台頭は刺激的でもあり、挑戦でもあります。しかし、同業者、顧客、パートナーと関わっていくうちに、AI の概念は必ずしも簡単に理解できるわけではないことに気づきました。この AI と機械学習 101 ガイドを始めるにあたり、多くの人が抱く主な疑問「人工知能とは実際何なのか?」に答えることで、AI パズルを解き明かしていきます。
人工知能を理解する最も簡単な方法は、それを私たちがすでに理解しているもの、つまり私たち自身の知能に当てはめることです。非人工的な人間の知能はどのように機能するのでしょうか?最も基本的なレベルでは、私たちの知能は単純な流れを辿ります。つまり、情報を受け取り、それを処理し、最終的にその情報が行動の助けになるのです。
これをシステム図に分解してみましょう。下の図では、左から右への人間の知能の 3 つの一般的なステップ、入力、処理、出力が示されています。人間の脳では、入力は物事を感知して知覚するという形で行われます。目、鼻、耳などは、光子や松の木の匂いなどの生の入力を左側で受け取り、それを処理します。システムの右側は出力です。これには発話や行動が含まれ、どちらも脳が受け取る生の入力をどのように処理するかに依存しています。処理は真ん中で行われ、そこで知識や記憶が形成されて取得され、決定や推論が行われ、学習が行われます。
図1. 人間の知能
非人工的な人間の知能はどのように機能するのでしょうか? 最も基本的なレベルでは、私たちの知能は単純な流れに従います。つまり、情報を取り入れ、それを処理し、最終的にその情報が行動に役立ちます。
道路の交差点で停止しているところを想像してください。目の前の信号がちょうど青に変わったのが目に入ります。経験(および運転教育)から学んだことに基づいて、青信号は前進すべきであることを知っているので、アクセルを踏みます。青信号は生の入力であり、加速は出力です。その間のすべては処理です。
電話に出る、チョコチップクッキーを焼く、信号に従うなど、私たちの周りの世界を賢くナビゲートするには、受け取った入力を処理する必要があります。これが人間の知能処理の核心であり、最終的には 3 つの異なる側面に分けられます。
- 知識と記憶。 私たちは、事実(ヘイスティングスの戦いは1066年に起こった)や社会規範(「お願いします」や「ありがとう」と言うのは礼儀正しいとされる)を摂取することで知識を蓄積していきます。さらに、記憶によって過去の情報を思い出し、現在の状況に適用することができます。例えば、ampエドワードはジェーンが誕生日プレゼントに感謝しなかったことを覚えているので、クリスマスプレゼントをあげたときにジェーンが感謝してくれるとは思っていない。
- 決定と推論。 意思決定や推論は、生の入力と知識や記憶に基づいて行われます。例:ampエドワードは去年ハラペーニョを食べたが、気に入らなかった。ジョニーがエドワードに唐辛子を勧めると、彼はそれを食べないことにした。
- 学ぶ。 人間は例によって学ぶことができるample、観察、またはアルゴリズム例による学習ampたとえば、ある動物は犬で、別の動物は猫だと教えられます。観察による学習では、犬は吠え、猫はニャーと鳴くということを自分で理解します。3つ目の学習方法であるアルゴリズムでは、一連の手順や特定のアルゴリズム(たとえば、長除算を実行する)に従ってタスクを完了することができます。
人間の知能のこれらの側面は人工知能と似ています。私たちが情報を受け取り、処理し、出力を共有するのと同じように、機械も情報を受け取ることができます。これがどのように表されるかを確認するには、下の図を見てみましょう。
図2. 人工知能
電話に出たり、チョコチップクッキーを焼いたり、信号に従ったりと、私たちの周りの世界を賢く移動するには、受け取った入力を処理する必要があります。
機械では、人工知能の入力部分の例として、自然言語処理、音声認識、視覚認識などが挙げられます。道路や障害物を感知する必要がある自動運転車から、音声を認識するAlexaやSiriまで、このような技術やアルゴリズムはいたるところで見られます。その後の出力は、機械が私たちの周りの世界と対話する方法です。これは、ロボット工学、ナビゲーションシステム(自動運転車を誘導するため)、音声生成(例:Siri)などの形をとることがあります。その間には、さまざまな形式の処理が行われます。
人間が知識や記憶を蓄積するのと同様に、機械は知識表現(グラフデータベース、オントロジーなど)を作成し、世界に関する情報を保存することができます。人間が意思決定や推論を行うのと同じように、機械は予測を行い、目標や結果を最適化し、特定の目標を達成するための最善の次のステップや決定を決定することができます。
最後に、私たちが例によって学んだようにamp教師あり学習は、実験、観察、アルゴリズムなどの類似の方法を使用して機械に教えることができる。教師あり学習は、実験による学習によく似ている。amp例: コンピュータはデータセット内の「ラベル」が答えとなるデータセットを与えられ、最終的には異なるラベルの違いを区別することを学習します(例: このデータセットには「犬」または「猫」とラベル付けされた写真が含まれており、十分な例amp例えば、コンピューターは犬は一般的に猫よりも尻尾が長く、耳が尖っていないことに気づくでしょう。
一方、教師なし機械学習は、観察による学習に似ています。コンピューターはパターン(犬は吠え、猫はニャーと鳴く)を観察し、これを通じてグループとパターンを独自に区別することを学習します(たとえば、動物には鳴き声で分けられる 2 つのグループがあり、1 つのグループは吠える(犬)で、もう 1 つのグループはニャーと鳴く(猫)など)。教師なし学習ではラベルは必要ないため、データ セットが限られていてラベルがない場合に適しています。最後に、アルゴリズムによる学習は、プログラマーがソフトウェア プログラムでコンピューターに正確に何を行うかを段階的に指示するときに行われます。
結局のところ、最も正確で欠陥のある人工知能の結果を得るには、学習方法の組み合わせが必要です。教師あり学習と教師なし学習はどちらも便利な方法ですが、適切なアプローチを適切なユースケースに適用することが重要です。
次に、機械学習を詳しく調べて、AI のこの部分がどのように脳内のニューロンを反映して入力を最適な出力に変換するのかを理解します。
理想的には、最も正確で効率的な人工知能の結果を得るには、学習方法を組み合わせる必要があります。教師あり機械学習と教師なし機械学習はどちらも便利な方法ですが、重要なのは適切なアプローチを適切なユースケースに適用することです。
ニューラルネットワークとディープラーニング
機械学習は AI の一部にすぎませんが、その中には膨大なアルゴリズムのサブセットが含まれています。今日よく耳にする手法の 1980 つが「ディープ ラーニング」です。これは、近年ニュースでかなりの注目を集めているアルゴリズムです。その人気と成功を理解するには、その仕組みを理解することが役立ちます。ディープ ラーニングは、XNUMX 年代に人気があった機械学習アルゴリズム (ご存知の方もいるでしょう) の進化形です。ニューラル ネットワークです。
ニューラル ネットワークは、機械に「学習」を訓練するプログラミング パラダイムであり、人体の神経系、特に脳の基礎を形成するニューロン、つまり特殊な細胞にヒントを得ています。これらの細胞は、体全体に信号を送信し、神経系の反応とプロセスをトリガーします。ニューロンは、私たちが見たり、聞いたり、嗅いだりすることを可能にするものです。
図3ニューロンがメッセージを受信して送信する方法
私たちが人間の学習と考えるものの多くは、脳内の 2 つのニューロン間の接続の強さとシナプスの端の強さによって説明できます。
このガイドのパート1では、人間の知能の基本的なプロセスである、左側の入力と右側の出力について説明しました。ニューロン(上図)は、このプロセスで重要な役割を果たします。ニューロンの左側では、細胞体が「入力」を収集します。十分な入力または刺激を受け取ると、軸索が伸び、情報を右側のシナプスに伝達します。次に、「出力」が他のニューロンに送信されます。
いかなる瞬間も、私たちのニューロンは互いにメッセージをやり取りしています。これらの細胞は、私たちが周囲を知覚する能力を担っています。そして、私たちが学習するとき、私たちのニューロンは非常に活発になります。実際、人間の学習と考えられているものの多くは、脳内の2つのニューロン間の接続の強さとシナプスの縁の強さによって説明できます。
ニューラルネットワークはニューロン細胞の集合を数学的にシミュレーションしたものです。下の画像は3層12ノードの基本的なニューラルネットワークを表しています。
各円形ノードは、生物学的にヒントを得た人工の「ニューロン」を表します。線は、左側の人工ニューロンの出力から右側の別の人工ニューロンの入力への接続を表します。これらのニューロン間の信号は、線に沿って左から右に流れます。これらのネットワークでは、ピクセル データなどの入力は、入力層から中間の「隠れた」層を経て、最終的に出力層に流れます。これは、実際の生物学的ニューロンの電気的活動に大まかにヒントを得た数式で記述されます。
図4. シンプルなニューラルネットワーク
ニューラル ネットワークは、入力層に提示されたデータ セットを出力層の望ましい結果と一致させることで学習します。数式によって出力が計算され、シミュレートされた出力が望ましい結果と比較され、その結果の差によって接続の強度が調整されます。
ニューラルネットワークは、入力層に提示されたデータセットを出力層の望ましい結果と一致させることで学習します。数式によって出力が計算され、シミュレートされた出力が望ましい結果と比較され、その結果の差によって接続の強度が調整されます。これらの調整は、計算された出力が望ましい結果に十分近くなるまで繰り返し変更され、その時点でニューラルネットワークは「学習」したとみなされます。
図5. 複雑なニューラルネットワーク
これらの「より深い」ニューラル ネットワークは、はるかに複雑な予測を行うことができます。数千のノードと数百のレイヤーが存在する可能性があり、これは数千の異なる計算を意味します。ディープラーニング モデルは、音声認識や画像認識などの特定の問題に非常に優れています。
ただし、ディープラーニングは機械学習の万能薬ではないことに注意が必要です。特にサイバーセキュリティでは、ディープラーニング手法に最適な大量のクリーンなデータがない場合があります。仕事に適したアルゴリズム、データ、原則を選択することが重要です。これは、機械が証拠を集め、点と点を結び付け、結論を導き出すための最良の方法です。
ニューラル ネットワークは未来のもののように思えるかもしれませんが、すでにかなり前から存在しています。実際、ニューラル ネットワークは 1940 年代に広まり始めたアイデアに基づいています。次のセクションでは、少し時間を遡って、ニューラル ネットワークと機械学習が現代生活のさまざまな部分に浸透してきた経緯を理解します。
ニューラル ネットワークは未来のもののように思えるかもしれませんが、すでにかなり前から存在しています。実際、ニューラル ネットワークは 1940 年代に広まり始めたアイデアに基づいています。
人工知能の簡単な歴史
人工知能(AI)という言葉を聞くと、空飛ぶ車や家庭用ロボットがある未来都市を思い浮かべる人もいるかもしれない。しかし、AIは、少なくとももう未来的な概念ではない。そのように呼ばれてはいないものの、人工知能の考え方は古代(ギリシャ神ヘパイストスのしゃべる機械仕掛けの侍女など)にまで遡ることができる¹。1930年代以来、科学者や数学者は、人間とは別の真の知能を創造することを熱心に模索してきた。
20世紀半ばのAIの決定的な瞬間は、数学と生物学の幸せな合流であり、ノーバート・ウィーナー、クロード・シャノン、アラン・チューリングなどの研究者がすでに電気信号と計算の交差点を少しずつ解明していました。1943年までに、ウォーレン・マカロックとウォルター・ピッツはニューラルネットワークのモデルを作成しました。ニューラルネットワークは、より強力なコンピューティングの素晴らしい新世界への道を開き、1956年にAI研究分野が正式に学問分野として確立されました。
70世紀後半はAIの研究と進歩にとって刺激的な時代だったが、80年代半ばからXNUMX年代後半にかけてAIが一般の期待に応えられず、この分野への投資が削減された「AIの冬」が時折訪れた。しかし、挫折にもかかわらず、AIと機械学習のさまざまな応用が次々と登場した。そのような応用に関するある逸話は、科学界で人気の寓話となっており、AIの研究と実装の試練と苦難を非常に効果的に語っている。
物語はこんな感じです。
1980年代、ペンtagチームは、ニューラル ネットワークを使用して、迷彩柄の戦車を識別することを決定しました。 1980 台のメインフレーム (200 年代のもの) のみを使用して、ニューラル ネットワークは 100 枚の写真 (戦車 100 台と木 1980 本) を使用してトレーニングされました。 100 年代の計算とメモリの制限により、ニューラル ネットワークは比較的小規模でしたが、ラボでのトレーニングでは XNUMX% の精度が得られました。 このような成功を受けて、チームはフィールドで試してみることにしました。 結果は芳しくありませんでした。
図6実験室と現場での写真の比較 (出典: Neural Network Follies、Neil Fraser、1998 年 XNUMX 月)
1980 年代には夢にも思わなかった膨大なコンピューティング リソースが利用できるようになったことで、ディープ ニューラル ネットワークは急速に人気の研究分野になりました。ディープラーニングにより、システムは数十億の組み合わせと観察を通じて自動的に「学習」できるようになり、人的リソースへの依存度が軽減されます。
なぜニューラルネットワークは研究室の写真では素晴らしい結果を出しているのに、野外ではまったくダメなのだろうか? 戦車以外の写真はすべて曇りの日に撮られたのに対し、木の写真はすべて太陽が輝いている日に撮られたことが判明した。ニューラルネットワークは戦車ではなく、日照を認識するように訓練されていた。
しかし、最終的には、ペンよりもはるかに複雑なニューラルネットワークによって促進されるディープラーニングによる視覚認識がtag1980年代のメインフレームで処理できたであろう処理能力が現実のものとなった。2012年、スタンフォード大学のアンドリュー・ン教授とグーグルのジェフ・ディーンは、1000コアのコンピュータ16台を使って、世界初のディープニューラルネットワークを作成した。タスクはYouTube動画10万本を分析すること。結果:猫を発見した。「ディープラーニング」アルゴリズムのおかげで、ネットワークは時間の経過とともに猫を非常に高い精度で認識することができた。
1980年代には夢にも思わなかった膨大なコンピューティングリソースが利用できるようになったことで、ディープニューラルネットワークは急速に研究対象として人気が高まっています。ディープラーニングは、システムに数十億の組み合わせと観察を通じて自動的に「学習」する能力を与え、人的資源への依存を減らします。サイバーセキュリティの分野では、この方法はマルウェアの検出に特に有望になっています。ampネットワークが学習できるマルウェアのリスト
残念ながら、ディープラーニング手法は、内部脅威などの特定のユースケースに関しては、現時点ではそれほど効果的ではありません。これは、この種の攻撃に関する適切な種類のデータが、必要な量だけ存在しないためです。ほとんどの場合、内部脅威に関して私たちが持っている情報は逸話的なものであり、この種のニューラル ネットワークでは効率的に使用できません。
より効果的なデータセットを収集し(そしてディープラーニングシステムのコストと複雑さを軽減し)、ディープラーニングはすべてのユースケースに適した選択肢ではありません。そしてそれは問題ありません。ディープラーニングは多くの機械学習アルゴリズムの1つに過ぎず、これらのアプローチは同等かそれ以上に価値がある可能性があります。すべては手元の仕事次第です。
AI テクノロジーが正式に「誕生」してから 60 年が経ち、その大きな可能性を目の当たりにしてきましたが、特にセキュリティの分野ではまだその表面をかすめたに過ぎません。次に、AI と分析の潜在的な用途について、セキュリティの脅威を特定して対応する方法を変革するために、さらに深く掘り下げていきます。
予測分析は、セキュリティ チームにさらに役立つ洞察を提供できる、はるかに大きなパズルの 1 つのピースにすぎません。
AI テクノロジーが正式に「誕生」してから 60 年が経ち、その計り知れない可能性を私たちは目の当たりにしてきましたが、特にセキュリティの分野では、その可能性はまだ表面をかすめた程度にしか過ぎません。
セキュリティ分析の新たなビジョン
これまで、このガイドでは機械学習を詳しく調べ、その限界と強みを理解してきました。機械学習は AI を促進する上で大きな可能性を秘めていますが、脅威検出のより広範な分野は、今日知られているディープラーニングや機械学習だけではないことに注意する必要があります。新しい分析方法と新しいデータ タイプを組み合わせることで、セキュリティの脅威を分析して対処するためのまったく新しいフレームワークを実現できます。
新しい方法 | 適応分析 継続的分析 不確実性下での最適化 | 状況への対応 ローカルの変更/フィードバックへの対応 リスクの定量化または軽減 |
伝統的 | 最適化 予測モデリング シミュレーション 予測 アラート クエリ/ドリルダウン アドホックレポート 標準レポート | 意思決定の複雑さ、解決のスピード カジュアル、確率、信頼度 高い忠実度、ゲーム、データファーミング 大規模なデータセット、非線形回帰 ルール/トリガー、コンテキスト依存、複雑なイベント メモリ内データ、あいまい検索、地理空間 exによるクエリample、ユーザーディフェンスレポートリアルタイム、視覚化、ユーザーインタラクション |
新しいデータ | エンティティ解決関係、特徴抽出注釈およびトークン化 | 人、役割、場所、物 ルール、意味推論、マッチング 自動化、クラウドソーシング |
アナリティクスが他の業界でどのような効果をもたらすかを見てきましたが、アナリティクスはサイバーセキュリティにも大きな影響を与える可能性があります。私たちは、これがセキュリティアナリティクスと呼ばれる新しい分野で形になりつつあると考えています。これは、基本的に、これまで議論してきた実戦でテストされたアルゴリズムと方法論(およびその他)を採用し、セキュリティにおける非常に困難な問題の解決に役立ちます。
今日のセキュリティ分野で最もよく見られる分析には予測モデルが関係しており、これにより大量のデータ内のどこにリスクがある可能性があるかを特定できます (ここで異常検出が役立ちます)。簡単に言うと、予測モデリングは履歴データとリアルタイムの動作を組み合わせて、将来の動作を理解または予測します。これにより、「次に何が起こるか」という質問に答えることができます。
しかし、セキュリティ分析に対する私たちのビジョンはここで終わるわけではありません。予測分析は、セキュリティチームにとってより有用な洞察を提供できる、はるかに大きなパズルの1ピースにすぎません。理想的な分析パラダイムは、インテリジェントセンサーとユビキタスデータソース(デスクトップとサーバー、モバイル、クラウド、ソーシャルネットワーク、オープンデータなど)を、フォレンジック分析、リスクモデリング、異常検出、行動と応答の最適化など、行動と脅威の分析に対する複数の高度な分析アプローチと組み合わせたものです。
つまり、脅威を予測または特定する以上のことができるということです。さらに、高度な検出だけでなく、最も効果的な対応方法に関する洞察も提供できるようになります。セキュリティ分析により、「脅威はいくつあるか?」や「最善の対応策は何か?」などの他の重要な質問に答える力が得られます。
最適化手法のような他の種類の分析がサイバーセキュリティに適用された例はまだありませんが、大きな可能性を秘めています。これらの手法は、セキュリティリスクに対するあらゆる可能な反応を検討し、最適な対応を決定します。はい、数学を使ってこれを行う方法があります。
例えばampたとえば、最適化手法は、問題を抱えて携帯電話サービス プロバイダーに電話をかけるときに使用されます。サービス プランを割引価格でアップグレードするかどうかをランダムに推奨しているわけではありません。バックグラウンドで、通話履歴、切断された通話の数、履歴と他のユーザーの履歴の比較などを調べる一連の計算に依存しています。さらに、別のサービス プロバイダーに切り替える可能性も計算します。次に、考えられるすべての次のステップの中から、顧客維持を最大化するための最適な次のステップを計算します。
同じ数学をセキュリティチームに適用して、リスクを特定し、対応するためのさまざまな方法を提供し、この特定のリスクを最大限に封じ込めるための最善の対応を数学的に決定することができます。
セキュリティの脅威が急速に増加し、進化しているため、このような対応の効率性が重要になっています。今日、私たちはかつてないほど多くのデータを持っています。幸いなことに、私たちは、数学を通じてこのデータを理解するのに役立つ、より高い計算能力、より優れたアルゴリズム、そして研究とテクノロジーへの幅広い投資も持っています。あらゆる観点から見て、私たちはセキュリティ分析はまだ始まったばかりだと考えています。
今日、私たちはかつてないほど多くのデータを持っています。ありがたいことに、私たちはさらに高い計算能力、より優れたアルゴリズム、そして数学を通じてこのデータを理解するための研究と技術への幅広い投資も持っています。私たちは、セキュリティ分析はまだ始まったばかりだと考えています。
カスタマーサポート
私たちとつながる
www.opentext.com
OpenText Cybersecurityは、あらゆる規模の企業やパートナーに包括的なセキュリティソリューションを提供します。予防、検出、対応から回復、調査、コンプライアンスまで、当社の統合エンドツーエンドプラットフォームは、包括的なセキュリティポートフォリオを通じてお客様がサイバーレジリエンスを構築できるよう支援します。当社のリアルタイムでコンテキストに基づいた脅威インテリジェンスから得られる実用的な洞察を活用することで、OpenText Cybersecurityのお客様は、高効率の製品、コンプライアンスに準拠したエクスペリエンス、簡素化されたセキュリティの恩恵を受け、ビジネスリスクの管理に役立ちます。
762-000016-003 | O | 01/24 | © 2024 Open Text
ドキュメント / リソース
![]() |
opentext 人工知能と機械学習 [pdf] 説明書 人工知能と機械学習、知能と機械学習、機械学習 |