Python 機械学習学習マニュアル

Published on 2023-04-20 00:10:05 · 中文 · English · بالعربية · Español · हिंदीName · Русский язык · 中文繁體

機械学習(ML)は基本的にコンピュータサイエンスの分野であり、コンピュータシステムは人間と同じようにデータの認識を提供できます。 簡単に言えば、MLは、アルゴリズムまたは方法を使用して生データからパターンを抽出できる人工知能です。 MLは、明示的なプログラミングや人間の介入なしに、コンピューターシステムが経験から学習できるようにすることに重点を置いています。
このチュートリアルは、この分野に興味がある、またはカリキュラムの一部として、大学院生、大学院生、研究生にとって非常に役立ちます。 読者は初心者でも上級者でもかまいません。 このチュートリアルは、学生と専門家向けに準備されており、すぐに改善できます。 このチュートリアルは、機械学習の旅への足がかりです。
読者は人工知能の基本的な知識を持っている必要があります。 彼/彼女はまた、Python、NumPy、Scikit-learn、Scipy、およびMatplotlibを知っている必要があります。 これらの概念に慣れていない場合は、先に進む前に、これらのトピックに関するチュートリアルを受講することをお勧めします。
私たちは、より優れたコンピューティングパワーとより多くのストレージリソースを備えた「データ時代」に生きています。 このデータまたは情報は日々増加していますが、本当の課題はすべてのデータを理解することです。 企業や組織は、データサイエンス、データマイニング、機械学習の概念と方法を使用してインテリジェントシステムを構築することで、それに対処しようとしています。 その中で、機械学習はコンピュータサイエンスで最もエキサイティングな分野です。 機械学習を、データに意味を与えることができるアルゴリズムの応用と科学と呼ぶなら、そうです。

機械学習とは?

機械学習(ML)は、コンピュータシステムが人間と同じようにデータの認識を提供できるコンピュータサイエンスの分野です。
簡単に言えば、MLは、アルゴリズムまたは方法を使用して生データからパターンを抽出する人工知能です。 MLの主な焦点は、明示的なプログラミングや人間の介入なしに、コンピューターシステムが経験から学習できるようにすることです。

機械学習の必要性

現在、人間は複雑な問題を考え、評価し、解決できるため、地球上で最も賢く、最も進んだ種です。 一方、人工知能はまだ揺籃期にあり、多くの面で人間の知能を超えていません。 次に、問題は、機械学習を作成するために何が必要かということです。 その最も適切な理由は、「データに基づいて効率的かつ効率的な意思決定を行う」ことです。
最近、組織は人工知能、機械学習、ディープラーニングなどの新しいテクノロジーに多額の投資を行って、データから重要な情報を導き出し、いくつかの実用的なタスクを実行し、問題を解決しています。 これは、機械、特にプロセスを自動化する機械によって行われるデータ主導の意思決定と呼ぶことができます。 プログラミングが本質的でない問題では、プログラミングロジックの代わりにこれらのデータ駆動型の決定を使用できます。 真実は、人間の知性なしではできないということですが、一方で、私たちは皆、現実世界の問題を効率的に解決する必要があります。 そのため、機械学習が必要です。

なぜ、いつ、機械学習を行うのか?

機械学習の必要性について話しましたが、別の質問は、どのような状況で機械学習を行う必要があるかということです。 場合によっては、データ主導の意思決定を効率的かつ大規模に行うためのマシンが必要です。 機械学習をより効果的にするそのようなケースをいくつか紹介します。

専門知識の欠如

機械学習とデータ主導の意思決定を実行する最初のシナリオは、専門知識が不足している領域である可能性があります。 例としては、未知の地域や宇宙惑星でのナビゲーションがあります。

ダイナミックなシーン

一部のシナリオは本質的に動的であり、時間の経過とともに絶えず変化します。 これらの状況や行動の場合、機械学習とデータ主導の意思決定が必要です。 たとえば、組織内のネットワーク接続やインフラストラクチャの可用性などです。

専門知識を計算タスクに変換することは困難です

人間はさまざまな分野で独自の専門知識を持つことができます。 しかし、彼らはこの専門知識を計算タスクに変換することができませんでした。 この場合、機械学習が必要です。 これらの例は、音声認識、認知タスクなどの領域にあります。

機械学習モデル

機械学習モデルについて説明する前に、ミッチェル教授によって与えられたMLの次の正式な定義を理解する必要があります。
「コンピュータプログラムは、経験Eから、Tのタスク(Pで測定)に対するコンピュータのパフォーマンスが経験Eとともに向上する場合、特定のタイプのタスクTとパフォーマンス指標Pについて学習できると言われています。」

パフォーマンス(P)

機械学習アルゴリズムは、タスクを実行し、時間の経過とともに経験を積む必要があります。 ML アルゴリズムが期待どおりに実行されるかどうかを測定するメトリックは、そのパフォーマンス (P) です。 Pは基本的に、経験的なEを使用してモデルにタスクTの実行方法を指示する定量的メトリックです。 精度スコア、F1スコア、混同行列、精度、再現率、感度など、MLパフォーマンスを理解するのに役立つ多くのメトリックがあります。

機械学習の課題

機械学習は急速に進歩し、サイバーセキュリティと自動運転車で大きな進歩を遂げていますが、AIの分野全体にはまだ長い道のりがあります。 この背後にある理由は、MLは多くの課題を克服できないためです。 MLが直面している現在の課題は次のとおりです。
データ品質 - ML アルゴリズムで高品質のデータを取得することは、最大の課題の 1 つです。 低品質のデータを使用すると、データの前処理と特徴抽出に関連する問題が発生する可能性があります。
時間のかかるタスク – ML モデルのもう一つの課題は、特にデータの取得、特徴量の抽出、取得において時間の浪費です。
専門家の不足 - 機械学習技術はまだ揺籃期にあるため、専門家のリソースへのアクセスは困難な作業です。
ビジネス上の問題を解決するための明確な目標がない - テクノロジがまだ成熟していないため、ML には別の明確な目標と明確なビジネス上の問題の目標がありません。
オーバーフィットとアンダーフィットの問題 - モデルがオーバーフィットまたはアンダーフィットの場合、問題はうまく解決されません。
ディメンションの呪い - ML モデルのもう 1 つの課題は、データポイントの特徴が多すぎることです。 これは本当の障害になる可能性があります。
デプロイが難しい - ML モデルは複雑であるため、実際のデプロイは困難です。

機械学習の応用

機械学習は最も急速に成長しているテクノロジーであり、研究者によると、私たちはAIとMLの黄金期にいます。 これは、従来の方法では解決できない現実世界の多くの複雑な問題を解決するために使用されます。 MLの実用的なアプリケーションをいくつか紹介します。
感情分析 感情分析 エラーの検出と防止 天気予報と予測 株式市場の分析と予測 音声合成 音声認識 顧客セグメンテーション 物体認識 不正検出 不正防止 オンラインショッピングで顧客に商品を推奨する