Python機器學習學習手册

Published on 2023-04-20 00:10:05 · 中文 · English · بالعربية · Español · हिंदीName · 日本語 · Русский язык

機器學習(ML)基本上是計算機科學領域,計算機系統可以像人類一樣提供對數據的感知。 簡而言之,ML是一種人工智慧,可以通過使用演算法或方法從原始數據中提取模式。 ML的重點是允許計算機系統從經驗中學習,而無需進行明確的程式設計或人工干預。
對於對本學科感興趣或將其作為課程一部分的研究生,研究生和研究型學生,本教程將非常有用。 讀者可以是初學者或高級學習者。 本教程已為學生和專業人士準備,可以迅速提高。 本教程是您機器學習之旅的墊腳石。
讀者必須具有人工智慧的基礎知識。 他/她還應該瞭解Python,NumPy,Scikit-learn,Scipy和Matplotlib。 如果您不熟悉這些概念,我們建議您先學習有關這些主題的教程,然後再進一步學習本教程。
我們生活在一個「數據時代」,該時代具有更好的計算能力和更多的存儲資源。 這些數據或資訊每天都在增加,但真正的挑戰是要理解所有數據。 企業和組織正在嘗試通過使用來自數據科學,數據挖掘和機器學習的概念和方法構建智慧系統來應對它。 其中,機器學習是計算機科學中最令人興奮的領域。 如果我們將機器學習稱為可以為數據提供意義的演算法的應用和科學,那就沒錯。

什麼是機器學習?

機器學習(ML)是計算機科學領域,計算機系統可以像人類一樣提供對數據的感知。
簡單來說,ML是一種人工智慧,它通過使用演算法或方法從原始數據中提取模式。 ML的主要重點是允許計算機系統從經驗中學習,而無需進行明確的程式設計或人工干預。

機器學習的需要

目前,人類是地球上最聰明,最先進的物種,因為他們可以思考,評估和解決複雜的問題。 另一方面,人工智慧還處於起步階段,在很多方面都沒有超越人類的智慧。 然後的問題是,使機器學習需要什麼? 這樣做的最合適的理由是「根據數據高效高效地做出決策」。
最近,組織正在大量投資於人工智慧,機器學習和深度學習等較新的技術,以從數據中獲取關鍵資訊,以執行一些實際任務並解決問題。 我們可以稱其為機器做出的數據驅動決策,尤其是使流程自動化的決策。 在無法固有程式設計的問題中,可以使用這些數據驅動的決策來代替程式設計邏輯。 事實是,我們離不開人類的智慧,但另一方面,我們都需要高效地解決現實問題。 這就是為什麼需要機器學習的原因。

為什麼以及何時使機器學習?

我們已經討論了機器學習的必要性,但另一個問題是,在什麼情況下必須使機器學習? 在某些情況下,我們需要機器來高效,大規模地進行數據驅動的決策。 以下是使機器學習更加有效的一些此類情況。

缺乏專業知識

我們想要機器學習並執行以數據為依據的決策的第一個場景可能是缺乏專業知識的領域。 範例可以是在未知地區或太空星球中的導航。

動態場景

有些場景本質上是動態的,即隨著時間的推移不斷變化。 在這些情況和行為的情況下,我們希望機器學習並採取以數據為依據的決策。 一些範例可以是組織中的網路連接性和基礎結構的可用性。

難以將專業知識轉化為計算任務

人類可以在各個領域擁有自己的專業知識; 但是,他們無法將這種專業知識轉化為計算任務。 在這種情況下,我們需要機器學習。 這些範例可以是語音辨識,認知任務等領域。

機器學習模型

在討論機器學習模型之前,我們必須瞭解由Mitchell教授給出的ML的以下正式定義-
“據說計算機程式可以從經驗E中學習有關某類任務T和績效指標P的資訊,如果計算機對T中的任務的績效(由P衡量)隨著經驗E的提高而得到改善。”

效能(P)

機器學習演算法應該隨著時間的流逝執行任務並獲得經驗。 衡量ML演算法是否按預期執行的指標是其性能(P)。 P基本上是一個定量指標,使用其經驗E來告訴模型是如何執行任務T的。 有許多指標有助於理解ML性能,例如準確性得分,F1得分,混淆矩陣,精度,召回率,靈敏度等。

機器學習中的挑戰

雖然機器學習正在迅速發展,並且在網路安全和自動駕駛汽車方面取得了長足的進步,但整個AI領域仍有很長的路要走。 背後的原因是ML無法克服許多挑戰。 ML當前面臨的挑戰是-
數據品質-為ML演算法獲得高質量的數據是最大的挑戰之一。 使用低品質的數據會導致與數據預處理和特徵提取相關的問題。
耗時的任務-ML模型面臨的另一個挑戰是時間的浪費,特別是在數據獲取,特徵提取和檢索方面。
缺乏專家-由於機器學習技術仍處於起步階段,因此專家資源的獲取是一項艱巨的任務。
沒有明確的解決業務問題的目標-ML沒有另一個明確的目標和明確的業務問題目標,因為該技術尚未成熟。
過度擬合和不足擬合的問題-如果模型過度擬合或不足擬合,則無法很好地解決問題。
維的詛咒-ML模型面臨的另一個挑戰是數據點的特徵太多。 這可能是一個真正的障礙。
部署困難-ML模型的複雜性使得在現實生活中難以部署。

機器學習的應用

機器學習是發展最快的技術,根據研究人員的說法,我們正處於AI和ML的黃金年。 它用於解決許多傳統方法無法解決的現實世界中的複雜問題。 以下是ML的一些實際應用-
情感分析 情緒分析 錯誤檢測與預防 天氣預報和預測 股票市場分析和預測 語音合成 語音辨識 客戶細分 對象識別 欺詐檢測 防欺詐 在線購物中向客戶推薦產品