機器學習是什麼？

2026-03-05 • 機器學習

人工智慧、機器學習與深度學習的關係與定義

AI、ML、DL 與生成式 AI 的層級關係

在開始談機器學習之前，有必要先釐清幾個經常被混用的詞彙，人工智慧（AI）、機器學習（ML）、深度學習（DL）與生成式 AI，它們之間其實是層層包含的關係。

人工智慧（AI）是最廣泛的研究領域，目標是讓電腦模擬人類的思考與決策過程，建立能夠解決問題的「智慧代理人」。

機器學習（ML）是 AI 的一個子領域，核心思路是透過資料驅動的方式讓電腦自行學習規律，而非由工程師逐條撰寫規則。

深度學習（DL）則是機器學習中的一個重要分支，模仿大腦神經元的結構，利用多層神經網絡自動提取資料中的關鍵特徵。

生成式 AI（Generative AI）主要基於深度學習技術，是其中最受矚目的應用方向之一。

這些技術並非孤立存在，而是隨著每一次突破而不斷進化、彼此疊加。

什麼是機器學習？為什麼需要它？

Arthur Samuel 在 1959 年提出了機器學習最早的定義：「讓電腦在不明確寫出程式碼的情況下學習的領域。」
Tom Mitchell 在 1997 年進一步將這個概念規範化：如果一個程式在某個任務（T）上的表現（P），能夠隨著經驗（E）的累積而提升，那麼我們就可以說這個程式從經驗中學習了。

簡單來說，機器學習的核心精神是不再手動撰寫規則，而是讓電腦自己從資料中歸納出規律。

機器學習解決了什麼問題？

傳統的解決方案仰賴人類手動制定規則。以早期的垃圾郵件過濾器為例，工程師需要針對各種促銷字眼逐一撰寫 IF-ELSE 條件判斷。當垃圾郵件的手法不斷翻新，這套規則就得持續維護、越寫越長，最終變得難以管理。

機器學習的價值正是在這裡：它能直接從大量資料中學習判斷模式，並自動適應環境的變化。特別適用於以下情境：規則過於複雜或經常變動的問題、需要處理大量變數的問題，以及環境持續變化、傳統硬編碼方法難以應對的場景。

機器學習的分類體系

機器學習的分類方式不只一種，可以從三個不同的維度來理解，每個維度回答的是不同的問題。

監督式學習（Supervised Learning）

監督式學習是最直觀的方式—，訓練資料附帶正確答案，模型的任務是學習輸入與答案之間的對應關係。常見應用包括分類（例如判斷郵件是否為垃圾郵件）與迴歸（例如預測房價）。

非監督式學習（Unsupervised Learning）

非監督式學習則沒有標籤，模型需要自行發掘資料中的隱藏結構。常見技術包括分群（Clustering）、異常檢測（Anomaly Detection）與降維（Dimensionality Reduction）。

自監督式學習（Self-supervised Learning）

自監督式學習介於兩者之間，從完全無標籤的資料中自動生成訓練目標。生成式 AI 在圖像修復或文字預測中的應用，就是典型案例。

強化學習（Reinforcement Learning）

強化學習走的是完全不同的路線，代理人（Agent）透過與環境互動，根據獲得的獎勵或懲罰來逐步優化決策策略。AlphaGo Zero 和掃地機器人都是強化學習的代表。

機器學習面臨的挑戰

有了好的演算法還不夠，實務中真正棘手的往往是資料和模型調校的問題。

資料量不足

某些問題可能需要數千甚至數百萬筆資料才能達到可用的預測精度，但取得這些資料的成本可能極高（例如醫學影像需要專業醫師逐張標註）。

資料不具代表性

如果訓練資料存在抽樣偏誤，模型就會學到偏頗的規律。例如一個只用都市交通資料訓練的自駕模型，遇到鄉間小路可能完全失靈。

資料品質差

未經清理的資料，缺失值、重複紀錄、格式不一致——會直接拉低模型的預測表現。資料清洗（Data Cleaning）在實務中往往佔據整個專案 60% 以上的時間。

過度擬合（Overfitting）

模型把訓練資料中的噪聲和偶然細節也學了進去，導致在訓練集上表現優異，但面對新資料時卻大幅退步。常見的應對方式包括簡化模型結構、增加訓練資料量，以及使用正則化（Regularization）技術。

欠擬合（Underfitting）

模型過於簡單，連訓練資料中的基本模式都無法捕捉。解決方向包括選用更具表達力的模型、進行特徵工程（Feature Engineering），或減少過度的正則化。

資料集劃分與評估指標

訓練出一個模型之後，我們需要一套客觀的方法來評估它的實際表現，而不是只看它在訓練資料上的成績。

為了確保評估的公正性，資料集通常會被劃分為三個部分：

訓練集（Training Set，約 60–70%）用於模型訓練，讓演算法學習資料特徵並擬合參數。驗證集（Validation Set / Dev Set，約 15–20%）用於比較不同模型架構、調整超參數，幫助我們挑選出最佳配置。測試集（Test Set，約 15–20%）全程不參與訓練或調參，僅在最終階段用來評估模型的真實泛化能力。

這樣劃分的目的，是確保我們不會用「考試題目」來練習，從而高估模型的實際能力。

混淆矩陣與評估指標

在分類任務中，模型的預測結果可以用混淆矩陣（Confusion Matrix）來呈現，根據預測與實際的組合，可分為四種情況：真陽性（TP）、真陰性（TN）、假陽性（FP）、假陰性（FN）。

總結

機器學習的核心價值，在於讓電腦從資料中自行歸納規律、建立預測能力，取代傳統需要人工逐條撰寫規則的方式。從本文的脈絡來看，理解機器學習需要掌握三條主線：

分類體系：依監督程度（監督式、非監督式、自監督式、強化學習）、學習時機（批量 vs. 線上）、歸納方式（實例式 vs. 模型式）三個維度來理解不同的學習方法，而非死記個別演算法的名稱。
資料與模型的雙重挑戰：資料決定了模型的品質上限，而過度擬合與欠擬合之間的平衡則決定了模型能否在真實環境中穩定運作。
嚴謹的評估方法：透過合理的資料集劃分避免「用考題練習」的陷阱，再根據業務場景選擇合適的評估指標——沒有一個指標能適用所有情境，理解每個指標背後的意義比記住公式更重要。

機器學習不只是選擇一個演算法然後按下執行。它是一個涵蓋資料品質、模型設計與評估策略的系統工程——而真正區分初學者與實務工作者的，往往不是演算法知識的多寡，而是對資料的敏感度和對問題的理解深度。

← 回到首頁