關鍵區別-有監督和無監督機器學習
有監督學習和無監督學習是機器學習的兩個核心概念。監督學習是一種機器學習任務,學習基於示例輸入輸出對將輸入映射到輸出的函數。無監督學習是從未標記的數據中推斷出一個描述隱藏結構的函數的機器學習任務。有監督和無監督機器學習的關鍵區別在於,有監督學習使用帶標籤的數據,而無監督學習使用未標記的數據。
機器學習是計算機科學中的一個領域,它使計算機系統能夠在沒有明確編程的情況下從數據中學習。它允許分析數據並預測其中的模式。機器學習有許多應用。其中包括人臉識別、手勢識別和語音識別。與機器學習相關的算法有很多種。其中一些是迴歸、分類和聚類。開發基於機器學習的應用程序最常用的編程語言是R和Python。也可以使用其他語言,如java、C++和MATLAB。
目錄
1. 概述和主要區別
2. 什麼是監督學習
3. 什麼是無監督學習
4. 有監督和無監督機器學習的相似性
5. 並列比較-表格形式的有監督和無監督機器學習
6. 摘要
什麼是監督學習(supervised learning)?
在基於機器學習的系統中,模型根據算法工作。在監督學習中,模型是有監督的。首先,需要對模型進行訓練。利用所獲得的知識,它可以預測未來實例的答案。模型是使用帶標籤的數據集進行訓練的。當一個樣本外的數據給系統時,它可以預測結果。下面是從流行的虹膜數據集中提取的一個小片段。
根據上表,萼片長、萼片寬、瓣長、瓣寬和種被稱為屬性。這些列被稱為特徵。一行包含所有屬性的數據。因此,一行被稱為觀察。數據可以是數字的,也可以是分類的。模型以相應的物種名稱作為輸入,給出觀測值。當一個新的觀察被給予時,模型應該預測它所屬的物種類型。
在監督學習中,有分類和迴歸算法。分類是對標記數據進行分類的過程。模型創建了分隔數據類別的邊界。當向模型提供新數據時,它可以根據點所在的位置進行分類。K-最近鄰(KNN)是一種分類模型。根據k值,決定類別。例如,當k為5時,如果某個特定數據點接近a類中的8個數據點和B類中的6個數據點,則該數據點將被歸類為a。
迴歸是預測先前數據的趨勢以預測新數據的結果的過程。在迴歸中,輸出可以由一個或多個連續變量組成。預測是用覆蓋大多數數據點的一條線來完成的。最簡單的迴歸模型是線性迴歸。它是快速的,不需要調整參數,如在KNN。如果數據呈拋物線趨勢,則線性迴歸模型不適用。
這些是有監督學習算法的一些例子。一般來說,由於輸入數據是已知的,並且標記了標籤,因此,由監督學習方法產生的結果更準確、更可靠。因此,機器只需分析隱藏的模式。
什麼是無監督學習(unsupervised learning)?
在無監督學習中,模型是不受監督的。該模型獨立工作,以預測結果。它使用機器學習算法對未標記的數據得出結論。一般來說,由於信息量少,無監督學習算法比有監督學習算法困難。聚類是一種無監督學習。它可以用算法對未知數據進行分組。k均值聚類和基於密度的聚類是兩種聚類算法。
k均值算法,為每個簇隨機放置k個質心。然後將每個數據點指定給最近的質心。歐氏距離用於計算數據點到質心的距離。數據點被分成組。再次計算k質心的位置。新的質心位置由組中所有點的平均值確定。同樣,每個數據點都指定給最近的質心。這個過程會重複,直到質心不再變化。k-mean是一種快速的聚類算法,但沒有指定聚類點的初始化。另外,基於聚類點初始化的聚類模型也有很大的變化。
另一種聚類算法是基於密度的聚類。它也被稱為基於密度的帶噪空間聚類應用。它的工作原理是將簇定義為最大密度連接點集。它們是用於基於密度的聚類的兩個參數。它們是Ɛ(epsilon)和最小點。Ɛ是鄰域的最大半徑。最小點是Ɛ鄰域中定義簇的最小點數。這些是屬於無監督學習的聚類的一些例子。
一般來說,無監督學習算法產生的結果不太準確和可靠,因為機器在確定隱藏模式和函數之前必須定義和標記輸入數據。
什麼是有監督和無監督機器學習的相似性(the similarity between supervised and unsupervised machine learning)?
- 有監督學習和無監督學習都是機器學習的類型。
被監督的(supervised)和無監督機器學習(unsupervised machine learning)的區別
有監督與無監督機器學習 | |
監督學習是一種機器學習任務,學習基於示例輸入輸出對將輸入映射到輸出的函數。 | 無監督學習是從未標記的數據中推斷出一個描述隱藏結構的函數的機器學習任務。 |
主要功能 | |
在監督學習中,該模型根據標記的輸入數據預測結果。 | 在無監督學習中,該模型通過自己識別模式來預測無標記數據的結果。 |
結果的準確性 | |
由監督學習方法產生的結果更準確可靠。 | 無監督學習方法產生的結果不太準確可靠。 |
主要算法 | |
有監督學習中有迴歸和分類算法。 | 無監督學習中有聚類算法。 |
總結 - 被監督的(supervised) vs. 無監督機器學習(unsupervised machine learning)
有監督學習和無監督學習是機器學習的兩種類型。監督學習是一種機器學習任務,學習基於示例輸入輸出對將輸入映射到輸出的函數。無監督學習是從未標記的數據中推斷出一個描述隱藏結構的函數的機器學習任務。有監督和無監督機器學習的區別在於,有監督學習使用帶標籤的數據,而無監督學習使用未標記的數據。
引用
1.大數據大學。機器學習——有監督與無監督學習,認知課程,2017年3月13日。此處提供2.“無監督學習”,維基百科,維基媒體基金會,2018年3月20日。此處提供3.“監督學習”,維基百科,維基媒體基金會,2018年3月15日。此處提供
2.“無監督學習”,維基百科,維基媒體基金會,2018年3月20日。
3.“監督學習”,維基百科,維基媒體基金會,2018年3月15日。