當前位置: 首頁 ? 資訊 ? 科普博覽 ? 科技博覽 ? 正文

科技名詞 | 決策樹 decision tree

發(fā)布日期:2022-07-11??來源:全國科學技術名詞審定委員會??瀏覽次數(shù):965
放大字體??縮小字體
核心提示:決策樹decision tree又稱:判定樹定義:一個流程圖形式的樹結構,其中每個中間結點代表某個屬性或某組屬性上的測試,每個分支則對應了該測試的不同結果,每個葉結點代表某個類別或預測結果。從訓練數(shù)據(jù)中產(chǎn)生決策樹的算法,通常被稱為決策樹學習算法或決策樹算法。學科:計算機科學技術_人工智能_機器學習相關名詞:數(shù)據(jù)挖掘 決策樹分析 決策樹系統(tǒng)圖片來源:視

決策樹  decision tree

又稱:判定樹

定義:一個流程圖形式的樹結構,其中每個中間結點代表某個屬性或某組屬性上的測試,每個分支則對應了該測試的不同結果,每個葉結點代表某個類別或預測結果。從訓練數(shù)據(jù)中產(chǎn)生決策樹的算法,通常被稱為決策樹學習算法或決策樹算法。

學科:計算機科學技術_人工智能_機器學習

相關名詞:數(shù)據(jù)挖掘 決策樹分析 決策樹系統(tǒng)

圖片來源:視覺中國

【延伸閱讀】

決策樹是利用樹形圖進行決策的預測模型,表現(xiàn)出的是對象屬性與對象值之間的一種映射關系,是歸納學習和數(shù)據(jù)挖掘的重要方法。決策樹分為分類樹和回歸樹兩種:分類樹對離散變量做決策樹,回歸樹對連續(xù)變量做決策樹。

一般情況下,一棵決策樹包含一個根節(jié)點、若干個內部節(jié)點和若干個葉結點。根節(jié)點包含樣本全集,從根節(jié)點到每個葉結點的路徑對應了一個判定測試序列。內部節(jié)點表示一個特征和屬性,每個內部節(jié)點都是一個判斷條件,并且包含數(shù)據(jù)集中,滿足從根節(jié)點到該節(jié)點所有條件的數(shù)據(jù)的集合。根據(jù)內部節(jié)點的屬性測試結果,內部節(jié)點對應的數(shù)據(jù)集合分別歸到兩個或多個子節(jié)點中。葉節(jié)點表示一個類,對應于決策結果。葉節(jié)點為最終的類別,如果該數(shù)據(jù)被包含在該葉節(jié)點,則屬于該類別。

建立決策樹的目標是通過訓練樣本集,建立目標變量關于各輸入變量的分類預測模型,全面實現(xiàn)輸入變量和目標變量不同取值下的數(shù)據(jù)分組,進而用于對新數(shù)據(jù)對象的分類和預測。當利用所建的決策樹對一個新數(shù)據(jù)對象進行分析時,決策樹能夠依據(jù)該數(shù)據(jù)輸入變量的取值,推斷出相應目標變量的分類或取值。決策樹算法主要圍繞兩大核心問題展開:第一,決策樹的生長問題,即利用訓練樣本集,完成決策樹的建立過程。第二,決策樹的剪枝問題,即利用檢驗樣本集,對形成的決策樹進行優(yōu)化處理。

決策樹的算法很多,如ID3、C4.5、CART等。這些算法均采用自頂向下的貪婪算法,每個節(jié)點選擇分類效果最好的屬性將節(jié)點分裂為2個或多個子結點,繼續(xù)這一過程直到這棵樹能準確地分類訓練集,或所有屬性都已被使用過。

決策樹的優(yōu)勢有:結構簡單,便于理解;效率高,較為適合訓練集數(shù)據(jù)量較大的情況;通常不需要接受訓練集數(shù)據(jù)外的知識;具有較高的分類精確度;等等。因此,決策樹算法廣泛應用于各個領域,如文本分類、語音識別、模式識別和專家系統(tǒng)等。

責任編輯:張鵬輝

?
?
[ 資訊搜索 ]? [ 加入收藏 ]? [ 打印本文 ]? [ 違規(guī)舉報 ]? [ 關閉窗口 ]

免責聲明:
本網(wǎng)站部分內容來源于合作媒體、企業(yè)機構、網(wǎng)友提供和互聯(lián)網(wǎng)的公開資料等,僅供參考。本網(wǎng)站對站內所有資訊的內容、觀點保持中立,不對內容的準確性、可靠性或完整性提供任何明示或暗示的保證。如果有侵權等問題,請及時聯(lián)系我們,我們將在收到通知后第一時間妥善處理該部分內容。



?
?

?
推薦圖文
推薦資訊
點擊排行
最新資訊
友情鏈接 >> 更多