研究計畫-專案詳細資料
摘要
記憶基礎理解 (memory-based reasoning, MBR)的原理為應用先前相似問題之解答,對面臨的新問題提出預測。MBR 在我們對問題領域缺乏足夠知識時特別適用來解決問題。其不依賴統計假設且提供的推論結果易於人類理解,因此被廣泛的應用在許多問題中。但在應用個案推理演算法,需要先決定相關的參數。若這些參數值設計不好,會獲得較差之結果。另外,資料集中包含著許多屬性資料,但其中的屬性並非全部對於預測都有所幫助。使用資料中可能屬性存有高度相關、含有雜訊或是屬性對於分類結果毫無助益,若不採用一些屬性篩選的方法,則會因雜訊或過多的資料造成分類效能不佳。大多數研究僅利用參數調整或屬性篩選其中一種來改善分類器的正確率,少部份文獻有同時考慮參數調整與屬性篩選,但其只應用於特定問題之資料而非公開的資料庫資料,所以無法供後續研究比較其優缺點。因此,本研究提出以啟發式演算法(模擬退火法、基因演算法、粒子群最佳化、分散式搜尋法和人工免疫系統)來尋找MBR 之進行參數設定與進行屬性篩選,以找出符合各種公開資料問題所需要的參數,並剔除對於分類正確率較無助益之屬性。各種預測模型有各自其優缺點及適用的問題特性,此時若能將其預測整合,得到更佳之結果的好處,此種方法稱為集成(ensemble)架構。在此架構之下按照某些特定的方式整合各個專家的意見進行決策,其結果會比只有單一專家的效果更好。因此本計畫擬使用集成架構,以更進一步地提高預測/分類的正確性。再另外一方面,資料隨著時間不斷增加,近乎無限量的資料與即時回應的需求已變成目前決策支援系統的一大挑戰。相較於傳統靜態資料庫,資料串流(data stream)的資料擁有屬性來源多元(多屬性)、隨時間變異(concept drifting)、資料流入量近似無限大、模型需具備能即時回應等特性,因此所發展之演算法必需考慮此情況,才能有效因應這種問題。為評估本計畫所提出之方法,本計畫擬使用UCI 機器學習資料庫之資料集作為標竿題目。本計劃預期同時進行參數調整與屬性篩選將會比單獨使用參數調整或屬性篩選,可獲得更好的分類結果與更少的計算時間。因此,五種不同的啟發式演算法(模擬退火法、基因演算法、粒子群最佳化、分散式搜尋法和人工免疫系統)可應用在MBR 應能在面對各種問題時,此外本計畫將考慮資料串流中加入最大模型數的限制以移除過時模型與刪除未被參照到案例的機制於即成架構,以提供更好的預測結果。
Project IDs
系統編號:PF10001-0904
原計畫編號:NSC99-2410-H182-023-MY2
原計畫編號:NSC99-2410-H182-023-MY2
狀態 | 已完成 |
---|---|
有效的開始/結束日期 | 01/08/11 → 31/07/12 |
Keywords
- 管理科學
指紋
探索此研究計畫-專案觸及的研究主題。這些標籤是根據基礎獎勵/補助款而產生。共同形成了獨特的指紋。