" />
支持向量機算法和軟件ChemSVM是一款教學軟件,它是支持向量機算法和軟件,可以解決小樣本難題。體積小,但功能強大。界面非常清爽,簡單易操作。
支持向量機算法和軟件ChemSVM由于計算機技術的發(fā)展,機器學習(包括線性和非線性回歸、人工神經(jīng)網(wǎng)絡、模式識別算法等)已成為處理化學化工數(shù)據(jù),總結經(jīng)驗規(guī)律,據(jù)以預報未知或控制生產(chǎn)過程的常規(guī)手段。但是,傳統(tǒng)的機器學習算法都以經(jīng)典統(tǒng)計數(shù)學的漸近理論為依據(jù)。該理論的大數(shù)定理規(guī)定:統(tǒng)計規(guī)律只有在已知樣本數(shù)無限多時才顯露出來。但化學化工實際工作中已知樣本總是有限的。忽視這一矛盾是造成實際計算中過擬合弊病的重要原因。針對經(jīng)典統(tǒng)計數(shù)學這一弱點,Vapnik學派提出了“統(tǒng)計學習理論”和“支持向量機算法”。新算法既能處理非線性問題,又能抑制傳統(tǒng)算法(如人工神經(jīng)網(wǎng)絡等)常遇到的過擬合弊病。本?械恼撐南盗泄ぷ鞅砻:支持向量機算法在分析化學的多變量校正、數(shù)據(jù)處理、商品檢驗、相圖和新化合物的計算機預報、新材料制備的實驗設計、環(huán)境污染的建模和預報,以及分子設計,藥物設計等領域的應用都有良好效果。在多數(shù)情況下所建的數(shù)學模型較傳統(tǒng)算法的結果有更好的預報正確率。這一新算法將會成為化學、化工領域數(shù)據(jù)處理廣泛應用的新計算工具。
1、不需要很多樣本,不需要有很多樣本并不意味著訓練樣本的絕對量很少,而是說相對于其他訓練分類算法比起來,同樣的問題復雜度下,SVM需求的樣本相對是較少的。并且由于SVM引入了核函數(shù),所以對于高維的樣本,SVM也能輕松應對。
2、結構風險最小。這種風險是指分類器對問題真實模型的逼近與問題真實解之間的累積誤差。
3、非線性,是指SVM擅長應付樣本數(shù)據(jù)線性不可分的情況,主要通過松弛變量(也叫懲罰變量)和核函數(shù)技術來實現(xiàn),這一部分也正是SVM的精髓所在。
Vladimir N.Vapnik等提出的統(tǒng)計學習理論(statistical learning theory,簡稱SLT)和支持向量機(support vector machine,簡稱SVM)算法已取得令人鼓舞的研究成果。本文旨在對這一新理論和新算法的原理作一介紹,并展望這一計算機學界的新成果在化學化工領域的應用前景。