- 相關(guān)推薦
理工類開題報告范文
在現(xiàn)實生活中,我們使用報告的情況越來越多,其在寫作上有一定的技巧。你所見過的報告是什么樣的呢?下面是小編為大家整理的理工類開題報告范文,歡迎大家借鑒與參考,希望對大家有所幫助。
一、論文的研究內(nèi)容
論文的研究內(nèi)容包括兩個方面:一是研究新的高效的聚類算法;一是把已有的聚類算法或論文提出的新算法和入侵檢測技術(shù)相結(jié)合,從而提出一個好的入侵檢測模型。具體的研究內(nèi)容包括以下幾個點:
第一、針對聚類算法的研究問題:
1、如何提高算法的可擴展性
許多聚類算法在小于200個數(shù)據(jù)對象的小數(shù)據(jù)集上是高效率的,但是無法處理一個大規(guī)模數(shù)據(jù)庫里的海量對象,F(xiàn)有的聚類算法只有極少數(shù)適合處理大數(shù)據(jù)集,而且只能處理數(shù)值型數(shù)據(jù)對象,無法分析具有類屬性的數(shù)據(jù)對象。
2、如何處理離群點
在實際應(yīng)用中,估計數(shù)據(jù)集中的離群點可能是非常困難的,很多算法通常丟棄增長緩慢的簇,這樣的簇趨向于代表離群點。然而在某些應(yīng)用中,用戶可能對相對較小的簇比較感興趣,比如入侵檢測中,這些小的簇可能代表異常行為,那么我們需要考慮在對算法影響更小的前提下,如何更好的處理這些離群點。
3、研究適合具有類屬性數(shù)據(jù)的聚類算法的有效性
對聚類分析而言,有效性問題通?梢赞D(zhuǎn)換為最佳類別數(shù)k的決策。而目前有關(guān)聚類算法的有效性分析,大都集中在對數(shù)值數(shù)據(jù)的聚類方式分析上。對于具有類屬性的數(shù)據(jù)聚類,還沒有行之有效的分析方法。
第二、針對聚類算法在ids應(yīng)用中的研究問題:
1、如何結(jié)合聚類技術(shù)和入侵檢測技術(shù)取得更好的效果
很多的聚類算法都已經(jīng)和ids應(yīng)用環(huán)境結(jié)合起來了,很多研究者對前人提出的算法作出改進后,應(yīng)用到ids系統(tǒng)中去,或者提出一個全新的算法來適應(yīng)ids的要求。隨著聚類技術(shù)的不斷發(fā)展,聚類技術(shù)在入侵檢測中的應(yīng)用將是一個很有前景的工作。我們需要把更好的聚類技術(shù)成果應(yīng)用到入侵檢測中。
2、利用聚類技術(shù)處理入侵檢測中的頻繁誤警
雖然入侵檢測是重要的安全措施,然而它常常觸發(fā)大量的誤警,使得安全管理員不堪重負(fù),事實上,大量的誤警是重復(fù)發(fā)生并且頻繁發(fā)生的,可以利用聚類技術(shù)來尋找導(dǎo)致ids產(chǎn)生大量誤警的本質(zhì)原因。
二、學(xué)位論文研究依據(jù)
學(xué)位論文的選題依據(jù)和研究意義,以及國內(nèi)外研究現(xiàn)狀和發(fā)展趨勢
聚類分析研究已經(jīng)有很長的歷史,其重要性及其與其他研究方向的交叉特性已經(jīng)得到了研究者的充分肯定。對聚類算法的研究必將推動相關(guān)學(xué)科向前發(fā)展。另外,聚類技術(shù)已經(jīng)活躍在廣泛的應(yīng)用領(lǐng)域。作為與信息安全專業(yè)的交叉學(xué)科,近年來,聚類算法在入侵檢測方面也得到大量的應(yīng)用。然而,聚類算法雖取得了長足的發(fā)展,但仍有一些未解決的問題。同時,聚類算法在某些應(yīng)用領(lǐng)域還沒有充分的發(fā)揮作用,聚類技術(shù)和入侵檢測技術(shù)結(jié)合得還不夠完善。在這種背景下,我們認(rèn)為,論文的選題是非常有意義的。
本論文研究的內(nèi)容主要包括兩個方面:聚類算法的研究以及聚類算法在入侵檢測中的應(yīng)用。下面從兩個方面闡述國內(nèi)外這兩個方面的發(fā)展現(xiàn)狀和趨勢:
前人已經(jīng)提出很多聚類算法,然而沒有任何一種聚類算法可以普遍適用于揭示各種多維數(shù)據(jù)集所呈現(xiàn)出來的多種多樣的結(jié)構(gòu),根據(jù)數(shù)據(jù)在聚類中的積聚規(guī)則以及應(yīng)用這些規(guī)則的方法,可以將聚類算法分為以下幾種:
1.劃分聚類算法
劃分聚類算法需要預(yù)先指定聚類數(shù)目或聚類中心,通過反復(fù)迭代運算,逐步降低目標(biāo)函數(shù)的誤差值,當(dāng)目標(biāo)函數(shù)收斂時,得到最終的聚類結(jié)果,劃分聚類算法典型代表是k-means算法[1]和k-modoids算法。這些算法處理過程簡單,運行效率好,但是存在對聚類數(shù)目的依賴性和退化性。迄今為止,許多聚類任務(wù)都選擇這兩個經(jīng)典算法,針對k-means及k-modoids的固有弱點,也出現(xiàn)了的不少改進版本。
2.層次聚類算法
又稱樹聚類算法,它使用數(shù)據(jù)的聯(lián)接規(guī)則,透過一種層次的架構(gòu)方式,反復(fù)將數(shù)據(jù)進行分裂和聚合,以形成一個層次序列的聚類問題解。由于層次聚類算法的計算復(fù)雜性比較高,所以適合于小型數(shù)據(jù)集的聚類。20xx年,gelbard等人有提出一種新的層次聚合算法,稱為正二進制方法。該方法把待分類數(shù)據(jù)以正的二進制形式存儲在二維矩陣中,他們認(rèn)為,將原始數(shù)據(jù)轉(zhuǎn)換成正二進制會改善聚類結(jié)果的正確率和聚類的魯棒性,對于層次聚類算法尤其如此。kumar等人[9]面向連續(xù)數(shù)據(jù)提出一種新的基于不可分辨粗聚合的層次聚類算法,既考慮了項的出現(xiàn)次序又考慮了集合內(nèi)容,該算法能有效挖掘連續(xù)數(shù)據(jù),并刻畫類簇的主要特性。
3.基于密度-網(wǎng)格的聚類算法
與傳統(tǒng)的聚類方法不同:基于密度的聚類算法,通過數(shù)據(jù)密度來發(fā)現(xiàn)任意形狀的類簇;基于網(wǎng)格的聚類算法,使用一個網(wǎng)格結(jié)構(gòu),圍繞模式組織由矩形塊劃分的值空間,基于塊的分布信息實現(xiàn)模式聚類,基于網(wǎng)格的聚類算法常常與其他方法相結(jié)合,特別是與基于密度的聚類方法相結(jié)合;诰W(wǎng)格和密度的聚類方法在以空間信息處理為代表的眾多領(lǐng)域有著廣泛的應(yīng)用。特別是伴隨著近來處理大規(guī)模數(shù)據(jù)集、可伸縮的聚類方法的開發(fā),它在空間數(shù)據(jù)挖掘研究子域日趨活躍。