基于變參數(shù)和混合模型的醫(yī)學縱向數(shù)據(jù)研究
下面是小編為大家整理的藥學專業(yè)畢業(yè)論文范文,歡迎參考~
基于變參數(shù)和混合模型的醫(yī)學縱向數(shù)據(jù)研究
第 1 章 引言
我們通常認為,時間序列資料(time series data)為某個對象的數(shù)據(jù)在不同時間點的多次測量,而橫斷面數(shù)據(jù)(cross section data)則為某個對象的某一個時間點的數(shù)據(jù),可以有多個影響因素,而縱向資料數(shù)據(jù)為兩者的結(jié)合,也叫時間序列截面數(shù)據(jù)(time series and cross section data),就單個面來講,是由個體在一些時間點上組合形成的橫斷面觀測值,但又有一個完整的隨時間推移的變化趨勢,即存在時間序列效應(yīng),縱向數(shù)據(jù)和時間序列數(shù)據(jù)有明顯的不同點:縱向數(shù)據(jù)研究的是很多個個體;而時間序列數(shù)據(jù)研究的是很少的個體(通常情況下只有一個個體)和重復(fù)很多次,重復(fù)測量的次數(shù)在一般情況下并不是很多,但他們多次測量是存在某種相關(guān)的,并且有一些共性,并且:1:數(shù)據(jù)的相鄰相關(guān)性相對來說一般是較大的,2:而時間點離得較遠的數(shù)據(jù)則逐漸減小了其相關(guān)性,可能因為時間的間隔增大而增大,而另一方面,時間序列數(shù)據(jù)具有很強的序列相關(guān)性,跟一般的線性方程和簡單的ARIMA時間序列模型相比,這種方法能夠分析出具有現(xiàn)實價值的'結(jié)果或結(jié)論[13]。
...........
第 2 章 模型的選擇
2.1 變參數(shù)模型
也被稱作協(xié)整性檢驗,即當我們根據(jù)所得到的樣本數(shù)據(jù),并且要用變參數(shù)模型來構(gòu)造模型的時候,我們應(yīng)該對所用的模型進行 F 檢驗,來避免殘差序列的不平穩(wěn)而出現(xiàn)構(gòu)造的方程有可能成為一個偽回歸的方程模型,我們所利用到的協(xié)整性檢驗是在 1987 年,由 Engle 和 Granger 提出的一種對回歸方程的不能解釋部分的殘差進行單位根檢驗協(xié)整性檢驗的方法,也就是,從協(xié)整理論的思想來看,因變量可以有自變量的線性組合來解釋,并且殘差要保持均衡,即,當模型構(gòu)造完成之后,模型中的因變量要能被自變量的線性組合所解釋[22]。F 統(tǒng)計量服從某種自由度下 F 分布,如果統(tǒng)計量 F 計算出來大于某個檢驗水準的(一般取檢驗水準為0.05)F 分布臨界值,則我們認為可以拒絕原假設(shè),反之則接受原假設(shè)。對于混合估計模型的假設(shè),接受原假設(shè)則表示利用混合估計模型擬合樣本;拒絕則不能接受,即變截距模型比混合估計模型更合適;對于變截距模型,接受則表示利用變截距模型擬合樣本;拒絕則表示利用變系數(shù)模型擬合樣本。
2.2 線性混合模型
線性混合模型(Linear Mixed Model)是一種既擁有隨機效應(yīng)又擁有固定效應(yīng)的模型,今年來越來越多的被用在各個領(lǐng)域。一般來講,在多元回歸分析里面,人們常常為了全面起見, 就將很多和結(jié)果變量有關(guān)或者可能會有關(guān)的解釋變量納入模型方程,結(jié)果是導(dǎo)致把某些對因變量影響特別小的,有一些甚至是沒有影響的解釋變量也包含在模型方程里面,而且過量的解釋變量也會使方程模型對結(jié)果變量預(yù)測的準確度下降,而且還會造成回歸模型參數(shù)的估計和計算量增加,同時對于一些實際問題,某些自變量的觀測數(shù)據(jù)的獲得代價比較昂貴,過多的自變量選入也勢必會造成觀測數(shù)據(jù)收集和模型應(yīng)用費用的不必要增加[4]。
第3 章 模型的模擬與比較 ................................ 22
3.1 時間序列截面回歸模型與傳統(tǒng)回歸模型的模擬比較 ...............................22
3.2 傳統(tǒng)回歸模型:POOLED OLS 回歸 ...........................22
3.3 時間序列截面回歸模型:TSCSREG 模型回歸 ............25
第4 章 討論 ......................... 30
第5 章 結(jié)論 ................. 33
第 4 章 討論
由于線性混合模型本身的數(shù)學原理和特點,使它在處理重復(fù)測量等縱向數(shù)據(jù)時更具有優(yōu)勢,這個模型考慮到結(jié)果變量之間可能存在的相關(guān)性,使得模型擬合參數(shù)更加可靠,而對于簇群聚集資料,線性混合模型也能利用隨機作用變量使得模型更為精煉,易于解釋,并且估計參數(shù)變異較小,結(jié)果更為穩(wěn)定,線性混合模型的估計參數(shù)穩(wěn)定,偏倚較小,結(jié)果更加苛刻,線性混合模型的估計參數(shù),如回歸斜率(Regression Coefficient)、標準誤(Standard Error, SE)、OR(Odd Ratio)及其 95%置信區(qū)間(Confidence Interval, CI) [19],還有估計參數(shù)[24]多數(shù)情況下都比經(jīng)典的一般線性模型更為穩(wěn)定,由于線性混合模型中每個隨機效應(yīng)的作用變量所占用的DF 均為 1,并且假定為服從正態(tài)分布,所以能夠減少因影響因素的樣本量不均衡而導(dǎo)致的偏差,使模型更容易收斂[19]。 一般的統(tǒng)計分析方法是用傳統(tǒng)的線性模型,這個方法必須滿足三個假定:①各樣本來自正態(tài)分布②各樣本來自相互獨立的隨機樣本③各總體的方差相等。而縱向數(shù)據(jù)不滿足②和③兩個假定,所以用傳統(tǒng)的統(tǒng)計分析方法去擬合縱向數(shù)據(jù)的資料難免欠妥當,就有可能擴大犯Ⅰ類錯誤概率的風險,從而出現(xiàn)較多的拒絕無效假設(shè),造成較多的假陽性錯誤[1]。
............
第 5 章 結(jié)論
本文把變參數(shù)模型和線性混合模型推廣到醫(yī)學領(lǐng)域,做了一次大膽的嘗試,兩個模型有以下優(yōu)勢 就變參數(shù)模型來說:
1、打破了傳統(tǒng)的固定參數(shù)模式,取消了斜率和截距的限制。
2、針對不同的縱向數(shù)據(jù)資料類型,可以擬合不同的模型,以達到擬合最優(yōu)化。
就線性混合模型來說:
1、將固定效應(yīng)模型和隨機效應(yīng)模型進行有機的融合,進一步減少了混雜因素所造成的隨機誤差。
2、利用多種方差-協(xié)方差結(jié)構(gòu)模型對不同效應(yīng)設(shè)計矩陣進行擬合,一方面是對傳統(tǒng)方差進行的有效擴展,另一方面也放寬了對影響因素的條件和假定的限制。 本研究的創(chuàng)新點 本篇論文打破了傳統(tǒng)統(tǒng)計模型的瓶頸,提出了分析醫(yī)學縱向資料和數(shù)據(jù)的新方法。
1、擴大了模型的適用范圍。用新方法和新模型替代縱向數(shù)據(jù)不適應(yīng)或強行擬合的模型。
2、增加了模型的擬合程度。讓模型的噪聲更小,損失的信息更少。
本研究的不足之處
1、在模型的算法方面,有其一定的局限和不足之處。
2、模型在模擬方面做的不夠好,如果有現(xiàn)成的數(shù)據(jù)會更能體現(xiàn)優(yōu)勢。
............
參考文獻(略)
【基于變參數(shù)和混合模型的醫(yī)學縱向數(shù)據(jù)研究】相關(guān)文章:
基于數(shù)學形態(tài)學和PCNN的圖像去噪的研究開題報告范文02-16
醫(yī)學研究生的簡歷模板09-11
日本研究生留學申請趨勢變難02-28
《基于導(dǎo)納的圖像加密算法的研究》的開題報告04-10
醫(yī)學論文的構(gòu)思和提綱設(shè)計09-13
基于大數(shù)據(jù)的江蘇省農(nóng)村電商建設(shè)不足與完善論文03-09
電腦的顯卡參數(shù)怎么看11-30
電腦顯卡的參數(shù)怎么看11-30