氣象中的統計方法總結
中國近20年來氣象統計預報綜述
中國近20年來氣象統計預報綜述謝炯光曾琮(廣東省氣象臺)
摘要
近20年來,多元統計分析方法有了長足的進步,涌現出不少新方法、新技術。本文著重介紹了近20年來氣象統計預報在中國氣象業(yè)務科研中的一些應用和發(fā)展,主要從多元統計分析意義上來選材。
關鍵詞:多元分析、氣象統計、預報。
一、前言
氣象統計預報在中國氣象業(yè)務預報和科研工作中占有重要的位置,特別是在模式統計釋用及中長期預報業(yè)務中,統計預報更是扮演著一個重要的角色,多元分析中的回歸分析、典型相關分析、EOF分析等更是氣象預報和分析不可少缺的工具。近20年來,氣象統計預報在中國取得了長足的發(fā)展。本文主要綜述統計方法在氣象預報業(yè)務中的各個方面的應用及其所取得的一些成績。
二、多元統計分析在氣象預報業(yè)務中的應用1、回歸分析
廣東、江西、河北、遼寧等氣象局[1]用0、1權重回歸、逐步回歸、多元回歸等方法,得出晴雨MOS預報方程。1978年曹鴻興等、史久恩等[2]用逐步回歸建立最高、最低氣溫預報方程。新疆自治區(qū)氣象臺張家寶等[3]以預報員經驗為基礎,采用完全預報(PerfectProgMethod)方法,應用0、1權重回歸建立了有無寒潮的預報。上海氣象臺丁長根、黃家鑫[4]用逐步回歸建立U、V和S(全風速)預報方程。1965年W.F.Massy[5]提出的主成份回歸、1970年Hoerl和Kennard[6]提出的嶺估計(Ridgeestimate)以及Webster等人[7]提出的特征根回歸(Latentrootregression,LRR)對在回歸分析中出現復共線性(Multi-collinearity)有較好的處理。馮耀煌[8]在預報集成中,應用了嶺回歸技術,李耀先[9]用嶺回歸作水稻產量年景預測。魏松林[10]用特征根回歸建立長春6-8月平均氣溫的特征根回歸。
Furnialhe和Wilson提出的窮盡所有回歸的算法,比較徹底地解決了最優(yōu)回歸(即最優(yōu)子集回歸)的問題。張萬誠[11]用最優(yōu)子集回歸作低緯高原雨季開始預報。在氣象預報的實際工作中,常要考慮多個自變量(預報因子)與多個因變量(預報量)的關系。中國數學家張堯庭[12]解決了這一問題的算法,徐一鳴等[13]用多預報量雙重篩選逐步回歸作臺風路徑預報,嚴華生等[14]用多因變量多自變量建立大氣環(huán)流--區(qū)域水稻產量預報。
引入非線性回歸是近年來發(fā)展的趨勢。馮耀煌等[15]、姜子俊等[16]提出了一種選擇非線性最優(yōu)預報因子和建立非線性預報方程的方法,可用于長、中短期預報。近年來由于數值預報模式的頻繁更迭,使模式輸出統計預報方法受到新的考驗,黃嘉佑等[17]介紹了卡爾曼濾波在天氣預報中的應用,劉春霞等[18]用此方法制作了廣東省冬季的最低氣溫預報。近年來,卡爾曼濾波技術在短期氣候預測中也得到了應用[19]。2、判別分析
廣東省徐聞氣象局[20]用二級判別做臺風登陸地段的預報。Fisher、Bayes以及逐步判別等雖然在氣象實際中廣泛應用,但嚴格地說,這些方法僅當變量為正態(tài)分布時才可應用,Logistic判別對變量的基本假設條件較寬,對未經正態(tài)檢驗的變量應用本方法是可行的,且可用于既有連續(xù)變量又有多值離散變量的情形。呂純濂等[21]將Logistic判別引入中國氣象界,并研究了二次Logistic判別[22]分析及逐步判別[23]在氣象中的應用。3、相關分析
近20年來在氣象統計中用得較多的主要有典型相關(CCA)分析和奇異值分解(SVD)方法。CCA是提取兩個氣象場的最大線性相關摸態(tài)的方法。朱盛明、祝浩敏[24]在數值預報的解釋應用中用典型相關分析提取有物理意義的預報因子作預報方程。陳嘉玲、謝炯光[25]用典型相關分析作中期冷空氣預報。黃嘉佑[26]用典型相關分析作副高的統計動力預報。近年來發(fā)展了一種新的CCA改進方法,稱為典型相關分析的BP(Barnert和Preisendorfer)方法,在氣象統計中也得到了應用[27]。
奇異值分解(SVD)也是提取兩個場的最大線性相關摸態(tài)的方法,SVD方法可以變成是兩個要素場關系的擴大EOF分析。謝炯光等[28]用奇異值分解方法,求出了廣東省前汛期(4-6月)西太平洋場海溫與廣東省降水場的6對奇異向量,來作汛期降水趨勢預報。江志紅等[29]用SVD方法討論了中國夏半年降水與北太平洋海溫異常的關系。
4、氣象場的分解及其應用
50年代中期由Loreng引入到大氣科學研究中的主成份分析以及后來發(fā)展的擴展經驗正交函數、復經驗正交函數、旋轉主分量分析、R型、Q型因子分析、對應分析、主震蕩型(PrincipalOscillationParterns,PPOS)。使氣象研究及業(yè)務水平進入一個更高層次。
4.1經驗正交函數(EOF)分解
章基嘉等[30]應用經驗正交函數對亞洲500hPa侯平均環(huán)流與我國侯平均氣溫之關系的時空結構進行分析。用EOF逐年劃分自然天氣季節(jié),張邦林、丑紀范[31]提出了一種時空綜合的經驗正交函數分析方法,多數的經驗正交函數分解是在標量場上展開的,但風場也用經驗正交函數展開,周紫東等[32]、王盤興[33]]討論了氣象向量場的經驗正交函數展開方法及其應用。4.2主成份(主分量)分析及其因子分析
氣象分析預報中,常要分析許多變量,而變量間往往互有影響,如何從多個變量中找出很少幾個綜合性的指標代替原來較多的指標,而且所找到的綜合指標又能盡可能多地反映原來數據的信息,而且主成份之間又是相互獨立的主成份分析。
何敏等[34]用主分量研究了歐亞地區(qū)大氣環(huán)流年際振蕩的時空分布特征,謝炯光[35]用主分量與非線性降維和相似綜合作廣東月降水量分布預報,陳創(chuàng)買等[36]提出一種氣候場的主分量逐步回歸預報模型,該模型將氣候場的預報變成對氣候場主分量的預報,并通過相關分析和逐步回歸,求得氣候場的主分量與各種不同的因子場的主分量因子之間的聯系。用于廣東年降水的預報。4.3擴展經驗正交函數(EEOF)
1982年Weare和Nasstrom[37]提出的EEOF分解可以得到氣象場空間分布結構,也可以得到隨時間變化空間分布結構的變化。張先恭等[38]用EEOF做太平洋海表溫度與中國降水準3.5年周期變化。
謝炯光[39]提出一種月、季降水預測的新方法,用EEOF分解得到的前期特征向量場,來預測后期的降水場分布特征。4.4復經驗正交函數(CEOF)
Rasmusson和Barnetl提出的復經驗正交函數(CEOF)[40]能表現出氣象場的位相變化及空間傳播特征。
黃嘉佑[41]使用復經驗正交函數分析中國降水長期變化的準兩年周期振動,魏鳳英等[42]用CEOF分析了近百年中國東部旱澇的分布及其年際變化特征,符綜斌等[43]曾將CEOF分析用于Elnino增暖的振幅和位相變化,畢幕瑩[44]用CEOF分析研究了夏季西太平洋副高的振蕩。
4.5因子分析、旋轉主因子分析(RPC)
將主成份分析向前推進一步,就是因子分析,因子分析又分R型分析和Q型分析兩種,我們知道,由于主因子是通過原始變量的線性組合得到的,因而可以了解到其天氣意義。但哪一個主因子的天氣意義更重要些,可通過因子荷載矩陣進行分析,一般來說因子荷載矩陣越簡單越易解釋。為此,使每個因子的荷載平方按列向0或1兩端分化。使主因子在每個變量上的荷載趨近于1,而在其它變量上的荷載接近于0,這樣,就更容易解釋主因子的天氣意義。這種變換稱為旋轉主因子分析,一般分正交旋轉與斜交旋轉兩種方式。極大方差旋轉是正交旋轉,是氣象預測、科研業(yè)務中最常用的旋轉方法。謝炯光等[45]用因子分析和旋轉因子分析對西太平洋8個海區(qū)進行了分析,對頭4個主因子的物理意義進行了初步的解釋,進而用它建立了廣東省各月降水與海溫的預報方程。黃嘉佑[46]用斜旋主分量分析了我國夏季氣溫及降水場(1951-1987年)的時空特征,王敬方等[47]用旋轉主分量(RPC)方法,分析近40年來我國夏季溫度變化的規(guī)律。4.6對應分析
對應分析是一種綜合了R型及Q型因子分析特點的多元統計分析技術,黃嘉佑[48]、李麥村等[49]用該方法發(fā)現副高逐月變化曲線與赤道海溫變化十分相似,謝炯光[50]用對應分析對4-6月逐月的連續(xù)變化進行分型,把各月的降水連續(xù)變化分為連升型、連降型、降后升型等四型,并利用回歸分析作出各型的預報,在前汛期降水趨勢和冬半年(1-3月)氣溫趨勢的預測中收到了較好的效果。4.7主振蕩型(POP)分析
主振蕩型(POP)是Hasselmamm和Storch在20世紀80年代末提出來的[51]。章基嘉等[52]對離散化場時間序列推導了主振蕩型分析方法的兩個導出量:主振蕩型(POP)及其伴隨相關型(ACP)。通過熱帶太平洋SST矩平場時間序列POP及相應區(qū)域850hPa風場ACP的計算例子,給出了它們的實際算法。5聚類分析
鄭祖光[53]在首先不能確定用幾個因子和分成幾類的情況下,提出用變K變N方案。章基嘉等[54]應用K-均值聚類法對東亞各自然天氣季節(jié)500hPa平均環(huán)流進行分型試驗。在聚類分析中多數的分類樣品是相互獨立的,分類時彼此是平等的,但在一些問題中,樣品的分類是不能打破順序的。比如,對某一階段氣象要素數據進行分段以確定不同時段的氣候特征。這種分類,稱為分割更為形象一些,Fisher提出了最優(yōu)分割的算法,謝炯光等[55]利用最優(yōu)分割,對中國T106數值預報輸出產品的各種物理意義明確的預報因子進行最優(yōu)二分割,挑選出晴雨及有無大于25毫米降水的預報因子,建立概率回歸方法,做24-144小時的晴雨,大于25毫米降水的完全概率預報,在業(yè)務中收到較好效果。最優(yōu)二分割的進一步優(yōu)化,產生了一種叫做AID的分割算法(AutomaticInteractionDetection),利用AID方法,不但可以分類,還可以根據新的樣品落區(qū)在哪一類作出預報。AID具有解決一些非線性問題的能力。謝炯光等[56]據天氣學實踐選出47個與廣東省臺風、暴雨關系密切的預報因子,利用AID方法,進行計算做出臺風暴雨的短期預報。6譜分析6.1功率譜
李小泉等[57]利用譜分析研究500hPa環(huán)流指數的變化,譜分析也常常與其它方法相結合應用于天氣分析與預報中,黃嘉佑[58]在研究海溫場與太平洋副熱帶高壓之間的關系時使用交叉譜發(fā)現,海溫不單有明顯的兩年振動周期,而且這種振動存在于太平洋地區(qū)的氣壓系統中,關系十分密切,它們之間的凝譜平方值高值0.65的臨界值。符淙斌[59]利用協譜與正交譜研究緯向和經向垂直環(huán)流強度之間的反相耦合振蕩關系。
6.2最大熵譜分析
在連續(xù)功率譜估計中,自相關函數估計與樣本量大小有關,1967年Burg提出了一種稱之為“最大熵”譜估計的方法,具有分辨率高、適用于短序列等優(yōu)點?婂\海[60]討論了最大熵譜的優(yōu)良特性和預報誤差過濾下系數階段的確定。曹鴻興等[61]討論了氣象歷史序列的最大熵譜分析。魏鳳英[62]用最大熵譜提取1952-1995年華北地區(qū)春季干旱指數序列的顯著周期。6.3奇異譜分析(SSA)
奇異譜分析(SingularSpectrumAnalysis)是從時間序列的動力重構出發(fā)與經驗正交函數(EOF)相結合的一種統計分析技術,特別適合用于大氣的非線性振動。吳洪寶[63]、、劉健文等[64]系統介紹了奇異譜的原理及其在氣象中的應用。謝炯光等[65]用SSA方法對登陸廣東省的熱帶氣旋的演變規(guī)律進行了分析,發(fā)現年登陸廣東的熱帶氣旋存在明顯的8年,準3年的周期振蕩,登陸珠江口以西的熱帶氣旋,存在12年,準2年的振蕩周期。6.4小波分析
小波分析是從傅立葉分析方法發(fā)展起來的并被認為是傅立葉分析方法的突破性進展。戴新剛和丑紀范[66]用子波變換研究了長江和黃河流域徑流的周期性問題,紀忠萍等[67]用小波分析對廣州近百年來氣候變化的多時間尺度進行分析,紀忠萍等[68]用小波變換分析廣東省低溫陰雨的年景趨勢變化,著重分析了重低溫陰雨年在小波系數圖中的分布特征,并根據分析結果對未來1-2年的低溫陰雨年景進行了預測估計。7時間序列分析模型
在氣象上用得較多的主要有自回歸模型(AR)、滑動平均模型(MA)、自回歸滑動平均模型(ARMA)、自回歸求和滑動平均(ARIMA)模型。氣象要素的時間序列多數是屬非線性變化的,上述的時間序列建模模型均為線性模型。而時間序列分析中的門限自回歸模型(TAR)是一種非線性模型,它利用逐段線性化手段來處理非線性系統。由于門限的控制作用,保證了遞推的穩(wěn)定性。門限自回歸模型可以有效地描述非線性振動現象,可以解釋自然界各種類型的穩(wěn)定循環(huán)。丁裕國等[69]利用奇異譜分析對Nino海區(qū)SSTA月際序列作短期氣候預測試驗,采用AR(P)模型,結果發(fā)現在SSA分析基礎上的AR模型對ENSO海區(qū)的SST預報特別有效。史久恩等[70]用自激勵門限自回歸模型作SOI(南方濤動指數)的預報,其結果與線性AR模型相比較,結果表明非線性門限自回歸模型擬合SOI數據,比線性模型更能有效地反映數據的內在規(guī)律。8多層遞階方法
1983年中國韓志剛教授[71]提出了建立在現代控制理論中“系統辨識”基礎上的含時變參數的新型統計預測方法—多層遞階方法。這種時間序列的新預報方法在氣象預報服務中取得了較好的效果[72],不少學者在使用過程中對這種方法的應用方面作了進一步的改進,使其在氣象預報應用上得到進一步的提高[73]。9均生函數模型曹鴻興、魏鳳英等提出了時間序列的均值生成函數(MeanGeneratingFunction,MGF,簡稱均生函數)模型。均生函數預測模型既可以作多步預測,又可以較好地預測極值,為短期氣候預測開辟了一條新的途徑。魏鳳英、曹鴻興[74]在《長期預測的數學模型及其應用》與《現代氣候統計診斷預測技術》兩書中對均生函數模型的數學原理及其在氣象中的應用作了詳細的介紹。10灰色系統預測模型
“灰色系統”理論,是我國學者鄧聚龍教授提出的新型理論。到目前為止,人們對天氣(氣候)系統的演變規(guī)律、發(fā)生、發(fā)展、消亡機制,子系統間的相互作用的了解尚不清楚、不充分,限制了動力和統計方法對天氣(氣候)系統的深入研究。天氣氣候系統,由于其復雜性,是一個典型的部分信息已知和部分信息未知的灰色系統。因此,鄧聚龍教授提出的灰色系統理論為氣象預測和分析研究提供了一個有力的工具。曹鴻興、翁文潔等人對灰色分析與預測及其在氣象中的應用作了推廣[75],鄧聚龍[76]在“灰色預測與決策”一書中對灰色系統的理論的來龍去脈,具體計算方法作了詳細的介紹,并把GM(1,1)模型、災變預測、季節(jié)災變預測、拓撲預測等方法在氣象中的實際應用作了介紹。謝定升等[77]根據GM(1,1)模型的方法原理,作降水峰日的中期預報。11車貝雪夫多項式展開
經典車貝雪夫多項式展開只適用于矩形網格,周家斌將車貝雪夫展開推廣到不規(guī)則格點上,并將其用于氣象要素的分布預報[78]。周家斌提出了一種用車貝雪夫多項式做時間序列預報的迭代算法,這是一個非線性、非參數方法,無需對序列作平穩(wěn)或其它假定。它的擬合和實際預報效果較好[79]。12神經網絡原理在氣象中的應用
近年來神經網絡在氣象中的應用快速發(fā)展。周曾奎等[80]利用神經BP網絡模型輸出判斷臺風移向趨勢-西進、北上、西北移。于波等[81]結合模糊判斷技術利用多層神經網絡對GMS云圖的臺風云系進行圖像識別。謝炯光等[82]利用神經BP網絡進行月雨量集成預報試驗,金龍等[83]提出了小波變換與神經網絡相結合的多步預測模型。
13非線性動力學
林振山[84]首先提出了諾干相空間預報模型,并提出將相空間模處理組合法用于業(yè)務預報中。周家斌[85]提出了相空間向量相似方法,相軌跡變率方法,空間變換方法和相空間模方法等4種以混沌理論為基礎的預報方法,這些方法已經用于南方濤動強度、北京降水和華北降水分布的預報。14分形
近年分形的思路和方法正逐步在氣象分析和業(yè)務中得到應用。劉式達等[86]指出分數維是氣候系統結構的特征,是氣候系統中尺度變換后的不變數。付昱華[87]應用分形分布模型N=C/rD的推廣形式,即連續(xù)變維分形(分維數D是r的連續(xù)函數,而不是常量)預測臺風路徑。
三、結束語
近20年來統計氣象學在中國取得了長足的發(fā)展,統計預報在中國氣象業(yè)務預報和科研中占有重要的位置。主要表現在:1在數值預報產品統計釋用中,統計預報方法發(fā)揮了積極的作用。2隨著計算技術和計算機的發(fā)展,以場分析和場相關的統計預報方法如SVD、EEOF、CCA分析等方法得以在業(yè)務上得到了廣泛應用,對提高業(yè)務預報精確率幫助很大。3一些新的統計方法由于種種原因,用在氣候分析中較多,用在業(yè)務預測上較少,有待今后進一步開發(fā)。
4近年來國內外一些數學界的研究新成果,如自記憶方程、主振蕩模、混沌分形、小波分析等引入到氣象界的速度很快,如何使其在天氣預測中更快、更好地發(fā)揮作用值得研究。
5在統計預報的使用中,如何發(fā)揮統計預報的長處,避免其不足的地方,要繼續(xù)研究
擴展閱讀:統計方法總結
一、統計分析方法總結
1.連續(xù)性資料
1.1兩組獨立樣本比較
1.1.1資料符合正態(tài)分布,且兩組方差齊性,直接采用t檢驗。1.1.2資料不符合正態(tài)分布,(1)可進行數據轉換,如對數轉換等,使之服從正態(tài)分布,然后對轉換后的數據采用t檢驗;(2)采用非參數檢驗,如Wilcoxon檢驗。1.1.3資料方差不齊,(1)采用Satterthwate的t’檢驗;(2)采用非參數檢驗,如Wilcoxon檢驗。
1.2兩組配對樣本的比較
1.2.1兩組差值服從正態(tài)分布,采用配對t檢驗。
1.2.2兩組差值不服從正態(tài)分布,采用wilcoxon的符號配對秩和檢驗。1.3多組完全隨機樣本比較
1.3.1資料符合正態(tài)分布,且各組方差齊性,直接采用完全隨機的方差分析。如果檢驗結果為有統計學意義,則進一步作兩兩比較,兩兩比較的方法有LSD檢驗,Bonferroni法,tukey法,Scheffe法,SNK法等。
1.3.2資料不符合正態(tài)分布,或各組方差不齊,則采用非參數檢驗的Kruscal-Wallis法。如果檢驗結果為有統計學意義,則進一步作兩兩比較,一般采用Bonferroni法校正P值,然后用成組的Wilcoxon檢驗。1.4多組隨機區(qū)組樣本比較
1.4.1資料符合正態(tài)分布,且各組方差齊性,直接采用隨機區(qū)組的方差分析。如果檢驗結果為有統計學意義,則進一步作兩兩比較,兩兩比較的方法有LSD檢驗,Bonferroni法,tukey法,Scheffe法,SNK法等。
1.4.2資料不符合正態(tài)分布,或各組方差不齊,則采用非參數檢驗的Fridman檢驗法。如果檢驗結果為有統計學意義,則進一步作兩兩比較,一般采用Bonferroni法校正P值,然后用符號配對的Wilcoxon檢驗。
****需要注意的問題:
(1)一般來說,如果是大樣本,比如各組例數大于50,可以不作正態(tài)性檢驗,直接采用t檢驗或方差分析。因為統計學上有中心極限定理,假定大樣本是服從正態(tài)分布的。
(2)當進行多組比較時,最容易犯的錯誤是僅比較其中的兩組,而不顧其他組,這樣作容易增大犯假陽性錯誤的概率。正確的做法應該是,先作總的各組間的比較,如果總的來說差別有統計學意義,然后才能作其中任意兩組的比較,這些兩兩比較有特定的統計方法,如上面提到的LSD檢驗,Bonferroni法,tukey法,Scheffe法,SNK法等。**絕不能對其中的兩組直接采用t檢驗,這樣即使得出結果也未必正確**
(3)關于常用的設計方法:多組資料盡管最終分析都是采用方差分析,但不同設計會有差別。常用的設計如完全隨即設計,隨機區(qū)組設計,析因設計,裂區(qū)設計,嵌套設計等。2.分類資料2.1四格表資料
2.1.1例數大于40,且所有理論數大于5,則用普通的Pearson檢驗。
2.1.2例數大于40,所有理論數大于1,且至少一個理論數小于5,則用校正的檢驗或Fisher’s確切概率法檢驗。
2.1.3例數小于40,或有理論數小于2,則用Fisher’s確切概率法檢驗。
2.22×C表或R×2表資料的統計分析
2.2.1列變量&行變量均為無序分類變量,則(1)例數大于40,且理論數小于5的格子數目格子數目>總格子數目的25%,則用Fisher’s確切概率法檢驗。
2.2.2列變量為效應指標,且為有序多分類變量,行變量為分組變量,用普通的Pearson檢驗只說明組間構成比不同,如要說明療效,則可用行平均分差檢驗或成組的Wilcoxon秩和檢驗。
2.2.3列變量為效應指標,且為二分類變量,行變量為有序多分類變量,則可采用普通的Pearson檢驗比較各組之間有無差別,如果總的來說有差別,還可進一步作兩兩比較,以說明是否任意兩組之間的差別都有統計學意義。
2.3R×C表資料的統計分析
2.2.1列變量&行變量均為無序分類變量,則(1)例數大于40,且理論數小于5的格子數目總格子數目的25%,則用Fisher’s確切概率法檢驗。(3)如果要作相關性分析,可采用Pearson相關系數。
2.2.2列變量為效應指標,且為有序多分類變量,行變量為分組變量,用普通的Pearson檢驗只說明組間構成比不同,如要說明療效或強弱程度的不同,則可用行平均分差檢驗或成組的Wilcoxon秩和檢驗或Ridit分析。
2.2.3列變量為效應指標,且為無序多分類變量,行變量為有序多分類變量,則可采用普通的Pearson檢驗比較各組之間有無差別,如果有差別,還可進一步作兩兩比較,以說明是否任意兩組之間的差別都有統計學意義。
2.2.4列變量&行變量均為有序多分類變量,(1)如要做組間差別分析,則可用行平均分差檢驗或成組的Wilcoxon秩和檢驗或Ridit分析。如果總的來說有差別,還可進一步作兩兩比較,以說明是否任意兩組之間的差別都有統計學意義。(2)如果要做兩變量之間的相關性,可采用Spearson相關分析。2.4配對分類資料的統計分析2.4.1四格表配對資料,(1)b+c>40,則用McNemar配對檢驗。(2)b+c照的注意問題附后);③隨訪的起點和止點應有明確的定義;④注意影響實驗研究結果的因素,并適當控制(具體內容附后)。
1.國內外研究現狀、水平、發(fā)展趨勢(簡要介紹與本課題有關研究的國內外現狀、水平、發(fā)展趨勢等,寫明本課題提出的依據及本課題研究目的;簡要介紹預試驗內容及結果。)。2.研究對象:
(1)具體診斷標準(用公認的或統一的,并闡明出處;如沒有統一的標準也應寫明是自定標準。)、制定入選(納入)標準及排除標準;(2)研究對象選擇范圍(包括對照組)及選樣和分組方法(使用正確的隨機方法選樣和分組;在實驗對象的分組和施加因素分配實驗組、對照組上,都要隨機化);(3)樣本含量。(說明確定樣本含量的依據)3.處理因素:(詳細寫)
處理因素設置要求:①抓住主要因素;②找出非處理因素(混雜因素);③處理因素標準化。(1)設備(或試劑或藥物)生產廠家(來源)及型號(劑量);(2)治療方法及操作程序(包括對照組);
(3)操作過程中的質量控制(包括方法、人員、設備三統一及實驗質控手段等);(4)技術關鍵。
4.研究結果:
確定研究效應的測量指標及測定方法,要考慮與待評價的結果有關聯性、客觀性、靈敏性、特異性及實用性等。
(1)療效判斷標準(用公認的或統一的,并闡明出處;如沒有統一的標準也應寫明是自定標準。);
(2)(近期、遠期)觀察指標(各組觀察指標應一致)及觀察方法;(3)科研記錄表格及匯總表格式樣;(4)統計方法及指標確定,預計結果;
(5)科研質量控制措施(包括科研全過程的各環(huán)節(jié),如預試驗工作、分組、施加處理因素、臨床觀察及隨訪、原始資料的記錄及收集、資料整理等方面質量控制措施)。5.創(chuàng)新設想(本研究的):
6.工作時間安排(包括調研、設計、研究、統計分析、總結鑒定等):
7.研究人員分工(包括姓名、性別、年齡、職稱、工作單位及在本研究中的詳細分工):8.經費的籌措及使用計劃:
9.存在(可能出現)的問題、困難及解決辦法:
臨床科研的對照問題
為保證臨床科研實驗組與對照組之間具有可比性,對照組中的觀察對象除了實驗因素不同以外,實驗過程中的實驗條件和輔助措施,都應與實驗組相同。常用對照方式如下:
1、空白對照:對照組不施加任何處理因素。這種對照僅用在某些病情較輕或長期穩(wěn)定無任何危險的疾病,如:慢性關節(jié)炎、HbsAg攜帶者、近視等。
2、安慰劑對照:對照組采用無藥理作用且無害的“藥“,如:淀粉、生理鹽水等經加工后其外形、味道等與試驗藥相似,不被受試者識別。這種對照僅用在研究的疾病尚無有效治療方法,或使用安慰劑后該病的病情、臨床經過、預后等影響小或無影響時。
3、實驗對照:對照組不施加處理因素,但施加某種與處理因素有關的實驗因素。4、標準對照:用現有標準方法或常規(guī)方法做對照,注意以一種低療效的方法作對照來提高試驗的療效是毫無意義的,甚至是有害的。5、歷史對照:以過去的研究結果作對照,這是一種非隨機和非同期的對照,容易產生偏倚(可能因為疾病自然病程會隨時間而變化,或醫(yī)生的收治病人診斷標準和治療方法或水平因時間而變化等,使兩組失去可比性)。這種對照可用于狂犬病、骨折愈合等療效對照。
6、自身對照:對照和實驗在同一受試對象進行,這種對照簡單易行,但應注意該方法的兩個缺陷:一是實驗總是把處理前作對照,這不符合隨機分配原則;二是實驗前后某些環(huán)境因素或自身因素發(fā)生了改變,可能影響實驗結果?煽紤]用交叉實驗解決。
7、相互對照:多種待研究觀察因素相互對照。
目前常用的設計方案有:隨機對照實驗、配對實驗、交叉實驗(適于病程較長的實驗研究),可根據具體情況,選用適合的方法進行實驗研究。10、影響實驗研究結果的因素及其控制一、誤差:
1、隨機誤差:通過增加樣本含量,可減小隨機誤差,但不能消除。2、非隨機誤差:
非系統誤差:偶然失誤造成的。
系統誤差:誤差值遵循一定的規(guī)律而存在或變化,增加樣本量,不能糾正。
二、編倚:(可以看成是一種系統誤差)
1、選擇性偏倚:防止選擇性偏倚的措施:①正確擬定觀察對象的納入和排除標準;②采用分層抽樣方法;③正確設立對照;④遵守隨機化原則。2、測量偏倚(或稱觀察偏倚或信息偏倚):產生原因:①沾染(對照組也接受了處理措施);②干擾;③依從與非依從;④失訪(>20%);⑤檢查與診斷結果不一致;⑥觀察記錄有誤;⑦心理因素的干擾。
防止措施:①用盲法試驗;②簽定實驗合同;③檢查實驗對象的依從情況;④注意醫(yī)德問題;⑤定期檢查研究記錄;⑥對實驗方法、診斷標準的一致性在實驗前應做出估計。3、混雜偏倚:
產生原因:多在總結分析階段,評價被研究因素與疾病之間的關系時,如果存在外來因素與該病和研究因素均有聯系,使研究因素效應與外來因素效應混
在一起,從而掩蓋或夸大研究因素與疾病的真實聯系。
防止措施:①設計時,用配對設計或采用分層抽樣方法;②分析階段,用分層分析技術或多變量回歸分析技術。其目的是平衡混雜因素的作用。
醫(yī)學科研設計基本內容(調查設計參考用)
1、國內外研究現狀、水平、發(fā)展趨勢(簡要介紹與本課題有關研究的國內外現狀、水平、發(fā)展趨勢等,寫明本課題提出的依據及研究目的。注意:研究目的應很明確,且圍繞一個中心;簡要介紹預試驗內容及結果。)。2、調查計劃:
⑴、確定觀察對象(所要研究的總體)和觀察單位(總體中的個體統計對象)
⑵、選定調查指標(調查指標是調查目的的具體體現):指標選擇要求:①精選、重點突出,不要貪多求全,分散精力。②計量指標比計數指標敏感。③客觀指標優(yōu)于主觀指標。④選用靈敏度高,特異度高的檢查方法作為診斷依據。⑶、調查方法(普查、抽樣調查等)
⑷、樣本含量(說明確定樣本含量的依據)
⑸、收集原始資料的調查方式(直接觀察、直接采訪(訪問調查、自填調查)、間接采訪(信訪、電話))
⑹、設計調查表和問卷(調查表和問卷設計相關問題附后)⑺、調查階段的組織工作(包括組織領導、關系協調、調查員培訓等)
⑻、設計階段質量控制:①正確劃分調查范圍;②盡量選擇客觀、明確的指標;③對調查問題進行精選,避免問題過于繁雜;④對于可能引起混淆的調查項目給出明確的定義。
⑼、調查階段質量控制:①通過預試驗工作完善調查設計;②抓好調查員的選拔和培訓,避免因調查員工作態(tài)度不好或業(yè)務水平不足而影響調查結果;③對被調查者可能存在的拒絕、躲避、隱瞞、等問題,采取相應措施,如:開展宣傳、摸清被調查者在家的時間規(guī)律、對敏感問題做好解釋和保密工作,對記憶不清者,可請知情人幫助回憶;④在問卷中設置相反問題,以了解應答的可靠性;⑤選擇調查方式時應考慮年齡和文化水平因素;⑥對檢測項目的調查應注明檢測設備、
試劑等生產廠家、型號、批號;操作過程應注意操作方法(包括診斷標準)、人員、設備(應有明確的校正靈敏度及準確度的方法及時間)三統一;⑦注意調查的效度(真實性)與信度(可靠性)問題,常采用現場抽樣復查來評價調查信度等。3、整理計劃:(去粗取精,去偽存真)
⑴、計算機錄入與整理工作:應提出確保錄入質量的措施:①在建立數據庫時,編寫邏輯查錯程序;②同一資料用兩個錄入員輸入并用計算機核對;③資料錄入完成后,做頻數表或散點圖,發(fā)現異常值;④正確選擇合適的指標和分析方法等。⑵、資料分組:(按數值大小分組、按類型分組等)⑶、分組組數確定:
4、統計分析計劃:(包括:①說明指標的內涵和計算方法及預期進行統計描述和推斷內容;②擬進行的探索性分析;③控制混雜因素的措施;④列出統計分析表,并通過統計分析表檢查調查、整理計劃有否遺漏。)5、創(chuàng)新設想(本研究的):
6、工作時間安排(包括調研、設計、研究、統計分析、總結鑒定等):
7、研究人員分工(包括姓名、性別、年齡、職稱、單位及在本研究中的詳細分工):8、經費的籌措及使用計劃:
9、存在(可能出現)的問題、困難及解決辦法:
10、調查表及問卷設計相關問題一、一般結構:
1、前言:用于說明調查目的、重要性、回答問題的必要性以及對調查內容保密等,以取得調查對象的合作。
2、填寫說明:為保證所有調查員和調查對象均能對調查項目和填寫方法正確理解,統一認識而編寫。
3、核(備)查項目:該部分與調查目的無關,作核查核對用。內容包括調查員姓名、調查日期、復核結果、未調查原因等。
4、調查(分析)項目:為直接用于調查指標所必須以及排除混雜因素所必須的項目,包括調查對象的①背景資料,如:姓名、住址、單位、電話等;②人口學項目,如:年齡、性別、民族、婚姻狀況、文化程度、職業(yè)等;③研究項目(該部分是調查表的核心內容,依不同調查目的而定,分問題項目和檢測項目)。二、問題的形式:問題的基本形式有提問式和陳述式兩種;根據問題答案的形式分開放式問題(無統一答案)和封閉式問題(有固定答案)。封閉式問題設計注意:1、答案應包括所有可能的答案,還應有“其它”一欄;2、各選擇答案不應相互包含,不應有重疊情況。三、問題設計的一般原則:1、盡量避免用專業(yè)術語(提問一般就低不就高);
2、避免混淆,對語義較模糊的詞(如:經常、偶爾、普通、大概等)應給出本次調查的定義或標準。
3、避免雙重問題,避免一個問題中實際提出兩個問題。4、提問避免誘導或強制性(否定形式的提問有誘導之嫌);對有社會期望偏倚的問題應注意。5、問題應適合全部調查對象并符合邏輯。
6、敏感問題的處理:對國家政策、倫理道德、經濟收入、生活行為、其它個人隱私等敏感問題,可以采用對象轉移法或假定法提問;關于敏感問題調查的隨機應答技術問題,須參考有關統計學專著。
7、調查項目的安排順序(注意問題順序的邏輯性)①、一般問題在前,特殊問題在后;②、易答問題在前,難答問題在后;
③、敏感問題一般在最后;如敏感問題較多,可分散在問卷中,以降低其敏感性;④、一般將問題項目放在前,檢測項目放在后。
友情提示:本文中關于《氣象中的統計方法總結》給出的范例僅供您參考拓展思維使用,氣象中的統計方法總結:該篇文章建議您自主創(chuàng)作。
來源:網絡整理 免責聲明:本文僅限學習分享,如產生版權問題,請聯系我們及時刪除。