統(tǒng)計(jì)、科研的一些總結(jié)
一
(1)統(tǒng)計(jì)學(xué)是關(guān)于數(shù)據(jù)收集、整理、分析、表達(dá)和解釋的普遍原理與方法的一門(mén)科學(xué)。(2)隨機(jī)事件:隨機(jī)現(xiàn)象每一個(gè)可能的結(jié)果,簡(jiǎn)稱(chēng)事件,常用字母A,B,C,表示。(3)概率:是隨機(jī)事件發(fā)生可能性大小的客觀度量指標(biāo),隨機(jī)事件A的概率記為P(A)。(4)正態(tài)曲線下面積的分布規(guī)律:X軸上與正態(tài)曲線下所夾面積恒等于1,即正態(tài)曲線下面積恒等于1。(5)χ2分布是一種連續(xù)型分布。
(6)連續(xù)型隨機(jī)變量最基本和常用的分布:正態(tài)分布
二(1)選擇樣本的兩個(gè)方法:概率抽樣和非概率抽樣(2)概率抽樣的方法:等概率抽樣、非等概率抽樣(3)誤差:系統(tǒng)誤差、隨機(jī)誤差。(4)設(shè)計(jì):專(zhuān)業(yè)設(shè)計(jì)、統(tǒng)計(jì)設(shè)計(jì)
(5)統(tǒng)計(jì)表可分為簡(jiǎn)單表、復(fù)合表(組合表)(6)自然界的現(xiàn)象可分為兩種:必然現(xiàn)象、隨機(jī)現(xiàn)象(7)隨機(jī)變量可分為:離散型隨機(jī)變量、連續(xù)型隨機(jī)變量。(8)離散型概率分布:二項(xiàng)分布、Poisson分布(9)數(shù)據(jù)的分布形狀:對(duì)稱(chēng)分布和偏態(tài)分布。
(10)假設(shè)檢驗(yàn)的兩類(lèi)錯(cuò)誤:①原假設(shè)為真而被拒絕的錯(cuò)誤稱(chēng)為第一類(lèi)錯(cuò)誤,也稱(chēng)I類(lèi)錯(cuò)誤,犯I類(lèi)錯(cuò)誤的概率記作α。②原假設(shè)為不真而被接受的錯(cuò)誤稱(chēng)為第二類(lèi)錯(cuò)誤,也稱(chēng)II類(lèi)錯(cuò)誤,犯II類(lèi)錯(cuò)誤的概率記作β。
三(1)資料的三個(gè)類(lèi)型:計(jì)量資料、計(jì)數(shù)資料和等級(jí)資料。(2)統(tǒng)計(jì)表的三個(gè)制表原則
①重點(diǎn)突出,一張表一般只表達(dá)一個(gè)中心內(nèi)容。②統(tǒng)計(jì)表如同完整的一句話,要有描述的對(duì)象和內(nèi)容。③統(tǒng)計(jì)表應(yīng)簡(jiǎn)單明了,一切文字、數(shù)字和線條都盡量從簡(jiǎn)。(3)醫(yī)學(xué)科研設(shè)計(jì):調(diào)查設(shè)計(jì)、實(shí)驗(yàn)設(shè)計(jì)、臨床實(shí)驗(yàn)設(shè)計(jì)(4)連續(xù)型概率分布:正態(tài)分布、t分布、F分布(5)樣本率的分布有以下三個(gè)特點(diǎn):
①總體率π相同時(shí),樣本量越大,樣本率的分布越趨向?qū)ΨQ(chēng)。②樣本量n相同時(shí),π偏離0.5,樣本率的分布呈偏態(tài)分布。③總體率π=0.5時(shí),樣本率呈對(duì)稱(chēng)分布。(6)假設(shè)檢驗(yàn)三個(gè)基本步驟:
①建立假設(shè)與確定檢驗(yàn)水準(zhǔn)(α)②確定檢驗(yàn)方法,計(jì)算統(tǒng)計(jì)量③確定P值作出推斷結(jié)論(7)實(shí)驗(yàn)研究三個(gè)基本組成部分:處理因素、研究對(duì)象和實(shí)驗(yàn)效應(yīng)。(8)實(shí)驗(yàn)設(shè)計(jì)的基本原則:對(duì)照原則、隨機(jī)原則和重復(fù)原則。(9)實(shí)驗(yàn)性研究中對(duì)照組設(shè)置必須具備3個(gè)條件:
①對(duì)等:除研究因素外,對(duì)照組(實(shí)驗(yàn)對(duì)象)具備與實(shí)驗(yàn)組(實(shí)驗(yàn)對(duì)象)對(duì)等的一切因素。②同步:設(shè)立的對(duì)照組與實(shí)驗(yàn)組在整個(gè)研究進(jìn)程中始終處于同一空間和同一時(shí)間。③專(zhuān)設(shè):任何一個(gè)對(duì)照組都是為相應(yīng)的實(shí)驗(yàn)專(zhuān)門(mén)設(shè)立的。
(10)描述集中趨勢(shì)的主要統(tǒng)計(jì)指標(biāo)有:算數(shù)均數(shù)、幾何均數(shù)和中位數(shù)。
四(1)醫(yī)學(xué)統(tǒng)計(jì)工作的四個(gè)基本步驟:①統(tǒng)計(jì)設(shè)計(jì):包括調(diào)查、實(shí)驗(yàn)設(shè)計(jì)。②收集資料:取得準(zhǔn)確可靠的原始資料③整理資料:對(duì)資料進(jìn)行清理、改錯(cuò),數(shù)量化④分析資料:統(tǒng)計(jì)描述、統(tǒng)計(jì)推斷(2)科研選題的四個(gè)原則:
①創(chuàng)新性:包括探索和創(chuàng)新兩個(gè)連續(xù)的過(guò)程,創(chuàng)新就是選擇前人沒(méi)有解決或沒(méi)有完全解決的問(wèn)題。是本學(xué)科的空白點(diǎn),或者將會(huì)在理論上或應(yīng)用上有新的發(fā)展和補(bǔ)充。②科學(xué)性:以科學(xué)理論為指導(dǎo),符合客觀規(guī)律。
③先進(jìn)性:先進(jìn)性是相對(duì)的,有國(guó)際先進(jìn)和國(guó)內(nèi)先進(jìn)。更重要的是結(jié)合實(shí)際條件選擇適合的先進(jìn)技術(shù)。
④可行性:研究課題的主要技術(shù)指標(biāo)實(shí)現(xiàn)的可能性。它包括人、財(cái)、物的支持和工作基礎(chǔ)。(3)等概率抽樣:簡(jiǎn)單隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣、整群抽樣。(4)文獻(xiàn)檢索的幾種查法:①先查國(guó)內(nèi)文獻(xiàn),再查國(guó)外文獻(xiàn)②先查綜述性文章,后原始文章③先近期后遠(yuǎn)期
④先核心期刊后一般期刊。(5)計(jì)量資料頻數(shù)表的編制步驟
①求極差②決定組數(shù)和組距③列出組段④劃記計(jì)數(shù)(6)頻數(shù)分布表的用途
①揭示計(jì)量資料分布的特征②描述計(jì)量資料分布的集中趨勢(shì)和離散趨勢(shì)③便于發(fā)現(xiàn)可疑值。④簡(jiǎn)化統(tǒng)計(jì)指標(biāo)的計(jì)算
(7)四種基本抽樣方法:?jiǎn)渭冸S機(jī)抽樣、系統(tǒng)抽樣、分層抽樣和整群抽樣。
五(1)文獻(xiàn)檢索的五個(gè)要點(diǎn):①有助于認(rèn)識(shí)本課題的重要性②了解有關(guān)的既往研究工作情況③了解有關(guān)研究現(xiàn)狀④尋找可借鑒的研究方法⑤注意有關(guān)的不同見(jiàn)解與爭(zhēng)論。
(2)五個(gè)概率分布:連續(xù)型概率分布:正態(tài)分布、t分布、F分布
離散型概率分布:二項(xiàng)分布、Poisson分布
(3)離散趨勢(shì)的描述:①全距②分位數(shù)區(qū)間③方差④標(biāo)準(zhǔn)差⑤變異系數(shù)(4)樣本均數(shù)的分布有以下五個(gè)特點(diǎn):①各樣本均數(shù)未必等于總體均數(shù)②各樣本均數(shù)間存在差異
③樣本均數(shù)的分布很有規(guī)律,圍繞總體均數(shù),呈現(xiàn)中間多,兩邊少,左右基本對(duì)稱(chēng),近似服從正態(tài)分布
④樣本均數(shù)的變異范圍較原變量的變異范圍縮小
⑤隨著樣本量的增大,樣本均數(shù)的變異范圍逐漸縮小
(5)常用的相對(duì)數(shù)指標(biāo):比、比例、率、相對(duì)危險(xiǎn)度(RR)和優(yōu)勢(shì)比(OR)
六(1)選題六個(gè)方法:①?gòu)恼袠?biāo)范圍中選題。②從碰到的問(wèn)題中選題③從文獻(xiàn)的空白點(diǎn)選題④從已有的課題延伸中選題⑤從改變研究?jī)?nèi)容組合中選題
⑥從其他學(xué)科移植中選題。(2)Wilcoxon符號(hào)秩檢驗(yàn)的步驟:①建立假設(shè),確定檢驗(yàn)水平②求差值③編秩④求秩和⑤確定統(tǒng)計(jì)量T
⑥確定P值,做出推斷結(jié)論。(3)醫(yī)學(xué)研究的基本步驟:
①建立科學(xué)假說(shuō),提出擬探索和解決的醫(yī)學(xué)問(wèn)題以及明確而具體的目標(biāo)②查閱文獻(xiàn),并對(duì)文獻(xiàn)進(jìn)行綜述、評(píng)價(jià)
③擬定研究設(shè)計(jì)方案和技術(shù)路線,必要的信息及條件保障④實(shí)施研究計(jì)劃
⑤收集、整理、分析研究所得信息和資料
⑥對(duì)研究結(jié)果進(jìn)行解釋?zhuān)瑢?duì)提出的假說(shuō)進(jìn)行評(píng)價(jià),并據(jù)此向更高更深的層次探索
七(1)統(tǒng)計(jì)表的七個(gè)基本結(jié)構(gòu)及要求
①標(biāo)題:統(tǒng)計(jì)表的標(biāo)題要確切、簡(jiǎn)練,能夠高度概括表的主要內(nèi)容,應(yīng)包括研究的時(shí)間、地點(diǎn)和研究?jī)?nèi)容,放在表的上方中央位置。如果一篇文章當(dāng)中有多個(gè)表,應(yīng)在左側(cè)加上表號(hào)。如果整個(gè)表的指標(biāo)統(tǒng)一,可將研究指標(biāo)的單位標(biāo)在標(biāo)題后面。
②標(biāo)目:標(biāo)目可分為橫標(biāo)目和縱標(biāo)目,用以說(shuō)明每行和每列數(shù)字的意義。標(biāo)目文字要精練、準(zhǔn)確。橫標(biāo)目是描述的對(duì)象,在表的左側(cè);縱標(biāo)目是描述的內(nèi)容,在表的右側(cè)。橫標(biāo)目和縱標(biāo)目的位置不能顛倒,從左到右應(yīng)構(gòu)成一句完整的話。③頂線④底線⑤縱標(biāo)目下橫線
統(tǒng)計(jì)表中的這三條基本線條,要從表的最左端畫(huà)至表的最右端。根據(jù)需要可由其他短的橫線,如合計(jì)上方的橫線、縱標(biāo)目的總標(biāo)目和縱標(biāo)目之間的橫線。統(tǒng)計(jì)表中不允許出現(xiàn)斜線和豎線。
⑥數(shù)字:統(tǒng)計(jì)表中的數(shù)字一律用阿拉伯?dāng)?shù)字表示,小數(shù)點(diǎn)位置對(duì)齊。如無(wú)數(shù)字用“-”表示,缺失數(shù)字用“”表示,數(shù)值為0的要填寫(xiě)“0”,不能空白。
⑦注釋?zhuān)航y(tǒng)計(jì)表中數(shù)字區(qū)域不能插入文字,也不列備注項(xiàng)。必須說(shuō)明的內(nèi)容用可以在表的下方說(shuō)明。
(2)常用的七種統(tǒng)計(jì)圖:條圖、百分條圖、圓圖、線圖、半對(duì)數(shù)線圖、箱圖、散點(diǎn)圖。
八計(jì)量資料的八個(gè)統(tǒng)計(jì)描述:①算術(shù)均數(shù),簡(jiǎn)稱(chēng)均數(shù)②幾何均數(shù)③中位數(shù)
④極差(全距)
⑤四分位數(shù)間距⑥方差⑦標(biāo)準(zhǔn)差⑧變異系數(shù)
九(1)假設(shè)檢驗(yàn)九點(diǎn)主要內(nèi)容①假設(shè)檢驗(yàn)的概念②假設(shè)檢驗(yàn)的基本步驟
③t檢驗(yàn)(單樣本、配對(duì)樣本、兩獨(dú)立樣本均數(shù)的t檢驗(yàn),正態(tài)性檢驗(yàn)、方差齊性檢驗(yàn)、t’檢驗(yàn))
④假設(shè)檢驗(yàn)的兩類(lèi)錯(cuò)誤⑤雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)
⑥假設(shè)檢驗(yàn)的統(tǒng)計(jì)意義與實(shí)際意義⑦檢驗(yàn)效能⑧多次重復(fù)檢驗(yàn)問(wèn)題
⑨假設(shè)檢驗(yàn)的因果關(guān)系推論與實(shí)驗(yàn)設(shè)計(jì)
(2)統(tǒng)計(jì)圖表種類(lèi):統(tǒng)計(jì)表、統(tǒng)計(jì)圖、條圖、百分條圖、圓圖、線圖、半對(duì)數(shù)線圖、箱圖、散點(diǎn)圖
十(1)關(guān)于臨床科研方法設(shè)計(jì)的10點(diǎn):①抉擇合理的設(shè)計(jì)方案
②研究對(duì)象的正確診斷③標(biāo)本的來(lái)源與樣本含量的估算
④試驗(yàn)措施要有創(chuàng)新性,有效性以及安全性⑤要設(shè)立對(duì)照組
⑥確定試驗(yàn)觀察的期間要合適
⑦注意盲法方法的合理應(yīng)用,避免測(cè)量性偏倚,干擾研究測(cè)試的真實(shí)性⑧防止混雜因素對(duì)研究的影響⑨限制機(jī)遇因素對(duì)研究結(jié)果的影響⑩要正確地應(yīng)用統(tǒng)計(jì)學(xué)分析方法(2)科研選題10種方法:①?gòu)呐R床實(shí)踐中尋找課題②學(xué)術(shù)交流與爭(zhēng)鳴中選題③從文獻(xiàn)中記載的難題中選題④從學(xué)科交叉的邊緣區(qū)選題⑤從醫(yī)學(xué)的空白區(qū)選題⑥從國(guó)家研究項(xiàng)目指南中選題
⑦從研究中出現(xiàn)的特殊現(xiàn)象或反,F(xiàn)象中選題⑧運(yùn)用借鑒、移植的方法選題⑨改變選題的組合因素,編制新的課題⑩從已有課題的延伸中選題
擴(kuò)展閱讀:外語(yǔ)研究中的統(tǒng)計(jì)方法總結(jié)
T-檢驗(yàn)方差分析MSb兩組平均數(shù)的差異檢驗(yàn):(1)比較多組平均數(shù);組間差異與組內(nèi)差異比值F定兩個(gè)樣本(2)單一樣本與總MSw義體1、抽取樣本的總體呈正態(tài)分布2、數(shù)據(jù)隨機(jī)從一個(gè)總體中通過(guò)樣本抽取3、因變量必須前是連續(xù)性數(shù)據(jù),即定距變量或提定必變量4、自變量必須是分類(lèi)的、離散性數(shù)據(jù),水平必須是2定義:檢驗(yàn)?zāi)硞(gè)變量的總體均值和某指定值之間是否存在顯著差異樣本均數(shù)與已知總體均數(shù)之間的比較)1、樣本所來(lái)自的總體呈方差齊性2、因變量數(shù)據(jù)在總體中呈正態(tài)分布3、數(shù)據(jù)由隨即抽樣獲得;4、因變量的數(shù)據(jù)必須是區(qū)間級(jí)變量或分類(lèi)不多的比率級(jí)變量5、自變量必須是名稱(chēng)級(jí)或順序變量F檢驗(yàn):方差分析以F檢驗(yàn)來(lái)推斷幾個(gè)平均數(shù)差異的顯著性。如果組間與組內(nèi)方差相等,即F比值等于或接近1,表明各組平均數(shù)無(wú)顯著差異;如果F值很大,大到超過(guò)F抽樣分布上某種顯著性水平的臨界值,則拒絕零假設(shè),接受有顯著性差異的備擇假設(shè)單一樣形本式t-前提:樣本總體服從正態(tài)檢分布驗(yàn)F分布:形態(tài)隨F比值分子和分母中的自由度的變化而形成的一簇正態(tài)分布組間方差MSb=SSb(組間平方和)dfb(組間自由度)組間自由度:dfb=K-1(組數(shù)減1)組內(nèi)方差MSWSSw(組內(nèi)平方和)dfw(組內(nèi)自由度)組內(nèi)自由度dfw=K(n-1)=N-K實(shí)現(xiàn)過(guò)程:analysis-comparemeans-one-samplet-test幾個(gè)概念:實(shí)驗(yàn)或調(diào)查中的自變量稱(chēng)為因素,只有一個(gè)自變量的方差分析稱(chēng)為單因素方差分析,用one-wayANOVA命令計(jì)算;有兩個(gè)以上因素的稱(chēng)為多因素方差分析,用Univariate命令計(jì)算某一個(gè)因素的不同情況稱(chēng)為因素的“水平”各因素水平之間的每個(gè)組合叫做一個(gè)“單元”(cell)定義:兩個(gè)樣本之間彼此沒(méi)有任何關(guān)聯(lián),兩個(gè)獨(dú)立樣本各自接受相同的測(cè)量單因素方前提:(1)兩個(gè)樣本互相差獨(dú)立>.05方差齊性;分≤.05方差不齊性(2)樣析本來(lái)自的兩個(gè)總體應(yīng)該呈正態(tài)分布單一因素各水平影響的一個(gè)(或幾個(gè)相互獨(dú)立的)因變量各組平均數(shù)之間的差異;對(duì)該因素的若干水平分組中哪一組與其他各組均值間具有顯著性差異盡心分析,即進(jìn)行均值多重比較實(shí)現(xiàn)過(guò)程:analysis-comparemeans-one-wayANOVA方差不齊性:Tamhane’sT2方差齊性:LSD兩獨(dú)立樣本t-檢實(shí)現(xiàn)形式:驗(yàn)analysis-comparemeans-independent-samplet-test定義:根據(jù)樣本數(shù)據(jù)對(duì)樣本來(lái)自的兩配對(duì)總體的均值。同一研究對(duì)象(或兩配對(duì)對(duì)象)分別給予兩種不同處理的效果比較,以及同一研究對(duì)象(或兩配對(duì)對(duì)象)處理前后的效果比較前提:兩個(gè)樣本應(yīng)該是配對(duì)的;觀察數(shù)目相同;順序不能隨意改變實(shí)現(xiàn)形式:analysis-comparemeans-paired-samplet-testCohen’sd=21效應(yīng)幅度:etasquaredbetweengroupssumsofsquares(組間)totalsumofsquares(總體)對(duì)一個(gè)獨(dú)立變量是否受一個(gè)或多個(gè)因素或變量影響;可以分析每一個(gè)因素的作用,也可以分析因素之間的交互作用,以及分析協(xié)方差、各因素變量與協(xié)變量之間的交互作用多因素單因變量方差分析兩配對(duì)樣本t-檢驗(yàn)公22式:mean1mean2(sdsd)/2效應(yīng)效應(yīng)幅度指數(shù)值:幅0-0.2aweekeffect效果弱度0.21-0.5amodesteffect效果弱強(qiáng)(尚可)0.51-1.00amoderateeffect效果中強(qiáng)>1.00astrongeffect效果強(qiáng)單因素:0-0.1aweekeffect0.1-0.3amodesteffect0.3-0.5amoderateeffect>0.5astrongeffect多因素:在P值小于.05時(shí)觀察Etasquared=SSmod/SStotal0-0.1效應(yīng)幅度弱0.1-0.3效應(yīng)幅度弱強(qiáng)0.3-0.5效應(yīng)幅度中強(qiáng)>0.5效應(yīng)幅度強(qiáng)相關(guān)分析
相關(guān)的概念:兩個(gè)變量之間不精確、不穩(wěn)定的變化關(guān)系稱(chēng)為相關(guān)關(guān)系。兩個(gè)變量值不是一一對(duì)應(yīng)得那樣精確、穩(wěn)定。
變化關(guān)系:變化方向上:正相關(guān)(變化方向一致)、負(fù)相關(guān)(變化方向相反)、零相關(guān)(變化
方向無(wú)一定規(guī)律)
密切程度:強(qiáng)相關(guān)或弱相關(guān)、中度相關(guān)、弱相關(guān)或低度相關(guān)相關(guān)系數(shù)(Correlationcoefficient):用r表示。數(shù)值范圍在-1到+1之間,即0≤r≤1重要知識(shí):相關(guān)系數(shù)的值,僅僅是一個(gè)比值,不能做數(shù)學(xué)運(yùn)算。也不能揭示兩者之間的內(nèi)在
本質(zhì),不一定存在因果關(guān)系。
相關(guān)系數(shù)所顯示的相關(guān)強(qiáng)度:r:<0.3低度/弱相關(guān)
r:>0.3且<0.8中度相關(guān)r:>0.8高度/強(qiáng)相關(guān)
相關(guān)系數(shù)的顯著性檢驗(yàn):要看r在抽樣分布上出現(xiàn)的概率如何形式:1皮爾遜相關(guān)分析
使用條件:1)兩個(gè)變量都是由測(cè)量獲得的連續(xù)性數(shù)據(jù)2)呈正態(tài)分布3)成對(duì)數(shù)據(jù),每對(duì)數(shù)據(jù)之間相互獨(dú)立4)呈線性關(guān)系(散點(diǎn)圖)實(shí)現(xiàn)形式:analyze-correlate-bivariate
注意:p指<.05才求效應(yīng)幅度(相關(guān)系數(shù)的平方)2等級(jí)相關(guān)分析定義:當(dāng)兩個(gè)變量之間以等級(jí)次序排列或以等級(jí)次序表示時(shí),兩個(gè)相應(yīng)總體并不一定呈正態(tài)
分布,樣本容量也不一定大于30,表示這兩變量之間的相關(guān),稱(chēng)為等級(jí)相關(guān)。優(yōu)點(diǎn):不要求呈正態(tài)分布,也不要求大于30,所以應(yīng)用范圍廣
缺點(diǎn):若兩個(gè)變量的原始資料都是較精確的度量資料,則不必化成較粗略大大等級(jí)資料,否
則會(huì)失掉很多信息。
前提:不能有較多的個(gè)案屬于同一等級(jí),這樣會(huì)嚴(yán)重影響協(xié)變關(guān)系的產(chǎn)生,因此,用于等級(jí)相關(guān)的順序級(jí)變量應(yīng)有較多數(shù)量的等級(jí)分類(lèi),且每一類(lèi)中的個(gè)案較少。3偏相關(guān)分析
定義:剔除其他相關(guān)因素影響的條件下計(jì)算相關(guān)系數(shù)條件:當(dāng)兩個(gè)變量同時(shí)與第三個(gè)變量有線性關(guān)系,求某兩個(gè)變量之間的相關(guān)系數(shù)才能用偏相
關(guān)分析
實(shí)現(xiàn)形式:analyze-correlation-partial4距離相關(guān)分析
定義:距離相關(guān)分析是對(duì)觀測(cè)量之間或變量之間相似或不相似的程度的一種測(cè)量
使用范圍:可用于同一變量?jī)?nèi)部各個(gè)取值之間,以考察其相互接近程度;也可用于變量間,
以考察預(yù)測(cè)值對(duì)實(shí)際值的擬合優(yōu)度。
分類(lèi):1)根據(jù)統(tǒng)計(jì)量的不同,可分為a不相似性測(cè)量,通過(guò)計(jì)算樣本或變量之間的距離表
示b相似性測(cè)量,通過(guò)計(jì)算Person相關(guān)系數(shù)或Cosine相關(guān)來(lái)表示
2)根據(jù)分析對(duì)象的不同,可分為a個(gè)案間分析(只測(cè)不相似性)b變量間分析
實(shí)現(xiàn)形式:變量之間相似性測(cè)量分析:analyze-correlation-distance-betweenvariables-similarities
變量之間不相似性測(cè)量分析:analyze-correlation-distance-betweenvariables-dissimilarities
個(gè)案之間不相似性測(cè)量分析:analyze-correlation-distance-betweencases-dissimilarities
注意:相似性數(shù)值越大,相似性越好;不相似性數(shù)值越大,不相似性越好5信度分析量表的可靠新1)同質(zhì)信度分析
內(nèi)部一致性,指的是測(cè)量?jī)?nèi)部所有項(xiàng)目的一致性Analyze-scale-reliabilityanalysis-alpha
Cronbacha信度系數(shù):連續(xù)變量系數(shù)在0.8以上較好,離散變量的系數(shù)在0.6以上較好
2)分半信度分析
在測(cè)試以后對(duì)測(cè)試項(xiàng)目按奇項(xiàng)、偶項(xiàng)或其他標(biāo)準(zhǔn)分成兩半,分別記分,有兩半分?jǐn)?shù)之間的相關(guān)系數(shù)得到信度系數(shù)。3)再測(cè)信度分析
再測(cè)信度系數(shù)為兩次測(cè)量結(jié)果之間的信度系數(shù),反映兩次測(cè)試分?jǐn)?shù)的穩(wěn)定程度。
滿(mǎn)足假設(shè):a所測(cè)量的特指必須是穩(wěn)定的;b遺忘和練習(xí)的效果相同c兩測(cè)試期間被試對(duì)問(wèn)題的熟悉程度情況沒(méi)有差別
卡方檢驗(yàn)1概念:交叉列聯(lián)表分析(crosstabulation),用于非連續(xù)變量的分析
零假設(shè):行列變量之間獨(dú)立(即不存在相關(guān)性)2前提
1)兩個(gè)變量必須是離散變量,即名稱(chēng)和順序級(jí)變量,順序級(jí)變量的分類(lèi)控制在5個(gè)以?xún)?nèi)2)每個(gè)單元的期待值不能少于1.通過(guò)觀察expectedvalue得知3)期待值少于5的單元不能超過(guò)20%,否則不能用卡方檢驗(yàn)
4)如果觀測(cè)值有數(shù)值小于5的單元,采用卡方檢驗(yàn)結(jié)果表中的Fisher’sexacttest數(shù)
值。
實(shí)現(xiàn)形式:analyze-descriptivestatistics-crosstabs效應(yīng)幅度強(qiáng)弱值:0.000。10弱
0.110.30有限,尚可0.310.5中0.510.8強(qiáng)0.8以上極強(qiáng)
2×2phi超過(guò)2×2Cramer’s回歸分析
1概念:用數(shù)學(xué)方程式來(lái)表達(dá)兩變量之間的非確定性因果關(guān)系,可利用該方程式,有自變量
的值來(lái)估計(jì)、預(yù)測(cè)因變量的估計(jì)值,這種分析就成為回歸分析。
回歸分析是處理兩個(gè)及兩個(gè)以上變量間線性依存關(guān)系或依存變化的數(shù)學(xué)關(guān)系的統(tǒng)計(jì)方法。形式:
1)一元線性回歸
一元線性回歸是指只有一個(gè)自變量的線性回歸;貧w線:如果散點(diǎn)圖有明確的直線趨勢(shì),我們就可以配置一條最能代表散點(diǎn)圖上分布趨勢(shì)的
直線,這條最優(yōu)擬合線即稱(chēng)為回歸線。
一元線性回歸方程:Y=a+bxY為因變量,X為自變量,a為截距,是個(gè)常數(shù)項(xiàng),b為回歸
系數(shù)
一元回歸方程的檢驗(yàn):1、對(duì)回歸方程進(jìn)行方差分析,檢驗(yàn)統(tǒng)計(jì)量值為F。當(dāng)F足夠大時(shí),
拒絕接受b=0的假設(shè)2、對(duì)回歸系數(shù)進(jìn)行顯著性檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量的值為t,P小于.053、R2判定系數(shù)。越大,擬合優(yōu)度越好
實(shí)現(xiàn)形式:analyze-regression-linear
2)多元線性回歸
研究在線性關(guān)系下,兩個(gè)或兩個(gè)以上自變量對(duì)一個(gè)因變量的數(shù)量變化關(guān)系,稱(chēng)為多元線性回歸分析。
Y=a+b1x1+b2x2++bnxn
應(yīng)用范圍:1篩選有關(guān)變量(主要用途)2獲得有實(shí)際意義的回歸方程一般步驟:1單因子模型分析2逐步篩選變量,建立多因素模型3綜合單因子和多因素模
型,當(dāng)兩者矛盾時(shí),結(jié)合專(zhuān)業(yè)知識(shí)分析原因
檢驗(yàn):方差分析;偏回歸系數(shù)與常數(shù)項(xiàng)檢驗(yàn),使用統(tǒng)計(jì)量t哪個(gè)自變量意義最大要看standardizedcoefficients擬合優(yōu)度:0.5以上最好,不低于0.3adjustedsquare
因子分析
1定義:因子分析是將多個(gè)實(shí)測(cè)變量轉(zhuǎn)換為少數(shù)幾個(gè)不相關(guān)的綜合指標(biāo)的多元統(tǒng)計(jì)分析方
法,即用少數(shù)幾個(gè)因子來(lái)描述許多指標(biāo)或因素之間的聯(lián)系,以較少幾個(gè)因子反映原資料的大部分信息。
2因子的概念
代表各類(lèi)信息的綜合指標(biāo)稱(chēng)為因子。3特點(diǎn):因子數(shù)量少于原有的變量;根據(jù)原有的信息進(jìn)行重新組構(gòu);不存在線性相關(guān)關(guān)
系;具有命名解釋性4幾個(gè)概念
因子載荷:原有變量和因子變量的相關(guān)系數(shù)。因子載荷的絕對(duì)值越大,則公共因子和原有變
量的關(guān)系越強(qiáng)。
變量共同度(公共方差):衡量因子分析效果的一個(gè)指標(biāo)。反映全部公共因子的原有變量的
總方差解釋說(shuō)明比例,越接近1,說(shuō)明解釋信息越強(qiáng)。
公共因子的方差貢獻(xiàn):反映該因子對(duì)所有原始變量總方差的解釋能力。其值越高說(shuō)明因子重
要程度越高。核心問(wèn)題:如何構(gòu)造因子數(shù)量;如何對(duì)因子變量進(jìn)行命名解釋。四個(gè)基本步驟:
1)確定帶分析的原有若干變量是否適合于因子分析2)構(gòu)造因子變量
3)因子變量的命名解釋
4)計(jì)算因子得分就是確定原樣本數(shù)據(jù)在不同因子上的具體數(shù)值。Analyze-datareduction-factor統(tǒng)計(jì)方法T-test定義兩組平均數(shù)形式單一樣本、兩獨(dú)立樣本、兩配對(duì)樣本實(shí)現(xiàn)過(guò)程Analyze-comparemeans-onesample/independentsample/pairedsample前提正態(tài)分布、數(shù)據(jù)隨即抽取、因變量是連續(xù)數(shù)據(jù)、自變量是離散數(shù)據(jù),水平是2效應(yīng)幅度d=mean1mean22(sd12sd2)/20-0.2aweekeffect效果弱0.21-0.5amodesteffect效果弱強(qiáng)(尚可)0.51-1.00amoderateeffect效果中強(qiáng)>1.00astrongeffect效果強(qiáng)Etasquared=SSmod/SStotal0-0.1效應(yīng)幅度弱0.1-0.3效應(yīng)幅度弱強(qiáng)0.3-0.5效應(yīng)幅度中強(qiáng)>0.5效應(yīng)幅度強(qiáng)P值<.05才求效應(yīng)幅度(相關(guān)系數(shù)的平方)方差分析多組平F-test均數(shù)單因素、多因素單一變量Analyze-comparemeans-one-wayANOVA/analyze-generallinearmodel-univariateAnalyze-correlation-bivariateAnalyze-correlation-partialAnalyze-correlation-distanceAnalyze-scale-reliabilityanalyze方差齊性、正態(tài)分布、數(shù)據(jù)隨機(jī)抽樣、因變量是區(qū)間級(jí)或分類(lèi)不多的變量、自變量是名稱(chēng)或順序變量連續(xù)性數(shù)據(jù)、正態(tài)分布、成對(duì)數(shù)據(jù)、線性關(guān)系Pearson相關(guān)分析等級(jí)相關(guān)偏相關(guān)距離相關(guān)相似性與不相似性量表的校度考核離散變量的相關(guān)分析個(gè)案間、變量間同質(zhì)信度、分半信度、再測(cè)信度不一定呈正態(tài)分布、不一定大于30兩變量同時(shí)與第三個(gè)變量有線性關(guān)系信度分析卡方檢驗(yàn)Analyze-descriptivestatistics-crosstabs離散變量、期待數(shù)值不少于1、期待數(shù)值少于5的不能超過(guò)20%、小于5的用Fisher’sexacttest0.000.10弱0.110.30有限,尚可0.310.5中0.510.8強(qiáng)0.8以上極強(qiáng)2×2phi超過(guò)2×2Cramer’s回歸分析因子分析線性依存關(guān)系多變量少變一元、多元Analyze-regression-linearAnalyze-datareduction-factor量
友情提示:本文中關(guān)于《統(tǒng)計(jì)、科研的一些總結(jié)》給出的范例僅供您參考拓展思維使用,統(tǒng)計(jì)、科研的一些總結(jié):該篇文章建議您自主創(chuàng)作。
來(lái)源:網(wǎng)絡(luò)整理 免責(zé)聲明:本文僅限學(xué)習(xí)分享,如產(chǎn)生版權(quán)問(wèn)題,請(qǐng)聯(lián)系我們及時(shí)刪除。