-
- 素材大。
- 842.00
- 素材授權(quán):
- 免費(fèi)下載
- 素材格式:
- .ppt
- 素材上傳:
- ppt
- 上傳時(shí)間:
- 2018-05-14
- 素材編號(hào):
- 118700
- 素材類別:
- 學(xué)校PPT
-
素材預(yù)覽
這是一個(gè)關(guān)于統(tǒng)計(jì)學(xué)基本概念和方法ppt模板,主要介紹統(tǒng)計(jì)可應(yīng)用于各個(gè)不同學(xué)科,在有些學(xué)科已經(jīng)有其特有的方法和特點(diǎn);如生物統(tǒng)計(jì)(biostatistics)、經(jīng)濟(jì)計(jì)量學(xué)以及目前很熱門的生物信息和數(shù)據(jù)挖掘(Data Mining)的方法主體都是統(tǒng)計(jì)。應(yīng)用統(tǒng)計(jì)學(xué) 參考書目:1、《統(tǒng)計(jì)學(xué):基本概念與方法》吳喜之譯著,高等教育出版社2、《統(tǒng)計(jì)建模與R軟件》,薛毅編著,清華大學(xué)出版社3、《復(fù)雜數(shù)據(jù)統(tǒng)計(jì)方法——基于R的應(yīng)用》吳喜之編著,中國(guó)人民大學(xué)出版社關(guān)于課程… 統(tǒng)計(jì)的基本思想學(xué)會(huì)用統(tǒng)計(jì)處理問(wèn)題統(tǒng)計(jì)軟件的使用(Matlab, R,…..) 第一章 一些基本概念什么是統(tǒng)計(jì)學(xué)? 1. 數(shù)據(jù)搜集:取得數(shù)據(jù) 2. 數(shù)據(jù)分析:分析數(shù)據(jù) 3. 數(shù)據(jù)表述:圖表展示數(shù)據(jù) 4. 數(shù)據(jù)解釋:結(jié)果的說(shuō)明統(tǒng)計(jì)學(xué)的作用我國(guó)著名的經(jīng)濟(jì)學(xué)家馬寅初指出“學(xué)者不能離開統(tǒng)計(jì)而治學(xué),政治家不能離開統(tǒng)計(jì)學(xué)而施政,事業(yè)家不能離開統(tǒng)計(jì)而執(zhí)業(yè)”。美國(guó)著名的科幻作家威爾斯說(shuō)“對(duì)于追求效率的公民而言,統(tǒng)計(jì)思維總有一天會(huì)和讀寫能力一樣重要”。在諾貝爾經(jīng)濟(jì)學(xué)獲獎(jiǎng)?wù)咧校?/3以上的研究成果與統(tǒng)計(jì)和定量分析有關(guān)。美國(guó)總統(tǒng)的年薪已經(jīng)達(dá)到40萬(wàn)美元,在各國(guó)元首中名列前茅,但根據(jù)美國(guó)《工作等級(jí)年鑒》一書的排名,總統(tǒng)一職并未進(jìn)入最好的職業(yè)之列,歡迎點(diǎn)擊下載統(tǒng)計(jì)學(xué)基本概念和方法ppt模板哦。
統(tǒng)計(jì)學(xué)基本概念和方法ppt模板是由紅軟PPT免費(fèi)下載網(wǎng)推薦的一款學(xué)校PPT類型的PowerPoint.
應(yīng)用統(tǒng)計(jì)學(xué) 參考書目: 1、《統(tǒng)計(jì)學(xué):基本概念與方法》吳喜之譯著,高等教育出版社 2、《統(tǒng)計(jì)建模與R軟件》,薛毅編著,清華大學(xué)出版社 3、《復(fù)雜數(shù)據(jù)統(tǒng)計(jì)方法——基于R的應(yīng)用》吳喜之編著,中國(guó)人民大學(xué)出版社關(guān)于課程… 統(tǒng)計(jì)的基本思想學(xué)會(huì)用統(tǒng)計(jì)處理問(wèn)題統(tǒng)計(jì)軟件的使用(Matlab, R,…..) 第一章 一些基本概念什么是統(tǒng)計(jì)學(xué)? 1. 數(shù)據(jù)搜集:取得數(shù)據(jù) 2. 數(shù)據(jù)分析:分析數(shù)據(jù) 3. 數(shù)據(jù)表述:圖表展示數(shù)據(jù) 4. 數(shù)據(jù)解釋:結(jié)果的說(shuō)明統(tǒng)計(jì)學(xué)的作用我國(guó)著名的經(jīng)濟(jì)學(xué)家馬寅初指出“學(xué)者不能離開統(tǒng)計(jì)而治學(xué),政治家不能離開統(tǒng)計(jì)學(xué)而施政,事業(yè)家不能離開統(tǒng)計(jì)而執(zhí)業(yè)”。美國(guó)著名的科幻作家威爾斯說(shuō)“對(duì)于追求效率的公民而言,統(tǒng)計(jì)思維總有一天會(huì)和讀寫能力一樣重要”。在諾貝爾經(jīng)濟(jì)學(xué)獲獎(jiǎng)?wù)咧校?/3以上的研究成果與統(tǒng)計(jì)和定量分析有關(guān)。美國(guó)總統(tǒng)的年薪已經(jīng)達(dá)到40萬(wàn)美元,在各國(guó)元首中名列前茅,但根據(jù)美國(guó)《工作等級(jí)年鑒》一書的排名,總統(tǒng)一職并未進(jìn)入最好的職業(yè)之列。在美國(guó),最好的職業(yè)是統(tǒng)計(jì)學(xué)家。 以歸納為主要思維方式的統(tǒng)計(jì)不是以演繹為主的數(shù)學(xué)統(tǒng)計(jì)可應(yīng)用于各個(gè)不同學(xué)科,在有些學(xué)科已經(jīng)有其特有的方法和特點(diǎn);如生物統(tǒng)計(jì)(biostatistics)、經(jīng)濟(jì)計(jì)量學(xué)(econometrics)以及目前很熱門的生物信息(bioinformation)和數(shù)據(jù)挖掘(Data Mining)的方法主體都是統(tǒng)計(jì) 統(tǒng)計(jì)的一些例子一些例子大家經(jīng)常在報(bào)刊雜志上看到類似的報(bào)道:通用汽車37%的銷售額來(lái)源于北美以外;我國(guó)失業(yè)率下降到25年來(lái)的最低點(diǎn)4%;上證指數(shù)接近2000點(diǎn)。我曾在網(wǎng)上利用“百度”搜索引擎對(duì)互聯(lián)網(wǎng)上有關(guān)網(wǎng)頁(yè)進(jìn)行搜索,得到的結(jié)果是:包含“旅游管理”這一詞匯的網(wǎng)頁(yè)高達(dá)25,500,000項(xiàng),包含“公共事業(yè)管理”這一詞匯的網(wǎng)頁(yè)有100,000,000項(xiàng)。 --以上數(shù)據(jù)實(shí)際上都是通過(guò)數(shù)據(jù)收集,統(tǒng)計(jì)得來(lái)的。 生活中我們也會(huì)不自覺(jué)地用到統(tǒng)計(jì),比如說(shuō),我們可能經(jīng)常去高中同學(xué)所在的學(xué)校去玩,他給你介紹同寢室的張三,要你猜他是哪兒人,只見(jiàn)他足有一米八,身材魁梧,你可能會(huì)問(wèn):你是北方人吧?反之,你可能會(huì)認(rèn)為他是南方人。這實(shí)際是應(yīng)用了統(tǒng)計(jì)中平均值的知識(shí)。 一些例子每當(dāng)季節(jié)交替之時(shí),商場(chǎng)都要對(duì)有關(guān)商品進(jìn)行打折銷售,那么為什么商家要進(jìn)行打折銷售,它怎么才能保證打折后的利潤(rùn)不會(huì)有損失?至少是打折后的利潤(rùn)要好于不打折的利潤(rùn),那么這個(gè)折扣的度是要事先進(jìn)行分析的。 商家在銷售之前通常都會(huì)對(duì)銷售量和打折的度進(jìn)行一個(gè)簡(jiǎn)單的估計(jì), 這里所用到的就是統(tǒng)計(jì)學(xué)中的參數(shù)估計(jì)理論。 有觀點(diǎn)認(rèn)為,紅樓夢(mèng)的后40回不是曹雪芹所著而是高鶚?biāo)鶎懙摹?在1981年,首屆國(guó)際《紅樓夢(mèng)》研討會(huì)在美國(guó)召開,威斯康星大學(xué)的陳炳藻就發(fā)表這樣的一篇論文,《從詞匯上的統(tǒng)計(jì)<紅樓夢(mèng)>作者的問(wèn)題》。他從字、詞出現(xiàn)頻率入手,通過(guò)計(jì)算機(jī)進(jìn)行統(tǒng)計(jì)分析,對(duì)《紅樓夢(mèng)》后40回系高鶚?biāo)鬟@一流行看法提出異議,認(rèn)為120回均系曹雪芹所作。這個(gè)就是利用了統(tǒng)計(jì)學(xué)中的假設(shè)推斷理論進(jìn)行分析的。 統(tǒng)計(jì)實(shí)踐的出現(xiàn) 隨著人類文明的出現(xiàn),就產(chǎn)生了最初的統(tǒng)計(jì)實(shí)踐活動(dòng)。統(tǒng)計(jì)實(shí)踐活動(dòng)隨著國(guó)家的產(chǎn)生而不斷加強(qiáng)和完善。早在四千多年前的中國(guó)夏禹王朝,為了治國(guó)治水的需要,曾進(jìn)行初步的國(guó)情統(tǒng)計(jì),查明當(dāng)時(shí)中國(guó)有人口約1355萬(wàn)人,土地約2431萬(wàn)頃,并將全國(guó)分為九州。公元前3000多年,古埃及為了建造金字塔征集經(jīng)費(fèi)、勞力,對(duì)全國(guó)的財(cái)產(chǎn)、人口進(jìn)行了數(shù)次普查。 我國(guó)在春秋戰(zhàn)國(guó)時(shí)期,管仲就明確指出“不明于計(jì)數(shù),猶如無(wú)舟楫欲徑于水,險(xiǎn)也”;商鞅提出了“強(qiáng)國(guó)知十三數(shù)”,系統(tǒng)地列出了治理國(guó)家必須了解的十三項(xiàng)指標(biāo),包括人口、土地、糧食等。我國(guó)的《周易正義》中寫到原始社會(huì):“事大,大結(jié)其繩;事小,小結(jié)其繩;結(jié)之多少,隨物眾寡”,這就是人們對(duì)社會(huì)現(xiàn)象進(jìn)行的簡(jiǎn)單的記錄和計(jì)量活動(dòng),于是產(chǎn)生了最早的統(tǒng)計(jì)萌芽。 古典統(tǒng)計(jì)學(xué)時(shí)期(17世紀(jì)中葉至18世紀(jì)末) 1. 創(chuàng)始人:海門爾·康令Herman Conring (1606-1681,德國(guó)) 繼承者:格特弗里德·阿亨瓦爾Gottfried Achenwall (1719-1772,德國(guó)) 2. 他們?cè)诘聡?guó)的大學(xué)開設(shè)了一門新課程 “國(guó)勢(shì)學(xué)”,主要講述有關(guān)國(guó)情國(guó)力的系統(tǒng)知識(shí),包括土地、人口、政治、軍事、財(cái)政、貨幣、科學(xué)、藝術(shù)和宗教等。阿亨華爾首先將 “國(guó)勢(shì)學(xué)”正式命名為 “統(tǒng)計(jì)學(xué)”。 3.但是由于他沒(méi)有將數(shù)量分析引入進(jìn)來(lái),因此“ 國(guó)勢(shì)學(xué)派”有 “統(tǒng)計(jì)學(xué)”之名而無(wú)“統(tǒng)計(jì)學(xué)”之實(shí)。 近代統(tǒng)計(jì)學(xué)時(shí)期(19世紀(jì)初至20世紀(jì)初) 數(shù)理統(tǒng)計(jì)學(xué)派的代表人物比利時(shí)的凱特勒博士深受拉普拉斯影響,在其《社會(huì)物理學(xué)》中將概率論引入統(tǒng)計(jì)學(xué),在生物統(tǒng)計(jì)和天文學(xué)研究中成功地運(yùn)用了二項(xiàng)分布和正態(tài)分布方法。凱特勒博士認(rèn)為要促進(jìn)科學(xué)的發(fā)展,就必須更多的應(yīng)用統(tǒng)計(jì)學(xué),大力提倡采用統(tǒng)計(jì)方法對(duì)自然現(xiàn)象和社會(huì)現(xiàn)象的規(guī)律性進(jìn)行觀察。社會(huì)統(tǒng)計(jì)學(xué)派的代表人物有克尼斯,梅爾和恩格爾等。社會(huì)統(tǒng)計(jì)學(xué)派繼承和發(fā)展了“政治算術(shù)學(xué)派”的理論體系,完善了統(tǒng)計(jì)有關(guān)描述性的分析方法,建立了較為完整的統(tǒng)計(jì)指標(biāo)方法和社會(huì)統(tǒng)計(jì)學(xué)科體系,對(duì)當(dāng)時(shí)的政府統(tǒng)計(jì)工作和統(tǒng)計(jì)學(xué)理論的推廣產(chǎn)生了積極的促進(jìn)作用 ★ 討論題 恩格爾指數(shù)及其應(yīng)用? 恩格爾系數(shù)(%)= 食品支出總額 /家庭或個(gè)人消費(fèi)支出總額×100% 國(guó)際上常常用恩格爾系數(shù)來(lái)衡量一個(gè)國(guó)家和地區(qū)人民生活水平的狀況。根據(jù)聯(lián)合國(guó)糧農(nóng)組織提出的標(biāo)準(zhǔn),恩格爾系數(shù)在59%以上為貧困,50-59%為溫飽,40-50%為小康,30-40%為富裕,低于30%為最富裕。 現(xiàn)代統(tǒng)計(jì)學(xué)的發(fā)展時(shí)期(20世紀(jì)初到現(xiàn)在) 20世紀(jì)初,大工業(yè)的發(fā)展對(duì)產(chǎn)品質(zhì)量檢驗(yàn)問(wèn)題提出了新的要求,即只抽取少量產(chǎn)品作為樣本對(duì)全部產(chǎn)品的質(zhì)量好壞作出推斷。因?yàn)榇笈慨a(chǎn)品要做全面的檢驗(yàn),既費(fèi)時(shí)、費(fèi)錢,又費(fèi)人力,加之有些產(chǎn)品質(zhì)量的檢驗(yàn)要做破壞性檢驗(yàn),全部檢驗(yàn)已不可能。1908年,英國(guó)的威廉.希利.高賽特提出了小樣本t統(tǒng)計(jì)量,利用它就可以從大量的產(chǎn)品中只抽取較小的樣本完成對(duì)全部產(chǎn)品質(zhì)量的檢驗(yàn)和推斷,這樣就使統(tǒng)計(jì)學(xué)進(jìn)入了現(xiàn)代統(tǒng)計(jì)學(xué)的新階段(主要是推斷性統(tǒng)計(jì)學(xué))。之后由費(fèi)歇爾、卡爾·皮爾遜、奈曼、瓦爾德等為代表的一代統(tǒng)計(jì)學(xué)大師,共同完成了現(xiàn)代統(tǒng)計(jì)學(xué)的理論框架,使統(tǒng)計(jì)學(xué)成為一門嚴(yán)謹(jǐn)?shù)膶W(xué)科,同時(shí)數(shù)理統(tǒng)計(jì)學(xué)逐漸成為了主流統(tǒng)計(jì)學(xué)。1950年以后,受計(jì)算機(jī)和新興科學(xué)的影響,這一時(shí)期統(tǒng)計(jì)學(xué)的研究和應(yīng)用范圍越來(lái)越廣。 大數(shù)據(jù)時(shí)代淘寶中的統(tǒng)計(jì) 男人和女人理財(cái)消費(fèi)有什么不同?浙江和北京民眾理財(cái)習(xí)慣有何不同?天秤座和處女座誰(shuí)更愛(ài)理財(cái)…… 數(shù)據(jù)顯示,男性用戶對(duì)于在淘寶上買理財(cái)產(chǎn)品,總體上比女性更積極。在淘寶理財(cái)?shù)目傆脩糁,男性用戶占?6.3%,多于女性。在現(xiàn)有的理財(cái)用戶中,浙江人熱情最高,占據(jù)所有用戶的18%,遙遙領(lǐng)先全國(guó)。而北京用戶出手則最大氣,人均購(gòu)買理財(cái)產(chǎn)品9920元,幾乎是全部用戶人均3417元的3倍。天秤座無(wú)疑是理財(cái)意識(shí)最高的星座,該星座用戶占總用戶的21%,而金牛座則是理財(cái)意識(shí)最淡薄的星座,該星座用戶僅占總用戶的6%。不同星座的男女,在購(gòu)買金額上也是表現(xiàn)各異。男性用戶中,摩羯座出手最豪爽,人均購(gòu)買金額達(dá)到6889元,而巨蟹座出手最謹(jǐn)慎,人均購(gòu)買金額僅3001元;在女性用戶中,天蝎座出手最豪爽,人均購(gòu)買金額為7401元,而天秤座出手最謹(jǐn)慎,人均僅2400元。一些例子 某企業(yè)開發(fā)出一種新的化妝品,在正式投產(chǎn)之前,需要根據(jù)市場(chǎng)需求情況制定其價(jià)格和銷售策略。該企業(yè)委托某市場(chǎng)調(diào)查公司在全市200萬(wàn)戶家庭中抽取1000戶家庭試用,然后了解該化妝品的銷售前景。如何科學(xué)地從該市200萬(wàn)家庭中抽出這1000戶家庭進(jìn)行調(diào)查,并由這1000戶家庭反饋的市場(chǎng)信息科學(xué)地推斷出全市200萬(wàn)戶家庭對(duì)該化妝品的購(gòu)買意愿這一數(shù)量規(guī)律,這就需要應(yīng)用統(tǒng)計(jì)學(xué)當(dāng)中的抽樣方式的知識(shí)。 更高級(jí)一點(diǎn)的統(tǒng)計(jì)理論呢,也能在我們的日常生活中反映出來(lái),我們?cè)谧鰷珪r(shí),嘗一下咸淡 這個(gè)過(guò)程上升到統(tǒng)計(jì)理論的范疇,包括抽樣方法(簡(jiǎn)單隨機(jī)抽樣)、分布理論(均勻分布)、推斷理論(以樣本推總體)。你相信統(tǒng)計(jì)結(jié)果嗎?數(shù)據(jù)可以有誤或作假統(tǒng)計(jì)方法(有意或無(wú)意)使用不當(dāng)可以誤導(dǎo)。有低級(jí)誤導(dǎo)和高級(jí)誤導(dǎo)。常識(shí)判斷和直覺(jué)是重要的關(guān)于美國(guó)選舉的兩個(gè)例子(1) 誰(shuí)會(huì)在1936選舉中獲勝 ?Alf London還是 F.D.R.(羅斯福)? Literary Digest (文摘)送出一千萬(wàn)份問(wèn)卷(返回二百四十萬(wàn)份)后,預(yù)測(cè)London 會(huì)贏. 而Gallop(蓋洛普)只問(wèn)了5000人說(shuō) Roosevelt (羅斯福)會(huì)贏. 最后羅斯福和蓋洛普都贏了.文摘倒閉了. 關(guān)于美國(guó)選舉的兩個(gè)例子(2) 誰(shuí)會(huì)在1948選舉中獲勝 ? Thomas Dewey還是Harry Truman(杜魯門)? Crossley, Gallop(蓋洛普), Roper所有都預(yù)測(cè)Dewey 會(huì)贏(每個(gè)機(jī)構(gòu)用了5000個(gè)問(wèn)卷). 最后(包括蓋洛普)他們都輸了, 而杜魯門贏了. 統(tǒng)計(jì)學(xué)的分類一、描述統(tǒng)計(jì) (descriptive statistics) 研究數(shù)據(jù)收集、整理和描述的統(tǒng)計(jì)學(xué)分支 內(nèi)容搜集數(shù)據(jù)整理數(shù)據(jù)展示數(shù)據(jù)描述性分析 目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律二、推斷統(tǒng)計(jì) (inferential statistics) 研究如何利用樣本數(shù)據(jù)來(lái)推斷總體特征的統(tǒng)計(jì)學(xué)分支內(nèi)容參數(shù)估計(jì)假設(shè)檢驗(yàn)?zāi)康膶?duì)總體特征作出推斷三、 理論統(tǒng)計(jì)學(xué)(Theoretical statistics) 和應(yīng)用統(tǒng)計(jì)學(xué)(Applied statistics) 根據(jù)統(tǒng)計(jì)學(xué)研究方法和統(tǒng)計(jì)方法的應(yīng)用范圍不同,統(tǒng)計(jì)學(xué)分為理論統(tǒng)計(jì)學(xué)和應(yīng)用統(tǒng)計(jì)學(xué)。理論統(tǒng)計(jì)學(xué)主要研究統(tǒng)計(jì)學(xué)的基本原理和基本方法,研究如何將數(shù)學(xué)原理和計(jì)算機(jī)技術(shù)應(yīng)用于統(tǒng)計(jì)學(xué),發(fā)展出新的統(tǒng)計(jì)學(xué)方法和技術(shù)。應(yīng)用統(tǒng)計(jì)學(xué)主要是研究如何將統(tǒng)計(jì)學(xué)的方法和原理與實(shí)際問(wèn)題相結(jié)合,使用統(tǒng)計(jì)學(xué)的方法解決實(shí)際問(wèn)題。統(tǒng)計(jì)的一些做法統(tǒng)計(jì)可以指導(dǎo)我們收集數(shù)據(jù). 當(dāng)擁有來(lái)自一些變量(指標(biāo))的數(shù)據(jù)或記錄,但缺乏模型來(lái)描述這些變量之間關(guān)系的情況下,可用統(tǒng)計(jì)方法建立模型. 在有了一定的模型時(shí),統(tǒng)計(jì)可以確定手中數(shù)據(jù)是否令人信服地支持某種論點(diǎn).模型也用來(lái)對(duì)未來(lái)進(jìn)行預(yù)測(cè). 統(tǒng)計(jì)直觀的圖表展示,可以使各個(gè)領(lǐng)域的專家容易理解統(tǒng)計(jì)學(xué)的目的任何客觀事物都是必然性與偶然性的對(duì)立統(tǒng)一。同樣,任何一個(gè)數(shù)據(jù)也都是必然性與偶然性共同作用的結(jié)果。必然性反映了事物本質(zhì)的特征和聯(lián)系,是比較穩(wěn)定的,因而它決定了事物的內(nèi)在本質(zhì)是有規(guī)律可循的。偶然性則反映了改事物每個(gè)表現(xiàn)形式的差異。如果事物只有必然性一個(gè)方面的特征,事物的表現(xiàn)形式就會(huì)比較簡(jiǎn)單,就可以比較容易把握它的規(guī)律性。正是由于偶然性的存在,形成數(shù)據(jù)表現(xiàn)形式的千差萬(wàn)別。這樣,必然性的數(shù)量規(guī)律性就被掩蓋在表面的差異之中了。 統(tǒng)計(jì)學(xué)的目的就是要從偶然性中探索到內(nèi)在的、本質(zhì)的數(shù)量規(guī)律。從統(tǒng)計(jì)方法上看,統(tǒng)計(jì)學(xué)提供了一系列的方法,專門用來(lái)收集數(shù)據(jù)、整理數(shù)據(jù)、顯示數(shù)據(jù)的特征,進(jìn)而分析和探索出事物總體的數(shù)量規(guī)律性。統(tǒng)計(jì)的內(nèi)容和需要的知識(shí)數(shù)學(xué)的幾乎所有內(nèi)容(不一定事先知道需要什么) 用計(jì)算機(jī)做統(tǒng)計(jì)計(jì)算其他(對(duì)象)領(lǐng)域的知識(shí)統(tǒng)計(jì)和數(shù)學(xué)的區(qū)別數(shù)學(xué)思維是以演繹為主統(tǒng)計(jì)思維是以歸納為主,兼有演繹統(tǒng)計(jì)各領(lǐng)域利用幾乎所有存在的數(shù)學(xué)內(nèi)容. 但統(tǒng)計(jì)本身的數(shù)學(xué)是為具體目標(biāo)服務(wù)的,自己一般不形成數(shù)學(xué)體系第五節(jié)、“虛假”的統(tǒng)計(jì)學(xué)統(tǒng)計(jì)數(shù)據(jù)的有效性:白血病,環(huán)保 好樣本和壞樣本:買桔子 調(diào)查中的非技術(shù)因素:措辭(stock),社會(huì)文化的不同(自殺) 案例分析(魅力) 比如有兩條這樣的新聞,他們都是關(guān)于高壓電線是否會(huì)導(dǎo)致附近的兒童得白血病,它的理論是因?yàn)殡娏鲿?huì)產(chǎn)生磁場(chǎng),磁場(chǎng)往往會(huì)引起白血病,所以生活在有電的環(huán)境里,會(huì)使人暴露在磁場(chǎng)中,那么住在高壓電線附近,會(huì)增加這種暴露的程度。第一條 新聞是找了一位能說(shuō)會(huì)道的母親,她的孩子得了白血病,剛好她家就在高壓電線附近,因此這位母親向觀眾介紹了在高壓電線附近是如何的危險(xiǎn)這一情況;另一條新聞呢,是國(guó)家癌癥所的一則報(bào)道,他們用了5年的時(shí)間和100萬(wàn)資金,走訪了全國(guó)十幾個(gè)省進(jìn)行高壓電線附近的兒童白血病情況的調(diào)查,最后得出結(jié)論,在白血病和暴露在高壓電線所在的磁場(chǎng)之間,找不到任何的相關(guān)關(guān)系。 那么對(duì)于這樣的兩條新聞,我想一般的觀眾都會(huì)傾向于后者,這主要的原因可能就是在于統(tǒng)計(jì)數(shù)字的魅力,人們往往對(duì)具有統(tǒng)計(jì)數(shù)字的新聞和文章都比較信服。案例分析(方式) 某個(gè)機(jī)構(gòu)花費(fèi)了很多的資金在某一城市做一個(gè)調(diào)查,他們將城區(qū)分成兩個(gè)部分,一個(gè)上層區(qū),一個(gè)下層區(qū),分別對(duì)應(yīng)工資的高與低,目的是想了解,哪個(gè)層區(qū)的住戶更加注重資源的回收,他們所采用的度量變量就是路邊資源回收垃圾每周的重量。結(jié)果得出上層區(qū)均超過(guò)下層區(qū),由此,這個(gè)機(jī)構(gòu)得出結(jié)論認(rèn)為上層區(qū)的居民更加注重資源回收。 那么對(duì)于這樣的數(shù)據(jù)報(bào)告,我們就要表示懷疑了,事實(shí)上,這個(gè)事件的本身是跟這個(gè)機(jī)構(gòu)的分析結(jié)果不符合的。因?yàn)樯蠈訁^(qū)在丟回收箱的物品都比較重,而下層區(qū)的就比較輕,比如單拿飲料來(lái)說(shuō),上層區(qū)的多半的丟入的是玻璃瓶的酒,而下層區(qū)的丟入的多半是塑料的飲料。這樣的話,單單從重量上來(lái)比較,統(tǒng)計(jì)數(shù)據(jù)就不是那么有效了。案例分析(質(zhì)量)當(dāng)我們看到一則新聞和一篇統(tǒng)計(jì)報(bào)告的時(shí)候,往往不知道它的樣本是如何取得的,這樣就給文章的可信度打了折扣。樣本也有好樣本和壞樣本的區(qū)分。我們首先來(lái)看看壞樣本,比如:我們要檢查一車桔子是不是優(yōu)質(zhì)的,那么最容易的方法就是在擺在每箱最上面的桔子中抽取,然而這樣得出的結(jié)論就值得懷疑了,首先在運(yùn)送的過(guò)程中,在下部的桔子是最容易受到碰撞的,其次如果供貨商也了解這一點(diǎn)的話,把最好的桔子都放在上部,那么對(duì)于這樣的統(tǒng)計(jì)結(jié)論就沒(méi)有很大的意義。這樣的果,我們用統(tǒng)計(jì)學(xué)的術(shù)語(yǔ)來(lái)說(shuō)是,有偏的。也就是說(shuō)樣本的情況對(duì)于整個(gè)總體來(lái)說(shuō)是有偏誤的。解決方法:利用隨機(jī)抽取的形式,來(lái)消除有偏性。比如,隨機(jī)數(shù)字表,電腦隨機(jī)生成數(shù)字壞樣本還有一個(gè)特性就是它的高變異性,不過(guò)它可以利用擴(kuò)大樣本容量的方法來(lái)消除。這個(gè)我們?cè)谝院蟮恼鹿?jié)再詳細(xì)說(shuō)。可能大家對(duì)于壞樣本的有偏和變異還不是很理解,這里我講一個(gè)非常直觀的概念,就是射箭原理。偏差:意思是我們的瞄準(zhǔn)有問(wèn)題,射出的箭都往同一個(gè)方向偏離靶心:樣本值沒(méi)有以總體值為中心點(diǎn)。變異性:箭著點(diǎn)在靶上分散得很廣“重復(fù)抽樣所得結(jié)果并不接近,彼此間差異很大。有時(shí)候會(huì)出現(xiàn)低變異性,高偏差或者低偏差,高變異性的情況。案例分析(措辭)有一個(gè)調(diào)查機(jī)構(gòu)想做一個(gè)關(guān)于居民擁有股票的比例的問(wèn)卷調(diào)查,他在采訪中問(wèn)道:“是否擁有stock”(股票,也是家禽),結(jié)果大部分的農(nóng)場(chǎng)主的回答都是yes,可是他們實(shí)際擁有股票的卻很少。那么這樣的統(tǒng)計(jì)分析結(jié)果往往很容易迷惑到不了解數(shù)據(jù)來(lái)源的讀者。 stock=(股票,也是家禽) 案例分析(文化) 在調(diào)查全球的自殺率問(wèn)題中,社會(huì)文化就占有很大的因素,在日本這樣的國(guó)家,有遇到恥辱就光榮自殺的傳統(tǒng),這就使得日本的自殺事件報(bào)道的比例較高,而在大部分信奉天主教的國(guó)家,他們都以自殺為恥辱,因此所公布的自殺率自然比其他的國(guó)家低很多。而隨著文化的發(fā)展,很多國(guó)家都將抑郁癥視為生理上的疾病,而不是個(gè)性上的弱點(diǎn),自殺是這種病的悲劇性結(jié)束,而不是道德瑕疵。這使得這些國(guó)家的家屬和醫(yī)生更愿意將自殺列為死因。也使著自殺率在逐年升高,這個(gè)并非真的數(shù)據(jù)在增加,而是人們的觀念發(fā)生了變化。 因此我們?cè)诳创愃七@樣的數(shù)據(jù)報(bào)表的時(shí)候,不能被數(shù)據(jù)值的外表迷惑,要弄清楚數(shù)據(jù)的來(lái)源是怎樣的,他調(diào)查的方式又是怎樣的。 計(jì)算機(jī)的重要性由于統(tǒng)計(jì)和數(shù)據(jù)打交道,沒(méi)有計(jì)算機(jī)的發(fā)展統(tǒng)計(jì)就沒(méi)有前途. 計(jì)算機(jī)和統(tǒng)計(jì)的發(fā)展相輔相成 現(xiàn)實(shí)中的隨機(jī)性從中學(xué)起,我們就知道自然科學(xué)的許多定律,例如物理中的牛頓三定律,物質(zhì)不滅定律以及化學(xué)中的各種定律等等。但是在許多領(lǐng)域,很難用如此確定的公式或論述來(lái)描述一些現(xiàn)象。比如,人的壽命是很難預(yù)先確定的。一個(gè)吸煙、喝酒、不鍛煉、而且一口長(zhǎng)葷的人可能比一個(gè)很少得病、生活習(xí)慣良好的人活得長(zhǎng)。因此,可以說(shuō),活得長(zhǎng)短是有一定隨機(jī)性的(randomness)。這種隨機(jī)性可能和人的經(jīng)歷、基因、習(xí)慣等無(wú)數(shù)說(shuō)不清的因素都有關(guān)系。現(xiàn)實(shí)中的規(guī)律性但是從總體來(lái)說(shuō),我國(guó)公民的平均年齡卻是非常穩(wěn)定的。而且女性的平均年齡也穩(wěn)定地比男性高幾年。這就是規(guī)律性。一個(gè)人可能活過(guò)這個(gè)平均年齡,也可能活不到這個(gè)年齡,這是隨機(jī)的。但是總體來(lái)說(shuō),平均年齡的穩(wěn)定性,卻說(shuō)明了隨機(jī)之中有規(guī)律性。這種規(guī)律就是統(tǒng)計(jì)規(guī)律。 概率和機(jī)會(huì)你可能經(jīng)常聽(tīng)到概率(probability)這個(gè)名詞。例如在天氣預(yù)報(bào)中會(huì)提到降水概率。大家都明白,如果降水概率是百分之九十,那就很可能下雨;但如果是百分之十,就不大可能下雨。因此,從某種意義說(shuō)來(lái),概率描述了某件事情發(fā)生的機(jī)會(huì)。顯然,這種概率不可能超過(guò)百分之百,也不可能少于百分之零。換言之,概率是在0和1之間的一個(gè)數(shù),說(shuō)明某事件發(fā)生的機(jī)會(huì)有多大。 有些概率是無(wú)法精確推斷的 比如你對(duì)別人說(shuō)你下一個(gè)周末去公園的概率是百分之八十。但你無(wú)法精確說(shuō)出為什么是百分之八十而不是百分之八十四或百分之七十八。其實(shí)你想說(shuō)的是你很可能去,但又沒(méi)有完全肯定。實(shí)際上,到了周末,你或者去,或者不去;不可能有分身術(shù)把百分之八十的你放到公園,而其余的放在別處。有些概率是可以估計(jì)的 比如擲骰子。只要沒(méi)有人在骰子上做手腳,你得到6點(diǎn)的概率應(yīng)該是六分之一。得到其他點(diǎn)的概率也是一樣。得到6的概率或者機(jī)會(huì)是可以知道的,但擲骰子的結(jié)果還只可能是六個(gè)數(shù)目之一。這個(gè)已知的規(guī)律就反映了規(guī)律性,而得到哪個(gè)結(jié)果則反映了隨機(jī)性。如果你擲1000次骰子,那么,大約有六分之一的可能會(huì)得到6;這也是隨機(jī)性呈現(xiàn)有規(guī)律的一個(gè)體現(xiàn)。變量和數(shù)據(jù)一節(jié)火車車廂有多少坐位是一個(gè)固定的數(shù)目,稱為常數(shù)(constant)或者常量。但是,開車后,坐在這節(jié)車廂的旅客有多少就沒(méi)準(zhǔn)了。這有隨機(jī)性。該車廂的乘客數(shù)為變量(variable)。變量和數(shù)據(jù)一個(gè)學(xué)校的注冊(cè)在校男女生比例是固定的,為常量但是,該校任意一群學(xué)生的男女生比例就不一定和全校的比例一樣了,它為變量(variable)。變量和數(shù)據(jù)當(dāng)變量按照隨機(jī)規(guī)律所取的值是數(shù)量時(shí)該變量稱為定量變量或數(shù)量變量(quantitative variable);因?yàn)槭请S機(jī)的,也稱為隨機(jī)變量(random variable)。如身高體重,購(gòu)買某商品的人數(shù)等等變量和數(shù)據(jù)象性別,觀點(diǎn)之類的取非數(shù)量值的變量就稱為定性變量或?qū)傩宰兞炕蚍诸愖兞?qualitative variable,或categorical variable)。這些定性變量也可以由定量變量來(lái)描述,如男女生的數(shù)目,持有某觀點(diǎn)的人數(shù)比例等等。變量和數(shù)據(jù)定性變量只有用數(shù)量來(lái)描述時(shí),才有可能建立數(shù)學(xué)模型,并使用計(jì)算機(jī)來(lái)分析。數(shù)據(jù)中它們通常用啞元(dummy variable)代表,比如性別用0、1代表,三種收入用0、1、2代表(或用字母代表)變量和數(shù)據(jù)有了變量,何謂數(shù)據(jù)?不同機(jī)構(gòu)調(diào)查所得到的北京收入萬(wàn)元以上市民的比例都不一樣,這是變量而這些調(diào)查產(chǎn)生一些數(shù)目,這些數(shù)目就是數(shù)據(jù)(data) 數(shù)據(jù)是關(guān)于變量的觀測(cè)值。變量和數(shù)據(jù)通過(guò)數(shù)據(jù)可驗(yàn)證有關(guān)的理論或假定。比如通過(guò)抽樣調(diào)查驗(yàn)證美國(guó)選民對(duì)共和黨候選人的支持率是否超過(guò)50% 通過(guò)抽樣,可以檢驗(yàn)?zāi)撑a(chǎn)品是否合格等等變量之間的關(guān)系現(xiàn)實(shí)世界緊密聯(lián)系的人們想知道投資方式和經(jīng)濟(jì)效益之間的關(guān)系、旅客人數(shù)和經(jīng)濟(jì)發(fā)展之間的關(guān)系等等不討論變量之間的關(guān)系,就無(wú)從談起任何有深度的應(yīng)用,統(tǒng)計(jì)的基本概念就僅僅是擺設(shè)而已。定量變量間的關(guān)系廣告投入和銷售之間的關(guān)系。下表(數(shù)據(jù)ads.txt)顯示了某企業(yè)的廣告投入和銷售額之間的關(guān)系(萬(wàn)元) 定量變量間的關(guān)系能否從該數(shù)據(jù)回答下面問(wèn)題:這兩個(gè)變量是否有關(guān)系?如果有,它們的關(guān)系是否顯著?這些關(guān)系是什么關(guān)系,能否用數(shù)學(xué)模型來(lái)描述?這個(gè)關(guān)系是否帶有普遍性?這個(gè)關(guān)系是不是因果關(guān)系?定量變量間的關(guān)系關(guān)于因果關(guān)系在可控制的試驗(yàn)中,較容易找到因果關(guān)系;比如治療方式和療效的關(guān)系等但是,一般來(lái)說(shuō),變量之間有關(guān)系這個(gè)事實(shí)并不意味著一定存在明確的因果關(guān)系。定量變量間的關(guān)系比如,北京GDP在一年中是快速增長(zhǎng)的,而一個(gè)剛出生的巴拿馬嬰兒在這一年中的體重也是快速增長(zhǎng)的如果畫出圖來(lái),它們有類似線性的關(guān)系但它們顯然沒(méi)有因果關(guān)系定量變量間的關(guān)系只要有關(guān)系,即使不是因果關(guān)系也不妨礙人們利用這種關(guān)系來(lái)進(jìn)行推斷。比如利用公雞打鳴來(lái)預(yù)報(bào)太陽(yáng)升起;雖然公雞打鳴絕對(duì)不是日出的原因(雖然打鳴發(fā)生在先)定量變量間的關(guān)系簡(jiǎn)單的辦法(諸如畫圖)可以得到一些信息,但不一定能夠給出滿意的答案需要更多的工具和手段來(lái)進(jìn)行數(shù)值分析得到更加嚴(yán)格和精確的解答因此,需要繼續(xù)我們的課程定性變量間的關(guān)系例下面是對(duì)123人進(jìn)行關(guān)于某項(xiàng)政策調(diào)查所得結(jié)果的一個(gè)簡(jiǎn)單的三維表,它顯示了人們的收入和性別對(duì)該項(xiàng)政策的觀點(diǎn)。定性變量間的關(guān)系從這個(gè)數(shù)據(jù),希望可以看出收入、性別對(duì)觀點(diǎn)是否有影響及如何影響如果要得到更加精確的結(jié)論,就要進(jìn)行進(jìn)一步的分析和計(jì)算這是后面列聯(lián)表分析或多項(xiàng)分布對(duì)數(shù)線性模型的內(nèi)容統(tǒng)計(jì)、計(jì)算機(jī)與統(tǒng)計(jì)軟件現(xiàn)代生活越來(lái)越離不開計(jì)算機(jī)了最初的計(jì)算機(jī)僅僅是為科學(xué)計(jì)算而設(shè)計(jì)和建造的統(tǒng)計(jì)是大型計(jì)算機(jī)的最早用戶,現(xiàn)在仍然是數(shù)值計(jì)算的主要用戶統(tǒng)計(jì)、計(jì)算機(jī)與統(tǒng)計(jì)軟件計(jì)算機(jī)的使用,從計(jì)算機(jī)語(yǔ)言到 “傻瓜式”地點(diǎn)擊鼠標(biāo)輸出結(jié)果也從數(shù)字輸出到各種可以想象得到的形式。輸入數(shù)據(jù),點(diǎn)鼠標(biāo)做一些選項(xiàng),就可得到漂亮結(jié)果但其中充滿了危險(xiǎn)的陷阱統(tǒng)計(jì)、計(jì)算機(jī)與統(tǒng)計(jì)軟件計(jì)算機(jī)無(wú)法識(shí)別你的統(tǒng)計(jì)方面的錯(cuò)誤錯(cuò)誤的方法、錯(cuò)誤的數(shù)據(jù)形式都必然輸出錯(cuò)誤的結(jié)果(雖然看上去可能很漂亮),得到大量垃圾另外,統(tǒng)計(jì)軟件輸出的結(jié)果太多、很難都理解統(tǒng)計(jì)、計(jì)算機(jī)與統(tǒng)計(jì)軟件統(tǒng)計(jì)軟件的種類很多。書中僅介紹最常見(jiàn)的幾種。只要學(xué)會(huì)使用一種“傻瓜式”軟件或編程軟件,使用其他類似的軟件也不會(huì)困難;最多看看幫助和說(shuō)明即可。學(xué)習(xí)軟件的最好方式是需要時(shí)在使用中學(xué)。統(tǒng)計(jì)軟件 SPSS:這是一個(gè)很受歡迎的統(tǒng)計(jì)軟件;它容易操作,輸出漂亮,功能齊全,價(jià)格合理。對(duì)于非統(tǒng)計(jì)工作者是很好的選擇。 Excel:它嚴(yán)格說(shuō)來(lái)并不是統(tǒng)計(jì)軟件,但作為數(shù)據(jù)表格軟件,必然有一定統(tǒng)計(jì)計(jì)算功能。而且凡是有Microsoft Office的計(jì)算機(jī),基本上都裝有Excel。但要注意,有時(shí)在裝Office時(shí)沒(méi)有裝數(shù)據(jù)分析的功能,那就必須裝了才行。當(dāng)然,畫圖功能是都具備的。對(duì)于簡(jiǎn)單分析,Excel還算方便,但隨著問(wèn)題的深入,Excel就不那么“傻瓜”,需要使用函數(shù),甚至根本沒(méi)有相應(yīng)的方法了。多數(shù)專門一些的統(tǒng)計(jì)推斷問(wèn)題還需要其他專門的統(tǒng)計(jì)軟件來(lái)處理。 SAS:這是功能非常齊全的軟件;盡管價(jià)格不菲,許多公司還是因?yàn)槠涔δ鼙姸嗪湍承┟绹?guó)政府機(jī)構(gòu)認(rèn)可而使用。盡管現(xiàn)在已經(jīng)盡量“傻瓜化”,仍然需要一定的訓(xùn)練才可以進(jìn)入。對(duì)于基本統(tǒng)計(jì)課程則不那么方便。統(tǒng)計(jì)軟件 S-plus:這是統(tǒng)計(jì)學(xué)家喜愛(ài)的軟件。不僅由于其功能齊全,而且由于其強(qiáng)大的編程功能,使得研究人員可以編制自己的程序來(lái)實(shí)現(xiàn)自己的理論和方法。它也在進(jìn)行“傻瓜化”以爭(zhēng)取顧客。但仍然以編程方便為顧客所青睞。 R軟件:這是一個(gè)免費(fèi)的,由志愿者管理的軟件。其編程語(yǔ)言與S-plus所基于的S語(yǔ)言一樣,很方便。還有不斷加入的各個(gè)方向統(tǒng)計(jì)學(xué)家編寫的統(tǒng)計(jì)軟件包。同時(shí)從網(wǎng)上可以不斷更新和增加有關(guān)的軟件包和程序。這是發(fā)展最快的軟件,受到世界上統(tǒng)計(jì)師生的歡迎。是用戶量增加最快的統(tǒng)計(jì)軟件。對(duì)于一般非統(tǒng)計(jì)工作者來(lái)說(shuō),主要問(wèn)題是它沒(méi)有“傻瓜化”。 統(tǒng)計(jì)軟件 Minitab:這個(gè)軟件是很方便的功能強(qiáng)大而又齊全的軟件,也已經(jīng)“傻瓜化”,在我國(guó)用的不如SPSS與SAS那么普遍。 Statistica:也是功能強(qiáng)大而齊全的“傻瓜化”的軟件,在我國(guó)用的也不如SAS與SPSS那么普遍。 Eviews:這是一個(gè)主要處理回歸和時(shí)間序列的軟件。 GAUSS:這是一個(gè)很好用的統(tǒng)計(jì)軟件,許多搞經(jīng)濟(jì)的喜歡它。主要也是編程功能強(qiáng)大。目前在我國(guó)使用的人不多。 FORTRAN:這是應(yīng)用于各個(gè)領(lǐng)域的歷史很長(zhǎng)的非常優(yōu)秀的編程軟件,功能強(qiáng)大,也有一定的統(tǒng)計(jì)軟件包。計(jì)算速度比這里介紹的都快得多。但需要編程和編譯。操作不那么容易。 MATLAB:這也是應(yīng)用于各個(gè)領(lǐng)域的以編程為主的軟件,在工程上應(yīng)用廣泛。編程類似于S和R。但是統(tǒng)計(jì)方法不多。想想看舉出你所知道的統(tǒng)計(jì)應(yīng)用例子。舉出日常生活中隨機(jī)性和規(guī)律性的例子。你使用過(guò)統(tǒng)計(jì)軟件或者利用過(guò)其他軟件中的統(tǒng)計(jì)功能嗎?你有什么經(jīng)驗(yàn)和體會(huì)?
社會(huì)統(tǒng)計(jì)學(xué)ppt:這是社會(huì)統(tǒng)計(jì)學(xué)ppt,包括了緒論,單變量的描述統(tǒng)計(jì)分析,兩個(gè)類別變量關(guān)系的描述統(tǒng)計(jì),兩個(gè)尺度變量關(guān)系的描述統(tǒng)計(jì),類別變量與尺度變量關(guān)系的描述統(tǒng)計(jì),概率與隨機(jī)變量的概率分布,大數(shù)定律、中心極限定理與抽樣分布,參數(shù)估計(jì),假設(shè)檢驗(yàn)的基本原理,總體均值與方差的假設(shè)檢驗(yàn),兩個(gè)類別變量關(guān)系的假設(shè)檢驗(yàn),兩個(gè)尺度變量關(guān)系的假設(shè)檢驗(yàn),類別變量與尺度變量關(guān)系的假設(shè)檢驗(yàn),非參數(shù)檢驗(yàn),抽樣,時(shí)間序列等內(nèi)容,歡迎點(diǎn)擊下載。
統(tǒng)計(jì)學(xué)曾五一ppt:這是統(tǒng)計(jì)學(xué)曾五一ppt,包括了什么是統(tǒng)計(jì),統(tǒng)計(jì)學(xué)的種類及其性質(zhì),統(tǒng)計(jì)學(xué)的基本概念,無(wú)處不在的統(tǒng)計(jì),精確到小數(shù)點(diǎn)的愛(ài)情--統(tǒng)計(jì)學(xué)博士的求婚信等內(nèi)容,歡迎點(diǎn)擊下載。
統(tǒng)計(jì)學(xué)假設(shè)檢驗(yàn)ppt:這是統(tǒng)計(jì)學(xué)假設(shè)檢驗(yàn)ppt,包括了假設(shè)檢驗(yàn)的一般問(wèn)題,一個(gè)正態(tài)總體的參數(shù)檢驗(yàn),兩個(gè)正態(tài)總體的參數(shù)檢驗(yàn),假設(shè)檢驗(yàn)中的其他問(wèn)題等內(nèi)容,歡迎點(diǎn)擊下載。