-
- 素材大。
- 1.42 MB
- 素材授權(quán):
- 免費下載
- 素材格式:
- .ppt
- 素材上傳:
- ppt
- 上傳時間:
- 2018-03-13
- 素材編號:
- 118387
- 素材類別:
- 學(xué)校PPT
-
素材預(yù)覽
這是一個關(guān)于統(tǒng)計學(xué)數(shù)據(jù)整理與展示PPT,主要介紹數(shù)據(jù)的預(yù)處理、品質(zhì)數(shù)據(jù)的整理與顯示、數(shù)值型數(shù)據(jù)的整理與顯示、合理使用圖表。第3章 數(shù)據(jù)的圖表展示 3.1 數(shù)據(jù)的預(yù)處理 3.2 品質(zhì)數(shù)據(jù)的整理與顯示 3.3 數(shù)值型數(shù)據(jù)的整理與顯示 3.4 合理使用圖表數(shù)據(jù)的預(yù)處理數(shù)據(jù)審核數(shù)據(jù)審核—原始數(shù)據(jù) (raw data) 完整性審核準(zhǔn)確性審核二手?jǐn)?shù)據(jù)(second hand data) 適用性審核時效性審核:盡可能使用最新的數(shù)據(jù)有必要做進(jìn)一步的加工整理數(shù)據(jù)篩選(data filter) 找出符合條件的數(shù)據(jù) 例3-1 數(shù)據(jù)排序 升序和降序數(shù)據(jù)透視表(pivot table) 按需要匯總 例3-2 品質(zhì)數(shù)據(jù)的整理與顯示分類數(shù)據(jù)頻數(shù)和頻數(shù)分布(frequency distribution)條形圖(bar Chart)、柱形圖(column chart)、對比條形圖帕累托圖(pareto chart) 餅圖 (pie Chart) 環(huán)形圖 (doughnut Chart) 分類數(shù)據(jù)的整理 (可計算的統(tǒng)計量) 頻數(shù)(frequency) :落在各類別中的數(shù)據(jù)個數(shù)比例(proportion) :某一類別數(shù)據(jù)個數(shù)占全部數(shù)據(jù)個數(shù)的比值百分比(percentage) :將對比的基數(shù)作為100而計算的比值比率(ratio) :不同類別數(shù)值個數(shù)的比值順序數(shù)據(jù)的整理(可計算的統(tǒng)計量) 1. 累積頻數(shù)(cumulative frequencies):各類別頻數(shù)的逐級累加,歡迎點擊下載統(tǒng)計學(xué)數(shù)據(jù)整理與展示PPT哦。
統(tǒng)計學(xué)數(shù)據(jù)整理與展示PPT是由紅軟PPT免費下載網(wǎng)推薦的一款學(xué)校PPT類型的PowerPoint.
第3章 數(shù)據(jù)的圖表展示 3.1 數(shù)據(jù)的預(yù)處理 3.2 品質(zhì)數(shù)據(jù)的整理與顯示 3.3 數(shù)值型數(shù)據(jù)的整理與顯示 3.4 合理使用圖表數(shù)據(jù)的預(yù)處理數(shù)據(jù)審核數(shù)據(jù)審核—原始數(shù)據(jù) (raw data) 完整性審核準(zhǔn)確性審核二手?jǐn)?shù)據(jù)(second hand data) 適用性審核時效性審核:盡可能使用最新的數(shù)據(jù)有必要做進(jìn)一步的加工整理數(shù)據(jù)篩選(data filter) 找出符合條件的數(shù)據(jù) 例3-1 數(shù)據(jù)排序 升序和降序數(shù)據(jù)透視表(pivot table) 按需要匯總 例3-2 品質(zhì)數(shù)據(jù)的整理與顯示分類數(shù)據(jù)頻數(shù)和頻數(shù)分布(frequency distribution)條形圖(bar Chart)、柱形圖(column chart)、對比條形圖帕累托圖(pareto chart) 餅圖 (pie Chart) 環(huán)形圖 (doughnut Chart) 分類數(shù)據(jù)的整理 (可計算的統(tǒng)計量) 頻數(shù)(frequency) :落在各類別中的數(shù)據(jù)個數(shù)比例(proportion) :某一類別數(shù)據(jù)個數(shù)占全部數(shù)據(jù)個數(shù)的比值百分比(percentage) :將對比的基數(shù)作為100而計算的比值比率(ratio) :不同類別數(shù)值個數(shù)的比值順序數(shù)據(jù)的整理(可計算的統(tǒng)計量) 1. 累積頻數(shù)(cumulative frequencies):各類別頻數(shù)的逐級累加 2. 累積頻率(cumulative percentages):各類別頻率(百分比)的逐級累加數(shù)值型數(shù)據(jù)的整理:分組組數(shù)應(yīng)以能顯示數(shù)據(jù)分布特征和規(guī)律為目的。實際中,組數(shù)一般為5K 15 組距是一個組上、下限之差,根據(jù)數(shù)據(jù)的最大值和最小值及組數(shù)確定。即 組距=( 最大值-最小值)÷ 組數(shù)統(tǒng)計頻數(shù)可整理出頻數(shù)分布表 頻數(shù)分布表的編制 (例題分析) 等距分組表 (上下組限重疊) 等距分組表 (使用開口組) 分組 Step 1: Decide on the number of classes. 確定組數(shù) A useful recipe to determine the number of classes (k) is the “2 to the k rule.” such that 2k > n. There were 80 vehicles sold. So n = 80. If we try k = 6, which means we would use 6 classes, then 26 = 64, somewhat less than 80. Hence, 6 is not enough classes. If we let k = 7, then 27 = 128, which is greater than 80. So the recommended number of classes is 7. Step 2: Determine the class interval or width. 確定組距 The formula is: i (H-L)/k where i is the class interval, H is the highest observed value, L is the lowest observed value, and k is the number of classes. If ($35,925 - $15,546)/7 = $2,911 Round up to some convenient number, such as a multiple of 10 or 100. Use a class width of $3,000 分組 Step 3: Set the individual class limits 確定各組組限 Put each observation into only one category, namely avoiding overlapping or unclear class limits. Put approximately equal amounts of the excess in each of the two tails. Select convenient class limits. A guideline is to make the lower limit of the first class a multiple of the class interval. Step 4: Tally the vehicle selling prices into the classes. 數(shù)據(jù)歸入各組數(shù)值型數(shù)據(jù)的顯示數(shù)值型數(shù)據(jù)的圖示分組數(shù)據(jù):直方圖 (histogram) 未分組數(shù)據(jù)莖葉圖(stem-and-leaf display) 箱線圖 (box plot) 時間序列數(shù)據(jù)—線圖(line plot) 兩個變量間的關(guān)系—二維散點圖(2D Scatterplots) 三個變量間的關(guān)系—氣泡圖(bubble chart) 多變量數(shù)據(jù)—雷達(dá)圖 (radar chart) 分組數(shù)據(jù)—直方圖 (histogram) 用矩形的面積表示頻率分布橫軸表示數(shù)據(jù)分組,縱軸表示頻率/組距,各組與相應(yīng)的頻率就形成了一個矩形,即直方圖分組數(shù)據(jù)—直方圖 (直方圖與條形圖的區(qū)別) 條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)未分組數(shù)據(jù)—莖葉圖 (stem-and-leaf display) 用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留最后一位數(shù)字 5. 莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)未分組數(shù)據(jù)—莖葉圖 (例題分析) 未分組數(shù)據(jù)—箱線圖 (box plot) 用于顯示未分組的原始數(shù)據(jù)的分布由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成繪制方法首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU) 連接兩個四分位數(shù)畫出箱子,再將兩個極值點與箱子相連接未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖 (箱線圖的構(gòu)成) 未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖(例題分析) 未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖 (例題分析) 未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖 (例題分析—Median/Quart./Range) 未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖 (例題分析—Median/Quart./Range) 股票分析中的K線圖與箱線圖類似K線圖最早是日本德川幕府時代大阪的米商用來記錄當(dāng)時一天、一周或一月中米價漲跌行情的圖示法,后被引入股市。K線圖有直觀、立體感強、攜帶信息量大的特點,是各類傳播媒介、電腦實時分析系統(tǒng)應(yīng)用較多的技術(shù)分析手段。以日K線為例:是根據(jù)股價(指數(shù))一天的走勢中形成的四個價位即:開盤價,收盤價,最高價,最低價繪制而成的。收盤價高于開盤價時,則開盤價在下收盤價在上,二者之間的長方柱用紅色或空心繪出,稱之為陽線;其上影線的最高點為最高價,下影線的最低點為最低價。收盤價低于開盤價時,則開盤價在上收盤價在下,二者之間的長方柱用綠色或?qū)嵭睦L出,稱之為陰線,其上影線的最高點為最高價,下影線的最低點為最低價。 08..11.27-09.3.26日K線圖時間序列數(shù)據(jù)—線圖 (line plot) 表示時間序列數(shù)據(jù)趨勢的圖形一般時間為橫軸,數(shù)據(jù)為縱軸圖形的長寬比例大致為10 : 7 一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷時間序列數(shù)據(jù)—線圖 (例題分析) 時間序列數(shù)據(jù)—線圖 (例題分析) 兩個變量間的關(guān)系—二維散點圖 (2D Scatterplots) 展示兩個變量之間的關(guān)系用橫軸代表變量x,縱軸代表變量y,每組數(shù)據(jù)(xi,yi)在坐標(biāo)系中用一個點表示,n組數(shù)據(jù)在坐標(biāo)系中形成的n個點稱為散點,由坐標(biāo)及其散點形成的二維數(shù)據(jù)圖兩個變量間的關(guān)系—二維散點圖 (2D Scatterplots) 三個變量間的關(guān)系—氣泡圖 (bubble chart) 顯示三個變量之間的關(guān)系 圖中數(shù)據(jù)點的大小依賴于第三個變量多變量數(shù)據(jù)—雷達(dá)圖 (radar chart) 也稱為蜘蛛圖(spider chart) 顯示多個變量的圖示方法在顯示或?qū)Ρ雀髯兞康臄?shù)值總和時十分有用假定各變量的取值具有相同的正負(fù)號,總的絕對值與圖形所圍成的區(qū)域成正比可用于研究多個樣本之間的相似程度多變量數(shù)據(jù)—雷達(dá)圖 (雷達(dá)圖的制作) 設(shè)有n組樣本S1,S2,… , Sn,每個樣本測得P個變量X1,X2 ,… , XP,要繪制這P個變量的雷達(dá)圖,其具體做法是多變量數(shù)據(jù)—雷達(dá)圖 (例題分析) 多變量數(shù)據(jù)—雷達(dá)圖 (例題分析) 2010年1月20日至1月25日中國及周邊版圖地震情況版圖周邊共計有901條地震記錄,其中大于ML5級的一共兩次: 2010-01-24 10:36:13.8 35.45 110.70 15 Ms4.8 天然地震 山西河津 2010-01-21 10:02:02.8 13.70 125.85 33 Ms5.1 天然地震 菲律賓群島地區(qū)其他統(tǒng)計圖舉例:火箭對熱火比賽(20100116)中,火箭球員的助攻網(wǎng)絡(luò)關(guān)系 社會網(wǎng)絡(luò)關(guān)系 假如:我是教練組成員,我提議(單從本場比賽結(jié)果看): Brooks、Battier、Ariza、Andersen 在火箭進(jìn)攻體系中位置比較重要,輪轉(zhuǎn)的時候盡量保證其中的兩人或三人同時在場。 Budinger 屬于絕好的替補球員,但似乎不適合同 Battier、Hayes 同時在場。 圖并沒有說謊,是說謊者在畫圖。 Benjamin Disraeli 鑒別圖表優(yōu)劣的準(zhǔn)則一張好的圖表應(yīng)包括以下基本特征顯示數(shù)據(jù)讓讀者把注意力集中在圖表的內(nèi)容上,而不是制作圖表的程序上避免歪曲強調(diào)數(shù)據(jù)之間的比較服務(wù)于一個明確的目的有對圖表的統(tǒng)計描述和文字說明 5種鑒別圖表優(yōu)劣的準(zhǔn)則:一張好的圖表應(yīng)當(dāng)精心設(shè)計、有助于洞察問題的實質(zhì)使復(fù)雜的觀點得到簡明、確切、高效的闡述能在最短的時間內(nèi)以最少的筆墨給讀者提供最大量的信息是多維的表述數(shù)據(jù)的真實情況不恰當(dāng)?shù)慕y(tǒng)計圖形舉例:縱橫比例不恰當(dāng)?shù)慕y(tǒng)計圖形舉例:三維效果不恰當(dāng)?shù)慕y(tǒng)計圖形舉例:圖形類型不恰當(dāng)?shù)慕y(tǒng)計圖形舉例:壓縮縱軸不恰當(dāng)?shù)慕y(tǒng)計圖形舉例:縱軸無零點統(tǒng)計表的設(shè)計合理安排統(tǒng)計表的結(jié)構(gòu)總標(biāo)題內(nèi)容應(yīng)滿足3W 要求數(shù)據(jù)計量單位相同時,可放在表的右上角標(biāo)明,不同時應(yīng)放在每個變量后或單列出一列標(biāo)明表中的上下兩條橫線一般用粗線,其他線用細(xì)線通常情況下,統(tǒng)計表的左右兩邊不封口表中的數(shù)據(jù)一般是右對齊,有小數(shù)點時應(yīng)以小數(shù)點對齊,而且小數(shù)點的位數(shù)應(yīng)統(tǒng)一對于沒有數(shù)字的表格單元,一般用“—”表示必要時可在表的下方加上注釋統(tǒng)計表的結(jié)構(gòu)作業(yè) P66-72 練習(xí)題二3.1——3.15 還有哪些統(tǒng)計圖?查查看?列舉幾個。
社會統(tǒng)計學(xué)ppt:這是社會統(tǒng)計學(xué)ppt,包括了緒論,單變量的描述統(tǒng)計分析,兩個類別變量關(guān)系的描述統(tǒng)計,兩個尺度變量關(guān)系的描述統(tǒng)計,類別變量與尺度變量關(guān)系的描述統(tǒng)計,概率與隨機變量的概率分布,大數(shù)定律、中心極限定理與抽樣分布,參數(shù)估計,假設(shè)檢驗的基本原理,總體均值與方差的假設(shè)檢驗,兩個類別變量關(guān)系的假設(shè)檢驗,兩個尺度變量關(guān)系的假設(shè)檢驗,類別變量與尺度變量關(guān)系的假設(shè)檢驗,非參數(shù)檢驗,抽樣,時間序列等內(nèi)容,歡迎點擊下載。
統(tǒng)計學(xué)曾五一ppt:這是統(tǒng)計學(xué)曾五一ppt,包括了什么是統(tǒng)計,統(tǒng)計學(xué)的種類及其性質(zhì),統(tǒng)計學(xué)的基本概念,無處不在的統(tǒng)計,精確到小數(shù)點的愛情--統(tǒng)計學(xué)博士的求婚信等內(nèi)容,歡迎點擊下載。
統(tǒng)計學(xué)假設(shè)檢驗ppt:這是統(tǒng)計學(xué)假設(shè)檢驗ppt,包括了假設(shè)檢驗的一般問題,一個正態(tài)總體的參數(shù)檢驗,兩個正態(tài)總體的參數(shù)檢驗,假設(shè)檢驗中的其他問題等內(nèi)容,歡迎點擊下載。