1、描述統(tǒng)計是通過圖表或數(shù)學(xué)方法,對數(shù)據(jù)資料進(jìn)行整理、分析,并對數(shù)據(jù)的分布狀態(tài)、數(shù)字特征和隨機(jī)變量之間關(guān)系進(jìn)行估計和描述的方法。
2、描述統(tǒng)計分為集中趨勢分析和離中趨勢分析和相關(guān)分析三大部分。
3、統(tǒng)計描述,就是用統(tǒng)計的方法對數(shù)據(jù)進(jìn)行一定的匯總。
(相關(guān)資料圖)
4、提到統(tǒng)計描述,不得不提統(tǒng)計推斷,何謂統(tǒng)計推斷呢,就是用概率論的方法對數(shù)據(jù)間的差異“是否有統(tǒng)計學(xué)意義”進(jìn)行一定的推斷。
5、描述統(tǒng)計中的數(shù)據(jù)可以分為分類型數(shù)據(jù)和數(shù)值型數(shù)據(jù)。
6、分類型數(shù)據(jù)是識別變量的類型,比如男女、地區(qū)、各種類別;數(shù)值型數(shù)據(jù)是表示數(shù)值的大小和多少,比如年齡中的18、19、20歲。
7、最明顯的區(qū)分是,分類型數(shù)據(jù)不能使用加減法,而數(shù)值型數(shù)據(jù)可以。
8、兩者在一定程度可以互相轉(zhuǎn)換。
9、比如年齡,18歲是數(shù)值型數(shù)據(jù),但它也可以轉(zhuǎn)換成分類數(shù)據(jù)青少年。
10、擴(kuò)展資料描述統(tǒng)計中數(shù)據(jù)的度量平均數(shù)是一種數(shù)據(jù)位置的度量,用以了解整體數(shù)據(jù),這是小學(xué)就學(xué)到的內(nèi)容。
11、可是平均數(shù)并不是一個權(quán)威的衡量指標(biāo),當(dāng)我們提到全國平均工資的時候,我們都是被馬云爸爸王健林爸爸平均的普通人。
12、平均數(shù)容易受到極值的影響,因為數(shù)據(jù)集并不能保證,各類運營數(shù)據(jù)經(jīng)常受到擾動,比如薅羊毛黨就會拉高營銷活動的平均值。
13、一般而言,可以用調(diào)整平均數(shù)(trimmed mean)消除異常波動,在數(shù)據(jù)集中刪除一定比例的極大值和極小值,比如5%,然后重新計算平均數(shù)。
14、2、中位數(shù)。
15、將所有數(shù)據(jù)按升序排列后,位于中間的數(shù)值即中位數(shù)。
16、當(dāng)數(shù)據(jù)集是奇數(shù),中位數(shù)是中間的數(shù)值,當(dāng)數(shù)據(jù)集是偶數(shù),中位數(shù)是中間兩個數(shù)的平均值。
17、3、另外一種度量是眾數(shù),它是數(shù)據(jù)集出現(xiàn)頻次最多的數(shù)據(jù),當(dāng)有多個眾數(shù)時,稱為多眾數(shù)。
18、眾數(shù)使用的頻率低于前兩者,更多用于分類數(shù)據(jù)。
19、4、數(shù)據(jù)分析師常將數(shù)據(jù)劃分為四個部分,每一部分包含25%的數(shù)據(jù)集,劃分的分割點叫做四分位數(shù)。
20、依次將數(shù)據(jù)升序排列,位于第25%位置的叫做第一四分位數(shù)Q1,位于第50%位置的叫做第二四分位數(shù)Q2,即中位數(shù),位于第75%的叫做第三分位數(shù)Q3。
21、這三個點,能輔助衡量數(shù)據(jù)的分布狀態(tài)。
22、參考資料來源:百度百科-描述統(tǒng)計。
本文分享完畢,希望對大家有所幫助。
關(guān)鍵詞: 描述統(tǒng)計 四分位數(shù) 分類數(shù)據(jù) 統(tǒng)計推斷