畫頻數分布直方圖,如何確定組距和組數

時間 2022-08-19 14:02:26

1樓:彭梓肇夢槐

在用頻數分布直方圖描述資料時,首先要把資料分組統計.合適地分組,會使資料分布規律顯得更為清楚,能更準確地作出情況分析.一般資料越多,分成的組數也要多.經驗表明,當資料個數在100個以內時,常常把資料分成5—12組來統計.分組時,往往與小組的組距聯絡在一起.也就是先定出組距,再確定組數,不同的組距會確定出不同的組數.

2樓:匿名使用者

①集中和記錄資料,求出其最大值和最小值。資料的數量應在100個以上,在數量不多的情況下,至少也應在50個以上。

②將資料分成若干組,並做好記號。分組的數量在5-12之間較為適宜。

③計算組距的寬度。用組數去除最大值和最小值之差,求出組距的寬度。

④計算各組的界限位。各組的界限位可以從第一組開始依次計算,第一組的下界為最小值減去組距的一半,第一組的上界為其下界值加上組距。第二組的下界限位為第一組的上界限值,第二組的下界限值加上組距,就是第二組的上界限位,依此類推。

⑤統計各組資料出現頻數,作頻數分布表。

⑥作直方圖。以組距為底長,以頻數為高,作各組的矩形圖。

在畫頻率分布直方圖時,先選組距還是組數

3樓:

通常需要先初步確定組距,再確定組數。

樣本容量不超過100時,常分成5~12組,組距的選擇力求「取整」。

頻率分布直方圖直觀形象地表示了樣本的頻率分布,從這個直方圖上可以求出樣本資料在各個組的頻率分布,根據頻率分布直方圖估計樣本(或者總體)的平均值時,一般是採取組中值乘以各組的頻率的方法。

擴充套件資料連線頻率分布直方圖中各小長方形上端的中點,就得到頻率分布折線圖.隨著樣本容量的增加,作圖時所分的組數增加,組距減小,相應的頻率分布折線圖就會越來越接近於一條光滑的曲線,統計中稱之為總體密度曲線,它能夠更加精細的反映出總體在各個範圍內取值的百分比。

從頻率分布直方圖可以估計出的幾個資料:

眾數:頻率分布直方圖中最高矩形的底邊中點的橫座標 。

算術平均數:頻率分布直方圖每組數值的中間值乘以頻率後相加。

加權平均數:加權平均數就是所有的頻率乘以數值後的和相加。

中位數:把頻率分布直方圖分成兩個面積相等部分的平行於y軸的直線橫座標。

4樓:匿名使用者

通常需要先初步確定組距,再確定組數(通常組數在5-12之間), 用組距去除最大值和最小值之差,求出組數,需要再確定一下組距是否合適, 以保證使資料不落在相鄰兩組的邊界值上,造成統計的錯誤。

組距,不一定是整數, 但通常情況下, 為了分組的方便而取整數。

組數,一定是整數。

5樓:匿名使用者

先選組距,再確定組數,最後再確定組距,因為為了在統計過程中,使資料不落在相鄰兩組的邊界值上,造成統計的錯誤,必須這麼做。

例如,一組資料有25個,其中極差為9.9,那麼我們可以選擇組距為2,則9.9÷2=4.

95≈5,為了保證我上述所要求,那麼每一組資料便要在精確一位,例如第一組原是4.6~6.6,但實際上為4.

55~6.55。

組距的話,不一定是整數,而通常情況下取整數,是為了分組的方便,而且老師也會要求取整數。

組數,一定是整數。

6樓:人間雜貨店

上面的所有的回答都有點問題吧

都說是先確定組距,再確定組數。

但是從我掌握的知識來說 應該是先確定組數,再確定組距,因為組距不是隨便選的是通過組數算出來的。

而組數也不是隨便定的,一般用數學家史特吉斯提出的公式計算組數,其公式如下:

k=1+3.322*ln(n);這個演算法四捨五入取整就是組數了n是你的數值數量,比如你採集了100個數值。n就是100.

通過這個公式計算出組數以後,再通過組數計算組距組距的計算公式為:極差/組數得出組距。

如果是通過常用採集數數量選擇組數的話,可以通過下標選擇但不管是怎麼選擇 都應該是先確定組數,才能得到組距。

7樓:茶蛋啦啦居然

可是這樣不會更造成差異嗎,還是說這只是在表面上,實際上還是原來的分組。另外,我不能理解組限在分界值上,這不是規定了x大於等於某數

小於某數嗎

如何確定「組距」和「組數」

8樓:禾鳥

1、組數和組距只能確定乙個,沒有限制,只要乙個定了下來,另乙個也就相應的可以按照書上的公式算出來。

組數(通常組數在5-12之間), 用組距去除最大值和最小值之差,求出組數,需要再確定一下組距是否合適, 以保證使資料不落在相鄰兩組的邊界值上,造成統計的錯誤。

2、組距5至12都可以;組數為8。

(最大值-最小值)÷組距=組數所以,(99-60)÷5=七又五分之四(也就是八),所以組數是8。

最大值減最小值除以組距的商的範圍一定要在5至12組之間。

擴充套件資料

組距分組的原則

採用組距分組時,需要遵循「不重不漏」的原則。「不重」是指一項資料只能分在其中的某一組,不能在其他組中重複出現;「不漏」是指組別能夠窮盡,即在所分的全部組別中每項資料都能分在其中的某一組,不能遺漏。

為解決「不重」的問題,統計分組時習慣上規定「上組限不在內」,即當相鄰兩組的上下限重疊時,恰好等於某一組上限的變數值不算在本組內,而計算在下一組內。

組距不一定是整數,但通常情況下為了分組的方便而取整數。組數一定是整數。

9樓:噯衲

這題是這樣算出來的:

(最大值-最小值)÷組距=組數

(99-60)÷5=七又五分之四(也就是八) 所以它的組數是8那個組距是自己定的,那就要假設了,最大值減最小值除以組距的商的範圍一定要在5至12組之間,這樣就可以啦~~

這些都是書本上有的,只要你認真點去看看的話,就一定會的~~

10樓:北極雪

組距分組是將全部變數值依次劃分為若干個區間,並將這一區間的變數值作為一組。組距分組是數值型資料分組的基本形式。在組距分組中,各組之間的取值界限稱為組限,乙個組的最小值稱為下限,最大值稱為上限;上限與下限的差值稱為組距;上限與下限值的平均數稱為組中值,它是一組變數值的代表值。

11樓:匿名使用者

1、先看極值(資料中最大值與最小值之差);

2、適當調整(有時不需要調整),便於分組;

3、分組:一般情況下分組在6~12組。

12樓:快樂方程式

(最大值-最小值)÷組距=組數

(99-60)÷5=七又五分之四(也就是八) 所以它的組數是8那個組距是自己定的,那就要假設了,最大值減最小值除以組距的商的範圍一定要在5至12組之間

由於分組的目的之一是為了觀察資料分布的特徵,因此組數的多少應適中。 如組數太少,資料的分布就會過於集中,組數太多,資料的分布就會過於分散,這都不便於觀察資料分布的特徵和規律。組數的確定應以能夠顯示資料的分布特徵和規律為目的。

組距是乙個組的上限與下限的差,可根據全部資料的最大值和最小值及所分的組數來確定,即組距=(最大值-最小值)÷組數。 採用組距分組時,需要遵循「不重不漏」的原則。「不重」是指一項資料只能分在其中的某一組,不能在其他組中重複出現;「不漏」是指組別能夠窮盡,即在所分的全部組別中每項資料都能分在其中的某一組,不能遺漏。

為解決「不重」的問題,統計分組時習慣上規定「上組限不在內」,即當相鄰兩組的上下限重疊時,恰好等於某一組上限的變數值不算在本組內,而計算在下一組內。根據分組整理成頻數分布表。 所以統計關鍵是分組,然後資料整理就方便了。

在頻率分布直方圖中組距是如何確定的?是假設出來的嗎?

13樓:河傳楊穎

組距=方差/組數,然後向上取整。

各組頻率之和的值為1,在頻率分布直方圖中表現為所有矩形的面積之和等於1。各組的平均頻率密度是指組頻率與組距的比值,是指該組內單位距離上的頻率。以平均頻率密度為縱座標,取代頻率分布直方圖中的頻率,所作的統計圖稱為平均頻率密度直方圖。

平均頻率密度直方圖中所有矩形的面積之和等於1。也就是平均頻率密度直方圖中所有矩形的頂邊與直方圖兩邊界邊及橫軸圍成的圖形的面積等於1。

當樣本量不斷增加而組距不斷減小,每一組的平均頻率密度就非常接近組中值處的頻率密度,此時頻率密度直方圖的矩形頂邊就非常接近一光滑曲線,該曲線就是頻率密度函式曲線。

從頻率分布直方圖可以估計出的幾個資料:

眾數:頻率分布直方圖中最高矩形的底邊中點的橫座標 。

算術平均數:頻率分布直方圖每組數值的中間值乘以頻率後相加。

加權平均數:加權平均數就是所有的頻率乘以數值後的和相加。

中位數:把頻率分布直方圖分成兩個面積相等部分的平行於y軸的直線橫座標。

14樓:假面

組距=方差/組數,然後向上取整。但是組數怎麼確定呢很複雜,8-10組之間然後再微調吧。

在直角座標系中,橫軸表示樣本資料的連續可取數值,按資料的最小值和最大值把樣本資料分為m組,使最大值和最小值落在開區間(a,b)內,a略小於樣本資料的最小值,b略大於樣本資料的最大值。

當樣本量不斷增加而組距不斷減小,每一組的平均頻率密度就非常接近組中值處的頻率密度,此時頻率密度直方圖的矩形頂邊就非常接近一光滑曲線,該曲線就是頻率密度函式曲線。

15樓:匿名使用者

組距的選擇沒有特定的規則,根據資料找出最適合的組距就可以。通常情況下是從5到10為乙個組距。

16樓:擺渡真我

是,首先要根據資料排出正確的組別,再運用組距來得出組中值等