Câu hỏi khởi động: Một cuộc khảo sát đã tiến hành xác định tuổi (theo năm) của 120 chiếc ô tô. Kết quả điều tra được cho trong Bảng 1.
Tìm các số đặc trưng đo xu thế trung tâm (số trung bình cộng, trung vị, tứ phân vị, mốt) cho mẫu số liệu ghép nhóm đó như thế nào cho thuận lợi?
Lời giải:
- Bảng tần số ghép nhóm bao gồm giá trị đại diện và tần số tích lũy như sau:
⦁ Số trung bình cộng của mẫu số liệu ghép nhóm đã cho là:
⦁ Số phần tử của mẫu là n = 120. Ta có = 60.
Mà 42 < 60 < 90 nên nhóm 3 là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bẳng 60.
Xét nhóm 3 là nhóm [8; 12) có r = 8, d = 4, n3 = 48 và nhóm 2 là nhóm [4; 8) có cf2 = 42.
Áp dụng công thức, ta có trung vị của mẫu số liệu đã cho là:
Me = = 9,5.
Do đó tứ phân vị thứ hai là Q2 = Me = 9,5.
⦁ Ta có: = 30 mà 13 < 30 < 42. Suy ra nhóm 2 là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng 30.
Xét nhóm 2 là nhóm [4; 8) có s = 4; h = 4; n2 = 29 và nhóm 1 là nhóm [0; 4) có cf1 = 13.
Áp dụng công thức, ta có tứ phân vị thứ nhất là:
Q1 = (năm).
⦁ Ta có: = 60 mà 42 < 60 < 90. Suy ra nhóm 3 là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng 60.
Xét nhóm 3 là nhóm [8; 12) có r = 8; d = 4; n3 = 48 và nhóm 2 là nhóm [4; 8) có cf2 = 42.
Áp dụng công thức, ta có tứ phân vị thứ hai là:
Q2 = Me = = 9,5 (năm).
⦁ Ta có: = 90 mà cf3 = 90. Suy ra nhóm 3 là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng 90.
Xét nhóm 3 là nhóm [8; 12) có r = 8; d = 4; n3 = 48 và nhóm 2 là nhóm [4; 8) có cf2 = 42.
Áp dụng công thức, ta có tứ phân vị thứ ba là:
Q3 = = 12 (năm).
Vậy tứ phân vị của mẫu số liệu trên là:
Q1 ≈ 6 (năm); Q2 ≈ 9,5 (năm) và Q3 ≈ 12 (năm).
I. Mẫu số liệu ghép nhóm
Hoạt động 1: Trong Bảng 1 ở phần mở đầu ta thấy:
⦁ Có 13 ô tô có độ tuổi dưới 4;
⦁ Có 29 ô tô có độ tuổi từ 4 đến dưới 8.
Hãy xác định số ô tô có độ tuổi:
a) Từ 8 đến dưới 12;
b) Từ 12 đến dưới 16;
c) Từ 16 đến dưới 20.
Lời giải:
a) Có 48 ô tô có độ tuổi từ 8 đến dưới 12;
b) Có 22 ô tô có độ tuổi từ 12 đến dưới 16;
c) Có 8 ô tô có độ tuổi từ 16 đến dưới 20.
Luyện tập 1: Mẫu số liệu ghép nhóm ở Bảng 1 có bao nhiêu số liệu? Bao nhiêu nhóm? Tìm tần số của mỗi nhóm.
Lời giải:
Mẫu số liệu ghép nhóm ở Bảng 1 có 120 số liệu và 5 nhóm
Tần số của các nhóm lần lượt là: 13, 29, 48, 22, 8
Hoạt động 2: Một trường trung học phổ thông chọn 36 học sinh nam của khối 11, đo chiều cao của các bạn học sinh đó và thu được mẫu số liệu sau (đơn vị: centimét):
Lời giải:
Từ mẫu số liệu đã cho ta thấy giá trị nhỏ nhất là 160, giá trị lớn nhất là 175. Do đó ta chia mẫu số liệu đã cho thành 5 nhóm như sau:
[160; 163); [163; 166); [166; 169); [169; 172); [172; 175).
Luyện tập 2: Một thư viện thống kê người đến đọc sách vào buổi tối trong 30 ngày của tháng vừa qua như sau:
Lập bảng tần số ghép nhóm có tám nhóm ứng với tám nửa khoảng sau:
[25; 34); [34; 43); [43; 52); [52; 61); [61; 70); [70; 79); [79; 88); [88; 97).
Lời giải:
Hoạt động 3: Trong Bảng 4, có bao nhiêu số liệu với giá trị không vượt quá giá trị đầu mút phải:
a) 163 của nhóm 1? b) 166 của nhóm 2?
c) 169 của nhóm 3? d) 172 của nhóm 4?
e) 175 của nhóm 5?
Lời giải:
Các giá trị không vượt quá giá trị của đầu mút phải:
a) 163 của nhóm 1: 6
b) 166 của nhóm 2: 18
c) 169 của nhóm 3: 28
d) 172 của nhóm 4: 33
e) 175 của nhóm 5: 36
Luyện tập 3: Trong bài toán ở Luyện tập 2, lập bảng tần số ghép nhóm bao gồm cả tần số tích lũy có tám nhóm ứng với tám nửa khoảng:
[25; 34); [34; 43); [43; 52); [52; 61); [61; 70); [70; 79); [79; 88); [88; 97).
Lời giải:
II. Số trung bình cộng (số trung bình)
Hoạt động 4: Xét mẫu số liệu trong Ví dụ 2 được cho dưới dạng bảng tần số ghép nhóm (Bảng 4).
a) Tìm trung điểm x1 của nửa khoảng (tính bằng trung bình cộng của hai đầu mút) ứng với nhóm 1. Ta gọi trung điểm x1 là giá trị đại diện của nhóm 1.
b) Bằng cách tương tự, hãy tìm giá trị đại diện của bốn nhóm còn lại. Từ đó, hãy hoàn thiện các số liệu trong Bảng 7.
c) Tính giá trị cho bởi công thức sau: .
Giá trị gọi là số trung bình cộng của mẫu số liệu đã cho.
Lời giải:
a) Trung điểm x1 (giá trị đại diện) của nửa khoảng ứng với nhóm 1 là:
x1 = = 161,5.
b) Giá trị đại diện của nửa khoảng ứng với nhóm 2 là:
x2 = = 164,5.
Giá trị đại diện của nửa khoảng ứng với nhóm 3 là:
x3 = = 167,5.
Giá trị đại diện của nửa khoảng ứng với nhóm 4 là:
x4 = = 170,5.
Giá trị đại diện của nửa khoảng ứng với nhóm 5 là:
x5 = = 173,5.
Ta hoàn thiện được Bảng 7 như sau:
c) Số trung bình cộng của mẫu số liệu đã cho là:
= 166,41(6).
Luyện tập 4: Xác định số trung bình cộng của mẫu số liệu ghép nhóm trong bài toán ở Luyện tập 2.
Lời giải:
III. Trung vị
Hoạt động 5: Trong phòng thí nghiệm, người ta chia 99 mẫu vật thành năm nhóm căn cứ trên khối lượng của chúng (đơn vị: gam) và lập bảng tần số ghép nhóm bao gồm cả tần số tích luỹ như Bảng 10.
a) Nhóm 3 là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng = 49,5 có đúng không?
b) Tìm đầu mút trái r, độ dài d, tần số n3 của nhóm 3; tần số tích lũy cf2 của nhóm 2.
c) Tính giá trị Me theo công thức sau: Me = .
Giá trị Me được gọi là trung vị của mẫu số liệu ghép nhóm đã cho.
Lời giải:
Luyện tập 5: Xác định trung vị của mẫu số liệu ghép nhóm ở Bảng 1.
Lời giải:
Ta có bảng tần số tích lũy như sau:
Số phần tử của mẫu là n = 120. Ta có = 60.
Mà 42 < 60 < 90 nên nhóm 3 là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bẳng 60.
Xét nhóm 3 là nhóm [8; 12) có r = 8, d = 4, n3 = 48 và nhóm 2 là nhóm [4; 8) có cf2 = 42.
Áp dụng công thức, ta có trung vị của mẫu số liệu đã cho là:
Me = = 9,5.
IV. Tứ phân vị
Hoạt động 6: Giáo viên chủ nhiệm chia thời gian sử dụng Internet trong một ngày của 40 học sinh thành năm nhóm (đơn vị: phút) và lập bảng tần số ghép nhóm bao gồm cả tần số tích lũy như Bảng 12.
a) Tìm trung vị Me của mẫu số liệu ghép nhóm đó. Trung vị Me còn gọi là tứ phân vị thứ hai Q2 của mẫu số liệu trên.
b) • Nhóm 2 là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng = 10 có đúng không?
⦁ Tìm đầu mút trái s, độ dài h, tần số n2 của nhóm 2; tần số tích luỹ cf1 của nhóm 1. Sau đó, hãy tính giá trị Q1 theo công thức sau: Q1 = .
Giá trị nói trên được gọi là tứ phân vị thứ nhất Q1 của mẫu số liệu đã cho.
c) • Nhóm 3 là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng = 30 có đúng không?
• Tìm đầu mút trái t, độ dài l, tần số n3 của nhóm 3; tần số tích luỹ cf2 của nhóm 2. Sau đó, hãy tính giá trị Q3 theo công thức sau: Q3 = .
Giá trị nói trên được gọi là tứ phân vị thứ ba Q3 của mẫu số liệu đã cho.
Lời giải:
a) Số phần tử của mẫu là
Xét nhóm 3 là nhóm [120 ; 180) có
Áp dụng công thức, ta có trung vị của mẫu số liệu là:
b) Nhóm 2 có tần số tích lũy là 19 => Nhóm 2 là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng
- Nhóm 2 có đầu mút trái s: 60, độ dài h: 60, tần số
- Nhóm 1 có tần số tích lũy là: 6
=>
c) Nhóm 3 có tần số tích lũy là 32 => Nhóm 3 là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng
- Nhóm 3 có đầu mút trái t: 120, độ dài l: 60, tần số
=>
Luyện tập 6: Tìm tứ phân vị của mẫu số liệu trong Bảng 1 (làm tròn các kết quả đến hàng đơn vị).
Lời giải:
Số phần tử của mẫu là n = 120.
⦁ Ta có: = 30 mà 13 < 30 < 42. Suy ra nhóm 2 là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng 30.
Xét nhóm 2 là nhóm [4; 8) có s = 4; h = 4; n2 = 29 và nhóm 1 là nhóm [0; 4) có cf1 = 13.
Áp dụng công thức, ta có tứ phân vị thứ nhất là:
Q1 = (năm).
⦁ Ta có: = 60 mà 42 < 60 < 90. Suy ra nhóm 3 là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng 60.
Xét nhóm 3 là nhóm [8; 12) có r = 8; d = 4; n3 = 48 và nhóm 2 là nhóm [4; 8) có cf2 = 42.
Áp dụng công thức, ta có tứ phân vị thứ hai là:
Q2 = Me = = 9,5 (năm).
⦁ Ta có: = 90 mà cf3 = 90. Suy ra nhóm 3 là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng 90.
Xét nhóm 3 là nhóm [8; 12) có r = 8; d = 4; n3 = 48 và nhóm 2 là nhóm [4; 8) có cf2 = 42.
Áp dụng công thức, ta có tứ phân vị thứ ba là:
Q3 = = 12 (năm).
Vậy tứ phân vị của mẫu số liệu trên là:
Q1 ≈ 6 (năm); Q2 ≈ 9,5 (năm) và Q3 ≈ 12 (năm).
V. Mốt
Hoạt động 7: Quan sát bảng tần số ghép nhóm bao gồm cả tần số tích luỹ ở Ví dụ 6 rồi cho biết:
a) Nhóm nào có tần số lớn nhất;
b) Đầu mút trái và độ dài của nhóm có tần số lớn nhất bằng bao nhiêu.
Lời giải:
a) Nhóm có tần số lớn nhất là: [50 ; 60)
b)
- Đầu mút trái của nhóm là: 50
- Độ dài của nhóm là: 10
Luyện tập 7: Tìm mốt của mẫu số liệu trong Ví dụ 6 (làm tròn các kết quả đến hàng phần mười).
Lời giải:
Ta thấy nhóm 3 là nhóm [50; 60) có tần số lớn nhất với u = 50, g = 10 và n3 = 16.
Nhóm 2 là nhóm [40; 50) có n2 = 10 và nhóm 4 là nhóm [60; 70) có n4 = 8.
Áp dụng công thức, ta có mốt của mẫu số liệu là:
Me = .
Bài tập
Bài tập 1: Mẫu số liệu dưới đây ghi lại tốc độ của 40 ô tô khi đi qua một trạm đo tốc độ (đơn vị: km/h).
a) Lập bảng tần số ghép nhóm cho mẫu số liệu trên có sáu nhóm ứng với sáu nửa khoảng:
[40; 45), [45; 50), [50; 55), [55; 60), [60; 65), [65; 70).
b) Xác định số trung bình cộng, trung vị, tứ phân vị của mẫu số liệu ghép nhóm trên.
c) Mốt của mẫu số liệu ghép nhóm trên là bao nhiêu?
Lời giải:
a) Bảng tần số ghép nhóm bao gồm cả giá trị đại diện là:
b)
- Trung bình cộng là:
- Trung vị là:
Có bảng ghép nhóm bao gồm cả tần số tích lũy là:
Số phần tử của mẫu là
Xét nhóm 3 là nhóm [50 ; 55) có
Áp dụng công thức, ta có trung vị của mẫu số liệu là:
-
Số phần tử của mẫu là
Ta có
Áp dụng công thức, ta có
=>
-
Có
-
Ta có
Áp dụng công thức, ta có
c) Mốt của mẫu số liệu là:
Có nhóm 2 là nhóm có tần số lớn nhất
=>
Bài tập 2: Mẫu số liệu sau ghi lại cân nặng của 30 bạn học sinh (đơn vị: kilôgam):
a) Lập bảng tần số ghép nhóm cho mẫu số liệu trên có tám nhóm ứng với tám nửa khoảng:
[15; 20), [20; 25), [25; 30), [30; 35), [35; 40), [40; 45), [45; 50), [50; 55).
b) Xác định số trung bình cộng, trung vị, tứ phân vị của mẫu số liệu ghép nhóm trên.
c) Mốt của mẫu số liệu ghép nhóm trên là bao nhiêu?
Lời giải:
a) Bảng tần số ghép nhóm cho mẫu số liệu trên như sau:
Nhóm | Tần số |
[15; 20) | 1 |
[20; 25) | 0 |
[25; 30) | 0 |
[30; 35) | 1 |
[35; 40) | 10 |
[40; 45) | 17 |
[45; 50) | 0 |
[50; 55) | 1 |
| n = 30 |
b) Bảng tần số ghép nhóm bao gồm giá trị đại diện và tần số tích lũy như sau:
Nhóm | Giá trị đại diện | Tần số | Tần số tích lũy |
[15; 20) | 17,5 | 1 | 1 |
[20; 25) | 22,5 | 0 | 1 |
[25; 30) | 27,5 | 0 | 1 |
[30; 35) | 32,5 | 1 | 2 |
[35; 40) | 37,5 | 10 | 12 |
[40; 45) | 42,5 | 17 | 29 |
[45; 50) | 47,5 | 0 | 29 |
[50; 55) | 52,5 | 1 | 30 |
|
| n = 30 |
|
⦁ Số trung bình cộng của mẫu số liệu ghép nhóm đã cho là:
⦁ Số phần tử của mẫu là n = 30. Ta có = 15.
Mà 12 < 15 < 29 nên nhóm 6 là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng 15.
Xét nhóm 6 là nhóm [40; 45) có r = 40, d = 5, n6 = 17 và nhóm 5 là nhóm [35; 40) có cf5 = 12.
Áp dụng công thức, ta có trung vị của mẫu số liệu là:
Me = (kg).
Do đó tứ phân vị thứ hai là Q2 = Me ≈ 40,9 (kg).
⦁ Ta có = 7,5. Mà 2 < 7,5 < 12 nên nhóm 5 là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng 7,5.
Xét nhóm 5 là nhóm [35; 40) có s = 35; h = 5; n5 = 10 và nhóm 4 là nhóm [30; 35) có cf4 = 2.
Áp dụng công thức, ta có tứ phân vị thứ nhất là:
Q1 = = 37,75 (kg).
⦁ Ta có = 22,5. Mà 12 < 22,5 < 29 nên nhóm 6 là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng 22,5.
Xét nhóm 6 là nhóm [40; 45) có t = 40; l = 5; n4 = 17 và nhóm 5 là nhóm [35; 40) có cf5 = 12.
Áp dụng công thức, ta có tứ phân vị thứ ba là:
Q3 = (kg).
c) Nhóm 6 là nhóm [40; 45) có tần số lớn nhất với u = 40, g = 5, n6 = 17 và nhóm 5 có tần số n5 = 10, nhóm 7 có tần số n7 = 0.
Áp dụng công thức, ta có mốt của mẫu số liệu là:
Mo = (kg).
Bài tập 3: Bảng 15 cho ta bảng tần số ghép nhóm số liệu thống kê chiều cao của 40 mẫu cây ở một vườn thực vật (đơn vị: centimét).
a) Xác định số trung bình cộng, trung vị, tứ phân vị của mẫu số liệu ghép nhóm trên.
b) Mốt của mẫu số liệu ghép nhóm trên là bao nhiêu?
Lời giải:
a) Bảng tần số ghép nhóm bao gồm giá trị đại diện và tần số tích lũy như sau:
Nhóm | Giá trị đại diện | Tần số | Tần số tích lũy |
[30; 40) | 35 | 4 | 4 |
[40; 50) | 45 | 10 | 14 |
[50; 60) | 55 | 14 | 28 |
[60; 70) | 65 | 6 | 34 |
[70; 80) | 75 | 4 | 38 |
[80; 90) | 85 | 2 | 40 |
|
| n = 40 |
|