Mở đầu: Một cửa hàng đã ghi lại số tiền bán xăng cho 35 khách hàng đi xe máy. Mẫu số liệu gốc có dạng: x1, x2, ..., x35 trong đó xi là số tiền bán xăng cho khách hàng thứ i. Vì một lí do nào đó, cửa hàng chỉ có mẫu số liệu ghép nhóm dạng sau:
Số tiền (nghìn đồng) | [0; 30) | [30; 60) | [60; 90) | [90; 120) |
Số khách hàng | 3 | 15 | 10 | 7 |
Bảng 3.1. Số tiền khách hàng mua xăng
Dựa trên mẫu số liệu ghép nhóm này, làm thế nào để ước lượng các số đặc trưng đo xu thế trung tâm (số trung bình, trung vị, tứ phân vị, mốt) cho mẫu số liệu gốc?
Trả lời:
+) Số trung bình
Trong mỗi khoảng số tiền, giá trị đại diện là trung bình cộng của giá trị hai đầu mút nên ta có bảng sau:
Số tiền (nghìn đồng) | 15 | 45 | 75 | 105 |
Số khách hàng | 3 | 15 | 10 | 7 |
Tổng số khách hàng là n = 35. Số tiền bán xăng trung bình của 35 khách hàng là
(nghìn đồng).
Do đó, số trung bình cho mẫu số liệu gốc khoảng 63 nghìn đồng.
+) Số trung vị, tứ phân vị
Cỡ mẫu là n = 35.
Gọi x1, x2, ..., x35 là số tiền xăng của 35 khách hàng và giả sử dãy này đã được sắp xếp theo thứ tự tăng dần. Khi đó, trung vị là x18. Do x18 thuộc nhóm [30; 60) nên nhóm này chứa trung vị. Do đó, p = 2; a2 = 30; m2 = 15; m1 = 3; a3 – a2 = 60 – 30 = 30 và ta có
.
Tứ phân vị thứ nhất Q1 là x9. Do x9 thuộc nhóm [30; 60) nên nhóm này chứa Q1. Do đó, p = 2; a2 = 30; m2 = 15; m1 = 3; a3 – a2 = 60 – 30 = 30 và ta có
.
Tứ phân vị thứ ba Q3 là x27. Do x27 thuộc nhóm [60; 90) nên nhóm này chứa Q3. Do đó, p = 3; a3 = 60; m3 = 10; m1 + m2 = 3 + 15 = 18; a4 – a3 = 90 – 60 = 30 và ta có
.
Tứ phân vị thứ hai Q2 = Me = 59.
Do đó, trung vị của mẫu số liệu gốc khoảng 59 và các tứ phân vị khoảng 41,5; 59; 84,75.
+) Mốt
Tần số lớn nhất là 15 nên nhóm chứa mốt là nhóm [30; 60). Ta có, j = 2, a2 = 30, m2 = 15, m1 = 3, m3 = 10, h = 30. Do đó
.
Vậy mốt của mẫu số liệu gốc xấp xỉ 51,18.
1. Số trung bình của mẫu số liệu ghép nhóm
Hoạt động 1: Khảo sát thời gian tự học của các học sinh trong lớp theo mẫu bên.
a) Hãy lập bảng thống kê cho mẫu số liệu ghép nhóm thu được.
b) Có thể tính chính xác thời gian tự học trung bình của các học sinh trong lớp không?
c) Có cách nào tính gần đúng thời gian tự học trung bình của các học sinh trong lớp dựa trên mẫu số liệu ghép nhóm này không?
Trả lời:
a) Giả sử lớp 11A có 30 học sinh và sau khi khảo sát, ta có được bảng thống kê như sau:
b) Ta không thể tính chính xác thời gian tự học trung bình của các học sinh trong lớp vì không có mẫu số liệu cụ thể về thời gian tự học của từng học sinh, chúng ta chỉ có thể tinh số gần đúng thời gian tự học trung bình của các học sinh trong lớp
c) Giá trị đại diện của nhóm bằng trung bình giá trị đầu mút phải và trái của nhóm đó
Nhóm
Số trung binh của mẫu số liệu:
Luyện tập 1: Tìm hiểu thời gian xem ti vi trong tuần trước (đơn vị: giờ) của một số học sinh thu được kết quả sau:
Tính thời gian xem ti vi trung bình trong tuần trước của các bạn học sinh này.
Trả lời:
Trong mỗi khoảng thời gian, giá trị đại diện là trung bình cộng của giá trị hai đầu mút nên ta có bảng sau:
Tổng số học sinh là n = 8 + 16 + 4 + 2 + 2 = 32. Thời gian xem ti vi trung bình trong tuần trước của các học sinh là
(giờ).
2. Trung vị của mẫu số liệu ghép nhóm
Hoạt động 2: Cho mẫu số liệu ghép nhóm về chiều cao của 21 cây na giống
Gọi
Trả lời:
Cỡ mẫu n = 3 + 8 + 7 + 3 = 21
Suy ra trung vị là
Luyện tập 2: Ghi lại tốc độ bóng trong 200 lần giao bóng của một vận động viên môn quần vợt cho kết quả như bảng bên.
Tính trung vị của mẫu số liệu ghép nhóm này.
Trả lời:
Cỡ mẫu là n = 200.
Gọi x1, x2, ..., x200 là tốc độ giao bóng của vận động viên trong 20 lần giao bóng và giả sử dãy này đã được sắp xếp theo thứ tự tăng dần. Khi đó, trung vị là . Do 2 giá trị x100, x101 thuộc nhóm [165; 170) (vì 18 + 28 + 35 + 43 = 124) nên nhóm này chứa trung vị. Do đó, p = 4; a4 = 165; m4 = 43; m1 + m2 + m3 = 18 + 28 + 35 = 81; a5 – a4 = 170 – 165 = 5 và ta có
.
3. Tứ phân vị của mẫu số liệu ghép nhóm
Hoạt động 3: Với mẫu số liệu ghép nhóm cho trong HĐ2, hãy cho biết tứ phân vị thứ nhất
Trả lời:
Cỡ mẫu là: n = 21
Suy ra tứ phân vị thứ nhất
Tứ phân vị thứ ba
Luyện tập 3: Tìm tứ phân vị thứ nhất và tứ phân vị thứ ba cho mẫu số liệu ghép nhóm ở Luyện tập 2.
Trả lời:
Cỡ mẫu là n = 200.
Tứ phân vị thứ nhất Q1 là . Do x50, x51 đều thuộc nhóm [160; 165) nên nhóm này chứa Q1. Do đó, p = 3; a3 = 160; m3 = 35; m1 + m2 = 18 + 28 = 46; a4 – a3 = 165 – 160 = 5 và ta có
.
Tứ phân vị thứ ba Q3 là . Do x150, x151 đều thuộc nhóm [170; 175) nên nhóm này chứa Q3. Do đó, p = 5; a5 = 170; m5 = 41; m1 + m2 + m3 + m4 = 18 + 28 + 35 + 43 = 124; a6 – a5 = 175 – 170 = 5 và ta có
.
4. Mốt của mẫu số liệu ghép nhóm
Hoạt động 4: Với số liệu cho trong Luyện tập 1:
a) Có thể tìm được giá trị chính xác cho mốt của mẫu số liệu gốc về thời gian xem ti vi của học sinh không?
b) Mốt thuộc nhóm nào là hợp lí nhất? Nên lấy số nào trong nhóm để ước lượng được cho mốt?
Trả lời:
a) không thể tìm được giá trị chính xác cho mốt của mẫu số liệu gốc về thời gian xem ti vi của học sinh
b) Tần số lớn nhất là 16 nên nhóm chứa mốt là [5;10)
Ta có
Do đó:
Luyện tập 4: Thời gian (phút) để học sinh hoàn thành một câu hỏi thi được cho như sau:
Tìm mốt của mẫu số liệu ghép nhóm này.
Trả lời:
Tần số lớn nhất là 10 nên nhóm chứa mốt là nhóm [10,5; 20,5).
Ta có, j = 2; a2 = 10,5; m2 = 10; m1 = 2; m3 = 6; h = 20,5 – 10,5 = 10. Do đó, mốt của mẫu số liệu ghép nhóm này là
.
Vận dụng: Hãy tính các số đặc trung cho mẫu số liệu trong Bảng 3.1 và giải thích ý nghĩa của các giá trị thu được.
Trả lời:
Ta có:
Số trung bình là:
Cỡ mẫu là: n= 3 + 15 + 10 + 7 =35
Ý nghĩa: Xấp xỉ bằng số trung bình của mẫu số liệu gốc, cho biết vị trí trung tâm của mẫu số liệu và đại diện cho mẫu số liệu
Trung vị là
Ý nghĩa: Xấp xỉ bằng trung vị của mẫu số liệu gốc, chia mẫu số liệu thành 2 phần , mỗi phần chứa 50% giá trị
Tứ phân vị thứ nhất
Ý nghĩa: Có 25% số giá trị nhỏ hơn 41.5
Tứ phân vị thứ ba
Ý nghĩa: Có 75% số giá trị nhỏ hơn 54.75%
Tần số lớn nhất là 15 nên mốt thuộc nhóm [30;60). Ta có,
Ý nghĩa: Xấp xỉ bằng mốt của mẫu số liệu gốc, được dùng để đo xu thế trung tâm của mẫu số liệu
Bài tập
Bài 3.4: Quãng đường (km) đi từ nhà đến nơi làm việc của 40 công nhân một nhà máy được ghi lại như sau:
a) Ghép nhóm dãy số liệu trên thành các khoảng có độ rộng bằng nhau, khoảng đầu tiên là [0; 5). Tìm giá trị đại diện cho mỗi nhóm.
b) Tính số trung bình của mẫu số liệu không ghép nhóm và mẫu số liệu ghép nhóm. Giá trị nào chính xác hơn?
c) Xác định nhóm chứa mốt của mẫu số liệu ghép nhóm thu được.
Trả lời:
a) Giá trị nhỏ nhất của mẫu số liệu là 2, giá trị lớn nhất của mẫu số liệu là 32, do đó khoảng biến thiên là 32 – 2 = 30.
Các nhóm có độ rộng bằng nhau và độ rộng của mỗi nhóm là 5. Để cho thuận tiện, ta chia thành 7 nhóm là các nhóm [0; 5), [5; 10), [10; 15), [15; 20), [20; 25), [25; 30), [30; 35). Đếm số giá trị thuộc mỗi nhóm, ta có mẫu số liệu ghép nhóm như sau:
Giá trị đại diện cho mỗi nhóm là trung bình của hai đầu mút của nhóm. Ta có bảng giá trị đại diện như sau:
b) Số trung bình của mẫu số liệu ghép nhóm là
.
Ta có: 5 + 3 + 10 + 20 + 25 + 11 + 13 + 7 + 12 + 31 + 19 + 10 + 12 + 17 + 18 + 11 + 32 + 17 + 16 + 2 + 7 + 9 + 7 + 8 + 3 + 5 + 12 + 15 + 18 + 3 + 12 + 14 + 2 + 9 + 6 + 15 + 15 + 7 + 6 + 12 = 476.
Số trung bình của mẫu số liệu không ghép nhóm là .
Giá trị trung bình của mẫu số liệu không ghép nhóm chính xác hơn vì nó là giá trị của mẫu số liệu gốc.
c) Tần số lớn nhất trong bảng tần số của mẫu số liệu ghép nhóm là 11. Do đó, nhóm chứa mốt của mẫu số liệu ghép nhóm là các nhóm [5; 10) và [10; 15).
Bài 3.5: Tuổi thọ (năm) của 50 bình ắc quy ô tô được cho như sau:
a) Xác định mốt và giải thích ý nghĩa.
b) Tính tuổi thọ trung bình của 50 bình ắc quy ô tô này.
Trả lời:
a) Tần số lớn nhất là 14 nên nhóm chứa mốt là nhóm [3; 3,5). Ta có, j = 3, a3 = 3, m3 = 14, m2 = 9, m4 = 11, h = 0,5. Do đó mốt của mẫu số liệu ghép nhóm là
.
Ý nghĩa: Tuổi thọ của bình ắc quy ô tô khoảng 3,3125 năm là nhiều nhất hay tuổi thọ chủ yếu của bình ắc quy ô tô khoảng 3,3125 năm.
b) Trong mỗi khoảng tuổi thọ, giá trị đại diện là trung bình cộng của giá trị hai đầu mút nên ta có bảng sau:
Tổng số ắc quy ô tô là 50. Tuổi thọ trung bình của 50 ắc quy ô tô này là
(năm).
Bài 3.6: Điểm thi môn Toán (thang điểm 100, điểm được làm tròn đến 1) của 60 thí sinh được cho trong bảng sau:
a) Hiệu chỉnh để thu được mẫu số liệu ghép nhóm dạng Bảng 3.2.
b) Tìm các tứ phân vị và giải thích ý nghĩa của chúng.
Trả lời:
a)
b) Cỡ mẫu n = 60
Tứ phân vị thứ nhất
Ý nghĩa: Có 25% số giá trị nhỏ hơn 41.3
Tứ phân vị thứ hai tức
Ý nghĩa: Có 50% số giá trị nhỏ hơn 51.67
Tứ phân vị thứ ba
Ý nghĩa: Có 75% số giá trị nhỏ hơn 65
Bài 3.7: Phỏng vấn một số học sinh khối 11 về thời gian (giờ) ngủ của một buổi tối, thu được bảng số liệu ở bên.
a) So sánh thời gian ngủ trung bình của các bạn học sinh nam và nữ.
b) Hãy cho biết 75% học sinh khối 11 ngủ ít nhất bao nhiêu giờ?
Trả lời:
a)
Thời gian ngủ trung bình của các bạn nam
Thời gian ngủ trung bình của các bạn nữ
6.77 > 6.52. Như vậy thời gian ngủ trung bình của các bạn nữ nhiều hơn các bạn nam
b) Cỡ mẫu n = 86
Tứ phân vị thứ ba
Vậy 75% học sinh khối 11 ngủ ít nhất 7,675 giờ.