Mở đầu: Để xác định độ ổn định của một máy đo độ ẩm không khí, người ta dùng máy này để đo 20 lần. Nếu độ lệch chuẩn của mẫu số liệu đo lớn hơn 0,15 thì người ta sẽ đưa máy đo đi sửa chữa. Trong một lần lấy mẫu, kĩ thuật viên có được mẫu số liệu ghép nhóm như sau:
Liệu có cần đưa máy đo này đi sửa chữa hay không?
Trả lời:
Chọn giá trị đại diện cho mẫu số liệu ta có:
Độ ẩm trung bình là: .
Phương sai:
.
Độ lệch chuẩn là: .
Vì s = 0,102 < 0,15 do đó không cần đưa máy đo này đi sửa chữa.
1. Phương sai và độ lệch chuẩn
Hoạt động 1: Trở lại bài toán trong tình huống mở đầu. Gọi x1, …, x¬20 là các kết quả đo (mẫu số liệu gốc).
a) Có thể tính được chính xác phương sai và độ lệch chuẩn của mẫu số liệu gốc hay không?
b) Thảo luận và đề xuất ước lượng cho phương sai và độ lệch chuẩn của mẫu số liệu gốc.
Trả lời:
a. Không thể tính được chính xác phương sai và độ lệch chuẩn của mẫu số liệu gốc.
b. Tính phương sai và độ lệch chuẩn thông qua số liệu của mẫu số liệu ghép nhóm như sau:
+ Tìm lần lượt là giá trị đại diện của các nhóm
;
;
;
;
.
+ Tính số trung bình cộng của mẫu số liệu ghép nhóm đó.
+ Tính phương sai:
+ Tính độ lệch chuẩn: .
=> Khi đó, phương sai và độ lệch chuẩn của mẫu số liệu gốc lần lượt xấp xỉ với các giá trị và
.
Luyện tập 1: Một vận động viên luyện tập chạy cự li 100 m đã ghi lại kết quả luyện tập như sau:
Tìm phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm này. Phương sai và độ lệch chuẩn cho biết điều gì?
Trả lời:
Chọn giá trị đại diện cho mẫu số liệu ta có:

Tổng số vận động viên là: 3 + 7 + 8 + 2 = 20.
Thời gian chạy trung bình là: .
Phương sai của mẫu số liệu là
.
Độ lệch chuẩn của mẫu số liệu là: .
Dựa vào phương sai và độ lệch chuẩn ta có kết luận rằng mẫu số liệu kết quả luyện tập có tính đồng đều, dữ liệu có xu hướng gần giá trị trung bình và ít bị phân tán.
Vận dụng: Hãy tính độ lệch chuẩn của mẫu số liệu ghép nhóm cho bài toán trong tình huống mở đầu và cho biết có cần đưa máy đi sửa chữa hay không?
Trả lời:
Chọn giá trị đại diện cho các nhóm số liệu, ta có:
Độ ẩm trung bình trong 20 lần đo là:
Phương sai của mẫu số liệu ghép nhóm là:
Độ lệch chuẩn của mẫu số liệu là:
Vì nên không cần đưa máy đo này đi sửa chữa.
Bài tập
Bài 3.4: Kiểm tra khối lượng của 30 bao xi măng (đơn vị: kg) được chọn ngẫu nhiên trước khi xuất xưởng cho kết quả như sau:
a) Thay dấu “?” bằng số thích hợp để hoàn thiện mẫu số liệu ghép nhóm sau.
b) Tính phương sai và độ lệch chuẩn của mẫu số liệu gốc và mẫu số liệu ghép nhóm. Giá trị nào là giá trị chính xác? Giá trị nào là giá trị xấp xỉ?
Trả lời:
a) Chọn giá trị đại diện cho mẫu số liệu ta có:
b) Mẫu số liệu gốc
Giá trị trung bình là:
Ta có bảng sau
Tổng bình phương độ lệch là: .
Khi đó phương sai: .
Độ lệch chuẩn là .
Mẫu số liệu ghép nhóm
Chọn giá trị đại diện cho mẫu số liệu ta có:
Giá trị trung bình là:
.
Phương sai:
.
Độ lệch chuẩn: .
Giá trị mẫu số liệu gốc là chính xác, giá trị mẫu số liệu ghép nhóm là xấp xỉ.
Bài 3.5: Tuổi thọ của một số linh kiện điện tử (đơn vị: năm) được sản cuất bởi hai phân xưởng được cho như sau:
Tìm phương sai và độ lệch chuẩn của mỗi mẫu số liệu ghép nhóm và nhận xét về độ phân tán của tuổi thọ các linh kiện điện tử được sản xuất bởi mỗi phân xưởng.
Trả lời:
Ta có bảng số liệu với giá trị đại diện:
Giá trị trung bình: ; phương sai:
; độ lệch chuẩn:
Xét phân xưởng 2:
Giá trị trung bình: ; phương sai:
; độ lệch chuẩn:
Vì nên độ phân tán của phân xưởng 1 lớn hơn độ phân tán của phân xưởng 2.
Bài 3.6: Một nhóm 20 học sinh dùng một thiết bị đo đường kính của một nhân tế bào cho kết quả như sau:
a) Tính số trung bình và độ lệch chuẩn của mẫu số liệu ghép nhóm trên.
b) Số trung bình và độ lệch chuẩn cho biết thông tin gì?
Trả lời:
Chọn giá trị đại diện cho mẫu số liệu ta có:
a) .
.
.
b) Dữ liệu cho thấy đường kính của các nhân tế bào có mức độ biến động nhỏ và gần giá trị trung bình. Điều này có thể thấy được mức độ đồng đều trong kích thước của các nhân tế bào hoặc quy trình đo lường được thực hiện một cách chính xác.
Bài 3.7: Thời gian chạy tập luyện cự li 100m cuả hai vận động viên được cho trong bảng sau:
Dựa trên độ lệch chuẩn của các mẫu số liệu ghép nhóm, hãy cho biết vận động viên nào có thành tích luyện tập ổn định hơn.
Trả lời:
Ta có bảng số liệu với giá trị đại diện:
Xét vận động viên A:
Giá trị trung bình: ; phương sai:
; độ lệch chuẩn:
Xét vận động viên B:
Giá trị trung bình: ; phương sai:
; độ lệch chuẩn:
Vì nên vận động viên A có thành tích Giải chi tiết Luyện tập ổn định hơn.
Bài 3.8: Có nên dùng phương sai (hoặc độ lệch chuẩn) để so sánh độ phân tán của hai mẫu số liệu ghép nhóm trong mỗi trường hợp sau không? Tại sao?
a) Các mẫu số liệu ghép nhóm về điểm thi tốt nghiệp môn Toán của học sinh hai trường trung học phổ thông có chất lượng tương đương.
b) Các mẫu số liệu ghép nhóm về doanh thu của 100 cửa hàng bán lẻ và doanh thu của 100 siêu thị.
Trả lời:
a) Trong trường hợp các mẫu số liệu ghép nhóm về đểm thi tốt nghiệp môn Toán của học sinh hai trường trung học phổ thông có chất lượng tương đương, phương sai hoặc độ lệch chuẩn có thể được sử dụng để so sánh độ phân tán của hai mẫu số liệu vì chất lượng hai trường là tương đương. Dùng phương sai hoặc độ lệch chuẩn giúp đánh giá mức độ biến động của điểm thi từ đó so sánh độ phân tán giữa hai trường.
b) Trong trường hợp này việc sử dụng phương sai hoặc độ lệch chuẩn để so sánh độ phân tán có thể không phản ánh đúng bản chất của dữ liệu. Vì doanh thu thường có phân phối không đồng đều, có nhiều yếu tố ảnh hưởng đến doanh thu của từng cửa hàng hoặc siêu thị. Do đó việc sử dụng phương sai hoặc độ lệch chuẩn không phải là phương pháp phù hợp để so sánh độ phân tán của doanh thu của hai nhóm này.