1. Số liệu ghép nhóm
- Mẫu số liệu ghép nhóm là thường được trình bày dưới dạng bảng thống kê có dạng như sau:
Bảng 1. Bảng tần số ghép nhóm
- Bảng trên gồm k nhóm \({\rm{[}}{u_i};{u_{i + 1}})\) với \(1 \le j \le k\), mỗi nhóm gồm một số giá trị được ghép theo một tiêu chí xác định.
- Cỡ mẫu \(n = {n_1} + ... + {n_k}\)
- Giá trị chính giữ mỗi nhóm được dùng làm giá trị đại diện.
- Hiệu \({u_{i + 1}} - {u_i}\)được gọi là độ dài của nhóm \({\rm{[}}{u_i};{u_{i + 1}})\)
- Một số quy tắc ghép nhóm của mẫu số liệu
- Sử dụng từ \(k = 5\) đến \(k = 20\) nhóm. Cỡ mẫu càng lớn thì cần càng nhiều nhóm số liệu.
- Các nhóm có cùng độ dài bằng L thỏa mãn R<k, trong đó R là khoảng biến thiên, k là số nhóm.
- Giá trị nhỏ nhất của mẫu thuộc vào nhóm\({\rm{[}}{u_1};{u_2})\) và càng gần \({u_1}\) càng tốt. Giá trị lớn nhất của mẫu thuộc nhóm \({\rm{[}}{u_k};{u_{k + 1}})\) và càng gần \({u_{k + 1}}\) càng tốt.
* Chú ý:
Các đầu mút của nhóm có thể không là giá trị của mẫu số liệu.
2. Số trung bình
Advertisements (Quảng cáo)
Số trung bình của mẫu số liệu ghép nhóm kí hiệu là \(\overline x \) được tính như sau:
\(\overline x = \frac{{{n_1}{c_1} + ... + {n_k}{c_k}}}{n}\)
Trong đó, \(n = {n_1} + ... + {n_k}\) là cỡ mẫu.
Ý nghĩa: Số trung bình của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho số trung bình của mẫu số liệu gốc. Nó thường dùng để đo xu thế trung tâm của mẫu số liệu.
3. Mốt
- Nhóm chứa mốt của mẫu số liệu ghép nhóm là nhóm có tần số lớn.
Giả sử nhóm chứa mốt là: \({\rm{[}}{u_m};{u_{m + 1}})\).Khi đó mốt của mẫu số liệu ghép nhóm, kí hiệu là \({M_o}\) được xác định bời công thức:
\({M_o} = {u_m} + \frac{{{n_m} - {n_{m - 1}}}}{{\left( {{n_m} - {n_{m - 1}}} \right) + \left( {{n_m} - {n_{m + 1}}} \right)}}.\left( {{u_{m + 1}} - {u_m}} \right)\)
- Chú ý:
- Nếu không có nhóm kề trước của nhóm chứa mốt thì \({n_{m - 1}} = 0\). Nếu không có hóm kề sau của nhóm chứa mốt thì \({n_{m + 1}} = 0\).
- Mốt của mẫu số liệu ghép nhóm là giá trị có khả năng xuất hiện cao nhất khi lấy mốt của mẫu số liệu sau khi ghép nhóm \({M_o}\) xấp xỉ với mốt của mẫu số liệu không ghép nhóm. Các giá trị nằm xung quanh \({M_o}\) thường có khả năng xuất hiện cao hơ các giá trị khác.
- Một mẫu có thể không có mốt hoặc có nhiều hơn một mốt.