- by Đạt Vũ
- 29/12/22
Loading
Một giả thuyết thống kê (statistical hypothesis) là một giả định về một tham số của tổng thể (population parameter). Giả định này có thể đúng hoặc không đúng. Kiểm định giả thuyết là tập hợp các bước mà nhà thống kê sử dụng để chấp nhận hay bác bỏ các giả thuyết thống kê.
Cách tốt nhất để quyết định xem một giả thuyết thống kê đúng hay không là xem xét toàn bộ tổng thể. Trong hầu hết trường hợp, điều này không khả thi nên các nhà nghiên cứu thường nghiên cứu một mẫu ngẫu nhiên từ một tổng thể. Nếu kết quả thu được không khớp với giả thuyết thống kê, thì giả thuyết bị bác bỏ.
Có 2 loại giả thuyết thống kê.
Ví dụ, giả sử chúng ta muốn quyết định xem liệu một đồng tiền xu có đồng chất và cân đối hay không. Một giả thuyết không có thể là Một nửa số lần tung sẽ ra mặt sấp, một nửa số lần còn lại sẽ ra mặt ngửa. Giả thuyết nghịch có thể là Số lần xuất hiện mặt sấp và mặt ngửa sẽ rất khác nhau.
Chúng ta ký hiệu như sau:
H0: P = 0.5
Ha: P ≠ 0.5
Giả sử chúng ta tung đồng xu 50 lần, 40 lần xuất hiện mặt ngửa, 10 lần xuất hiện mặt sấp. Nếu thu được kết quả này, chúng ta sẽ nghiêng về hướng để bác bỏ giả thuyết không. Chúng ta có thể đưa ra kết luận, dựa trên bằng chứng thu được, đồng xu có thể không đồng chất và mất cân đối.
Một số nhà nghiên cứu nói rằng một bài kiểm định giả thuyết có thể có một trong hai kết quả: chấp nhận giả thuyết không hoặc bác bỏ giả thuyết không. Nhiều nhà thống kê lại dè chừng hơn trong việc dùng cụm từ “chấp nhận giả thuyết không”. Thay vào đó, họ nói: bác bỏ giả thuyết không hoặc thất bại trong việc bác bỏ giả thuyết không.
Tại sao lại có sự phân biệt giữa “chấp nhận” và “thất bại trong việc bác bỏ”? Chấp nhận ngụ ý rằng giả thuyết không là đúng. Thất bại trong việc bác bỏ ngụ ý rằng dữ liệu ta có không đủ thuyết phục để chúng ta chọn giả thuyết nghịch thay thế cho giả thuyết không.
Các nhà thống kê tuân theo một quá trình chuẩn mực để đưa ra quyết định bác bỏ một giả thuyết không hay không, dựa trên một dữ liệu mẫu. Quá trình này gọi là kiểm định giả thuyết (hypothesis testing), bao gồm 4 bước sau đây:
Để đưa ra được quyết đinh bác bỏ giả thuyết không, các nhà thống kê cần dựa vào những quy tắc nhất định. Những quy tắc này được liệt kê trong kế hoạch phân. Theo thông lệ, các nhà thống kê mô tả những quy tắc quyết định này theo 2 cách – tham chiếu tới một giá trị P-value hoặc tham chiếu tới vùng chấp nhận (region of acceptance).
Tập giá trị nằm ngoài khu vực chấp nhận được gọi là khu vực bác bỏ. Nếu thống kê mẫu nằm trong khu vực bác bỏ, giả thuyết không bị bác bỏ. Trong những trường hợp này, chúng ta nói rằng, giả thuyết đã bị bác bỏ ở mức ý nghĩa α.
Những cách tiếp cận này tương đương nhau. Một số tài liệu thống kê sử dụng cách tiếp cận P-value, một số khác sử dụng vùng chấp nhận. Trong website này, chúng tôi sử dụng cách tiếp cận vùng chấp nhận.
Nếu một bài kiểm định giả thuyết thống kê có vùng bác bỏ chỉ là một bên của phân phối mẫu thì được gọi là kiểm định một đuôi (one-tailed test). Ví dụ, giả sử giả thuyết không chỉ ra rằng trung bình nhỏ hơn hoặc bằng 10. Giả thuyết nghịch sẽ là trung bình lớn hơn 10. Vùng bác bỏ sẽ bao gồm dãy số ở phía bên phải của phân phối mẫu, đó là, dãy các số lớn hơn 10.
Nếu một bài kiểm định giả thuyết thống kê có vùng bác bỏ ở cả hai bên của phân phối mẫu thì được gọi là bài kiểm định hai đuôi (two-tailed test). Ví dụ, giả sử giả thuyết không chỉ ra rằng trung bình bằng 10. Giả thuyết nghịch sẽ là trung bình nhỏ hơn 10 hoặc lớn hơn 10. Vùng bác bỏ bao gồm các số ở cả 2 phía của phân phối mẫu, đó là vùng dãy các số nhỏ hơn 10 và lớn hơn 10
2 Bình luận: