Nguyên tắc của kiểm định thống kê trong nghiên cứu là đưa ra các giả thuyết về mối quan hệ giữa các khái niệm trong tổng thể, thu thập thông tin từ mẫu để kiểm định các giả thuyết đã đưa ra. Quy trình kiểm định các giả thuyết nghiên cứu có thể được chia thành năm bước như sau:
1. Thiết lập giả thuyết cần kiểm định
2. Chọn mức ý nghĩa a
3. Chọn phép kiểm định thích hợp và tính giá trị thống kê kiểm định của nó
4. Xác định giá trị tới hạn của phép kiểm định
5. So sánh giá trị kiểm định với giá trị tới hạn để ra quyết định
Bước 1. Thiết lập giả thuyết kiểm định
Trong thống kê, chúng ta có hai dạng giả thuyết: giả thuyết không (null hypothesis), ký hiệu là H0, và giả thuyết thay thế (alternative hypothesis). Gọi là giả thuyết không là vì phát biểu của nó thường bằng không (bằng 0, không khác biệt,…). Ví dụ, không có mối quan hệ giữa tiền lương và sự hài lòng trong công việc (mối quan hệ giữa giữa chúng bằng không), sự hài lòng công việc của nhân viên nam không giống với nhân viên nữ,…
Trong nghiên cứu, giả thuyết chúng ta muốn kiểm định là giả thuyết thay thế chứ không phải H0. Giả thuyết thay thế là giả thuyết nghiên cứu ký hiệu là HR (research hypothesis) hoặc H1, và được thiết lập dựa vào lý thuyết nền. Vì vậy khi kiểm định lý thuyết khoa học, chúng ta luôn mong muốn giả thuyết này được chấp nhận. Lấy ví dụ nhà nghiên cứu đưa ra giả thuyết là “có mối quan hệ giữa mức độ nhận biết thương hiệu và ý định sử dụng sản phẩm của thương hiệu” (giả thuyết H1). Giả thuyết H0 là không có mối quan hệ này.
Bước 2. Chọn mức ý nghĩa alpha α
Như chúng ta đã biết, mức ý nghĩa alpha α là mức độ chấp nhận sai lầm của nghiên cứu. Trong nghiên cứu kiểm định lý thuyết khoa học trong ngành kinh doanh, mức ý nghĩa thường được chọn là 5%. Ba mức α phổ biến thường được báo cáo trong các kết quả là 10% (0.1), 5% (0.05) và 1% (0.01). Vì vậy, khi kiểm định giả thuyết nghiên cứu, các báo cáo thường viết ở dạng: p < 0.1, p < 0.05 hay p < 0.01. Ví dụ, chúng ta thường kết luận là: Kết quả kiểm định cho thấy giả thuyết H1 được chấp nhận tại mức ý nghĩa 0.05.
Chúng ta cần chú ý thêm một số điểm. Một là, mức 5% là mức được sử dụng phổ biến trong lĩnh vực kinh tế – tiếp thị (và nhiều lĩnh vực xã hội khác). Tuy nhiên đó không phải là mức bắt buộc. Chúng ta có thể chọn mức 10%. Khi chọn mức ý nghĩa α là 10%, chúng ta đã tăng mức chấp nhận giả thuyết nghiên cứu H1. Nếu làm điều này, chúng ta sẽ làm tăng xác suất mắc phải sai lầm loại I trong thống kê. Chúng ta cũng có thể chọn mức ý nghĩa α = 1% (0.01). Nếu chọn α ở mức này, chúng ta giảm xác suất chấp nhận giả thuyết nghiên cứu H1 (nghĩa là chúng ta giảm sai lầm loại I nhưng lại tăng sai lầm loại II).
Bước 3. Chọn phép kiểm định và tính giá trị thống kê
Bước tiếp theo là chúng ta phải chọn lựa phép kiểm định thích hợp. Chọn phép kiểm định phụ thuộc bản chất mối quan hệ trong giả thuyết và phân phối dữ liệu của các biến. Sau đó chúng ta sẽ tính giá trị thống kê kiểm định (test statistic) theo công thức phù hợp. Ví dụ khi chúng ta cần kiểm định giả thuyết là có mối quan hệ giữa X và Y. Nếu phân phối dữ liệu của cặp (X,Y) là phân phối chuẩn (normal distribution), chúng ta dùng phép kiểm định t và giá trị trị thống kê kiểm định t với n–2 bậc tự do được tính như sau:
Bước 4. Xác định giá trị tới hạn của phép kiểm định
Sau khi xác định được phép kiểm định thích hợp và tính giá trị của nó, chúng ta sẽ tra bảng để tìm giá trị tới hạn (critical value) tương ứng với mức ý nghĩa đã chọn. Ví dụ khi chúng ta dùng phép kiểm định t với mẫu có kích thước là n= 300 và mức ý nghĩa α = 5% thì giá trị tới hạn trong trường hợp kiểm định hai phía (tdf=298,α=0.05) là 1.968.
Bước 5. So sánh giá trị kiểm định với giá trị tới hạn
Sau khi đã có giá trị thống kê kiểm định và giá trị tới hạn của nó, chúng ta sẽ so sánh chúng với nhau. Tùy theo kết quả của so sánh này chúng ta sẽ ra quyết định là chấp nhận hay từ chối giả thuyết đã đưa ra. Ví dụ trong kiểm định mối tương quan giữa X và Y trên đây, nếu chúng ta tính được giá trị thống kê kiểm định t = 1.968, chúng ta kết luận là chấp nhận giả thuyết H1 (từ chối giả thuyết H0), nghĩa là có mối quan hệ giữa X và Y.