Kiểm định Chi bình phương được áp dụng nhằm xác định sự tồn tại của mối liên hệ giữa hai biến định tính hoặc biến phân loại trong một bộ dữ liệu nghiên cứu. Phương pháp này cho phép đánh giá liệu các đặc điểm như độ tuổi và thâm niên công tác của nhân viên có liên quan với nhau hay không, hoặc liệu giới tính và tình trạng hôn nhân của khách hàng có mối quan hệ thống kê đáng kể hay không.
Để minh họa cụ thể, xem xét một ví dụ thực nghiệm dựa trên bộ dữ liệu gồm 350 quan sát thu thập trong nghiên cứu về mức độ hài lòng của nhân viên tại một doanh nghiệp. Mục tiêu phân tích là xem xét mối liên hệ giữa thâm niên công tác và mức thu nhập của nhân viên, từ đó xác định hai biến này có sự phụ thuộc lẫn nhau về mặt thống kê hay không.
Biến thâm niên công tác được phân chia thành các nhóm giá trị sau:
Dưới 1 năm
Từ 1 đến 3 năm
Từ 3 đến 5 năm
Trên 5 năm
Biến thu nhập được phân chia thành các nhóm giá trị sau:
Dưới 10 triệu
Từ 10 đến dưới 15 triệu
Từ 15 đến dưới 20 triệu
Từ 20 triệu trở lên
Giả thuyết Ho được đặt ra là thâm niên công tác và thu nhập không có mối quan hệ với nhau, hay nói cách khác hai biến này độc lập về mặt thống kê.
Để kiểm định mối quan hệ giữa thâm niên và thu nhập, nghiên cứu sử dụng phép kiểm định Chi bình phương trên phần mềm SPSS phiên bản 26. Trình tự thực hiện bắt đầu bằng việc chọn Analyze > Descriptive Statistics > Crosstabs.

Trong hộp thoại Crosstabs, biến Thâm niên được đưa vào ô Row(s) và biến Thu nhập được đưa vào ô Column(s). Hai biến này có thể được hoán đổi vị trí cho nhau giữa hàng và cột mà không làm thay đổi kết quả kiểm định. Ngoài ra, có thể lựa chọn Display clustered bar charts để trực quan hóa mối quan hệ giữa hai biến thông qua biểu đồ.

Tiếp theo, người nghiên cứu chọn nút Statistics, đánh dấu chọn Chi-square và Cramer’s V nhằm thực hiện kiểm định mối liên hệ và đo lường mức độ chặt chẽ của mối quan hệ, sau đó nhấn Continue.

Sau đó, tại mục Cells, trong phần Percentages, lựa chọn hiển thị tỷ lệ theo Rows và Columns. Tiếp tục nhấn Continue và chọn OK để tiến hành phân tích dữ liệu.

Kết quả phân tích được hiển thị trong cửa sổ Output. Trước hết, bảng Crosstabulation cung cấp thông tin tổng quan về phân bố tần số và tỷ lệ giữa các nhóm thâm niên và mức thu nhập, qua đó cho phép quan sát sơ bộ xu hướng mối quan hệ giữa hai biến.

Cuối cùng, bảng Chi-Square Tests là căn cứ quan trọng để đưa ra kết luận thống kê. Nếu giá trị Asymptotic Significance (2-sided) tại dòng Pearson Chi-Square nhỏ hơn 0.05, giả thuyết Ho bị bác bỏ, cho thấy thâm niên và thu nhập có mối quan hệ với nhau. Ngược lại, nếu giá trị Sig lớn hơn 0.05, giả thuyết Ho được chấp nhận, đồng nghĩa với việc không có bằng chứng thống kê cho thấy mối quan hệ giữa thâm niên và thu nhập.

Dưới bảng Chi-Square Tests trong SPSS luôn xuất hiện một dòng thông báo theo dạng: X cells (Z%) have expected count less than 5. The minimum expected count is Y. Khi quá trình phân tích không cho ra kết quả kiểm định, người nghiên cứu cần đặc biệt chú ý đến thông báo này. Kiểm định Chi bình phương chỉ đảm bảo độ tin cậy khi kích thước mẫu đủ lớn; trong trường hợp có trên 20% số ô trong bảng Crosstabulation có tần số kỳ vọng nhỏ hơn 5, kết quả kiểm định Chi-Square sẽ không còn chính xác hoặc thậm chí không thể thực hiện và hệ thống sẽ báo lỗi. Khi gặp tình huống này, cần điều chỉnh dữ liệu bằng cách tăng số lượng quan sát ở các nhóm có tần số thấp hoặc tiến hành mã hóa lại biến nhằm phân bổ lại số lượng quan sát sao cho mỗi nhóm đạt quy mô tối thiểu cần thiết. Ví dụ, nếu nhóm Thâm niên với phương án Trên 5 năm chỉ có 3 người lựa chọn, nhà nghiên cứu cần tiếp tục thu thập thêm dữ liệu để đảm bảo số lượng quan sát của nhóm này đủ lớn cho phân tích.
Trong trường hợp gặp khó khăn trong việc thu thập dữ liệu phù hợp để phân tích SPSS và đáp ứng các điều kiện của kiểm định thống kê, người nghiên cứu có thể tham khảo mua các nguồn dữ liệu SPSS có sẵn của Phạm Lộc Blog để tiết kiệm thời gian và đảm bảo hiệu quả phân tích.

Đối với kiểm định Chi bình phương trong SPSS, giá trị Sig của Chi-Square Test chỉ cho biết liệu hai biến có tồn tại mối quan hệ thống kê hay không. Khi xác định được rằng hai biến có mối liên hệ, bước tiếp theo là đánh giá mức độ liên kết giữa chúng thông qua các hệ số đo lường như Phi và Cramer’s V. Hệ số Phi chỉ được sử dụng trong trường hợp cả hai biến đều là biến nhị phân, mỗi biến chỉ có hai giá trị. Nếu một trong hai biến có từ ba giá trị trở lên, hệ số Cramer’s V sẽ được sử dụng để đánh giá mức độ liên kết. Cụ thể, trong bảng kết quả phân tích, giá trị Cramer’s V bằng 0.429, tương đương 42.9%, cho thấy hai biến có mức độ tương quan tương đối cao.
Xem thêm: Giáo trình xử lý SPSS có dữ liệu thực hành

Đồ thị cột thể hiện tần suất trả lời (số lượng đáp viên) của từng giá trị của biến nghiên cứu khi đặt trong mối quan hệ so sánh với biến còn lại, phản ánh trực quan kết quả của bảng phân tích chéo (Crosstabulation). Chẳng hạn, đối với nhóm đáp viên có thâm niên dưới 1 năm, số lượng người thuộc nhóm được ký hiệu bằng màu xanh dương và màu hồng đều vượt trên 20 người, trong khi nhóm được ký hiệu bằng màu xanh lá chỉ ghi nhận khoảng dưới 10 người.
Trong nghiên cứu luận văn, kiểm định Chi bình phương, còn được gọi là kiểm định Crosstab, được sử dụng phổ biến nhằm phân tích sâu mối quan hệ giữa các đặc điểm nhân khẩu học của đáp viên hoặc đánh giá mức độ liên kết giữa các yếu tố trong thị trường. Phương pháp này đóng vai trò như một công cụ phân tích thống kê quan trọng, hỗ trợ nhà nghiên cứu trong việc diễn giải kết quả và đề xuất các giải pháp phù hợp cho vấn đề nghiên cứu.
Post Views:
57