Trong một số tình huống, biến có quá nhiều giá trị sẽ gây những trở ngại nhất định cho các phép thống kê. Vì vậy, các biến này cần được mã hóa lại để còn ít nhóm giá trị hơn. Xét ví dụ sau: Lập bảng tần số đối với dữ liệu về tuổi của những nhân viên tham gia trả lời trong nghiên cứu về sự hài lòng trong công việc, ta có bảng tần số dưới đây:
Nhằm mục đích sử dụng biến tuổi cho một số kiểm định, phân tích, nhà nghiên cứu quyết định chia biến này thành các nhóm như sau: (1) Dưới 25 tuổi, (2) Từ 25 đến 35 tuổi, (3) Trên 35 tuổi. Tiến hành mã hóa lại biến trên SPSS 26, chúng ta vào Transform > Recode into Different Variables…
Đưa biến cần mã hóa từ khung bên trái vào hộp Input Variable -> Output Variable.
Nhập tên biến mới (biến chứa các nhóm giá trị đã mã hóa) vào ô Name, nhập nhãn cho biến mới vào ô Label. Sau đó nhấp vào nút Change. Tiếp tục nhấp vào nút Old and New Values.
Cửa sổ Old and New Values xuất hiện cho phép chúng ta chuyển đổi giá trị cũ sang giá trị mới.
SPSS có nhiều tùy chọn để chúng ta chia nhóm cho các giá trị hiện tại. Tuy nhiên, ba mục trong vùng bôi đỏ ở hình trên được sử dụng nhiều nhất:
- Range … through … : Đoạn giá trị từ bao nhiêu tới bao nhiêu (đoạn giá trị bao gồm cả giá trị đầu và cuối).
- Range, LOWEST through value: Đoạn giá trị từ giá trị thấp nhất cho đến mức giá trị nhập vào.
- Range, value through HIGHEST: Đoạn giá trị từ giá trị nhập vào cho đến mức giá trị cao nhất.
Như đã xác định ban đầu, chúng ta sẽ chia các mức tuổi thành ba nhóm:
Mức 1: Dưới 25 tuổi
Chúng ta sử dụng lựa chọn Range, LOWEST through value với giá trị nhập vào là 24. Ô New Value, chúng ta gán giá trị mới là 1. Sau đó nhấp vào nút Add.
Mức 2: Từ 25 đến 35 tuổi
Chúng ta sử dụng lựa chọn Range … through … với giá trị Range là 25 và giá trị through là 35. Ô New Value, chúng ta gán giá trị mới là 2. Sau đó nhấp vào nút Add.
Mức 3: Trên 35 tuổi
Chúng ta sử dụng lựa chọn Range, HIGHTEST through value với giá trị nhập vào là 36. Ô New Value, chúng ta gán giá trị mới là 3. Sau đó nhấp vào nút Add.
Sau khi đã phân nhóm giá trị xong, nhấp vào nút Continue. Cửa sổ quay về giao diện ban đầu, nhấp tiếp nút OK để kết thúc quá trình mã hóa. Tại giao diện Data View, chúng ta sẽ thấy biến mới tên DoTuoi đã được tạo ra và có sẵn dữ liệu.
Chúng ta chuyển sang giao diện Variable View để khai báo giá trị vào Values của biến mới với 1: Dưới 25 tuổi, 2: Từ 25 đến 35 tuổi và 3: Trên 35 tuổi.
Như vậy, chúng ta đã hoàn thành việc mã hóa lại biến Tuoi có rất nhiều giá trị sang biến DoTuoi chỉ còn ba giá trị.