1. Giao diện khai báo biến Variable View trên SPSS
Chúng ta sẽ làm quen với hai giao diện Variable View và Data View trên SPSS 26. Variable View là giao diện chúng ta sẽ sử dụng để khai báo biến.
– Name: Khai báo tên biến. Nên đặt tên biến không có dấu Tiếng Việt, không được sử dụng dấu cách trắng, không được đặt ký tự đầu tiên là một con số, không đặt tên biến trùng với cụm cấm trong SPSS. Chúng ta không cần quan tâm những cụm nào cấm sử dụng cho đặt tên trong SPSS, khi vô tình đặt tên biến rơi vào các cụm này, phần mềm sẽ báo tên biến không hợp lệ, chúng ta chỉ cần đặt một tên khác đi là được. Nếu muốn liên kết từ trong tên biến, chúng ta sử dụng dấu gạch dưới ( _ ). Cách đặt tên phù hợp: GioiTinh, Dotuoi, Hoc_Van, ChiPhi1, Giaca_2. Cách đặt tên không phù hợp: Giớitính, Do Tuoi, Học vấn, NgheNghiep.
– Type: Khai báo kiểu dữ liệu. Có nhiều tùy chọn kiểu dữ liệu, tuy nhiên, tác giả sẽ chỉ trình bày 2 kiểu dữ liệu thường dùng nhất khi làm luận văn là Numeric và String. Nếu giá trị nhập vào là một con số, chúng ta sẽ khai báo là Numeric; nếu giá trị nhập vào là ký tự văn bản, chúng ta khai báo là String. Ví dụ: Chúng ta có biến Giới tính, trường hợp không mã hóa Nam thành 1, Nữ thành 2 mà muốn nhập dạng văn bản “Nam” – “Nữ” vào SPSS thì chúng ta sẽ phải khai báo kiểu dữ liệu là String; trường hợp nhập vào con số đã mã hóa 1 – 2 đại diện cho Nam – Nữ thì chúng ta sẽ khai báo kiểu dữ liệu là Numeric.
– Width: Số lượng ký tự tối đa. Nếu chúng ta nhập vào giá trị có số ký tự lớn hơn 8, chúng ta cần tăng giá trị Width lên phù hợp. Cũng không nên tăng quá cao như 500, 1000 vì chúng ta gần như không bao giờ nhập vào một ô giá trị có số ký tự cao như vậy. Việc để thừa số ký tự trống quá nhiều sẽ làm tệp dữ liệu nặng hơn một cách không cần thiết.
Khi nhập liệu, nếu ô giá trị không hiển thị đầy đủ các ký tự chúng ta nhập vào mà bị cắt mất một đoạn phía sau, nghĩa là Width của ô đó quá nhỏ, không đủ chứa số ký tự chúng ta đã nhập vào. Như ví dụ bên dưới, biến NgheNghiep1 có giá trị Width rất nhỏ nên không thể chứa đủ chuỗi văn bản nhập vào, do đó nghề nghiệp được nhập trong cột biến NgheNghiep1 không được hiển thị đầy đủ.
– Decimals: Số ký tự thập phân. Nếu dữ liệu thu thập là các con số nguyên, chúng ta nên để là 0. Nếu dữ liệu có phần thập phân, chúng ta sẽ tùy chỉnh Decimals tăng lên 1, 2, 3… tùy vào số ký tự thập phân muốn thể hiện.
– Label: Khai báo nhãn cho biến. Đây là phần chúng ta giải thích ý nghĩa cho cột tên biến Name. Trong Label chúng ta không bị giới hạn bởi các quy tắc đặt tên, có thể viết dài, viết ngắn, viết có dấu Tiếng Việt và tự do sử dụng dấu cách trắng.
– Values: Khai báo giá trị của biến. Mỗi giá trị sẽ tương ứng với một trường hợp xảy ra của biến và được xác định bằng một con số (value) đi kèm với một nhãn giải thích (label). Ví dụ, biến Bộ phận làm việc có các giá trị là Phòng nhân sự, Phòng kế toán, Phòng sản xuất, Phòng marketing. Tác giả sẽ khai báo value = 1 tương ứng label “Phòng Nhân sự”, tương tự cho các giá trị 2, 3, 4.
– Missing: Khai báo các giá trị khuyết trong dữ liệu. Một số trường hợp dữ liệu chúng ta xuất hiện các giá trị khuyết, nghĩa là tại ô dữ liệu đó không có giá trị nào được nhập. Lý do xuất hiện giá trị khuyết đến từ nhiều nguyên nhân: bản chất câu hỏi khảo sát, đáp viên không trả lời, do sơ sót từ người nhập liệu… Chúng ta sẽ cần khai báo giá trị khuyết để phần mềm hiểu được giá trị khuyết có tồn tại và giá trị khuyết đó đến từ nguyên nhân nào. Điều này rất quan trọng, bởi một số kiểm định, phần mềm sẽ dựa vào khai báo missing value để quyết định có đưa quan sát đó vào tính toán không.
Ở hàng Discrete missing values có ba ô, tương ứng phần mềm cho phép bạn khai báo ba loại giá trị khuyết. Giả sử trong cùng một biến của dữ liệu có hai loại giá trị khuyết. Loại thứ nhất là do câu hỏi, người nào phù hợp mới trả lời câu hỏi đó, người nào không phù hợp sẽ không trả lời, điều này dẫn đến các ô dữ liệu của người không phù hợp sẽ là các ô khuyết. Thay vì để trống ô, chúng ta nhập vào các ô đó giá trị 99, đồng thời khai báo missing value của biến đó ở ô số một là 99. Loại giá trị khuyết thứ hai là do một số đáp viên bỏ sót câu hỏi. Chúng ta cũng khai báo cho phần mềm biết đó là missing value, để tránh trùng với giá trị 99 – nguyên nhân do bản chất câu hỏi, chúng ta khai báo là 88 cho loại giá trị khuyết thứ hai, nhập vào ô thứ hai ở Discrete missing values là 88.
– Measure: Chọn loại thang đo thể hiện dữ liệu: Thang đo định danh (Nominal), Thang đo thứ bậc (Ordinal), Thang đo mức độ (Scale).
2. Giao diện nhập liệu Data View trên SPSS
Giao diện tiếp theo là Data View dùng để nhập liệu. Nếu Variable View làm nhiệm vụ tạo khuôn, thì Data View làm nhiệm vụ đưa nội dung vào khuôn dữ liệu đã tạo. Trong giao diện Data View, các cột sẽ biểu diễn danh sách biến, các hàng được đánh dấu số thứ tự 1, 2, 3,… đại diện cho từng quan sát của mẫu. Kết quả giá trị được nhập vào ở mỗi hàng đại diện cho câu trả lời của một đáp viên.