Nghiên cứu sơ bộ là một giai đoạn có ý nghĩa then chốt trong toàn bộ quy trình nghiên cứu khoa học. Tuy nhiên, trên thực tế, không ít người nghiên cứu chưa nhận thức đầy đủ vai trò của giai đoạn này, dẫn đến những hạn chế và sai lệch nghiêm trọng trong nghiên cứu chính thức sau đó.
Quá trình thực hiện một đề tài nghiên cứu hoặc luận văn có thể được xem như một chuỗi các bước tuyến tính. Khi đã chuyển sang giai đoạn tiếp theo, việc quay lại điều chỉnh các bước trước là rất khó khăn, bởi điều này đòi hỏi phải đánh đổi đáng kể về thời gian, nguồn lực và chi phí thực hiện.
Trong các tài liệu và giáo trình về nghiên cứu marketing cũng như phương pháp nghiên cứu khoa học, khái niệm nghiên cứu sơ bộ được đề cập phổ biến và được xác định là một bước chính thức trong quy trình nghiên cứu, được tiến hành trước giai đoạn nghiên cứu chính thức. Mục tiêu của nghiên cứu sơ bộ là làm rõ các khái niệm còn mơ hồ, phát hiện sớm những rủi ro tiềm ẩn, đồng thời hỗ trợ hoàn thiện mô hình nghiên cứu và bảng câu hỏi khảo sát trước khi triển khai thu thập dữ liệu trên diện rộng.
Cần lưu ý rằng trong nghiên cứu chính thức, số lượng bảng hỏi thường rất lớn, do đó quá trình thu thập dữ liệu đòi hỏi nhiều thời gian, công sức và chi phí. Ví dụ, người nghiên cứu có thể phải mất khoảng hai tháng và một khoản chi phí đáng kể để thu thập 300 quan sát phục vụ cho một đề tài luận văn. Tuy nhiên, nếu sau khi tiến hành phân tích nhân tố khám phá (EFA), kết quả cho thấy hầu hết các thang đo đều hội tụ vào một hoặc hai nhân tố, trong khi mô hình nghiên cứu ban đầu giả định có tám đến chín nhóm nhân tố độc lập, thì dữ liệu thu được gần như không còn giá trị sử dụng. Tình trạng này càng nghiêm trọng hơn khi các nhân tố hình thành lại bao gồm các biến quan sát thuộc nhiều thang đo khác nhau, gây ra sự chồng chéo và thiếu tính phân biệt. Mặc dù EFA có chức năng khám phá cấu trúc tiềm ẩn của dữ liệu và việc xuất hiện các nhân tố mới là điều có thể chấp nhận, nhưng nếu cấu trúc này khác biệt quá lớn so với cơ sở lý thuyết và các nghiên cứu trước đó, thì có thể khẳng định nghiên cứu đang gặp vấn đề về thiết kế công cụ đo lường.
Một trong những nguyên nhân phổ biến dẫn đến thực trạng trên là việc không tiến hành hoặc tiến hành một cách hình thức giai đoạn nghiên cứu sơ bộ. Trên thực tế, bảng câu hỏi khảo sát không thể được xây dựng theo một khuôn mẫu chung để áp dụng cho mọi đối tượng nghiên cứu. Sau khi xây dựng bảng câu hỏi dựa trên cơ sở lý thuyết và các nghiên cứu trước, người nghiên cứu cần tiến hành tham vấn ý kiến của chuyên gia, giảng viên hoặc người hướng dẫn khoa học để điều chỉnh nội dung cho phù hợp. Tiếp theo, nghiên cứu sơ bộ cần được triển khai một cách nghiêm túc nhằm thu thập phản hồi từ đối tượng khảo sát thử nghiệm, từ đó tổng hợp, phân tích và điều chỉnh bảng câu hỏi trước khi sử dụng trong nghiên cứu chính thức.
Trong trường hợp người nghiên cứu gặp khó khăn khi xử lý dữ liệu trên phần mềm SPSS do dữ liệu không đạt yêu cầu hoặc vi phạm các giả định thống kê, việc tham khảo các dịch vụ hỗ trợ phân tích dữ liệu SPSS của Phạm Lộc Blog có thể giúp tiết kiệm thời gian và nâng cao chất lượng kết quả nghiên cứu.
Một số vấn đề liên quan đến bảng câu hỏi khảo sát cần được xem xét và đánh giá trong giai đoạn nghiên cứu sơ bộ bao gồm:
1. Các câu hỏi đã rõ ràng hay chưa?
Một bảng câu hỏi khảo sát được đánh giá là đạt chất lượng khi người trả lời có thể hiểu đúng và đầy đủ nội dung mà từng câu hỏi hướng tới. Việc diễn giải sai câu hỏi có thể dẫn đến sai lệch dữ liệu, từ đó ảnh hưởng đến độ tin cậy và giá trị của các kiểm định cũng như các phân tích định lượng được thực hiện bằng phần mềm thống kê ở các giai đoạn sau. Trong quá trình nghiên cứu sơ bộ, nhà nghiên cứu cần lần lượt trao đổi với từng đáp viên để xác định xem có câu hỏi nào còn mơ hồ, khó hiểu hoặc gây nhầm lẫn hay không. Tất cả các ý kiến phản hồi cần được ghi nhận, tổng hợp và phân tích một cách hệ thống nhằm điều chỉnh, hoàn thiện bảng câu hỏi, bảo đảm nội dung rõ ràng, dễ hiểu và phù hợp với mục tiêu nghiên cứu.
2. Thang đo sử dụng có phù hợp hay không?
Giả định nghiên cứu sử dụng thang đo Likert 5 mức độ để đo lường các phát biểu, với các mức từ 1 đến 5. Trong đó, mức 3 được xem là giá trị trung lập; hai mức 1 và 2 phản ánh xu hướng không đồng ý, còn hai mức 4 và 5 phản ánh xu hướng đồng ý. Tuy nhiên, do đặc thù của môi trường và đối tượng khảo sát, câu trả lời của người tham gia thường có xu hướng nghiêng hẳn về một phía, tức là tập trung chủ yếu vào các mức 1–2 hoặc 4–5. Hệ quả là phân phối dữ liệu giữa các biến quan sát trở nên tương đối đồng nhất, thiếu sự khác biệt cần thiết. Điều này có thể gây ra các vấn đề về khả năng phân biệt của thang đo khi tiến hành phân tích định lượng. Chẳng hạn, trong phân tích nhân tố khám phá (EFA), khi các biến có giá trị quá tương đồng, các nhân tố có thể bị gộp không hợp lý hoặc nhiều biến cùng hội tụ vào một nhân tố trong ma trận xoay.
Đối với những nghiên cứu mà câu trả lời có xu hướng thiên lệch mạnh về một nhánh đáp án, một giải pháp thường được đề xuất là mở rộng số mức của thang đo. Thay vì sử dụng thang đo 5 mức độ, nhà nghiên cứu có thể cân nhắc áp dụng thang đo 7 hoặc 9 mức độ. Khi đó, nhánh không đồng ý vốn chỉ bao gồm các mức 1 và 2 sẽ được mở rộng thành 1, 2, 3 đối với thang 7 mức, hoặc 1, 2, 3, 4 đối với thang 9 mức; tương tự, nhánh đồng ý sẽ được mở rộng từ các mức 4, 5 sang 5, 6, 7 hoặc 6, 7, 8, 9. Việc gia tăng số lựa chọn trong mỗi nhánh giúp nâng cao mức độ phân biệt giữa các câu hỏi và cải thiện chất lượng dữ liệu thu thập được. Tuy nhiên, cũng cần lưu ý rằng số mức quá nhiều có thể làm tăng gánh nặng nhận thức cho người trả lời, do họ phải cân nhắc giữa nhiều lựa chọn hơn, từ đó có thể ảnh hưởng đến độ chính xác của câu trả lời.
3. Thái độ hợp tác của đáp viên và đặc điểm đáp viên
Trong nghiên cứu khảo sát, không phải mọi cá nhân đều sẵn sàng và nghiêm túc dành thời gian để hoàn thành bảng hỏi. Thực tế cho thấy tồn tại một bộ phận đáp viên trả lời mang tính hình thức, lựa chọn phương án ngẫu nhiên hoặc đánh dấu cho xong mà không cân nhắc nội dung câu hỏi. Thông qua giai đoạn khảo sát sơ bộ, nhà nghiên cứu có thể nhận diện những đặc điểm cơ bản của đối tượng khảo sát, chẳng hạn như độ tuổi chủ yếu tập trung ở mức A, trình độ học vấn phần lớn thuộc nhóm B, môi trường khảo sát thường diễn ra tại C, cũng như thời điểm khảo sát là khi đáp viên đang rảnh rỗi hay trong lúc làm việc. Từ các thông tin này, có thể đưa ra nhận định ban đầu về mức độ hợp tác của người trả lời và khả năng họ cung cấp các câu trả lời chính xác, đáng tin cậy.
Dựa trên kết quả đánh giá sơ bộ về thái độ hợp tác của đáp viên, nhà nghiên cứu có cơ sở để xây dựng kế hoạch khảo sát phù hợp, bao gồm việc lựa chọn địa điểm, thời gian và nhóm đối tượng khảo sát nhằm tối ưu hóa chất lượng dữ liệu thu thập. Đồng thời, cần thiết kế các câu hỏi kiểm tra, câu hỏi gài và câu hỏi đảo thứ tự đáp án để phát hiện và loại bỏ những phiếu khảo sát có dấu hiệu trả lời qua loa, chọn đáp án theo kiểu bao lô hoặc thiếu nhất quán. Các kỹ thuật xây dựng câu hỏi này có thể tham khảo thêm trong các tài liệu chuyên khảo về ebook SPSS của mình ở link này.
Tóm lại, việc nhận thức đầy đủ và đánh giá đúng tầm quan trọng của nghiên cứu sơ bộ là yêu cầu mang tính then chốt trong quá trình nghiên cứu định lượng. Khi giai đoạn khảo sát sơ bộ được thực hiện nghiêm túc và bài bản, dữ liệu thu thập ở giai đoạn chính thức sẽ có chất lượng và độ tin cậy cao hơn đáng kể. Ngược lại, nếu bỏ qua hoặc thực hiện sơ sài bước sơ bộ, các sai sót và rủi ro sẽ tích tụ và ảnh hưởng trực tiếp đến kết quả nghiên cứu chính thức. Trong trường hợp nghiêm trọng, dữ liệu thu thập được có thể không đạt yêu cầu, buộc nhà nghiên cứu phải loại bỏ toàn bộ, điều chỉnh lại bảng câu hỏi và tiến hành khảo sát lại từ đầu.
