Website chỉ chia sẻ kiến thức, không giải đáp thắc mắc, không tư vấn!

Phép trích PCA và PAF trong phân tích nhân tố khám phá EFA

EFA October 13, 2021

1. Phương sai của biến quan sát

Vì mục tiêu của phân tích nhân tố EFA là mô hình hóa mối quan hệ giữa các biến quan sát từ đó giúp giảm chiều của dữ liệu (dimension reduction) nhằm thu về số ít nhân tố đại diện cho số nhiều biến quan sát đưa vào EFA. Trên cơ sở này, chúng ta sẽ tập trung chủ yếu vào phương sai (variance) và hiệp phương sai (covariance) giữa các biến quan sát tham gia vào một phép EFA. Phân tích nhân tố giả định rằng phương sai của một biến quan sát được chia thành hai loại: phương sai chung (common variance) và phương sai riêng (unique variance).

phep trich pca va paf trong efa

Tổng phương sai (Total Variance) bằng tổng số của phương sai chung và phương sai riêng cộng lại:

– Phương sai chung là phần phương sai được giải thích bởi các nhân tố ở EFA. Đây là phần phương sai chúng ta tập trung nhiều trong phân tích EFA.

– Phương sai riêng là phần phương sai KHÔNG được giải thích bởi các nhân tố ở EFA. Phương sai riêng gồm hai thành phần nhỏ là phương sai đặc thù (specific variance)sai số phương sai (error variance).

Principal Components Analysis (PCA) và Principal Axis Factoring (PAF) là hai phép trích được sử dụng phổ biến trong phân tích nhân tố EFA. Hai phép trích này có sự khác biệt về giả định sự tồn tại của phần phương sai riêng trong tổng phương sai của một biến quan sát. Chính vì vậy, tính ứng dụng của hai phép trích cũng có phần khác nhau.

2. Phép trích Principal Components Analysis (PCA)

Phép trích Principal Components Analysis (PCA – Phân tích thành phần chính) giả định rằng biến quan sát chỉ có phương sai chung mà không có phương sai riêng, nghĩa là 100% sự biến đổi của biến quan sát đều được giải thích bởi các nhân tố. Do vậy: Tổng phương sai = Phương sai chung. Trên cơ sở này, PCA trích được nhiều phương sai hơn so với PAF.

phep trich pca va paf trong efa

Mục đích của PCA là giải thích cho phương sai của các biến quan sát hơn là giải thích cho mối quan hệ tương quan giữa chúng. Như vậy, PCA sẽ thích hợp khi mục tiêu của nhà nghiên cứu nhằm giảm số lượng chiều của dữ liệu, cụ thể là tạo ra một nhóm biến mới có số lượng nhỏ hơn so với số lượng biến ban đầu và sử dụng chúng cho các phân tích tiếp theo (Fabrigar và cộng sự, 1999).

2. Phép trích Principal Axis Factoring (PAF)

Phép trích Principal Axis Factoring (PAF – Phân tích nhân tố chính) còn được gọi với tên là Common Factor Analysis giả định rằng biến quan sát có đủ hai loại phương sai chung và riêng, nghĩa là sự biến đổi của biến quan sát ngoài việc được giải thích bởi các nhân tố thì còn được giải thích bởi phương sai riêng. Do vậy: Tổng phương sai = Phương sai chung + Phương sai riêng. Trên cơ sở này, PAF trích được ít phương sai hơn so với PCA.

phep trich pca va paf trong efa

PAF cũng giống với PCA khi cả hai đều giúp giảm chiều của dữ liệu để thu về một số lượng ít nhân tố đại diện tốt cho số lượng nhiều các biến quan sát đưa vào EFA. Tuy nhiên, khi PCA tập trung vào việc thu được phương sai được giải thích (explained total variance) cao nhất có thể thì PAF lại tập trung vào việc phản ánh cấu trúc dữ liệu chính xác nhất có thể. Gerbing và Anderson (1988) cho rằng, PAF cùng với phép quay không vuông góc (như Promax) phản ảnh cấu trúc dữ liệu chính xác hơn PCA. Do vậy, nếu mục tiêu của nhà nghiên cứu nhằm tìm ra mối quan hệ tiềm ẩn của các biến quan sát được đưa vào phân tích EFA, từ đó giúp xác định các cấu trúc nhân tố phù hợp nhất thì PAF là lựa chọn phù hợp.

3. Những tranh cãi về PCA và PAF

Nhiều nhà nghiên cứu cho rằng, PCA là hợp lý và là giải pháp thay thế vượt trội cho PAF, căn cứ trên quan điểm cho rằng PCA có các đặc điểm thống kê đáng mong muốn (ví dụ, dễ tính toán hơn, không tạo ra giải pháp không thích hợp, thường cho kết quả giống với EFA, có khả năng tính toán điểm số cho thành phần chính, trong khi PAF rất phức tạp trong tính toán).

Mặc dù các bàn cãi trong giới nghiên cứu về vấn đề này vẫn tiếp tục, Fabrigar và cộng sự (1999) đã đưa ra một số quan điểm đối lập với giới ủng hộ thay thế PAF bằng PCA. Những tác giả này nhấn mạnh vào tình huống khi kết quả giữa EFA và PCA là khác nhau, ví dụ, khi phương sai chung thấp, hoặc khi nhân tố có ít chỉ báo (Widaman, 1993). Theo họ, PAF là thích hợp hơn nếu mục tiêu nhằm mô phỏng mối tương quan giữa một tập hợp các biến quan sát để tạo ra một số chiều tiềm ẩn nhỏ hơn, xem xét sự tồn tại của sai số đo lường trong các biến quan sát. Floyd & Widaman (1995) nhận định rằng, ước lượng căn cứ vào PAF có mối quan hệ với CFA (phân tích nhân tố khẳng định) tốt hơn là PCA bởi cả PAF và CFA đều giả định một biến quan sát gồm hai loại phương sai chung-riêng. Đây là đặc điểm đáng chú ý bởi PAF thường được sử dụng như là bước tiền đề cho CFA trong việc phát triển thang đo và khẳng định giá trị của các cấu trúc.

ĐIỂM NỔI BẬT:

– Chúng ta nên sử dụng phép trích PCA khi các biến quan sát của các biến tiềm ẩn đã được định hình trước đó. Có nghĩa là các biến quan sát được sử dụng để giải thích cho biến tiềm ẩn đã có lý thuyết nền vững vàng hoặc được chứng minh ở các công trình nghiên cứu lớn, được nhiều nhà nghiên cứu lớn công nhận. Việc sử dụng PCA nhấn mạnh vào việc thu gọn số lượng biến quan sát để có được số nhân tố ít hơn nhưng đại diện nhiều nhất cho đặc tính của toàn bộ các biến quan sát.

– Chúng ta nên sử dụng phép trích PAF khi chỉ có các biến quan sát nhưng chưa định hình được có bao nhiêu biến tiềm ẩn cũng như tên gọi các biến tiềm ẩn đó. Việc thực hiện PAF nhấn mạnh vào mục đích khám phá được các cấu trúc tiềm ẩn tồn tại giữa các biến quan sát này, có bao nhiêu biến tiềm ẩn và mỗi biến tiềm ẩn sẽ gồm những biến quan sát nào.

– Chúng ta cũng nên sử dụng PAF nếu nghiên cứu có sử dụng phân tích nhân tố khẳng định CFA sau bước EFA. Nhờ PAF, các cấu trúc nhân tố tiềm ẩn được xác định phù hợp với cấu trúc dữ liệu, điều này giúp kết quả của CFA tốt hơn một cách đáng kể và giúp tối ưu thời gian, công sức cho nhà nghiên cứu ở bước xử lý CFA.