Phân tích và đọc kết quả hồi quy tuyến tính bội trong SPSS

Thực hiện phân tích hồi quy tuyến tính bội để đánh giá sự tác động của các biến độc lập này lên biến phụ thuộc. Chúng ta vào Analyze > Regression > Linear…

Đưa biến phụ thuộc vào ô Dependent, các biến độc lập vào ô Independents.

Vào mục Statistics, tích chọn các mục như trong ảnh và chọn Continue.

Vào mục Plots, tích chọn vào HistogramNormal probability plot, kéo biến ZRESID thả vào ô Y, kéo biến ZPRED thả vào ô X như hình bên dưới. Tiếp tục chọn Continue.

Các mục còn lại chúng ta sẽ để mặc định. Quay lại giao diện ban đầu, mục Method là các phương pháp đưa biến vào, tùy vào dạng nghiên cứu mà chúng ta sẽ chọn Enter hoặc Stepwise. Tính chất đề tài thực hành là nghiên cứu khẳng định, do vậy tác giả sẽ chọn phương pháp Enter đưa biến vào một lượt. Tiếp tục nhấp vào OK. 

SPSS sẽ xuất ra rất nhiều bảng, chúng ta sẽ tập trung vào các bảng ANOVA, Model Summary, Coefficients và ba biểu đồ Histogram, Normal P-P Plot, Scatter Plot.

Một thước đo sự tương thích của quy mô hồi quy tuyến tính thường dùng là thông số xác lập R2 ( R square ). Khi phần đông những điểm tài liệu tập trung chuyên sâu sát vào đường hồi quy, giá trị R2 sẽ cao, ngược lại, nếu những điểm tài liệu phân bổ rải rác cách xa đường hồi quy, R2 sẽ thấp. Chỉ số R2 nằm trong bảng Model Summary .Các điểm tài liệu luôn phân tán và có xu thế tạo thành dạng một đường thẳng chứ không phải là một đường thẳng trọn vẹn. Do đó, hầu hết không có đường thẳng nào hoàn toàn có thể đi qua hàng loạt toàn bộ những điểm tài liệu, luôn có sự rơi lệch giữa những giá trị ước tính và những giá trị thực tiễn. Chúng ta sẽ cần thống kê giám sát được mức độ xô lệch đó cũng như mức độ tương thích của quy mô hồi quy tuyến tính với tập dữ liệu .

Khi tất cả chúng ta đưa thêm biến độc lập vào nghiên cứu và phân tích hồi quy, R2 có xu thế tăng lên. Điều này dẫn đến 1 số ít trường hợp mức độ tương thích của quy mô hồi quy bị thổi phồng khi tất cả chúng ta đưa vào những biến độc lập lý giải rất yếu hoặc không lý giải cho biến phụ thuộc vào. Trong SPSS, bên cạnh chỉ số R2, tất cả chúng ta còn có thêm chỉ số R2 Adjusted ( R2 hiệu chỉnh ). Chỉ số R2 hiệu chỉnh không nhất thiết tăng lên khi nhiều biến độc lập được thêm vào hồi quy, do đó R2 hiệu chỉnh phản ánh độ tương thích của quy mô đúng mực hơn thông số R2 .

R2 hay R2 hiệu chỉnh đều có mức dao động trong đoạn từ 0 đến 1. Nếu R2 càng tiến về 1, các biến độc lập giải thích càng nhiều cho biến phụ thuộc, và ngược lại, R2 càng tiến về 0, các biến độc lập giải thích càng ít cho biến phụ thuộc. 

Không có tiêu chuẩn đúng mực R2 ở mức bao nhiêu thì quy mô mới đạt nhu yếu. Cần quan tâm rằng, không phải luôn luôn một quy mô hồi quy có R2 cao thì nghiên cứu và điều tra có giá trị cao, quy mô có R2 thấp thì điều tra và nghiên cứu đó có giá trị thấp, độ tương thích quy mô hồi quy không có mối quan hệ nhân quả với giá trị của bài điều tra và nghiên cứu. Trong nghiên cứu và điều tra tái diễn, tất cả chúng ta thường chọn mức trung gian là 0.5 để phân ra 2 nhánh ý nghĩa mạnh / ý nghĩa yếu và kỳ vọng từ 0.5 đến 1 thì quy mô là tốt, bé hơn 0.5 là quy mô chưa tốt. Tuy nhiên, điều này không thực sự đúng mực bởi việc nhìn nhận giá trị R2 sẽ nhờ vào rất nhiều vào những yếu tố như nghành nghề dịch vụ điều tra và nghiên cứu, đặc thù nghiên cứu và điều tra, cỡ mẫu, số lượng biến tham gia hồi quy, hiệu quả những chỉ số khác của phép hồi quy, …

Trong ví dụ ở trên, bảng Model Summary cho chúng ta kết quả R bình phương (R Square) và R bình phương hiệu chỉnh (Adjusted R Square) để đánh giá mức độ phù hợp của mô hình. Giá trị R bình phương hiệu chỉnh bằng 0.695 cho thấy các biến độc lập đưa vào phân tích hồi quy ảnh hưởng 69.5% sự biến thiên của biến phụ thuộc, còn lại 31.4% là do các biến ngoài mô hình và sai số ngẫu nhiên. 

Kết quả bảng này cũng đưa ra giá trị Durbin–Watson để đánh giá hiện tượng tự tương quan chuỗi bậc nhất. Giá trị DW = 1.849, nằm trong khoảng 1.5 đến 2.5 nên kết quả không vi phạm giả định tự tương quan chuỗi bậc nhất (Yahua Qiao, 2011).

3.3 Bảng Coefficients

Chúng ta sẽ nhìn nhận thông số hồi quy của mỗi biến độc lập có ý nghĩa trong quy mô hay không dựa vào kiểm định t ( student ) với giả thuyết H0 : Hệ số hồi quy của biến độc lập Xi bằng 0. Mô hình hồi quy có bao nhiêu biến độc lập, tất cả chúng ta sẽ đi kiểm tra bấy nhiêu giả thuyết H0. Kết quả kiểm định :

  • Sig < 0.05: Bác bỏ giả thuyết H0, nghĩa là hệ số hồi quy của biến Xi khác 0 một cách có ý nghĩa thống kê, biến X1 có tác động lên biến phụ thuộc.
  • Sig > 0.05: Chấp nhận giả thuyết H0, nghĩa là hệ số hồi quy của biến Xi bằng 0 một cách có ý nghĩa thống kê, biến Xi không tác động lên biến phụ thuộc.

Trong hồi quy, thường chúng ta sẽ có hai hệ số hồi quy: chưa chuẩn hóa (trong SPSS gọi là B) và đã chuẩn hóa (trong SPSS gọi là Beta). Mỗi hệ số hồi quy này có vai trò khác nhau trong việc diễn giải hàm ý quản trị của mô hình hồi quy. Để hiểu khi nào dùng phương trình hồi quy nào, bạn có thể xem bài viết Sự khác nhau giữa hệ số hồi quy chuẩn hóa và chưa chuẩn hóa

Nếu hệ số hồi quy (B hoặc Beta) mang dấu âm, nghĩa là biến độc lập đó tác động nghịch chiều lên biến phụ thuộc. Ngược lại nếu B hoặc Beta không có dấu (dấu dương), nghĩa là biến độc lập tác động thuận chiều lên biến phụ thuộc. Khi xem xét mức độ tác động giữa các biến độc lập lên biến phụ thuộc, chúng ta sẽ dựa vào trị tuyệt đối hệ số Beta, trị tuyệt đối Beta càng lớn, biến độc lập tác động càng mạnh lên biến phụ thuộc. Xem chi tiết hơn tại bài viết Hệ số hồi quy B, Beta âm trong phân tích SPSS.

Trong SPSS, những số liệu của kiểm định t được lấy từ bảng thông số hồi quy Coefficients. Cũng chú ý quan tâm rằng, nếu một biến độc lập không có ý nghĩa thống kê trong tác dụng hồi quy, tất cả chúng ta sẽ Kết luận biến độc lập đó không có sự ảnh hưởng tác động lên biến nhờ vào mà không cần thực thi loại biến và nghiên cứu và phân tích lại hồi quy .