Độ lệch – Skewness

Độ lệch ( skewness ) của một phân phối Xác Suất thống kê giám sát sự đối xứng của phân phối đó. Giá trị tuyệt đối của độ lệch càng cao thì phân phối đó càng bất đối xứng. Một phân phối đối xứng có độ lệch bằng 0 .

Công thức toán học của độ lệch là :
\[skewness\ =\ \frac{n}{\left(n\ -\ 1\right)\left(n\ -\ 2\right)}\frac{\sum_{i=1}^n \left(X_i\ –\ \bar X\right)^3}{s^3}\ ≈\ \frac1n\frac{\sum_{i=1}^n \left(X_i\ –\ \bar X\right)^3}{s^3}\]

\[skewness\ =\ \frac{n}{\left(n\ -\ 1\right)\left(n\ -\ 2\right)}\frac{\sum_{i=1}^n \left(X_i\ –\ \bar X\right)^3}{s^3}\ ≈\ \frac1n\frac{\sum_{i=1}^n \left(X_i\ –\ \bar X\right)^3}{s^3}\]

Bạn đang đọc: Độ lệch – Skewness

với :

  • \(n\) : số lượng mẫu – sample size
  • \(X_i\) : giá trị của mẫu thứ i – i th sample value
  • \(\bar X\) : giá trị trung bình của mẫu – sample mean
  • \(s \) : độ lệch chuẩn của mẫu – sample standard deviation

[ HuyAdsInHere ]
Thật như mong muốn là ông không cần phải biết công thức này, nên hãy trục xuất nó ngay ra khỏi đầu của ông luôn đi nhé. Điều ông cần biết là :

  • hình dạng của một phân phối có độ lệch dương (positive skewness) hoặc độ lệch âm (negative skewness)
  • độ lệch dương hay âm bao nhiêu thì được coi đáng kể
  • một số tính chất của phân phối có độ lệch dương hoặc độ lệch âm

Độ lệch dương có nghĩa là những giá trị cực lớn hơn giá trị trung bình ( mean ) sẽ ở xa hơn so với giá trị cực nhỏ hơn giá trị trung bình ( mean ). Một đồ thị nổi bật của một phân phối liên tục với độ lệch dương sẽ trông như thế này :
( Phân phối này còn được gọi là right-tailed )

Tương tự, một đồ thị điển hỉnh của một phân phối liên tục có độ lệch âm sẽ có hình dạng như sau

( Phân phối này còn được gọi là left-tailed )

Chú ý : Độ lệch được coi là đáng kể nếu giá trị tuyệt đối của nó \ ( \ geq 0.5 \ ) ( tức là giá trị \ ( \ leq – 0.5 \ ) hoặc \ ( \ geq + 0.5 \ ) )
Tính chất quan trọng của độ lệch được bộc lộ qua 2 hình minh họa ở trên : với một phân phối có một mode duy nhất, ông cần phải biết giá trị tương đối của mean, mode và truyền thông. Ở đây có một mẹo để ghi nhớ, đó là sắp xếp những từ này theo thứ tự bảng vần âm, từ trái qua phải :
mean median mode

Nếu phân phối có độ lệch dương – nó sẽ bị lệch sang phải – khi đó ký hiệu sẽ là dấu >. Cụ thể:

mean     >     median    >       mode

Ngược lại, nếu phân phối có độ lệch âm – nó sẽ bị lệch sang trái – ký hiệu sẽ là < :

mean     <     median    <       mode

( Bài viết được dịch từ bài viết gốc tại đây )