Bước tới nội dung

Nghịch lý Simpson

Bách khoa toàn thư mở Wikipedia
Simpson's paradox for quantitative data: a positive trend appears for two separate groups (blue and red), whereas a negative trend (black, dashed) appears when the groups are combined.

Nghịch lý Simpson hay hiệu ứng Yule–Simpson, là một nghịch lý trong xác suấtthống kê, trong đó một xu hướng xuất hiện trong nhiều nhóm của dữ liệu nhưng biến mất hoặc đảo ngược khi các nhóm đó được gộp lại nếu là thứ khác. Nó đôi khi được gọi bằng nghịch lý đảo ngược hay nghịch lý gộp.[1]

Kết quả này thường gặp trong các thống kê của khoa học xã hội và y tế,[2] và gây hiểu lầm đặc khi dữ liệu tần suất được diễn giải như là nhân quả một cách biệt and is particularly confounding when frequency không phù hợp.[3] Những yếu tố nghịch lý biến mất khi quan hệ nhân quả được xét tới. Nhiều nhà thống kê tin rằng công chúng cần được thông tin về các kết quả phản trực quan trọng thống kê như nghịch lý Simpson.[4][5]

Edward H. Simpson mô tả hiện tượng này lần đầu tiên trong một bài báo kỹ thuật năm 1951,[6] nhưng các nhà thống kê Karl Pearson, et al., năm 1899,[7]Udny Yule, năm 1903, đã nhắc đến hiện tượng tương tự trước đó.[8] Cái tên Nghịch lý Simpson được đưa ra bởi Colin R. Blyth năm 1972.[9]

Tham khảo

[sửa | sửa mã nguồn]
  1. ^ I. J. Good, Y. Mittal (tháng 6 năm 1987). “The Amalgamation and Geometry of Two-by-Two Contingency Tables”. The Annals of Statistics. 15 (2): 694–711. doi:10.1214/aos/1176350369. ISSN 0090-5364. JSTOR 2241334.
  2. ^ Clifford H. Wagner (tháng 2 năm 1982). “Simpson's Paradox in Real Life”. The American Statistician. 36 (1): 46–48. doi:10.2307/2684093. JSTOR 2684093.
  3. ^ Judea Pearl. Causality: Models, Reasoning, and Inference, Cambridge University Press (2000, 2nd edition 2009). ISBN 0-521-77362-8.
  4. ^ Robert L. Wardrop (February 1995). "Simpson's Paradox and the Hot Hand in Basketball". The American Statistician, 49 (1): pp. 24–28.
  5. ^ Alan Agresti (2002). "Categorical Data Analysis" (Second edition). John Wiley and Sons ISBN 0-471-36093-7
  6. ^ Simpson, Edward H. (1951). “The Interpretation of Interaction in Contingency Tables”. Journal of the Royal Statistical Society, Series B. 13: 238–241.
  7. ^ Pearson, Karl; Lee, Alice; Bramley-Moore, Lesley (1899). “Genetic (reproductive) selection: Inheritance of fertility in man, and of fecundity in thoroughbred racehorses”. Philosophical Transactions of the Royal Society A. 192: 257–330. doi:10.1098/rsta.1899.0006.
  8. ^ G. U. Yule (1903). “Notes on the Theory of Association of Attributes in Statistics”. Biometrika. 2 (2): 121–134. doi:10.1093/biomet/2.2.121.
  9. ^ Colin R. Blyth (tháng 6 năm 1972). “On Simpson's Paradox and the Sure-Thing Principle”. Journal of the American Statistical Association. 67 (338): 364–366. doi:10.2307/2284382. JSTOR 2284382.

Bibliography

[sửa | sửa mã nguồn]
  • Leila SchnepsCoralie Colmez, Math on trial. How numbers get used and abused in the courtroom, Basic Books, 2013. ISBN 978-0-465-03292-1. (Sixth chapter: "Math error number 6: Simpson's paradox. The Berkeley sex bias case: discrimination detection").

Liên kết ngoài

[sửa | sửa mã nguồn]