วันศุกร์ที่ 10 กรกฎาคม พ.ศ. 2552

การหาความสัมพันธ์ด้วย chi-square test

การวิเคราะห์หาความสัมพันธ์ระหว่างตัวแปรเชิงกลุ่ม+เชิงกลุ่ม
เช่น การหาความสัมพันธ์ระหว่างการเป็นโรคเบาหวาน (0=non-dm, 1=dm) กับการเกิดโรคความดันโลหิตสูง (0=non-HT, 1=HT) ด้วยสถิติ chi-square test นั้น จะต้องตรวจสอบข้อตกลงเบื้องต้นของการใช้สถิติดังกล่าวก่อน (กรณีที่วิเคราะห์ข้อมูลโดยการใช้สถิติ parametric จะต้องมีการตรวจสอบข้อตกลงเบื้องต้นของการใช้สถิตินั้นๆ เสมอคะ) สำหรับ chi-square เอง (อ่านว่า ไคว์-สแควร์ นะคะ ไม่ใช่ ชิ-สแควร์) ก็มีข้อตกลงของการใช้เช่นเดียวกัน คือ ค่าคาดหวัง (expected) ของแต่ละเซลล์ (แต่ละช่องของข้อมูล) จะต้องมากกว่า 5 และมากกว่า 0 และยอมให้มีค่า expected น้อยกว่า 5 ได้ไม่เกิน 20% ของจำนวนเซลล์ทั้งหมด เช่น ตาราง 2x2 มีจำนวน 4 cells (4*0.2=0.8 แสดงว่าถ้ามีค่า expected น้อยกว่า 5 ไม่ได้แม้แต่ cell เดียว) ตาราง 2x3 มีจำนวน 6 cells (6*0.2=1.2 แสดงว่ายอมให้มีค่า expected น้อยกว่า 5 ได้ 1 cell ซึ่งสามารถใช้สถิติ chi-square test ในการวิเคราะห์ได้คะ)
คำสั่งในโปรแกรม STATA
แบบที่ 1

tabulate VarX VarY, expect chi exact
(หลัง comma [,] จะเป็น opion เพิ่มเติมเสมอคะ และต่อไปถ้าเห็นตัวอักษรสีชมพู แสดงว่ามีคำสั่งย่อคะ)
tabi #a #b \ #c #d, expect chi exact [Immediate command]
(กรณีที่เรามีตัวเลขในตาราง 2x2 หรือจริงๆ rxc ก้อสามารถนำมาลงได้หมดคะ)

แบบที่ 2
tabchi VarX VarY
(คำสั่งนี้ไม่ต้องเพิ่ม opion เพราะจะหาค่า expected ให้โดยอัตโนมัติ)
tabchii #a #b \ #c #d [Immediate command]

เนื่องจากเคย copy output มาวางแล้วมันไม่สวยอ่ะ และก็แทรกตารางไม่ได้ด้วย ดังนั้น เลยจะไม่ได้แสดง output ให้ดูนะคะ ส่วนรายละเอียดอธิบายได้ ดังนี้ ผลการวิเคราะห์ตัวเลขที่อยู่ในตารางจะประกอบไปด้วยตัวเลขที่ได้จากการเก็บข้อมูล (เราเรียกว่าค่าสังเกต-observe) ซึ่งจะแสดงไว้ที่บรรทัดแรก และตัวเลขบรรทัดที่สองคือค่า expected นั่นเอง (ซึ่งเราจะต้องขอ option เพิ่ม) หากพบว่าค่า expected > 5 ทุก cells ดังนั้น สามารถใช้สถิติ chi-square test ได้ โดยผลจาก Pearson chi2 ค่า p-value คือค่า Pr คะ
ทิ้งท้ายไว้นิดนึงคะ....ในกรณีการหาความสัมพันธ์ระหว่างตัวแปรนั้น เราจะต้องรู้จักประเภท/ชนิดของตัวแปรเหล่านั้นเสียก่อน ไว้บทความหน้าจะมา review basic ให้เพิ่มเติมคะ

มาใช้โปรแกรม STATA กันเถอะ

ปัจจุบันนี้การวิเคราะห์ข้อมูลงานวิจัยทางการแพทย์มีโปรแกรมสำเร็จรูปมากมายให้ท่านๆ ได้เลือกใช้ และเรียนรู้ ไม่ว่าจะเป็น free software อย่าง R, epi info แต่ก็มีโปรแกรมทางสถิติที่น่าใช้อีกมากมายเช่นกัน อย่างโปรแกรม STATA ในประเทศไทยเริ่มมีใช้กันมากเพิ่มขึ้น เนื่องจากโปรแกรมนี้สามารถวิเคราะห์อะไรได้มากมายไม่แพ้โปรแกรมอื่นเลย ราคาก็พอที่จะหาซื้อมาใช้กันได้ ว่ากันง่ายๆ ถูกกว่า SPSS หรือ SAS นั่นเอง แต่ส่วนใหญ่ก็จะถนัดใช้ SPSS กันมากกว่าเนื่องจากลักษณะการใช้งานที่ค่อนข้างง่าย แต่ถ้าท่านๆ มีเวลาในการเรียนรู้ ได้ฝึกปฏิบัติแล้ว ท่านจะรู้ว่าโปรแกรม STATA ก็สามารถใช้งานได้ง่ายเช่นเดียวกันคะ

Enjoy with analysis by STATA.......