การวิเคราะห์หาความสัมพันธ์ระหว่างตัวแปรเชิงกลุ่ม+เชิงกลุ่ม
เช่น การหาความสัมพันธ์ระหว่างการเป็นโรคเบาหวาน (0=non-dm, 1=dm) กับการเกิดโรคความดันโลหิตสูง (0=non-HT, 1=HT) ด้วยสถิติ chi-square test นั้น จะต้องตรวจสอบข้อตกลงเบื้องต้นของการใช้สถิติดังกล่าวก่อน (กรณีที่วิเคราะห์ข้อมูลโดยการใช้สถิติ parametric จะต้องมีการตรวจสอบข้อตกลงเบื้องต้นของการใช้สถิตินั้นๆ เสมอคะ) สำหรับ chi-square เอง (อ่านว่า ไคว์-สแควร์ นะคะ ไม่ใช่ ชิ-สแควร์) ก็มีข้อตกลงของการใช้เช่นเดียวกัน คือ ค่าคาดหวัง (expected) ของแต่ละเซลล์ (แต่ละช่องของข้อมูล) จะต้องมากกว่า 5 และมากกว่า 0 และยอมให้มีค่า expected น้อยกว่า 5 ได้ไม่เกิน 20% ของจำนวนเซลล์ทั้งหมด เช่น ตาราง 2x2 มีจำนวน 4 cells (4*0.2=0.8 แสดงว่าถ้ามีค่า expected น้อยกว่า 5 ไม่ได้แม้แต่ cell เดียว) ตาราง 2x3 มีจำนวน 6 cells (6*0.2=1.2 แสดงว่ายอมให้มีค่า expected น้อยกว่า 5 ได้ 1 cell ซึ่งสามารถใช้สถิติ chi-square test ในการวิเคราะห์ได้คะ)
เช่น การหาความสัมพันธ์ระหว่างการเป็นโรคเบาหวาน (0=non-dm, 1=dm) กับการเกิดโรคความดันโลหิตสูง (0=non-HT, 1=HT) ด้วยสถิติ chi-square test นั้น จะต้องตรวจสอบข้อตกลงเบื้องต้นของการใช้สถิติดังกล่าวก่อน (กรณีที่วิเคราะห์ข้อมูลโดยการใช้สถิติ parametric จะต้องมีการตรวจสอบข้อตกลงเบื้องต้นของการใช้สถิตินั้นๆ เสมอคะ) สำหรับ chi-square เอง (อ่านว่า ไคว์-สแควร์ นะคะ ไม่ใช่ ชิ-สแควร์) ก็มีข้อตกลงของการใช้เช่นเดียวกัน คือ ค่าคาดหวัง (expected) ของแต่ละเซลล์ (แต่ละช่องของข้อมูล) จะต้องมากกว่า 5 และมากกว่า 0 และยอมให้มีค่า expected น้อยกว่า 5 ได้ไม่เกิน 20% ของจำนวนเซลล์ทั้งหมด เช่น ตาราง 2x2 มีจำนวน 4 cells (4*0.2=0.8 แสดงว่าถ้ามีค่า expected น้อยกว่า 5 ไม่ได้แม้แต่ cell เดียว) ตาราง 2x3 มีจำนวน 6 cells (6*0.2=1.2 แสดงว่ายอมให้มีค่า expected น้อยกว่า 5 ได้ 1 cell ซึ่งสามารถใช้สถิติ chi-square test ในการวิเคราะห์ได้คะ)
คำสั่งในโปรแกรม STATA
แบบที่ 1
tabulate VarX VarY, expect chi exact
(หลัง comma [,] จะเป็น opion เพิ่มเติมเสมอคะ และต่อไปถ้าเห็นตัวอักษรสีชมพู แสดงว่ามีคำสั่งย่อคะ)
tabi #a #b \ #c #d, expect chi exact [Immediate command]
(กรณีที่เรามีตัวเลขในตาราง 2x2 หรือจริงๆ rxc ก้อสามารถนำมาลงได้หมดคะ)
แบบที่ 2
tabchi VarX VarY
(คำสั่งนี้ไม่ต้องเพิ่ม opion เพราะจะหาค่า expected ให้โดยอัตโนมัติ)
tabchii #a #b \ #c #d [Immediate command]
เนื่องจากเคย copy output มาวางแล้วมันไม่สวยอ่ะ และก็แทรกตารางไม่ได้ด้วย ดังนั้น เลยจะไม่ได้แสดง output ให้ดูนะคะ ส่วนรายละเอียดอธิบายได้ ดังนี้ ผลการวิเคราะห์ตัวเลขที่อยู่ในตารางจะประกอบไปด้วยตัวเลขที่ได้จากการเก็บข้อมูล (เราเรียกว่าค่าสังเกต-observe) ซึ่งจะแสดงไว้ที่บรรทัดแรก และตัวเลขบรรทัดที่สองคือค่า expected นั่นเอง (ซึ่งเราจะต้องขอ option เพิ่ม) หากพบว่าค่า expected > 5 ทุก cells ดังนั้น สามารถใช้สถิติ chi-square test ได้ โดยผลจาก Pearson chi2 ค่า p-value คือค่า Pr คะ
ทิ้งท้ายไว้นิดนึงคะ....ในกรณีการหาความสัมพันธ์ระหว่างตัวแปรนั้น เราจะต้องรู้จักประเภท/ชนิดของตัวแปรเหล่านั้นเสียก่อน ไว้บทความหน้าจะมา review basic ให้เพิ่มเติมคะ