วันศุกร์ที่ 15 กุมภาพันธ์ พ.ศ. 2556

การวัดการกระจายข้อมูล




การสรุปลักษณะต่างๆ ของข้อมูลนั้น ใช้การวัดแนวโน้มเข้าสู่ส่วนกลางเพียงอย่างเดียวไม่เพียงพอ จำเป็นที่จะต้องใช้การวัดการกระจายด้วยเพื่อให้ทราบว่าข้อมูลแต่ละชุดมีการกระจายแตกต่างกันอย่างไร โดยมีวิธีการดังนี้
1. พิสัย (Range) คือความแตกต่างระหว่างข้อมูลที่มีค่าสูงสุดกับข้อมูลที่มีค่าต่ำสุด การจัดการกระจายแบบนี้เป็นการวัดแบบหยาบๆ
2. ค่าเบี่ยงเบนควดไทล์ (Quartile deviation : Q.D.) คือค่าครึ่งหนึ่งของผลต่างระหว่างควอไทล์ที่ 3 กับควอไทล์ที่ 1 ใช้เมื่อข้อมูลนั้นมีการวัดแนวโน้มเข้าสู่ส่วนกลางด้วยค่ามัธยฐาน
3. ค่าเบี่ยงเบนเฉลี่ย (Mean deviation : M.D.) คือค่าเฉลี่ยของค่าเบี่ยงเบนของข้อมูลแต่ละตัวที่เบี่ยงเบนไปจากค่าเฉลี่ยของข้อมูลชุดนั้น โดยไม่คำนึงถึงทิศทางหรือเครื่องหมาย การวัดการกระจายนี้ไม่นิยมใช้เพราะไม่คำนึงถึงเครื่องหมาย แต่ถ้าใช้จะใช้คู่กับค่าเฉลี่ย
4. ค่าเบี่ยงเบนมาตรฐาน (Standard deviation : S.D.) คือ รากที่สองของค่าเฉลี่ยของกำลังสองของค่าเบี่ยงเบนของข้อมูลแต่ละตัวจากค่าเฉลี่ยของข้อมูลชุดนั้น ค่าเบี่ยงเบนมาตรฐานเป็นค่าสถิติที่แก้ไขจุดอ่อนของการใช้ค่าเบี่ยงเบนเฉลี่ย โดยค่าเบี่ยงเบนมาตรฐานนี้จะใช้คู่กับค่าเฉลี่ย
 ความแปรปรวน (Variance) คือ ค่ากำลังสองของค่าเบี่ยงเบนมาตรฐาน
 สรุปการเลือกใช้สถิติที่ใช้วัดการกระจายของข้อมูล
1. ในกรณีที่ต้องการดูการกระจายอย่างหยาบๆ ของข้อมูล และเพื่อความรวดเร็วใช้พิสัย แต่การใช้พิสัยจะบอกอะไรไม่ได้มากนัก
2. ในกรณีที่ใช้ค่ามัธยฐานเป็นค่าสถิติที่ใช้วัดแนวโน้มเข้าสู่ส่วนกลาง ควรใช้ค่าเบี่ยงเบนควอไทล์ เป็นสถิติที่ใช้วัดการกระจาย
3. ในกรณีที่ใช้ค่าเฉลี่ยเป็นสถิติในการวัดแนวโน้มเข้าสู่ส่วนกลาง ควรใช้ค่าเบี่ยงเบนมาตรฐานเป็นสถิติในการวัดการกระจาย
4. ค่าเบี่ยงเบนเฉลี่ยเป็นสถิติที่นักวิจัยไม่นิยมใช้ เพราะมีปัญหาในการที่ไม่นำเครื่องหมายมาพิจารณาด้วย
สัมประสิทธิ์การกระจาย (Coefficient of variation)
ในการเปรียบเทียบลักษณะการกระจายของข้อมูล 2 ชุดนั้น ถ้าข้อมูลทั้งสองชุดมีค่าเฉลี่ยหรือมัธยฐานใกล้เคียงกัน ใช้ค่าเบี่ยงเบนมาตรฐาน หรือค่าเบี่ยงเบนควอไทล์ในการเปรียบเทียบการกระจายของข้อมูลได้เลย แต่ถ้าข้อมูลสองชุดนั้นมีค่าเฉลี่ยหรือมัธยฐานต่างกัน สถิติที่เหมาะสมในการเปรียบเทียบการกระจายของข้อมูล คือ สัมประสิทธิ์การกระจาย
คุณสมบัติทางพีชคณิตของค่าเฉลี่ยและความแปรปรวน
1. ค่าเฉลี่ยของผลบวกของตัวแปรต่างๆ ที่เป็นอิสระต่อกันมีค่าเท่ากับผลบวกของค่าเฉลี่ยของตัวแปรเหล่านั้น
2. ความแปรปรวนของผลบวกของตัวแปรต่างๆ ที่เป็นอิสระต่อกันมีค่าเท่ากับผลบวกของความแปรปรวนของตัวแปรเหล่านั้น
3. บวกหรือลบค่าคงที่ทุกๆ ค่าของตัวแปรชุดใดๆ ค่าเฉลี่ยของตัวแปรชุดใหม่มีค่าเท่ากับค่าเฉลี่ยของตัวแปรชุดเดิม บวกหรือลบด้วยค่าคงที่นั้น และค่าความแปรปรวนไม่เปลี่ยนแปลง
4. คูณหรือหารทุกๆ ค่าของตัวแปรชุดใดๆ ด้วยค่าคงที่ ค่าเฉลี่ยของตัวแปรชุดใหม่มีค่าเท่ากับค่าเฉลี่ยของตัวแปรชุดเดิมคูณด้วยค่าคงที่นั้น และค่าความแปรปรวนของข้อมูลชุดใหม่มีค่าเท่ากับค่าความแปรปรวนของตัวแปรชุดเดิม คูณด้วยกำลังสองของค่าคงที่

จากตารางที่ผ่านมา ข้อมูลกลุ่ม Y และ Z สามารถหาค่าความแปรปรวน ได้ดังนี้


Y(  X - X )
10(10-30) = -20
30(30-30) = 0
30(30-30) = 0
30(30-30) = 0
50(50-30) = 20
X = 30average = 0

Z(  X - X )
10(10-30) = -20
20(20-30) = -10
30(30-30) = 0
40(40-30) = 10
50(50-30) = 20
X = 30average = 0
 
ดังนั้นค่าความแปรปรวนของกลุ่มข้อมูล Y คือ 


ค่าเบี่ยงเบนมาตรฐานของกลุ่มข้อมูล คือ  


ดังนั้นค่าความแปรปรวนของกลุ่มข้อมูล คือ


ค่าเบี่ยงเบนมาตรฐานของกลุ่มข้อมูล คือ 




แบบทดสอบ









เฉลย
1.ค
2.ง
3.ง
4.ค
5.ก




ที่มา http://www.nattapon.com/2011/06/การวัดการกระจาย
        http://www.kroobannok.com/52844

2 ความคิดเห็น:

  1. เฉลยผิดหรือเปล่า ข้อ 1 น่าจะเป็น ง เพราะ 1.6 + 2 หาร 2 ได้ 1.6

    ตอบนำออก
  2. ข้อ 4 ก็เฉลยผิด (0.61x2)-0.375 = 0.845

    0.845 - 0.375 = ขอบบน - ขอบล่าง

    ตอบ ก. 0.47

    ตอบนำออก