Linear Correlation and Regression
الارتباط هو علاقة بين متغيرين يمثل كل متغير ظاهرة معينة فإن تغيرت إحدى الظاهرتين في اتجاه معين فالثانية تتغير في اتجاه الأولى أو في اتجاه معاكس للأولى.
والتغير للظاهرتين في نفس الاتجاه بمعنى الزيادة في الأولى يقابله زيادة في الثانية أو العكس نقص في الأولى يقابله نقص في الثانية فالعلاقة تكون طردية أو متزايدة (موجبة) وإن كان الزيادة في الأولى يقابله نقص في الثانية أو العكس النقص في الظاهرة الأولى يقابله زيادة في الثانية فنقول أن الارتباط عكسي أو متناقص (سالباً).
الارتباط يكون تاماً بين المتغيرين إذا عرفنا قيمة أحد المتغيرين نعرف قيمة المتغير الآخر تماماً.
تقاس قوة الارتباط بين متغيرين بمعامل الارتباط ولاستقصاء تأثير أحد المتغيرين على الآخر فنوجد علاقة جبرية تعرف بمعادلة الانحدار (سندرسها لاحقاً) وهي معادلة خط مستقيم (علاقة خطية) بين المتغيرين x ، y مثلاً بالشكل y = a x + b حيث a , b ثابتان يعبر a عن الاتجاه (الميل) و b الجزء المقطوع من محور الصادات ( – 1) وإن كانت a موجبة كانت العلاقة طردية وإن كانت سالبة فإنَّ العلاقة عكسية والارتباط هنا تاماً لأن النقاط (x , y) يمر بها خط مستقيم واحد فمثلاً العلاقة y = 2 x – 1 تحدد قيم y بمعرفة قيم x وبتمثيلها بيانياً نجد أن:
3 2 1 x 5 3 1 y
يقاس الارتباط بين متغيرين بمقياس كمي يعرف بمعامل الارتباط Correlation Coefficient
معامل الارتباط قد يساوي الصفر (منعدم) بين المتغيرين لعدم وجود علاقة بينهم فمعرفة قيمة أحدهم لا يعني معرفة قيمة الآخر فالمتغيرين الطول ودرجة الامتحان مثلاً وإن تمثيلها بيانياً يظهر مجموعة من النقاط المبعثرة.
إن معرفة العلاقة بين المتغيرات من حيث النوع والقوة والاتجاه يعتبر هدفاً مهماً من أهداف البحث العلمي.
العلاقة المبينة في الجدول أعلاه طردية حيث تزداد قيم y بزيادة قيم x وهي علاقة خطية (Linear).
وتكون درجة العلاقة قوية عندما تكون قيمة معامل الارتباط ± 1 وتكون العلاقة هنا تامة في حين تضعف درجة العلاقة كلما اقتربت القيمة من الصفر، ونوضح قيمة معامل الارتباط بالشكل الآتي:
الشكل ألانتشاري
إذا أخذنا (س ، ص) كقيم متناظرة لمتغيرين وقمنا بتمثيلها في مستوى الإحداثيات وحصلنا على الأشكال التالية:
فلكل قيمة للمتغير x توجد قيمة تقابلها للمتغير y وإن الأزواج المرتبة (x , y) تكون مجتمع ذو بعدين ويعرف الزوج المرتب بمتغير عشوائي ذو بعدين وللمجتمع ذو البعدين نطرح سؤالاً عل توجد علاقة بين المتغيرين؟ وإن وجدت فكيف نعبر عنها بمعادلة؟ فوجود المعادلة يعني معرفة أحد المتغيرين من معرفة الآخر فالمتغير الأول يعرف بالمتغير المستقل في حين الآخر يعرف بالمتغير التابع، الشكل المرفق هنا يعرف بلوحة الانتشار وكل نقطة هنا تمثل زوج مرتب بالصورة (x , y).