تحليل الانحدار الزوجي الخطي. طريقة المربعات الصغرى. مجالات التطبيق

تقريب البيانات التجريبية هو طريقة تعتمد على استبدال البيانات التي تم الحصول عليها تجريبياً بوظيفة تحليلية تمر أو تتطابق بشكل وثيق عند النقاط العقدية مع القيم الأولية (البيانات التي تم الحصول عليها أثناء التجربة أو التجربة). يوجد حاليًا طريقتان لتحديد وظيفة تحليلية:

من خلال بناء استيفاء متعدد الحدود بدرجة n يمر مباشرة من خلال جميع النقاطمجموعة معينة من البيانات. في هذه الحالة ، يتم تمثيل دالة التقريب على النحو التالي: استيفاء متعدد الحدود في صيغة لاغرانج أو استيفاء متعدد الحدود في صيغة نيوتن.

من خلال بناء كثير الحدود التقريبي n- درجة يمر قريبة من النقاطمن مجموعة البيانات المحددة. وبالتالي ، تعمل وظيفة التقريب على تلطيف جميع الضوضاء العشوائية (أو الأخطاء) التي قد تحدث أثناء التجربة: تعتمد القيم المقاسة أثناء التجربة على عوامل عشوائية تتقلب وفقًا لقوانينها العشوائية (أخطاء القياس أو الأداة ، عدم الدقة أو التجريبية أخطاء). في هذه الحالة ، يتم تحديد دالة التقريب بطريقة المربعات الصغرى.

طريقة المربعات الصغرى(في الأدب الإنجليزي ، المربعات الصغرى العادية ، OLS) هي طريقة رياضية تعتمد على تعريف دالة تقريبية ، والتي تم إنشاؤها في أقرب نقطة من النقاط من مجموعة معينة من البيانات التجريبية. يتم تحديد القرب من الدالتين الأولي والتقريب F (x) بواسطة مقياس رقمي ، أي: يجب أن يكون مجموع الانحرافات التربيعية للبيانات التجريبية من المنحنى التقريبي F (x) هو الأصغر.

منحنى ملائم تم إنشاؤه بواسطة طريقة المربعات الصغرى

يتم استخدام طريقة المربعات الصغرى:

لحل أنظمة المعادلات شديدة التحديد عندما يتجاوز عدد المعادلات عدد المجهول ؛

للبحث عن حل في حالة أنظمة المعادلات غير الخطية العادية (غير المحددة بإفراط) ؛

لتقريب قيم النقطة ببعض الوظائف التقريبية.

يتم تحديد دالة التقريب بواسطة طريقة المربعات الصغرى من حالة الحد الأدنى لمجموع الانحرافات التربيعية لوظيفة التقريب المحسوبة من مجموعة معينة من البيانات التجريبية. تتم كتابة معيار طريقة المربعات الصغرى على النحو التالي:

قيم دالة التقريب المحسوبة عند النقاط العقدية ،

مجموعة محددة من البيانات التجريبية عند نقاط العقد.

يحتوي المعيار التربيعي على عدد من الخصائص "الجيدة" ، مثل التفاضل ، والتأكد الحل الوحيدمسائل التقريب لوظائف تقريب كثيرات الحدود.

اعتمادًا على ظروف المشكلة ، فإن دالة التقريب هي كثير حدود من الدرجة m

لا تعتمد درجة دالة التقريب على عدد النقاط العقدية ، ولكن يجب أن يكون بُعدها دائمًا أقل من بُعد (عدد النقاط) لمجموعة معينة من البيانات التجريبية.

∙ إذا كانت درجة دالة التقريب م = 1 ، فإننا نقرب دالة الجدول بخط مستقيم (الانحدار الخطي).

∙ إذا كانت درجة دالة التقريب م = 2 ، فإننا نقرب دالة الجدول بمكافئ تربيعي (تقريب تربيعي).

∙ إذا كانت درجة دالة التقريب م = 3 ، فإننا نقرب دالة الجدول بمقطع مكافئ مكعب (تقريب تكعيبي).

في الحالة العامة ، عندما يكون مطلوبًا إنشاء كثير حدود تقريبي للدرجة m لقيم جدولية معينة ، تتم إعادة كتابة شرط الحد الأدنى لمجموع الانحرافات التربيعية على جميع النقاط العقدية بالشكل التالي:

- معاملات غير معروفة لكثير الحدود التقريبي للدرجة م ؛

عدد قيم الجدول المحددة.

الشرط الضروري لوجود حد أدنى من الوظيفة هو المساواة إلى الصفر من مشتقاتها الجزئية فيما يتعلق بالمتغيرات غير المعروفة . نتيجة لذلك ، نحصل على نظام المعادلات التالي:

دعنا نحول نظام المعادلات الخطي الناتج: افتح الأقواس وانقل المصطلحات الحرة إلى الجانب الأيمن من التعبير. نتيجة لذلك ، سيتم كتابة النظام الناتج من التعبيرات الجبرية الخطية بالشكل التالي:

يمكن إعادة كتابة هذا النظام من التعبيرات الجبرية الخطية في شكل مصفوفة:

نتيجة لذلك ، تم الحصول على نظام المعادلات الخطية ذات البعد m + 1 ، والذي يتكون من m + 1 غير معروف. يمكن حل هذا النظام باستخدام أي طريقة لحل المعادلات الجبرية الخطية (على سبيل المثال ، طريقة غاوس). نتيجة للحل ، سيتم العثور على معلمات غير معروفة لوظيفة التقريب ، مما يوفر الحد الأدنى للمبلغتربيع الانحرافات للدالة التقريبية عن البيانات الأصلية ، أي أفضل تقريب تربيعي ممكن. يجب أن نتذكر أنه إذا تغيرت قيمة واحدة من البيانات الأولية ، فإن جميع المعاملات ستغير قيمها ، حيث يتم تحديدها بالكامل بواسطة البيانات الأولية.

تقريب البيانات الأولية بالاعتماد الخطي

(الانحدارالخطي)

كمثال ، ضع في اعتبارك تقنية تحديد الوظيفة التقريبية ، والتي يتم تقديمها في النموذج الاعتماد الخطي. وفقًا لطريقة المربعات الصغرى ، تتم كتابة شرط الحد الأدنى لمجموع الانحرافات المربعة على النحو التالي:

إحداثيات النقاط العقدية للجدول ؛

معاملات غير معروفة للدالة التقريبية ، والتي تُعطى كعلاقة خطية.

الشرط الضروري لوجود حد أدنى من الوظيفة هو المساواة إلى الصفر من مشتقاتها الجزئية فيما يتعلق بالمتغيرات غير المعروفة. نتيجة لذلك ، نحصل على نظام المعادلات التالي:

دعونا نحول النظام الخطي الناتج من المعادلات.

نحل نظام المعادلات الخطية الناتج. يتم تحديد معاملات دالة التقريب في الشكل التحليلي على النحو التالي (طريقة كرامر):

توفر هذه المعاملات بناء دالة تقريبية خطية وفقًا لمعيار تقليل مجموع مربعات دالة التقريب من قيم جدولية معينة (بيانات تجريبية).

خوارزمية لتنفيذ طريقة المربعات الصغرى

1. البيانات الأولية:

بالنظر إلى مجموعة من البيانات التجريبية مع عدد القياسات N

يتم إعطاء درجة التقريب كثير الحدود (م)

2. خوارزمية الحساب:

2.1. يتم تحديد المعاملات لبناء نظام معادلات ذات أبعاد

معاملات نظام المعادلات (الجانب الأيسر من المعادلة)

- فهرس رقم العمود مصفوفة مربعةأنظمة المعادلات

الأعضاء الأحرار في نظام المعادلات الخطية (الجانب الأيمن من المعادلة)

- فهرس رقم صف المصفوفة المربعة لنظام المعادلات

2.2. تكوين نظام معادلات خطية ذات أبعاد.

2.3 حل نظام معادلات خطية لتحديد المعاملات غير المعروفة لكثير الحدود التقريبي للدرجة م.

2.4 تحديد مجموع الانحرافات التربيعية لكثير الحدود التقريبي من القيم الأولية على جميع النقاط العقدية

القيمة التي تم العثور عليها لمجموع الانحرافات التربيعية هي الحد الأدنى الممكن.

التقريب مع وظائف أخرى

تجدر الإشارة إلى أنه عند تقريب البيانات الأولية وفقًا لطريقة المربعات الصغرى ، تُستخدم أحيانًا دالة لوغاريتمية ودالة أسية ودالة طاقة كدالة تقريبية.

تقريب السجل

ضع في اعتبارك الحالة عندما يتم إعطاء وظيفة التقريب دالة لوغاريتميةيكتب:

100 صمكافأة من الدرجة الأولى

حدد نوع العمل عمل الدورةملخص أطروحة الماجستير تقرير عن ممارسة مراجعة تقرير المادة اختبارمونوغراف حل المشكلات خطة الأعمال إجابات على الأسئلة عمل ابداعيمقال رسم التراكيب عروض ترجمة كتابة أخرى زيادة تفرد نص أطروحة المرشح العمل المخبريمساعدة عبر الإنترنت

اسأل عن السعر

طريقة المربعات الصغرى هي تقنية رياضية (رياضية إحصائية) تعمل على معادلة السلاسل الزمنية ، وتحديد شكل الارتباط بين المتغيرات العشوائية ، وما إلى ذلك. وهي تتكون من حقيقة أن الوظيفة التي تصف هذه الظاهرة يتم تقريبها من خلال دالة أبسط . علاوة على ذلك ، يتم تحديد الأخير بطريقة يكون فيها الانحراف المعياري (انظر التباين) للمستويات الفعلية للوظيفة عند النقاط المرصودة من المستويات المستوية هو الأصغر.

على سبيل المثال ، وفقًا للبيانات المتاحة ( الحادي عشر,يي) (أنا = 1, 2, ..., ن) يتم إنشاء مثل هذا المنحنى ذ = أ + bx، حيث يتم الوصول إلى الحد الأدنى لمجموع الانحرافات التربيعية

على سبيل المثال ، يتم تصغير الوظيفة التي تعتمد على معلمتين: أ- المقطع على المحور ص و ب- منحدر الخط المستقيم.

معادلات العطاء الشروط اللازمةتصغير الوظيفة س(أ,ب)، وتسمى المعادلات العادية.كدوال تقريبية ، لا يتم استخدام الخطي فقط (المحاذاة على طول خط مستقيم) ، ولكن أيضًا من الدرجة الثانية ، ومكافئ ، وأسي ، وما إلى ذلك. M.2 ، حيث مجموع المسافات المربعة ( ذ 1 – ȳ 1)2 + (ذ 2 – ȳ 2) 2 .... - الأصغر ، والخط المستقيم الناتج أفضل طريقةيعكس اتجاه السلسلة الديناميكية للملاحظات لبعض المؤشرات بمرور الوقت.

بالنسبة لمقدرات المربعات الصغرى غير المتحيزة ، من الضروري والكافي ذلك شرط أساسيتحليل الانحدار: يجب أن يكون التوقع الرياضي لخطأ عشوائي مشروط بالعوامل مساوياً للصفر. هذا الشرط، على وجه الخصوص ، يكون مقتنعًا إذا: 1 - توقع الأخطاء العشوائية هو صفر ، 2 - العوامل والأخطاء العشوائية عبارة عن متغيرات عشوائية مستقلة. يمكن اعتبار الشرط الأول مرضيًا دائمًا للنماذج ذات الثابت ، نظرًا لأن الثابت يأخذ توقعًا رياضيًا غير صفري للأخطاء. الشرط الثاني - حالة العوامل الخارجية - أساسي. إذا لم يتم استيفاء هذه الخاصية ، فيمكننا أن نفترض أن أي تقديرات تقريبًا ستكون غير مرضية للغاية: لن تكون حتى متسقة (أي ، حتى صوت عاليالبيانات لا تسمح لتلقي التقييمات النوعيةفي هذه الحالة).

الطريقة الأكثر شيوعًا في ممارسة التقدير الإحصائي لمعاملات معادلات الانحدار هي طريقة المربعات الصغرى. تعتمد هذه الطريقة على عدد من الافتراضات حول طبيعة البيانات ونتائج بناء النموذج. تتمثل العوامل الرئيسية في الفصل الواضح بين المتغيرات الأولية إلى متغيرات مستقلة ومستقلة ، وعدم ترابط العوامل المدرجة في المعادلات ، والخطية للعلاقة ، وغياب الارتباط التلقائي للمتبقي ، والمساواة بينهما التوقعات الرياضيةالصفر والتشتت المستمر.

إحدى الفرضيات الرئيسية لـ LSM هي افتراض أن تشتت الانحرافات ei متساوية ، أي يجب أن يكون انتشارها حول القيمة المتوسطة (صفر) للسلسلة قيمة ثابتة. هذه الخاصية تسمى اللواط. في الممارسة العملية ، غالبًا ما لا تكون تباينات الانحرافات هي نفسها ، أي أنه يتم ملاحظة عدم التجانس. قد يكون هذا نتيجة أسباب مختلفة. على سبيل المثال ، قد تكون هناك أخطاء في البيانات الأصلية. عدم الدقة العشوائية في معلومات اساسية، مثل الأخطاء في ترتيب الأرقام ، يمكن أن يكون لها تأثير ملموس على النتائج. غالبًا ما يتم ملاحظة انتشار أكبر للانحرافات єi عند القيم الكبيرة للمتغير التابع (المتغيرات). إذا كانت البيانات تحتوي على خطأ كبير ، فمن الطبيعي أن يكون انحراف قيمة النموذج المحسوبة من البيانات الخاطئة كبيرًا أيضًا. للتخلص من هذا الخطأ ، نحتاج إلى تقليل مساهمة هذه البيانات في نتائج الحساب ، وتحديد وزن أقل لها عن باقي البيانات الأخرى. يتم تنفيذ هذه الفكرة في المربعات الصغرى الموزونة.

تتيح لك طريقة المربعات الصغرى (LSM) تقدير كميات مختلفة باستخدام نتائج العديد من القياسات التي تحتوي على أخطاء عشوائية.

خاصية MNC

الفكرة الرئيسية هذه الطريقةيتكون من حقيقة أنه كمعيار لدقة حل المشكلة ، يتم النظر في مجموع الأخطاء التربيعية ، والتي يُسعى إلى تصغيرها. عند استخدام هذه الطريقة ، يمكن تطبيق النهجين العددي والتحليلي.

على وجه الخصوص ، كتطبيق عددي ، تتضمن طريقة المربعات الصغرى إجراء أكبر عدد ممكن من قياسات المجهول. متغير عشوائي. علاوة على ذلك ، كلما زادت العمليات الحسابية ، كان الحل أكثر دقة. في هذه المجموعة من الحسابات (البيانات الأولية) ، يتم الحصول على مجموعة أخرى من الحلول المقترحة ، والتي يتم بعد ذلك تحديد أفضلها. إذا كانت مجموعة الحلول ذات معلمات ، فسيتم تقليل طريقة المربعات الصغرى لإيجاد القيمة المثلى للمعلمات.

كنهج تحليلي لتنفيذ LSM على مجموعة البيانات الأولية (القياسات) ومجموعة الحلول المقترحة ، يتم تعريف البعض (الوظيفية) ، والتي يمكن التعبير عنها من خلال صيغة تم الحصول عليها كفرضية معينة تحتاج إلى تأكيد. في هذه الحالة ، يتم تقليل طريقة المربعات الصغرى لإيجاد الحد الأدنى من هذه الوظيفة في مجموعة الأخطاء التربيعية للبيانات الأولية.

لاحظ أنه ليس الأخطاء نفسها ، بل مربعات الأخطاء. لماذا ا؟ الحقيقة هي أنه غالبًا ما تكون انحرافات القياسات عن القيمة الدقيقة موجبة وسالبة. عند تحديد المتوسط ​​، يمكن أن يؤدي الجمع البسيط إلى استنتاج غير صحيح حول جودة التقدير ، منذ الإلغاء المتبادل للإيجابية و القيم السالبةسيقلل من قوة أخذ العينات لمجموعة القياسات. وبالتالي دقة التقييم.

لمنع حدوث ذلك ، يتم تلخيص الانحرافات التربيعية. أكثر من ذلك ، من أجل معادلة أبعاد القيمة المقاسة والتقدير النهائي ، يتم استخدام مجموع الأخطاء التربيعية لاستخراج

بعض تطبيقات الشركات متعددة الجنسيات

يستخدم MNC على نطاق واسع في مناطق مختلفة. على سبيل المثال ، في نظرية الاحتمالات والإحصاءات الرياضية ، تُستخدم الطريقة لتحديد خاصية متغير عشوائي مثل الانحراف المعياري ، الذي يحدد عرض نطاق قيم المتغير العشوائي.

يستخدم على نطاق واسع في الاقتصاد القياسي في شكل تفسير اقتصادي واضح لمعاييره.

يتم تقليل الانحدار الخطي إلى إيجاد معادلة للصيغة

أو

اكتب المعادلة يسمح بقيم معلمة معينة Xلها قيم نظرية للميزة الفعالة ، لتحل محل القيم الفعلية للعامل فيها X.

يعتمد بناء الانحدار الخطي على تقدير معلماته - أو في.يمكن العثور على تقديرات معامل الانحدار الخطي بطرق مختلفة.

يعتمد النهج الكلاسيكي لتقدير معاملات الانحدار الخطي على المربعات الصغرى(MNK).

يسمح LSM للشخص بالحصول على تقديرات المعلمات هذه أو في،تحتها مجموع الانحرافات التربيعية للقيم الفعلية للسمة الناتجة (ذ)من المحسوب (النظري) الحد الأدنى المصغر:

للعثور على الحد الأدنى للدالة ، من الضروري حساب المشتقات الجزئية فيما يتعلق بكل من المعلمات أو بونعادلها بالصفر.

دل من خلال S ، ثم:

عند تحويل الصيغة ، نحصل على النظام التالي من المعادلات العادية لتقدير المعلمات أو في:

حل نظام المعادلات العادية (3.5) إما بطريقة الحذف المتتالي للمتغيرات أو بطريقة المحددات نجد تقديرات المعلمات المرغوبة أو في.

معامل فييسمى معامل الانحدار. توضح قيمته متوسط ​​التغيير في النتيجة مع تغيير في العامل بمقدار وحدة واحدة.

دائمًا ما يتم استكمال معادلة الانحدار بمؤشر على ضيق الاتصال. عند استخدام الانحدار الخطي ، يعمل معامل الارتباط الخطي كمؤشر. يوجد تعديلات مختلفةصيغ معامل الارتباط الخطي. بعضها مذكور أدناه:

كما تعلم ، فإن معامل الارتباط الخطي يقع ضمن الحدود: -1 1.

لتقييم جودة اختيار دالة خطية ، يتم حساب المربع

يسمى معامل الارتباط الخطي معامل التحديد.معامل التحديد يميز نسبة تباين السمة الفعالة ذيفسره الانحدار ، في التباين الكلي للسمة الناتجة:

وفقًا لذلك ، فإن القيمة 1 - تميز نسبة التشتت ذبسبب تأثير عوامل أخرى لا تؤخذ في الاعتبار في النموذج.

أسئلة لضبط النفس

1. جوهر طريقة المربعات الصغرى؟

2. كم عدد المتغيرات التي توفر الانحدار الزوجي؟

3. ما المعامل الذي يحدد ضيق الاتصال بين التغييرات؟

4. في أي حدود يتم تحديد معامل التحديد؟

5. تقدير المعامل (ب) في تحليل الارتباط والانحدار؟

1. كريستوفر دوجيرتي. مقدمة في الاقتصاد القياسي. - م: INFRA - M، 2001-402 ص.

2. S.A. بوروديتش. الاقتصاد القياسي. مينسك ذ م م "المعرفة الجديدة" 2001.


3. R.U. رحمتوف دورات قصيرةفي الاقتصاد القياسي. الدورة التعليمية. ألماتي. 2004. -78 ثانية.

4. I.I. إليسيفا. - م: "المالية والإحصاء" ، 2002

5. مجلة إعلامية وتحليلية شهرية.

النماذج الاقتصادية غير الخطية. نماذج الانحدار غير الخطي. التحويل المتغير.

غير خطي النماذج الاقتصادية..

التحويل المتغير.

معامل المرونة.

إذا كانت هناك علاقات غير خطية بين الظواهر الاقتصادية ، فسيتم التعبير عنها باستخدام الوظائف غير الخطية المقابلة: على سبيل المثال ، القطع الزائد المتساوي الأضلاع , القطع المكافئ من الدرجة الثانية وإلخ.

هناك فئتان من الانحدارات غير الخطية:

1. الانحدارات غير الخطية فيما يتعلق بالمتغيرات التوضيحية المدرجة في التحليل ، ولكنها خطية فيما يتعلق بالمعلمات المقدرة ، على سبيل المثال:

كثيرات الحدود بدرجات مختلفة - , ;

غلو متساوي الأضلاع - ؛

دالة شبه لوغاريتمية -.

2. الانحدارات غير الخطية في المعلمات المقدرة ، على سبيل المثال:

قوة - ؛

إيضاحي -؛

متسارع - .

المجموع الكلي للانحرافات التربيعية للقيم الفردية للسمة الناتجة فيمن متوسط ​​القيمة ناتج عن تأثير العديد من العوامل. نقسم مجموعة الأسباب بأكملها بشكل مشروط إلى مجموعتين: درس العامل العاشرو عوامل اخرى.

إذا لم يؤثر العامل على النتيجة ، فإن خط الانحدار على الرسم البياني يكون موازيًا للمحور أوهو

ثم يرجع التشتت الكامل للسمة الناتجة إلى تأثير العوامل الأخرى وسيتطابق المجموع الكلي للانحرافات التربيعية مع المتبقي. إذا لم تؤثر العوامل الأخرى على النتيجة ، إذن ش مقيدمع Xوظيفيًا ، ومجموع المربعات المتبقي هو صفر. في هذه الحالة ، يكون مجموع الانحرافات التربيعية التي أوضحها الانحدار هو نفسه المجموع الكلي للمربعات.

نظرًا لأنه لا تقع جميع نقاط مجال الارتباط على خط الانحدار ، فإن تبعثرها يحدث دائمًا بسبب تأثير العامل X، أي الانحدار فيعلى X ،وينتج عن فعل أسباب أخرى (اختلاف غير مفسر). تعتمد ملاءمة خط الانحدار للتنبؤ على أي جزء من التباين الكلي للسمة فيحسابات الاختلاف الموضح

من الواضح ، إذا كان مجموع الانحرافات التربيعية بسبب الانحدار أكبر من المجموع المتبقي للمربعات ، فإن معادلة الانحدار تكون ذات دلالة إحصائية والعامل Xله تأثير كبير على النتيجة. ذ.

, أي مع عدد حرية التباين المستقل للميزة. يرتبط عدد درجات الحرية بعدد وحدات السكان n وعدد الثوابت المحددة منها. فيما يتعلق بالمشكلة قيد الدراسة ، يجب أن يوضح عدد درجات الحرية عدد الانحرافات المستقلة عن ص

يتم تقييم أهمية معادلة الانحدار ككل بمساعدة F- معيار فيشر. في هذه الحالة ، يتم طرح فرضية فارغة مفادها أن معامل الانحدار يساوي صفرًا ، أي ب = 0 ، وبالتالي العامل Xلا يؤثر على النتيجة ذ.

يسبق الحساب المباشر لمعيار F تحليل التباين. محورها هو توسيع المجموع الكلي للانحرافات التربيعية للمتغير فيمن متوسط ​​القيمة فيإلى جزأين - "موضح" و "غير مفسر":

- مجموع الانحرافات التربيعية ؛

- مجموع الانحرافات التربيعية التي أوضحها الانحدار ؛

هو المجموع المتبقي لمربعات الانحراف.

يرتبط أي مجموع من الانحرافات التربيعية بعدد درجات الحرية , أي مع عدد حرية التباين المستقل للميزة. عدد درجات الحرية مرتبط بعدد الوحدات السكانية نوبعد تحديد الثوابت منه. فيما يتعلق بالمشكلة قيد الدراسة ، يجب أن يوضح عدد درجات الحرية عدد الانحرافات المستقلة عن صممكن مطلوب لتكوين مجموع معين من المربعات.

التشتت حسب درجة الحريةد.

نسب F (معيار F):

إذا كانت الفرضية الصفرية صحيحة، ثم لا يختلف العامل والفروق المتبقية عن بعضها البعض. بالنسبة لـ H 0 ، يكون التفنيد ضروريًا بحيث يتجاوز تباين العامل المتبقي عدة مرات. طور الإحصائي الإنجليزي Snedecor جداول القيم الحرجة F- العلاقات على مستويات مختلفة من أهمية فرضية العدم و أعداد مختلفةدرجات الحرية. قيمة الجدول F-المعيار هو القيمة القصوى لنسبة التباينات التي يمكن أن تحدث إذا تباعدوا بشكل عشوائي لمستوى معين من احتمالية وجود فرضية فارغة. القيمة المحسوبة F- يتم التعرف على العلاقة على أنها موثوقة إذا كانت o أكبر من تلك الجدولية.

في هذه الحالة ، يتم رفض الفرضية الصفرية حول عدم وجود علاقة سمات ويتم التوصل إلى استنتاج حول أهمية هذه العلاقة: حقيقة F> جدول F.تم رفض H 0.

إذا كانت القيمة أقل من الجدول حقيقة F ‹، جدول F، ثم يكون احتمال الفرضية الصفرية أعلى من مستوى معين ولا يمكن رفضه دون وجود خطر جاد في التوصل إلى نتيجة خاطئة حول وجود علاقة. في هذه الحالة ، تعتبر معادلة الانحدار غير ذات دلالة إحصائية. لا لا ينحرف.

الخطأ المعياري لمعامل الانحدار

لتقدير أهمية معامل الانحدار ، يتم مقارنة قيمته مع قيمته خطأ تقليدي، أي يتم تحديد القيمة الفعلية ر- معيار الطالب: والتي تتم مقارنتها بعد ذلك بالقيمة المجدولة عند مستوى معين من الأهمية وعدد درجات الحرية ( ن- 2).

معلمة خطأ معياري أ:

يتم التحقق من أهمية معامل الارتباط الخطي بناءً على حجم الخطأ معامل الارتباط ص:

التباين الكلي للميزة X:

الانحدار الخطي المتعدد

بناء نموذج

الانحدار المتعددهو انحدار للخاصية الناتجة مع اثنين و عدد كبيرالعوامل ، أي نموذج العرض

يمكن أن يعطي الانحدار نتيجة جيدة في النمذجة إذا كان من الممكن إهمال تأثير العوامل الأخرى التي تؤثر على موضوع الدراسة. لا يمكن التحكم في سلوك المتغيرات الاقتصادية الفردية ، أي أنه ليس من الممكن ضمان المساواة بين جميع الشروط الأخرى لتقييم تأثير عامل واحد قيد الدراسة. في هذه الحالة ، يجب أن تحاول تحديد تأثير العوامل الأخرى عن طريق إدخالها في النموذج ، أي إنشاء معادلة انحدار متعددة: ص = أ + ب 1 س 1 + ب 2 + ... + ب س س ع + .

الهدف الرئيسي من الانحدار المتعدد هو بناء نموذج مع عدد كبير من العوامل ، مع تحديد تأثير كل منها على حدة ، وكذلك تأثيرها التراكمي على المؤشر النموذجي. تتضمن مواصفات النموذج مجالين من الأسئلة: اختيار العوامل واختيار نوع معادلة الانحدار

  • الدورة التعليمية

مقدمة

أنا مبرمج الكمبيوتر. لقد حققت أكبر قفزة في مسيرتي عندما تعلمت أن أقول: "أنا لا أفهم شيئا!"الآن لا أخجل من إخبار نجم العلم بأنه يلقي لي محاضرة ، وأنني لا أفهم ما الذي يتحدث عنه ، النجم اللامع. وهذا صعب للغاية. نعم ، من الصعب والمحرج الاعتراف بأنك لا تعرف. من يحب أن يعترف بأنه لا يعرف أساسيات شيء ما هناك. بحكم مهنتي ، يجب أن أحضر بأعداد كبيرةالعروض والمحاضرات ، حيث أعترف ، في الغالبية العظمى من الحالات ، أريد أن أنام ، لأنني لا أفهم شيئًا. لا أفهم لأنها مشكلة كبيرة. الوضع الراهنفي العلوم تكمن في الرياضيات. يفترض أن جميع الطلاب على دراية بجميع مجالات الرياضيات (وهو أمر سخيف). إن الاعتراف بأنك لا تعرف ما هو المشتق (أن هذا متأخر قليلاً) هو عار.

لكنني تعلمت أن أقول إنني لا أعرف ما هو الضرب. نعم ، لا أعرف ما هو الجبر الفرعي على جبر الكذب. نعم ، لا أعرف لماذا تحتاج في الحياة المعادلات التربيعية. بالمناسبة ، إذا كنت متأكدًا من أنك تعرف ، فلدينا شيء نتحدث عنه! الرياضيات عبارة عن سلسلة من الحيل. يحاول علماء الرياضيات إرباك الجمهور وتخويفهم ؛ حيث لا يوجد ارتباك ولا سمعة ولا سلطة. نعم ، إنه لأمر مرموق التحدث بأكثر لغة مجردة ممكنة ، وهذا مجرد هراء في حد ذاته.

هل تعرف ما هو المشتق؟ على الأرجح ستخبرني عن حد علاقة الاختلاف. في السنة الأولى للرياضيات في جامعة ولاية سانت بطرسبرغ ، فيكتور بتروفيتش خافين لي مُعرفمشتق كمعامل للمصطلح الأول لسلسلة تايلور للوظيفة عند النقطة (كان جمبازًا منفصلاً لتحديد سلسلة تايلور بدون مشتقات). ضحكت على هذا التعريف لفترة طويلة ، حتى فهمت أخيرًا ما يدور حوله. المشتق ليس أكثر من مجرد قياس لمدى تشابه الدالة التي نشتقها مع الدالة y = x ، y = x ^ 2 ، y = x ^ 3.

يشرفني الآن أن أحاضر الطلاب الذين يخافالرياضيات. إذا كنت تخاف من الرياضيات - فنحن في الطريق. بمجرد أن تحاول قراءة بعض النصوص ويبدو لك أنها معقدة للغاية ، فاعلم أنها مكتوبة بشكل سيئ. أنا أزعم أنه لا توجد منطقة واحدة في الرياضيات لا يمكن التحدث عنها "على الأصابع" دون فقدان الدقة.

التحدي الذي يواجه المستقبل القريب: لقد وجهت طلابي لفهم ماهية أداة التحكم الخطية التربيعية. لا تخجل ، تضيع ثلاث دقائق من حياتك ، اتبع الرابط. إذا كنت لا تفهم شيئًا ، فنحن في الطريق. أنا (عالم رياضيات-مبرمج محترف) لم أفهم شيئًا أيضًا. وأؤكد لكم أنه يمكن تسوية ذلك "على الأصابع". في الوقت الحالي لا أعرف ما هو ، لكنني أؤكد لكم أننا سنكون قادرين على معرفة ذلك.

لذا ، فإن المحاضرة الأولى التي سأقدمها لطلابي بعد أن يأتوا إليّ وهم يركضون في حالة من الرعب مع الكلمات التي تقول إن وحدة التحكم الخطية التربيعية هي خلل فظيع لن تتقنه أبدًا في حياتك طرق المربعات الصغرى. هل يمكنك أن تقرر المعادلات الخطية؟ إذا كنت تقرأ هذا النص ، فعلى الأرجح لا.

لذلك ، بالنظر إلى نقطتين (x0 ، y0) ، (x1 ، y1) ، على سبيل المثال ، (1،1) و (3،2) ، فإن المهمة هي إيجاد معادلة خط مستقيم يمر عبر هاتين النقطتين:

توضيح

يجب أن يكون لهذا الخط المستقيم معادلة مثل ما يلي:

هنا لا نعرف ألفا وبيتا ، لكن نقطتين من هذا الخط معروفان:

يمكنك كتابة هذه المعادلة في شكل مصفوفة:

هنا يجب أن تفعل استطرادا غنائيا: ما هي المصفوفة؟ المصفوفة ليست سوى مصفوفة ثنائية الأبعاد. هذه طريقة لتخزين البيانات ، ولا يجب إعطاء المزيد من القيم لها. الأمر متروك لنا بالضبط لتفسير مصفوفة معينة. بشكل دوري ، سأفسرها على أنها رسم خرائط خطي ، وبشكل دوري كشكل تربيعي ، وأحيانًا ببساطة كمجموعة من المتجهات. سيتم توضيح كل هذا في السياق.

دعنا نستبدل المصفوفات المحددة بتمثيلها الرمزي:

ثم يمكن العثور بسهولة على (alpha، beta):

بشكل أكثر تحديدًا لبياناتنا السابقة:

مما يؤدي إلى المعادلة التالية لخط مستقيم يمر بالنقطتين (1،1) و (3،2):

حسنًا ، كل شيء واضح هنا. ولنجد معادلة الخط المستقيم المار ثلاثةالنقاط: (x0، y0)، (x1، y1) و (x2، y2):

أوه أوه أوه ، لكن لدينا ثلاث معادلات لاثنين من المجهولين! سيقول عالم الرياضيات القياسي أنه لا يوجد حل. ماذا سيقول المبرمج؟ وسيعيد كتابة نظام المعادلات السابق أولاً بالشكل التالي:

في حالتنا ، المتجهات i و j و b ثلاثية الأبعاد ، لذلك (في الحالة العامة) لا يوجد حل لهذا النظام. أي متجه (alpha \ * i + beta \ * j) يقع في المستوى الممتد بواسطة المتجهات (i، j). إذا كانت b لا تنتمي إلى هذا المستوى ، فلا يوجد حل (لا يمكن تحقيق المساواة في المعادلة). ماذا أفعل؟ دعونا نبحث عن حل وسط. دعونا نشير بواسطة ه (ألفا ، بيتا)كيف بالضبط لم نحقق المساواة:

وسنحاول تقليل هذا الخطأ:

لماذا مربع؟

نحن لا نبحث فقط عن الحد الأدنى من القاعدة ، ولكن عن الحد الأدنى من مربع القاعدة. لماذا ا؟ تتطابق النقطة الدنيا نفسها ، ويعطي المربع وظيفة سلسة (دالة تربيعية للوسيطات (ألفا ، بيتا)) ، بينما يعطي الطول فقط وظيفة في شكل مخروط ، غير قابل للتفاضل عند أدنى نقطة. برر. المربع هو أكثر ملاءمة.

من الواضح أن الخطأ يتم تصغيره عندما يكون المتجه همتعامد مع الطائرة التي امتدت من قبل المتجهات أناو ي.

توضيح

بمعنى آخر: نحن نبحث عن خط بحيث يكون مجموع الأطوال التربيعية للمسافات من جميع النقاط إلى هذا الخط ضئيلًا:

تحديث: هنا لدي دعامة ، يجب قياس المسافة إلى الخط عموديًا ، وليس الإسقاط الإملائي. هذا المعلق صحيح.

توضيح

بكلمات مختلفة تمامًا (بعناية ، غير رسمية بشكل جيد ، ولكن يجب أن تكون واضحة على الأصابع): نأخذ جميع الخطوط الممكنة بين جميع أزواج النقاط ونبحث عن الخط المتوسط ​​بين الكل:

توضيح

تفسير آخر على الأصابع: نعلق زنبركًا بين جميع نقاط البيانات (لدينا هنا ثلاث نقاط) والخط الذي نبحث عنه ، وخط حالة التوازن هو بالضبط ما نبحث عنه.

شكل تربيعي الحد الأدنى

لذلك ، بالنظر إلى المتجه بويمتد المستوى بواسطة متجهات أعمدة المصفوفة أ(في هذه الحالة (x0، x1، x2) و (1،1،1)) ، نحن نبحث عن متجه هبحد أدنى للطول. من الواضح أن الحد الأدنى يمكن تحقيقه فقط للمتجه ه، متعامد مع المستوى الممتد بواسطة متجهات أعمدة المصفوفة أ:

بمعنى آخر ، نحن نبحث عن متجه x = (alpha، beta) بحيث:

أذكرك أن هذا المتجه x = (alpha، beta) هو الحد الأدنى وظيفة من الدرجة الثانية|| ه (ألفا ، بيتا) || ^ 2:

من المفيد هنا أن نتذكر أنه يمكن تفسير المصفوفة وكذلك الشكل التربيعي ، على سبيل المثال ، يمكن تفسير مصفوفة الهوية ((1،0) ، (0،1)) على أنها دالة في x ^ 2 + y ^ 2:

شكل تربيعي

يُعرف كل هذا الجمباز بالانحدار الخطي.

معادلة لابلاس مع شرط حدود ديريتشليت

الآن أبسط مشكلة حقيقية: هناك سطح مثلثي معين ، من الضروري تنعيمه. على سبيل المثال ، لنقم بتحميل نموذج وجهي:

الالتزام الأصلي متاح. لتقليل التبعيات الخارجية ، أخذت رمز عارض البرامج الخاص بي ، الموجود بالفعل على Habré. عن الحلول نظام خطيأستخدم OpenNL ، إنه حل رائع ، لكن من الصعب جدًا تثبيته: تحتاج إلى نسخ ملفين (.h + .c) إلى مجلد مشروعك. كل التجانس يتم بواسطة الكود التالي:

لـ (int د = 0 ؛ د<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i& الوجه = الوجوه [i] ؛ لـ (int j = 0 ؛ j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

إحداثيات X و Y و Z قابلة للفصل ، وأنا أقوم بتنعيمها بشكل منفصل. أي أنني قمت بحل ثلاثة أنظمة من المعادلات الخطية ، لكل منها نفس عدد المتغيرات مثل عدد الرؤوس في نموذجي. الصفوف n الأولى من المصفوفة A بها صف واحد فقط لكل صف ، وأول n من الصفوف من المتجه b لها إحداثيات النموذج الأصلي. أي أنني أربط بين موضع الرأس الجديد وموضع الرأس القديم - لا ينبغي أن تكون الموضع الجديد بعيدًا جدًا عن الموضع القديم.

كل الصفوف التالية من المصفوفة A (الوجوه. الحجم () * 3 = عدد حواف كل المثلثات في الشبكة) لها تكرار واحد للعدد 1 وتكرار واحد هو -1 ، بينما المتجه ب له مكونات صفرية متقابلة. هذا يعني أنني وضعت زنبركًا على كل حافة من شبكتنا المثلثية: تحاول جميع الحواف الحصول على نفس رأس نقطة البداية والنهاية.

مرة أخرى: جميع الرؤوس متغيرات ، ولا يمكنها أن تنحرف بعيدًا عن موضعها الأصلي ، لكنها في نفس الوقت تحاول أن تصبح متشابهة مع بعضها البعض.

ها هي النتيجة:

سيكون كل شيء على ما يرام ، فالنموذج ناعم حقًا ، لكنه ابتعد عن حافته الأصلية. دعنا نغير الكود قليلاً:

لـ (int i = 0 ؛ i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

في المصفوفة A ، بالنسبة للرؤوس الموجودة على الحافة ، لا أضيف صفًا من الفئة v_i = verts [i] [d] ، ولكن أضف 1000 * v_i = 1000 * verts [i] [d]. ماذا تغير؟ وهذا يغير الصيغة التربيعية للخطأ. الآن لن يكلف الانحراف الفردي عن القمة عند الحافة وحدة واحدة ، كما كان من قبل ، ولكن 1000 * 1000 وحدة. أي أننا علقنا زنبركًا أقوى على القمم المتطرفة ، يفضل الحل أن يمد الآخرين بقوة أكبر. ها هي النتيجة:

لنضاعف قوة الينابيع بين القمم:
معامل nl (الوجه [j] ، 2) ؛ معامل nl (الوجه [(j + 1)٪ 3] ، -2) ؛

من المنطقي أن يصبح السطح أكثر سلاسة:

والآن أقوى بمئة مرة:

ما هذا؟ تخيل أننا غمسنا حلقة سلكية في الماء والصابون. نتيجة لذلك ، سيحاول فيلم الصابون الناتج الحصول على أقل انحناء ممكن ، بحيث يلامس نفس الحد - حلقة الأسلاك الخاصة بنا. هذا بالضبط ما حصلنا عليه من خلال إصلاح الحدود وطلب سطح أملس بالداخل. تهانينا ، لقد حللنا للتو معادلة لابلاس بشروط حدود ديريتشليت. يبدو جيدا؟ ولكن في الواقع ، هناك نظام واحد فقط من المعادلات الخطية لحلها.

معادلة بواسون

دعونا نحصل على اسم رائع آخر.

لنفترض أن لدي صورة مثل هذه:

الجميع بخير ، لكني لا أحب الكرسي.

قطعت الصورة إلى نصفين:



وسأختار كرسي بيدي:

ثم سأقوم بسحب كل ما هو أبيض في القناع إلى الجانب الأيسر من الصورة ، وفي نفس الوقت سأقول طوال الصورة بأكملها أن الاختلاف بين وحدتي بكسل متجاورتين يجب أن يكون مساويًا للفرق بين وحدتي بكسل متجاورتين. الصورة الصحيحة:

لـ (int i = 0 ؛ i

ها هي النتيجة:

الكود والصور متوفرة

المنشورات ذات الصلة