რა არის მულტიკოლინეარობის უარყოფითი გავლენა? მულტიკოლინეარობის ცნება

  • 4. PLR პარამეტრების სტატისტიკური შეფასება უმცირესი კვადრატების მეთოდით. უმცირესი კვადრატების შეფასების თვისებები
  • უმცირესი კვადრატების შეფასების თვისებები:
  • 5. მრავალჯერადი წრფივი რეგრესიის ხარისხის შემოწმება: პარამეტრების მნიშვნელობა, ნდობის ინტერვალები, მოდელის ადეკვატურობა. პროგნოზირება.
  • 6. მრავალჯერადი წრფივი რეგრესია (MLR). კლასიკური ვარაუდები. მოდელის პარამეტრების OLS შეფასება.
  • 7. მრავალჯერადი წრფივი რეგრესიის OLS შეფასების თვისებები. გაუს-მარკოვის თეორემა.
  • 8. მრავალჯერადი წრფივი რეგრესიის ხარისხის შემოწმება: პარამეტრების მნიშვნელობა, ნდობის ინტერვალები, მოდელის ადეკვატურობა. პროგნოზირება.
  • 5. კოეფიციენტი განსაზღვრებები
  • პროგნოზირება მრავალჯერადი ხაზოვანი რეგრესიის მოდელის გამოყენებით
  • 9. ეკონომეტრიული მოდელის დაზუსტება: ეგზოგენური ცვლადების შერჩევის მეთოდები და დიაგნოსტიკა. რამსის და ამემიას ტესტები.
  • რამსის კრიტერიუმი:
  • 10. ეკონომეტრიული მოდელის სპეციფიკაცია: არაწრფივი მოდელის დამოკიდებულების ფორმის შერჩევა
  • სპეციფიკაციის პრინციპები
  • 11. მულტიკოლინეარობის პრობლემა. მულტიკოლინეარობის არსებობისა და დიაგნოზის შედეგები.
  • მულტიკოლინეარობის დიაგნოსტიკის მეთოდები:
  • 12. მულტიკოლინეარობის აღმოფხვრის მეთოდები. ძირითადი კომპონენტის მეთოდი. ქედის რეგრესია.
  • 13. მოდელის ჰეტეროსკედასტიურობის პრობლემები. მისი დიაგნოზის კრიტერიუმები.
  • 1. პარკის კრიტერიუმი.
  • 2. გოლდფელდ-კვანდის კრიტერიუმი.
  • 3. ბრეუშ-წარმართული კრიტერიუმი.
  • 4. თეთრი კრიტერიუმი.
  • 14. განზოგადებული უმცირესი კვადრატები (oms). mlr შეფასების თვისებები omnk-ისთვის. შეწონილი უმცირესი კვადრატების მეთოდი მოდელის პარამეტრების შეფასების პრობლემაში. შეფასების თვისებები შეწონილი უმცირესი კვადრატების გამოყენებით.
  • კითხვა 15. მოდელის ნარჩენების ავტოკორელაციის პრობლემა. ავტოკორელაციის შედეგები მოდელის გამოყენებისას.
  • ნარჩენების ავტოკორელაციის მიზეზები
  • ავტოკორელაციის შედეგები:
  • 16. დურბინ-უოტსონის ავტოკორელაციის დიაგნოსტიკური კრიტერიუმი
  • 17.ავტოკორელაციის აღმოფხვრის მეთოდები. კოკრეინ-ორკუტისა და ჰილდრეტ-ლუს ქულების გატანის პროცედურები
  • 18. მოდელები განაწილებული ჩამორჩენით: ლაგის სტრუქტურა კოიკის მიხედვით: სპეციალური შემთხვევები (მოდელი არასრული კორექტირებით და ადაპტური მოლოდინებით)
  • 19 მოდელები განაწილებული ჩამორჩენით: ჩამორჩენის წრფივი-არითმეტიკული სტრუქტურა და ჩამორჩენის მრავალწევრი სტრუქტურა ალმონის მიხედვით
  • 20. h-Durbin ტესტი და მრავალჯერადი Lagrange ტესტი ავტოკორელაციის შესამოწმებლად ლაგის მოდელებში
  • 21. დროის სერიების ცნება (დრო). VR მოდელი, VR ანალიზის ძირითადი ამოცანები. დროის დაგლუვების მეთოდები (მოძრავი საშუალო, ექსპონენციალური გლუვი, თანმიმდევრული განსხვავებები)
  • 22 დროის სერიების სტაციონალურობა (დრო). ტემპერატურის დონეების კორელაციის მახასიათებლები.
  • 23 სტაციონარული დროის სერიების მოდელები: ავტორეგრესია, მოძრავი საშუალო, რკალი
  • 24. წარმოშობის არასტაციონარული მოდელი. მოდელის პარამეტრების შეფასება.
  • 28. დროის სერიების პროგნოზირება. პროგნოზის სიზუსტის ინდიკატორები.
  • 30. ჩაუ ტესტი ეკონომეტრიულ მოდელში მოჩვენებითი ცვლადების ჩართვის დიაგნოსტიკისთვის.
  • 32. ერთდროული ეკონომეტრიული განტოლებების სისტემები (SOE). სისტემის სტრუქტურული და შემცირებული ფორმა (გრაფიკული და მატრიცული წარმოდგენა).
  • 33. ერთდროულ განტოლებათა სისტემების იდენტიფიკაციის ამოცანები (SOE). სოიოს განტოლებების იდენტიფიცირება (რიგობითი და რანგის კრიტერიუმები)
  • 34. ერთდროული განტოლებათა სისტემების შეფასების მეთოდები: უმცირესი კვადრატების არაპირდაპირი მეთოდი, ორსაფეხურიანი უმცირესი კვადრატების მეთოდი. შეფასებების გამოყენებადობა და თვისებები
  • 35. ეკონომეტრიის დღევანდელი მდგომარეობა. დიდი ეკონომეტრიული მოდელების მაგალითები
  • 11. მულტიკოლინეარობის პრობლემა. მულტიკოლინეარობის არსებობისა და დიაგნოზის შედეგები.

    Თუ არის შესაძლებელი ეგზოგენური ცვლადების წრფივი ურთიერთობა მაგალითად, მაშინ OLS შეფასებები არ იარსებებს, რადგან არ არსებობს მატრიცის ინვერსია, რომელიც იქნება სინგულარული. ამ მდგომარეობას ეკონომეტრიაში პრობლემა ეწოდება მრავალმხრივობა.

    მულტიკოლინეარობის მიზეზები:

    მოდელის არასწორი სპეციფიკაცია

    სტატისტიკური მონაცემების უყურადღებო შეგროვება (განმეორებითი დაკვირვების გამოყენება).

    გამოარჩევენ გამოკვეთილი და იმპლიციტური მრავალმხრივობა.

    აშკარა - ცნობილი ზუსტი ხაზოვანი ურთიერთობამოდელის ცვლადებს შორის.

    მაგალითად, თუ საინვესტიციო პროცესის მოდელი მოიცავს ნომინალურ და რეალურ საპროცენტო განაკვეთებს, ე.ი.

    სადაც ცნობილია რეალურ და ნომინალურ მაჩვენებლებსა და ინფლაციის მაჩვენებელს შორის კავშირი

    მაშინ აშკარაა მულტიკოლინეარულობა.

    იმპლიციტური ხდება მაშინ, როდესაც არსებობს სტოქასტური (გაურკვეველი, შემთხვევითი) წრფივი დამოკიდებულება ეგზოგენურ ცვლადებს შორის.

    ჭარბობს იმპლიციტური, მისი არსებობა ხასიათდება6 ნიშანი :

    1. მოდელის პარამეტრების OLS შეფასებები კარგავენ უადგილო თვისებებს .

    2. OLS შეფასებების ვარიაცია იზრდება:

    გამომდინარე იქიდან, რომ კორელაციის კოეფიციენტი, რომელიც გულისხმობს

    3. არის კლება - სტატისტიკა, რომელიც არის პარამეტრების მნიშვნელობის მაჩვენებელი:

    4. განსაზღვრის კოეფიციენტი აღარ არის მოდელის ადეკვატურობის საზომი, ვინაიდან დაბალი მნიშვნელობები - სტატისტიკოსები იწვევს უნდობლობას შერჩეული დამოკიდებულების მოდელის მიმართ.

    5. არაკოლინარული ეგზოგენური ცვლადების პარამეტრების შეფასება ხდება ძალიან მგრძნობიარე მონაცემების ცვლილებების მიმართ.

    6. არაკოლინარული ეგზოგენური ცვლადების პარამეტრების შეფასება ხდება უმნიშვნელო.

    მულტიკოლინეარობის დიაგნოსტიკის მეთოდები:

    Ნაბიჯი 1.მრავალჯერადი წრფივი რეგრესიის (საწყისში) მოდელში ჩვენ გავივლით ყველა ქვემოდელს, რომელშიც ნებისმიერი ეგზოგენური ცვლადი ხდება ენდოგენური, ე.ი.

    ნაბიჯი 2.ჩვენ ვიანგარიშებთ ყველა მიღებული მოდელის განსაზღვრის კოეფიციენტებს, რის საფუძველზეც ვიანგარიშებთ ინფლაციის ე.წ.

    თუ , მაშინ ისინი ასკვნიან, რომ არსებობს მულტიკოლნეარულობა.

    ა) ისინი არ ცვლიან არცერთ სტრუქტურას მოდელში, მაგრამ კომპიუტერული უმცირესი კვადრატების გამოყენებით აანალიზებენ მულტიკოლნეარობის პრობლემის არსებობას ვიზუალური მეთოდების გამოყენებით.

    ბ) მოდელის სპეციფიკაციის გაუმჯობესება ორიგინალური მოდელიდან კოლინარული ეგზოგენური ცვლადების აღმოფხვრით.

    გ) სტატისტიკური მონაცემების მოცულობის გაზრდა.

    დ) აერთიანებს კოლინარული ცვლადები და მოიცავს საერთო ეგზოგენურ ცვლადს მოდელში.

    12. მულტიკოლინეარობის აღმოფხვრის მეთოდები. ძირითადი კომპონენტის მეთოდი. ქედის რეგრესია.

    თუ მოდელის მთავარი ამოცანაა დამოკიდებული ცვლადის მომავალი მნიშვნელობების პროგნოზირება, მაშინ განსაზღვრის საკმარისად დიდი კოეფიციენტით R2 (≥ 0.9), მულტიკოლნეარობის არსებობა ხშირად არ მოქმედებს მოდელის პროგნოზირებულ თვისებებზე.

    თუ კვლევის მიზანია თითოეული ახსნა-განმარტებითი ცვლადის გავლენის ხარისხის დადგენა დამოკიდებულ ცვლადზე, მაშინ მულტიკოლნეარობის არსებობა ამახინჯებს ცვლადებს შორის ნამდვილ მიმართებებს. ამ სიტუაციაში მულტიკოლინეარულობა სერიოზულ პრობლემად გვევლინება.

    გაითვალისწინეთ, რომ არ არსებობს მულტიკოლინეარობის აღმოფხვრის ერთი მეთოდი, რომელიც ნებისმიერ შემთხვევაში შესაფერისია. ეს იმიტომ ხდება, რომ მულტიკოლინეარობის მიზეზები და შედეგები ორაზროვანია და დიდწილად დამოკიდებულია ნიმუშის შედეგებზე.

    მეთოდები:

    ცვლად(ებ)ის გამორიცხვა მოდელიდან

    მაგალითად, გარკვეულ საქონელზე მოთხოვნის შესწავლისას, ამ საქონლის ფასი და ამ საქონლის შემცვლელის ფასები, რომლებიც ხშირად კორელაციაშია ერთმანეთთან, შეიძლება გამოყენებულ იქნას როგორც განმარტებითი ცვლადები. მოდელიდან შემცვლელების ფასების გამორიცხვით, ჩვენ სავარაუდოდ შევიტანთ სპეციფიკაციის შეცდომას. შედეგად შესაძლებელია მიკერძოებული შეფასებების მიღება და უსაფუძვლო დასკვნების გამოტანა. გამოყენებითი ეკონომეტრიულ მოდელებში სასურველია არ გამოირიცხოს ახსნა-განმარტებადი ცვლადები, სანამ კოლინარულობა არ გახდება სერიოზული პრობლემა.

    მეტი მონაცემების ან ახალი ნიმუშის მიღება

    ზოგჯერ საკმარისია ნიმუშის ზომის გაზრდა. მაგალითად, თუ იყენებთ წლიურ მონაცემებს, შეგიძლიათ გადახვიდეთ კვარტალურ მონაცემებზე. მონაცემთა რაოდენობის გაზრდა ამცირებს რეგრესიის კოეფიციენტების დისპერსიას და ამით ზრდის მათ სტატისტიკურ მნიშვნელობას. თუმცა, ახალი ნიმუშის მიღება ან ძველის გაფართოება ყოველთვის არ არის შესაძლებელი ან დაკავშირებულია სერიოზულ ხარჯებთან. გარდა ამისა, ამ მიდგომას შეუძლია გააძლიეროს ავტოკორელაცია. ეს პრობლემები ზღუდავს ამ მეთოდის გამოყენებას.

    მოდელის სპეციფიკაციის შეცვლა

    ზოგიერთ შემთხვევაში, მულტიკოლნეარობის პრობლემა შეიძლება მოგვარდეს მოდელის სპეციფიკაციის შეცვლით: ან მოდელის ფორმის შეცვლით, ან ახსნა-განმარტებითი ცვლადების დამატებით, რომლებიც არ არის გათვალისწინებული ორიგინალურ მოდელში, მაგრამ მნიშვნელოვნად მოქმედებს დამოკიდებულ ცვლადზე. .

    წინასწარი ინფორმაციის გამოყენება ზოგიერთი პარამეტრის შესახებ

    ზოგჯერ, მრავალჯერადი რეგრესიის მოდელის შექმნისას, შეგიძლიათ გამოიყენოთ წინასწარი ინფორმაცია, კერძოდ, ზოგიერთი რეგრესიის კოეფიციენტის ცნობილი მნიშვნელობები. სავარაუდოა, რომ კოეფიციენტების მნიშვნელობები მიღებული ზოგიერთი წინასწარი (ჩვეულებრივ უფრო მარტივი) მოდელისთვის, ან მსგავსი მოდელისთვის, რომელიც დაფუძნებულია ადრე მოპოვებულ ნიმუშზე, შეიძლება გამოყენებულ იქნას ამჟამად შემუშავებული მოდელისთვის.

    საილუსტრაციოდ ვაძლევთ შემდეგ მაგალითს. აგებულია რეგრესია. დავუშვათ, რომ X1 და X2 ცვლადები კორელაციურია. ადრე აგებული დაწყვილებული რეგრესიის მოდელისთვის Y = γ0 + γ1X1+υ, განისაზღვრა სტატისტიკურად მნიშვნელოვანი კოეფიციენტი γ1 (განსაზღვრულობისთვის, მოდით, γ1 = 0,8), რომელიც აკავშირებს Y-ს X1-თან. თუ არსებობს საფუძველი ვიფიქროთ, რომ კავშირი Y-სა და X1-ს შორის დარჩება უცვლელი, მაშინ შეგვიძლია დავნიშნოთ γ1 = β1 = 0,8. შემდეგ:

    Y = β0 + 0,8X1 + β2X2 + ε. ⇒ Y – 0,8X1 = β0 + β2X2 + ε.

    განტოლება რეალურად არის წყვილი რეგრესიის განტოლება, რომლისთვისაც მულტიკოლნეარობის პრობლემა არ არსებობს.

    ამ მეთოდის გამოყენების შეზღუდვები გამოწვეულია:

      წინასწარი ინფორმაციის მიღება ხშირად რთულია,

      ალბათობა იმისა, რომ გამოყოფილი რეგრესიის კოეფიციენტი იგივე იქნება სხვადასხვა მოდელისთვის, არ არის მაღალი.

    ცვლადების კონვერტაცია

    ზოგიერთ შემთხვევაში, მულტიკოლინეარობის პრობლემა შეიძლება მინიმუმამდე შემცირდეს ან თუნდაც აღმოიფხვრას ცვლადების გარდაქმნით.

    მაგალითად, მოდით, ემპირიული რეგრესიის განტოლება იყოს Y = b0 + b1X1 + b2X2

    სადაც X1 და X2 კორელაციური ცვლადებია. ამ სიტუაციაში, შეგიძლიათ სცადოთ განსაზღვროთ ფარდობითი მნიშვნელობების რეგრესული დამოკიდებულებები. სავარაუდოა, რომ მსგავს მოდელებში მულტიკოლინეარობის პრობლემა არ იქნება.

    ძირითადი კომპონენტის მეთოდი არის მრავალჯერადი რეგრესიის მოდელიდან ცვლადების აღმოფხვრის ერთ-ერთი მთავარი მეთოდი.

    ეს მეთოდი გამოიყენება რეგრესიის მოდელში ფაქტორების ცვლადების მულტიკოლნეარობის აღმოსაფხვრელად ან შესამცირებლად. მეთოდის არსი : ფაქტორების ცვლადების რაოდენობის შემცირება ყველაზე მნიშვნელოვნად გავლენის ფაქტორებამდე . ეს მიიღწევა ყველა ფაქტორის ცვლადის xi (i=0,...,n) წრფივი გარდაქმნით ახალ ცვლადებად, რომელსაც ეწოდება ძირითადი კომპონენტები, ე.ი. ხდება გადასვლა X ფაქტორების ცვლადების მატრიციდან F ძირითადი კომპონენტების მატრიცაზე. ამ შემთხვევაში დაყენებულია მოთხოვნა, რომ პირველი ძირითადი კომპონენტის შერჩევა შეესაბამებოდეს ყველა ფაქტორის ცვლადის ჯამური ვარიაციის მაქსიმუმს (i=0,...,n), მეორე კომპონენტი შეესაბამებოდეს მაქსიმუმს. დარჩენილი განსხვავება, პირველი ძირითადი კომპონენტის გავლენის აღმოფხვრის შემდეგ და ა.შ.

    თუ მრავლობითი რეგრესიის მოდელში შემავალი არცერთი ფაქტორული ცვლადი არ შეიძლება გამოირიცხოს, მაშინ გამოიყენება რეგრესიის მოდელის კოეფიციენტების შეფასების ერთ-ერთი მთავარი მიკერძოებული მეთოდი - ქედის რეგრესია ან ქედი. ქედის რეგრესიის მეთოდის გამოყენებისას მცირე რიცხვი ემატება მატრიცის ყველა დიაგონალურ ელემენტს (XTX) τ: 10-6 ‹ τ ‹ 0.1. მრავალჯერადი რეგრესიის მოდელის უცნობი პარამეტრების შეფასება ხორციელდება ფორმულის გამოყენებით:

    სადაც ln არის პირადობის მატრიცა.

    Multicollinearity ნიშნავს, რომ მრავალჯერადი რეგრესიის მოდელში, ორი ან მეტი დამოუკიდებელი ცვლადი (ფაქტორი) მჭიდროდ არის დაკავშირებული წრფივად ან, სხვა სიტყვებით რომ ვთქვათ, აქვთ მაღალი ხარისხის კორელაცია ().

    მულტიკოლინეარობის შედეგები:

    1. მულტიკოლინეარობის პირველი პრაქტიკული შედეგი არის უმცირესი კვადრატების პარამეტრის შეფასების დიდი დისპერსია და კოვარიანტობა.

    2. მულტიკოლინეარობის მეორე პრაქტიკული შედეგია წრფივი რეგრესიის განტოლების თეორიული კოეფიციენტების ნდობის ინტერვალების ზრდა.

    3. კოეფიციენტების სტატისტიკა მცირდება, ამიტომ შეიძლება დავასკვნათ, რომ კოეფიციენტი სტატისტიკურად უმნიშვნელოა.

    4. რეგრესიის განტოლების კოეფიციენტები ძალიან მგრძნობიარე ხდება მონაცემების უმცირესი ცვლილებების მიმართ.

    5. ძნელია განისაზღვროს თითოეული ცვლადის წვლილი განტოლებით ახსნილი ნიშან-თვისების ცვალებადობაში.

    სამწუხაროდ, არ არსებობს ერთიანი მიდგომა მულტიკოლინეარობის დასადგენად. აქ მოცემულია რამდენიმე მეთოდი მულტიკოლინეარობის არსებობის შესამოწმებლად.

    1) დეტერმინაციის კოეფიციენტის მაღალი მნიშვნელობა და ზოგიერთი ცვლადის დაბალი სტატისტიკა.

    2) ნაწილობრივი კორელაციის კოეფიციენტების მაღალი მნიშვნელობები. თუმცა, ეს პირობა საკმარისია, მაგრამ არა აუცილებელი პირობა მულტიკოლინეარობის არსებობისთვის. ეს შეიძლება მოხდეს კორელაციის კოეფიციენტების შედარებით მცირე მნიშვნელობებითაც კი, როდესაც ფაქტორების რაოდენობა ორზე მეტია.

    3) Farrar–Glober ტესტი.

    ამ ტესტს სხვა სახელი აქვს: დამხმარე რეგრესიის აგება.

    განსაზღვრის კოეფიციენტი არის დეტერმინაციის კოეფიციენტი რეგრესიის განტოლებაში, რომელიც აკავშირებს ფაქტორს სხვა ფაქტორებთან, მაგალითად, .არის ასეთი რეგრესიის განსაზღვრის კოეფიციენტი:

    თითოეული განსაზღვრის კოეფიციენტისთვის ჩვენ ვიანგარიშებთ თანაფარდობას:

    ტესტი ამოწმებს ჰიპოთეზას

    კონკურენტი ჰიპოთეზით

    გამოთვლილი მნიშვნელობა შედარებულია ფიშერის განაწილების ცხრილებიდან აღმოჩენილ კრიტიკულ მნიშვნელობასთან თავისუფლების ხარისხით და მოცემული მნიშვნელობის დონით. თუ მაშინ უარვყოფთ ნულოვანი ჰიპოთეზას და მივიჩნევთ, რომ ფაქტორი მულტიკოლინეარულია; თუ მაშინ მივიღებთ ნულოვანი ჰიპოთეზას და დავრწმუნდებით, რომ ფაქტორი არ არის მულტიკოლნეარული.

    მულტიკოლინეარობის აღმოსაფხვრელად რამდენიმე გზა არსებობს.

    პირველი გზა.თუ ორ ფაქტორს შორის არის მულტიკოლინეარულობა, მაშინ ერთ-ერთი ფაქტორი გამორიცხულია განხილვისაგან.

    კითხვები კურსის გამოცდისთვის

    "ეკონომეტრია (მოწინავე დონე)"

    1. მრავალჯერადი რეგრესიის მოდელი. მრავალჯერადი რეგრესიის მოდელების ტიპები.

    2. მატრიცის ჩაწერის ფორმა და მატრიცული ფორმულა მრავალჯერადი რეგრესიის პარამეტრების შესაფასებლად.

    3. რეგრესიის განტოლების ხარისხის შეფასება. რეგრესიის განტოლების ახსნილი და აუხსნელი კომპონენტები.

    4. განსაზღვრის კოეფიციენტი და კორელაციის კოეფიციენტი, მათი გამოთვლა დაწყვილებული რეგრესიის მოდელში.

    5. განსაზღვრის მრავალჯერადი კოეფიციენტის შერჩევა და მისი მნიშვნელობის შემოწმება ფიშერის კრიტერიუმით.

    6. მრავალჯერადი რეგრესიის განტოლების მნიშვნელოვნების შემოწმება ფიშერის ტესტის გამოყენებით.

    რეგრესიის განტოლების მნიშვნელობა, ე.ი. ეკონომეტრიული მოდელის მორგება = ˆ0 + 1 X+ ფაქტობრივი (ემპირიული) მონაცემები გვაძლევს საშუალებას

    დაადგინეთ არის თუ არა რეგრესიის განტოლება პრაქტიკული გამოყენებისთვის (ანალიზისა და პროგნოზირებისთვის) შესაფერისი თუ არა.

    განტოლების მნიშვნელობის შესამოწმებლად გამოიყენეთ - ფიშერის კრიტერიუმი. ის გამოითვლება ფაქტობრივი მონაცემებიდან, როგორც მიუკერძოებლის თანაფარდობა

    ნარჩენი კომპონენტის ვარიაცია ორიგინალური სერიის დისპერსიასთან. განსაზღვრის კოეფიციენტის მნიშვნელობა შემოწმდება ფიშერის კრიტერიუმის გამოყენებით, რომლის გამოთვლილი მნიშვნელობა გვხვდება ფორმულის გამოყენებით:

    ,

    სადაც არის მრავალჯერადი კორელაციის კოეფიციენტი, არის დაკვირვებების რაოდენობა, არის ცვლადების რაოდენობა, არის მატრიცის დიაგონალური ელემენტი.

    ჰიპოთეზის შესამოწმებლად ცხრილის მნიშვნელობა განისაზღვრება ცხრილიდან

    ფიშერის ტესტი .

    F(α ν1 ν2) არის კრიტერიუმის მაქსიმალური შესაძლო მნიშვნელობა, რომელიც დამოკიდებულია შემთხვევითი ფაქტორების გავლენას თავისუფლების მოცემულ ხარისხებზე

    ν = m1, ν2 = −1 და მნიშვნელოვნების დონე α. Აქ – არგუმენტების რაოდენობა მოდელში.

    მნიშვნელოვნების დონე α არის სწორი ჰიპოთეზის უარყოფის ალბათობა, მაგრამ იმ პირობით, რომ ის მართალია (I ტიპის შეცდომა). როგორც წესი, α მიიღება 0,05 ან 0,01.

    თუ ვ> მაგიდა, მაშინ H0– უარყოფილია ჰიპოთეზა შეფასებული მახასიათებლების შემთხვევითობის შესახებ და აღიარებულია მათი სტატისტიკური მნიშვნელობა და სანდოობა. თუ პირიქით, მაშინ ჰიპოთეზა H0არ არის უარყოფილი და აღიარებულია რეგრესიის განტოლების სტატისტიკური უმნიშვნელოობა და არასანდო.

    7. წრფივი კორელაციის კოეფიციენტების მნიშვნელოვნების შეფასება. -სტუდენტის t-ტესტი.

    რეგრესიის კოეფიციენტებისა და კორელაციის კოეფიციენტის სტატისტიკური მნიშვნელოვნების შესაფასებლად გამოითვლება Student t-ტესტი. წამოაყენეს ჰიპოთეზა 0 ინდიკატორების შემთხვევითობის შესახებ, ე.ი. მათი უმნიშვნელო სხვაობის შესახებ ნულიდან. დაკვირვებული t-ტესტის მნიშვნელობები გამოითვლება ფორმულების გამოყენებით:

    , , ,

    სადაც არის წრფივი რეგრესიის პარამეტრების შემთხვევითი შეცდომები და კორელაციის კოეფიციენტი.


    წრფივი წყვილის რეგრესიის შემთხვევაში, თანასწორობა დაკმაყოფილებულია, ამიტომ ჰიპოთეზების ტესტირება ფაქტორზე რეგრესიის კოეფიციენტის მნიშვნელოვნების შესახებ და კორელაციის კოეფიციენტი უდრის ჰიპოთეზის ტესტირებას მთლიანობაში რეგრესიის განტოლების სტატისტიკური მნიშვნელობის შესახებ.

    ზოგადად, შემთხვევითი შეცდომები გამოითვლება ფორმულების გამოყენებით:

    , , .

    სად არის ნარჩენი დისპერსია თავისუფლების ხარისხზე:

    .

    t-სტატისტიკის ტაბულური (კრიტიკული) მნიშვნელობა ნაპოვნია t-Student განაწილების ცხრილებიდან α = 0,05 მნიშვნელოვნების დონეზე და თავისუფლების გრადუსების რაოდენობაზე. თუ მაგიდა< ფაქტი, მაშინ 0 უარყოფილია, ე.ი. შემთხვევითი არ არის, რომ რეგრესიის კოეფიციენტები განსხვავდება ნულიდან და ჩამოყალიბდა სისტემატურად მოქმედი ფაქტორის გავლენის ქვეშ.

    8. ფაქტორების გავლენის ანალიზი მრავალფაქტორიანი რეგრესიის მოდელებზე დაყრდნობით: ელასტიურობის კოეფიციენტი; ბეტა კოეფიციენტი და დელტა კოეფიციენტი.

    9. კობ-დუგლასის წარმოების ფუნქციის , , პარამეტრების გამოთვლის მეთოდები.

    10. რეგრესიის განტოლებები ცვლადი სტრუქტურით. მოჩვენებითი ცვლადები. მოჩვენებითი ცვლადების ტიპები. მატყუარა ცვლადების გამოყენების უპირატესობები რეგრესიის მოდელების აგებისას.

    11. მოჩვენებითი ცვლადების გამოყენება სტრუქტურული ცვლილების შესასწავლად. სეზონურობის მოდელირება. ორობითი ცვლადების რაოდენობა ზე გრადაციები.

    მულტიკოლინეარობის ცნება. მულტიკოლინეარობის გამოვლენისა და აღმოფხვრის მეთოდები.

    რეგრესიის განტოლების პარამეტრების რაოდენობრივი შეფასება ვარაუდობს, რომ დამოუკიდებელ ცვლადებს შორის წრფივი დამოუკიდებლობის პირობა დაკმაყოფილებულია. თუმცა, პრაქტიკაში, ახსნა-განმარტებით ცვლადებს ხშირად აქვთ ერთმანეთთან ურთიერთკავშირის მაღალი ხარისხი, რაც ამ პირობის დარღვევაა. ამ ფენომენს ე.წ მრავალმხრივობა.

    ვადა კოლინარულობა (კოლინარული) აღნიშნავს წრფივ კორელაციას ორ დამოუკიდებელ ცვლადს შორის და მულტიკოლინეარულობა (მრავალწახნაგოვანი) – ორზე მეტ დამოუკიდებელ ცვლადს შორის. როგორც წესი, მულტიკოლინეარულობა ორივე შემთხვევას ეხება.

    ამრიგად, მრავალმხრივობა ნიშნავს, რომ არსებობს მჭიდრო წრფივი კავშირი ან ძლიერი კორელაცია ორ ან მეტ განმარტებით (დამოუკიდებელ) ცვლადს შორის.ეკონომეტრიის ერთ-ერთი ამოცანაა დამოუკიდებელ ცვლადებს შორის მულტიკოლინეარობის იდენტიფიცირება.

    გამოარჩევენ სრულყოფილიდა არასრულყოფილიმრავალმხრივობა. სრულყოფილი Multicollinearity ნიშნავს, რომ ცვალებადობა ერთ-ერთ დამოუკიდებელ ცვლადში შეიძლება სრულად აიხსნას სხვა ცვლადი(ებ)ის ცვლილებით.

    წინააღმდეგ შემთხვევაში, მათ შორის ურთიერთობა გამოიხატება წრფივი ფუნქციით

    ამ შემთხვევის გრაფიკული ინტერპრეტაცია:

    არასრულყოფილიმულტიკოლინეარულობა შეიძლება განისაზღვროს, როგორც წრფივი ფუნქციონალური ურთიერთობა ორ ან მეტ დამოუკიდებელ ცვლადს შორის, რომელიც იმდენად ძლიერია, რომ მას შეუძლია მნიშვნელოვნად იმოქმედოს მოდელის ცვლადების კოეფიციენტების შეფასებაზე.

    არასრულყოფილი მულტიკოლნეარულობა ჩნდება, როდესაც ორი (ან მეტი) დამოუკიდებელი ცვლადი ერთმანეთთან სწორხაზოვან ფუნქციურ ურთიერთობაშია, რაც აღწერილია განტოლებით.

    განსხვავებით ადრე განხილული განტოლებისგან, ეს მოიცავს სტოქასტური შეცდომის სიდიდეს. ეს ვარაუდობს, რომ მიუხედავად იმისა, რომ და-ს შორის კავშირი შეიძლება იყოს საკმაოდ ძლიერი, ის არც ისე ძლიერია, რომ ცვლადის ცვლილება სრულად აიხსნას ცვლილებით, ე.ი. არის რაღაც აუხსნელი ვარიაცია.

    გრაფიკულად ეს შემთხვევა წარმოდგენილია შემდეგნაირად:


    რა შემთხვევებში შეიძლება მოხდეს მულტიკოლინეარულობა? სულ მცირე ორი მათგანია.

    1. შეიმჩნევა ეკონომიკური მაჩვენებლების ერთდროული ცვლილების გლობალური ტენდენცია. მაგალითად, შეგვიძლია მოვიყვანოთ ისეთი მაჩვენებლები, როგორიცაა წარმოების მოცულობა, შემოსავალი, მოხმარება, დაგროვება, დასაქმება, ინვესტიცია და ა.შ., რომელთა ღირებულებები იზრდება ეკონომიკური ზრდის პერიოდში და მცირდება რეცესიის პერიოდში.

    მულტიკოლინეარობის ერთ-ერთი მიზეზი ეკონომიკური მაჩვენებლების დინამიკაში ტენდენციის (ტენდენციის) არსებობაა.

    2. ცვლადების ჩამორჩენილი მნიშვნელობების გამოყენება ეკონომიკურ მოდელებში.

    მაგალითად, ჩვენ შეგვიძლია განვიხილოთ მოდელები, რომლებიც იყენებენ როგორც მიმდინარე პერიოდის შემოსავალს, ასევე წინა პერიოდის მოხმარების ხარჯებს.

    ზოგადად, ეკონომიკური პროცესებისა და ფენომენების შესწავლისას ეკონომეტრიული მეთოდების გამოყენებით, ძალიან რთულია ინდიკატორებს შორის დამოკიდებულების თავიდან აცილება.

    მულტიკოლინეარობის შედეგები იშლება

    1. შეფასების სიზუსტის შემცირება, რაც გამოიხატება

    ა. ძალიან დიდი შეცდომები ზოგიერთ შეფასებაში,

    ბ. შეცდომებს შორის კორელაციის მაღალი ხარისხი,

    გ. პარამეტრების შეფასებების დისპერსიის მკვეთრი ზრდა. მულტიკოლნეარობის ეს გამოვლინება შეიძლება ასევე აისახოს პარამეტრების შეფასებისას მოულოდნელი ნიშნის მიღებაში;

    2. ზოგიერთი მოდელის ცვლადის პარამეტრების შეფასების უმნიშვნელოობა, უპირველეს ყოვლისა, სხვა ცვლადებთან მათი ურთიერთობის არსებობის გამო და არა იმის გამო, რომ ისინი გავლენას არ ახდენენ დამოკიდებულ ცვლადზე. ანუ მოდელის პარამეტრების -სტატისტიკა არ აკმაყოფილებს მნიშვნელოვნების დონეს (სტუდენტის t-ტესტი არ გადის ადეკვატურობის ტესტს);

    3. პარამეტრების შეფასებების მგრძნობელობის ძლიერი ზრდა დაკვირვების პოპულაციის ზომის მიმართ. ანუ, დაკვირვებების რაოდენობის ზრდამ შეიძლება მნიშვნელოვნად იმოქმედოს მოდელის პარამეტრების შეფასებებზე;

    4. ნდობის ინტერვალების გაზრდა;

    5. შეფასებების სენსიტიურობის გაზრდა მოდელის სპეციფიკაციის ცვლილებების მიმართ (მაგალითად, მოდელიდან ცვლადების დამატება ან გამორიცხვა, თუნდაც ის, ვისაც აქვს უმნიშვნელო ეფექტი).

    მულტიკოლინეარობის ნიშნები:

    1. როცა წყვილთა კორელაციის კოეფიციენტებს შორის

    განმარტებით (დამოუკიდებელ) ცვლადებს შორის არის ისეთებიც, რომელთა დონე ან უახლოვდება ან უდრის მრავალჯერადი კორელაციის კოეფიციენტს.

    თუ მოდელში ორზე მეტი დამოუკიდებელი ცვლადია, მაშინ აუცილებელია ცვლადებს შორის ურთიერთობების უფრო დეტალური შესწავლა. ეს პროცედურა შეიძლება განხორციელდეს Farrar-Glober ალგორითმის გამოყენებით;

    2. როცა დამოუკიდებელ ცვლადებს შორის წყვილი კორელაციის კოეფიციენტების მატრიცის განმსაზღვრელი უახლოვდება ნულს:

    თუ , მაშინ არის სრული მულტიკოლნეარულობა,

    თუ , მაშინ არ არსებობს მულტიკოლნეარულობა;

    3. თუ მოდელში აღმოჩენილია პარამეტრის მცირე მნიშვნელობა ნაწილობრივი განსაზღვრის კოეფიციენტის მაღალ დონეზე და ამავე დროს - კრიტერიუმი მნიშვნელოვნად განსხვავდება ნულიდან;

    მრავალჯერადი რეგრესიის განტოლების აგებისას შეიძლება წარმოიშვას ფაქტორების მრავალკოლინარობის პრობლემა. მულტიკოლინეარულობაარის ხაზოვანი ურთიერთობა ორ ან მეტ ახსნა-განმარტებით ცვლადს შორის, რომელიც შეიძლება გამოვლინდეს ფუნქციური (გამოკვეთილი) ან სტოქასტური (ლატენტური) ფორმით.
    შერჩეულ მახასიათებლებს შორის კავშირის დადგენა და კავშირის სიახლოვის რაოდენობრივი შეფასება ხორციელდება კორელაციური ანალიზის მეთოდების გამოყენებით. ამ ამოცანების გადასაჭრელად ჯერ ფასდება , შემდეგ მის საფუძველზე ხდება ნაწილობრივი და მრავალჯერადი კორელაციისა და განსაზღვრის კოეფიციენტების განსაზღვრა და მათი მნიშვნელოვნების შემოწმება. კორელაციური ანალიზის საბოლოო მიზანია ფაქტორული მახასიათებლების შერჩევა x 1, x 2,…, x m რეგრესიის განტოლების შემდგომი მშენებლობისთვის.

    თუ ფაქტორების ცვლადები დაკავშირებულია მკაცრი ფუნქციური დამოკიდებულებით, მაშინ ჩვენ ვსაუბრობთ სრული მულტიკოლინეარულობა. ამ შემთხვევაში, ფაქტორების ცვლადების მატრიცის სვეტებს შორის Xარის წრფივად დამოკიდებული სვეტები და, მატრიცის განმსაზღვრელთა თვისებით, det(X T X) = 0, ანუ მატრიცა (X T X) არის სინგულარული, რაც ნიშნავს, რომ არ არსებობს შებრუნებული მატრიცა. მატრიცა (X T X) -1 გამოიყენება OLS შეფასებების ასაგებად. ამრიგად, სრული მულტიკოლინეარულობა არ გვაძლევს საშუალებას ცალსახად შევაფასოთ ორიგინალური რეგრესიული მოდელის პარამეტრები.

    რა სირთულეებს იწვევს მოდელში შემავალი ფაქტორების მულტიკოლინარულობა და როგორ შეიძლება მათი გადაჭრა?

    მულტიკოლინეარულობამ შეიძლება გამოიწვიოს არასასურველი შედეგები:

    1. პარამეტრების შეფასება არასანდო ხდება. ისინი პოულობენ დიდ სტანდარტულ შეცდომებს. დაკვირვების მოცულობის ცვლილებით, იცვლება შეფასებები (არა მხოლოდ სიდიდით, არამედ ნიშნითაც), რაც მოდელს უვარგისს ხდის ანალიზისა და პროგნოზირებისთვის.
    2. ძნელი ხდება მრავალი რეგრესიული პარამეტრის ინტერპრეტაცია, როგორც ფაქტორების მოქმედების მახასიათებლები „სუფთა“ ფორმით, რადგან ფაქტორები ურთიერთდაკავშირებულია; ხაზოვანი რეგრესიის პარამეტრები კარგავს ეკონომიკურ მნიშვნელობას;
    3. შეუძლებელი ხდება ფაქტორების იზოლირებული გავლენის დადგენა შესრულების ინდიკატორზე.

    მულტიკოლნეარობის ტიპი, რომელშიც ფაქტორების ცვლადები დაკავშირებულია გარკვეული სტოქასტური დამოკიდებულებით, ეწოდება ნაწილობრივი.თუ ფაქტორების ცვლადებს შორის არის კორელაციის მაღალი ხარისხი, მაშინ მატრიცა (X T X) ახლოსაა დეგენერატთან, ანუ det(X T X) ≈ 0.
    მატრიცა (X T X) -1 იქნება ცუდად განპირობებული, რაც იწვევს OLS შეფასებების არასტაბილურობას. ნაწილობრივი მულტიკოლინეარულობა იწვევს შემდეგ შედეგებს:

    • პარამეტრების შეფასებების დისპერსიების ზრდა აფართოებს ინტერვალის შეფასებებს და აუარესებს მათ სიზუსტეს;
    • შემცირება -კოეფიციენტების სტატისტიკა იწვევს არასწორ დასკვნებს ფაქტორების მნიშვნელოვნების შესახებ;
    • OLS შეფასებების არასტაბილურობა და მათი ვარიაციები.

    არ არსებობს ზუსტი რაოდენობრივი კრიტერიუმები ნაწილობრივი მულტიკოლნეარობის გამოსავლენად. მულტიკოლინეარობის არსებობა შეიძლება მიუთითებდეს მატრიცის (X T X) განმსაზღვრელი ნულთან სიახლოვით. ასევე განიხილება წყვილი კორელაციის კოეფიციენტების მნიშვნელობები. თუ ინტერფაქტორების კორელაციის მატრიცის განმსაზღვრელი ერთთან ახლოსაა, მაშინ არ არსებობს მულტიკოლნეარულობა.

    არსებობს სხვადასხვა მიდგომა ძლიერი ინტერფაქტორული კორელაციის დასაძლევად. მათგან უმარტივესი არის იმ ფაქტორის (ან ფაქტორების) მოდელიდან გამორიცხვა, რომელიც ყველაზე მეტად პასუხისმგებელია მულტიკოლინარობაზე, იმ პირობით, რომ მოდელის ხარისხი უმნიშვნელოდ დაზარალდება (კერძოდ, განსაზღვრის თეორიული კოეფიციენტი -R 2 y(x1...xm ) უმნიშვნელოდ შემცირდება) .

    რა ზომა არ შეიძლება გამოყენებულ იქნას მულტიკოლინეარობის აღმოსაფხვრელად?
    ა) ნიმუშის ზომის გაზრდა;
    ბ) ცვლადების გამორიცხვა, რომლებიც დიდ კორელაციაშია სხვებთან;
    გ) მოდელის სპეციფიკაციის ცვლილება;
    დ) შემთხვევითი კომპონენტის ტრანსფორმაცია.

    დაწყვილებული (წრფივი) და ნაწილობრივი კორელაციის კოეფიციენტები

    კავშირის სიახლოვე, მაგალითად, x და y ცვლადებს შორის მნიშვნელობების ნიმუშისთვის (x i, y i), i=1,n, (1)
    სადაც x და y არის საშუალო მნიშვნელობები, S x და S y არის შესაბამისი ნიმუშების სტანდარტული გადახრები.

    წყვილი კორელაციის კოეფიციენტი მერყეობს –1-დან +1-მდე. რაც უფრო ახლოს არის ის აბსოლუტური მნიშვნელობით ერთიანობასთან, მით უფრო ახლოს არის სტატისტიკური კავშირი x-სა და y-ს შორის წრფივ ფუნქციონალურთან. კოეფიციენტის დადებითი მნიშვნელობა მიუთითებს, რომ მახასიათებლებს შორის კავშირი პირდაპირია (როგორც x იზრდება, y-ის მნიშვნელობა იზრდება), უარყოფითი მნიშვნელობა მიუთითებს, რომ ურთიერთობა ინვერსიულია (როგორც x იზრდება, y-ის მნიშვნელობა მცირდება).
    ჩვენ შეგვიძლია მივცეთ კორელაციის კოეფიციენტის შესაძლო მნიშვნელობების შემდეგი თვისობრივი ინტერპრეტაცია: თუ |r|<0.3 – связь практически отсутствует; 0.3≤ |r| < 0.7 - связь средняя; 0.7≤ |r| < 0.9 – связь сильная; 0.9≤ |r| < 0.99 – связь весьма сильная.
    ფაქტორების მრავალმხრივობის შესაფასებლად გამოიყენეთ დამოკიდებული (შედეგობრივი) y მახასიათებლის დაწყვილებული კორელაციის კოეფიციენტების მატრიცა ფაქტორების მახასიათებლებით x 1, x 2,…, x m, რომელიც საშუალებას გაძლევთ შეაფასოთ თითოეული ფაქტორის ინდიკატორის x j ზემოქმედების ხარისხი. დამოკიდებული ცვლადი y, ასევე ფაქტორებს შორის ურთიერთობის სიახლოვე. კორელაციის მატრიცას ზოგად შემთხვევაში აქვს ფორმა
    .
    მატრიცა სიმეტრიულია, მის დიაგონალზე არის მატრიცა. თუ მატრიცას აქვს ინტერფაქტორული კორელაციის კოეფიციენტი r xjxi >0.7, მაშინ არსებობს მულტიკოლინეარულობა ამ მრავალჯერადი რეგრესიის მოდელში.
    ვინაიდან საწყისი მონაცემები, რომლიდანაც დგინდება მახასიათებლების კავშირი, არის ნიმუში გარკვეული ზოგადი პოპულაციისგან, ამ მონაცემებით გამოთვლილი კორელაციის კოეფიციენტები შერჩევითი იქნება, ანუ ისინი მხოლოდ აფასებენ ურთიერთობას. საჭიროა მნიშვნელოვნების ტესტი, რომელიც პასუხობს კითხვას: შემთხვევითია თუ არა მიღებული გამოთვლის შედეგები?
    წყვილი კორელაციის კოეფიციენტების მნიშვნელობაშეამოწმეთ t-სტუდენტის t ტესტი. წამოაყენეს ჰიპოთეზა, რომ ზოგადი კორელაციის კოეფიციენტი ნულის ტოლია: H 0: ρ = 0. შემდეგ დაყენებულია პარამეტრები: მნიშვნელოვნების დონე α და თავისუფლების გრადუსების რაოდენობა v = n-2. ამ პარამეტრების გამოყენებით tcr მოიძებნება სტუდენტური განაწილების კრიტიკული წერტილების ცხრილიდან და გამოითვლება არსებული მონაცემებიდან. დაკვირვებული კრიტერიუმის მნიშვნელობა:
    , (2)
    სადაც r არის დაწყვილებული კორელაციის კოეფიციენტი, რომელიც გამოითვლება კვლევისთვის შერჩეული მონაცემებიდან. დაწყვილებული კორელაციის კოეფიციენტი განიხილება მნიშვნელოვნად (უარყოფილია ჰიპოთეზა, რომ კოეფიციენტი ნულის ტოლია) ნდობის ალბათობით γ = 1-α, თუ t Obs მოდული მეტია t crit-ზე.
    თუ ცვლადები ერთმანეთთან კორელაციაშია, მაშინ კორელაციის კოეფიციენტის მნიშვნელობა ნაწილობრივ გავლენას ახდენს სხვა ცვლადების გავლენით.

    ნაწილობრივი კორელაციის კოეფიციენტიახასიათებს შედეგსა და შესაბამის ფაქტორს შორის წრფივი ურთიერთობის სიახლოვეს სხვა ფაქტორების გავლენის აღმოფხვრისას. ნაწილობრივი კორელაციის კოეფიციენტი აფასებს ორ ცვლადს შორის ურთიერთობის სიახლოვეს სხვა ფაქტორების ფიქსირებულ მნიშვნელობასთან. თუ გამოითვლება, მაგალითად, r yx 1| x2 (პარციალური კორელაციის კოეფიციენტი y-სა და x 1-ს შორის ფიქსირებული გავლენით x 2), ეს ნიშნავს, რომ განისაზღვრება y-სა და x 1-ს შორის წრფივი ურთიერთობის რაოდენობრივი ზომა, რომელიც მოხდება, თუ x 2-ის გავლენა ამ მახასიათებლებზე იქნება აღმოფხვრილი. თუ მხოლოდ ერთი ფაქტორის გავლენა გამოირიცხება, მივიღებთ ნაწილობრივი პირველი რიგის კორელაციის კოეფიციენტი.
    დაწყვილებული და ნაწილობრივი კორელაციის კოეფიციენტების მნიშვნელობების შედარება გვიჩვენებს ფიქსირებული ფაქტორის გავლენის მიმართულებას. თუ ნაწილობრივი კორელაციის კოეფიციენტი r yx 1| x2 ნაკლები იქნება შესაბამისი წყვილის კოეფიციენტზე r yx 1, რაც ნიშნავს, რომ y და x 1 მახასიათებლებს შორის ურთიერთობა გარკვეულწილად განისაზღვრება მათზე ფიქსირებული x 2 ცვლადის გავლენით. პირიქით, წყვილის კოეფიციენტთან შედარებით ნაწილობრივი კოეფიციენტის უფრო დიდი მნიშვნელობა მიუთითებს იმაზე, რომ ფიქსირებული ცვლადი x 2 ასუსტებს y-სა და x 1-ს შორის ურთიერთობას თავისი გავლენით.
    ნაწილობრივი კორელაციის კოეფიციენტი ორ ცვლადს (y და x 2) შორის ერთი ფაქტორის გავლენის გამორიცხვისას (x 1) შეიძლება გამოითვალოს შემდეგი ფორმულის გამოყენებით:
    . (3)
    სხვა ცვლადებისთვის ფორმულები აგებულია ანალოგიურად. ფიქსირებულ x2-ზე
    ;
    ფიქსირებულ x 3-ზე
    .
    ნაწილობრივი კორელაციის კოეფიციენტების მნიშვნელობა შემოწმებულია ისევე, როგორც წყვილი კორელაციის კოეფიციენტების შემთხვევაში. განსხვავება მხოლოდ არის თავისუფლების გრადუსების რაოდენობა, რომელიც უნდა იქნას მიღებული v = n – l -2-ის ტოლი, სადაც l არის ფიქსირებული ფაქტორების რაოდენობა.

    ეტაპობრივი რეგრესია

    მრავალჯერადი რეგრესიის მოდელში შემავალი x 1, x 2, …, x m ფაქტორების შერჩევა ეკონომეტრიული მოდელირების ერთ-ერთი ყველაზე მნიშვნელოვანი ეტაპია. მოდელში ფაქტორების თანმიმდევრული (ნაბიჯ-ნაბიჯ) ჩართვის (ან გამორიცხვის) მეთოდი საშუალებას გაძლევთ აირჩიოთ ცვლადების შესაძლო ნაკრებიდან ზუსტად ის, რაც გააუმჯობესებს მოდელის ხარისხს.
    მეთოდის განხორციელებისას პირველი ნაბიჯი არის კორელაციის მატრიცის გამოთვლა. წყვილი კორელაციის კოეფიციენტების საფუძველზე ვლინდება კოლინარული ფაქტორების არსებობა. x i და x j ფაქტორები განიხილება კოლინურად, თუ r xjxi >0.7. მოდელში შედის მხოლოდ ერთი ურთიერთდაკავშირებული ფაქტორი. თუ ფაქტორებს შორის არ არის კოლინარული ფაქტორები, მაშინ ნებისმიერი ფაქტორი, რომელსაც აქვს მნიშვნელოვანი გავლენა .

    მეორე საფეხურზე აგებულია რეგრესიის განტოლება ერთი ცვლადით, რომელსაც აქვს წყვილი კორელაციის კოეფიციენტის მაქსიმალური აბსოლუტური მნიშვნელობა მიღებულ ატრიბუტთან.

    მესამე საფეხურზე მოდელში შემოდის ახალი ცვლადი, რომელსაც აქვს ნაწილობრივი კორელაციის კოეფიციენტის უდიდესი აბსოლუტური მნიშვნელობა დამოკიდებულ ცვლადთან, ადრე შემოღებული ცვლადის ფიქსირებული გავლენით.
    როდესაც მოდელში შედის დამატებითი ფაქტორი, უნდა გაიზარდოს განსაზღვრის კოეფიციენტი და შემცირდეს ნარჩენი დისპერსია. თუ ეს არ მოხდა, ანუ მრავალჯერადი განსაზღვრის კოეფიციენტი ოდნავ იზრდება, მაშინ ახალი ფაქტორის დანერგვა მიზანშეწონილად ითვლება.

    მაგალითი No1. რეგიონის 20 საწარმოსთვის, თითო თანამშრომელზე გამომუშავების დამოკიდებულება y (ათასი რუბლი) მაღალკვალიფიციური მუშაკების წილზე მუშაკთა საერთო რაოდენობაში x1 (აქტივების ღირებულების % წლის ბოლოს) და ექსპლუატაციაში გაშვებაზე. შესწავლილია ახალი ძირითადი საშუალებების x2 (%).

    X1 X2
    6 10 3,5
    6 12 3,6
    7 15 3,9
    7 17 4,1
    7 18 4,2
    8 19 4,5
    8 19 5,3
    9 20 5,3
    9 20 5,6
    10 21 6
    10 21 6,3
    11 22 6,4
    11 23 7
    12 25 7,5
    12 28 7,9
    13 30 8,2
    13 31 8,4
    14 31 8,6
    14 35 9,5
    15 36 10

    საჭირო:

    1. შექმენით კორელაციური ველი ერთ მუშაკზე გამომუშავებასა და მაღალკვალიფიციურ მუშაკთა წილს შორის. წამოაყენეთ ჰიპოთეზა X1 და Y ინდიკატორებს შორის სიახლოვისა და ურთიერთობის შესახებ.
    2. შეაფასეთ წრფივი კავშირის სიახლოვე ერთ მუშაკზე გამომუშავებასა და მაღალკვალიფიციურ მუშაკთა პროპორციას შორის სანდოობით 0,9.
    3. გამოთვალეთ წრფივი რეგრესიის განტოლების კოეფიციენტები თითო მუშაკზე გამომუშავების დამოკიდებულების მაღალკვალიფიციური მუშაკების წილზე.
    4. შეამოწმეთ რეგრესიული განტოლების პარამეტრების სტატისტიკური მნიშვნელოვნება 0,9 სანდოობით და ააგეთ მათთვის ნდობის ინტერვალები.
    5. გამოთვალეთ განსაზღვრის კოეფიციენტი. ფიშერის F ტესტის გამოყენებით შეაფასეთ რეგრესიის განტოლების სტატისტიკური მნიშვნელოვნება 0,9 სანდოობით.
    6. მიეცით წერტილი და ინტერვალის პროგნოზი სანდოობით 0,9 გამომავალი ერთ თანამშრომელზე საწარმოსთვის, სადაც დასაქმებულთა 24% მაღალკვალიფიციურია.
    7. გამოთვალეთ წრფივი მრავალჯერადი რეგრესიის განტოლების კოეფიციენტები და ახსენით მისი პარამეტრების ეკონომიკური მნიშვნელობა.
    8. გაანალიზეთ 0,9 სანდოობის მრავალრიცხოვანი განტოლების კოეფიციენტების სტატისტიკური მნიშვნელოვნება და ააგეთ მათთვის ნდობის ინტერვალები.
    9. იპოვეთ წყვილი და ნაწილობრივი კორელაციის კოეფიციენტები. გაანალიზეთ ისინი.
    10. იპოვეთ მრავალჯერადი განსაზღვრის მორგებული კოეფიციენტი. შეადარეთ განსაზღვრის დაუზუსტებელ (საერთო) კოეფიციენტს.
    11. ფიშერის F ტესტის გამოყენებით შეაფასეთ რეგრესიის განტოლების ადეკვატურობა 0,9 სანდოობით.
    12. მიეცით წერტილი და ინტერვალის პროგნოზი სანდოობით 0,9 გამომავალი ერთ თანამშრომელზე საწარმოსთვის, რომელშიც დასაქმებულთა 24% მაღალკვალიფიციურია, ხოლო ახალი ძირითადი საშუალებების ექსპლუატაციაში გაშვება არის 5%.
    13. შეამოწმეთ აგებული განტოლება მულტიკოლინიარობის არსებობისთვის: მოსწავლის ტესტის გამოყენებით; χ2 ტესტი. შეადარეთ შედეგები.

    გამოსავალიჩვენ ამას ვაკეთებთ კალკულატორის გამოყენებით. ქვემოთ მოცემულია მე-13 პუნქტის ამოხსნის პროგრესი.
    წყვილის კორელაციის კოეფიციენტების მატრიცა R:

    - x 1x 2
    1 0.97 0.991
    x 1 0.97 1 0.977
    x 2 0.991 0.977 1

    მულტიკოლინეარობის არსებობისას, კორელაციის მატრიცის განმსაზღვრელი არის ნულთან ახლოს. ჩვენი მაგალითისთვის: det = 0.00081158, რაც მიუთითებს ძლიერი მულტიკოლნეარობის არსებობაზე.
    ყველაზე მნიშვნელოვანი x i ფაქტორების შესარჩევად გათვალისწინებულია შემდეგი პირობები:
    - კავშირი შედეგიან მახასიათებელსა და პირველ ფაქტორს შორის უნდა იყოს უფრო მაღალი ვიდრე ინტერფაქტორული კავშირი;
    - ფაქტორებს შორის კავშირი არ უნდა იყოს 0,7-ზე მეტი. თუ მატრიცას აქვს ინტერფაქტორული კორელაციის კოეფიციენტი r xjxi > 0.7, მაშინ არსებობს მულტიკოლნეარულობა ამ მრავალჯერადი რეგრესიის მოდელში.;
    - მახასიათებლის მაღალი ინტერფაქტორული კავშირით, შეირჩევა მათ შორის უფრო დაბალი კორელაციის კოეფიციენტის მქონე ფაქტორები.
    ჩვენს შემთხვევაში, r x 1 x 2-ს აქვს |r|>0.7, რაც მიუთითებს ფაქტორების მულტიკოლნეარულობაზე და ერთი მათგანის შემდგომი ანალიზიდან გამორიცხვის აუცილებლობაზე.
    ამ მატრიცის პირველი რიგის ანალიზი იძლევა ფაქტორთა მახასიათებლების არჩევის საშუალებას, რომლებიც შეიძლება ჩართული იყოს მრავალჯერადი კორელაციის მოდელში. ფაქტორების მახასიათებლები, რომლისთვისაც |r yxi | 0.3 - პრაქტიკულად არ არის კავშირი; 0.3 ≤ |r| ≤ 0.7 - საშუალო კავშირი; 0.7 ≤ |r| ≤ 0.9 – ძლიერი კავშირი; |რ| > 0.9 - კავშირი ძალიან ძლიერია.
    შევამოწმოთ მიღებული წყვილი კორელაციის კოეფიციენტების მნიშვნელობა Student-ის t-ტესტის გამოყენებით. კოეფიციენტები, რომლებისთვისაც t- სტატისტიკის მოდულის მნიშვნელობები აღემატება ნაპოვნი კრიტიკულ მნიშვნელობას, ითვლება მნიშვნელოვნად.
    მოდით გამოვთვალოთ t- სტატისტიკის დაკვირვებული მნიშვნელობები r yx 1-ისთვის ფორმულის გამოყენებით:

    სადაც m = 1 არის ფაქტორების რაოდენობა რეგრესიის განტოლებაში.

    სტუდენტის ცხრილის გამოყენებით ვპოულობთ Ttable-ს
    t კრიტი (n-m-1;α/2) = (18;0.025) = 2.101
    ვინაიდან t obs > t crit, ჩვენ უარვყოფთ ჰიპოთეზას, რომ კორელაციის კოეფიციენტი 0-ის ტოლია. სხვა სიტყვებით რომ ვთქვათ, კორელაციის კოეფიციენტი სტატისტიკურად მნიშვნელოვანია
    მოდით გამოვთვალოთ t- სტატისტიკის დაკვირვებული მნიშვნელობები r yx 2-ისთვის ფორმულის გამოყენებით:

    ვინაიდან t obs > t crit, ჩვენ უარვყოფთ ჰიპოთეზას, რომ კორელაციის კოეფიციენტი 0-ის ტოლია. სხვა სიტყვებით რომ ვთქვათ, კორელაციის კოეფიციენტი სტატისტიკურად მნიშვნელოვანია
    ამრიგად, კავშირი (y ​​და x x 1), (y და x x 2) შორის მნიშვნელოვანია.
    ეფექტურ ატრიბუტზე ყველაზე დიდი გავლენა აქვს x2 ფაქტორს (r = 0.99), რაც იმას ნიშნავს, რომ მოდელის აგებისას ის პირველი შევა რეგრესიის განტოლებაში.
    მულტიკოლინეარობის ტესტირება და აღმოფხვრა.
    მულტიკოლინეარობის შესწავლის ყველაზე სრულყოფილი ალგორითმი არის Farrar-Glober ალგორითმი. ის ამოწმებს მულტიკოლინეარობის სამ ტიპს:
    1. ყველა ფაქტორი (χ 2 - ჩი-კვადრატი).
    2. თითოეული ფაქტორი სხვებთან ერთად (ფიშერის კრიტერიუმი).
    3. ფაქტორების თითოეული წყვილი (Student's t-test).
    მოდით შევამოწმოთ ცვლადები მულტიკოლნეარობისთვის Farrar-Glouber მეთოდის გამოყენებით პირველი ტიპის სტატისტიკური კრიტერიუმების გამოყენებით (chi-square ტესტი).
    Farrar-Glouber-ის სტატისტიკის მნიშვნელობის გამოთვლის ფორმულა არის:
    χ 2 = -ln(det[R])
    სადაც m = 2 არის ფაქტორების რაოდენობა, n = 20 არის დაკვირვებების რაოდენობა, det[R] არის დაწყვილებული კორელაციის კოეფიციენტების მატრიცის განმსაზღვრელი.
    ჩვენ შევადარებთ ცხრილის მნიშვნელობას v = m/2(m-1) = თავისუფლების 1 გრადუსი და მნიშვნელოვნების დონე α. თუ χ 2 > χ ცხრილი 2, მაშინ ფაქტორების ვექტორში არის მულტიკოლინიარულობა.
    χ ცხრილი 2 (1;0.05) = 3.84146
    შევამოწმოთ ცვლადები მულტიკოლინეარობისთვის მეორე ტიპის სტატისტიკური კრიტერიუმების გამოყენებით (ფიშერის ტესტი).

    შევამოწმოთ ცვლადები მულტიკოლინეარულობაზე მესამე ტიპის სტატისტიკური კრიტერიუმების გამოყენებით (სტუდენტის ტესტი). ამისათვის ჩვენ ვიპოვით ნაწილობრივი კორელაციის კოეფიციენტებს.
    ნაწილობრივი კორელაციის კოეფიციენტები.
    ნაწილობრივი კორელაციის კოეფიციენტი განსხვავდება მარტივი ხაზოვანი წყვილის კორელაციის კოეფიციენტისგან იმით, რომ ზომავს შესაბამისი მახასიათებლების (y და x i) წყვილურ კორელაციას, იმ პირობით, რომ მათზე სხვა ფაქტორების (xj) გავლენა აღმოიფხვრება.
    ნაწილობრივი კოეფიციენტებიდან გამომდინარე, შეგვიძლია დავასკვნათ, რომ რეგრესიის მოდელში ცვლადების ჩართვა გამართლებულია. თუ კოეფიციენტის მნიშვნელობა მცირეა ან უმნიშვნელო, ეს ნიშნავს, რომ კავშირი ამ ფაქტორსა და შედეგის ცვლადს შორის ან ძალიან სუსტია ან სრულიად არ არსებობს, ამიტომ ფაქტორი შეიძლება გამოირიცხოს მოდელიდან.


    კომუნიკაციის სიმკვრივე დაბალია.
    განვსაზღვროთ კორელაციის კოეფიციენტის მნიშვნელობა r yx 1 / x 2. როგორც ვხედავთ, კავშირი y-სა და x 2-ს შორის, იმ პირობით, რომ x 1 შედის მოდელში, შემცირდა. აქედან შეგვიძლია დავასკვნათ, რომ x 2-ის შეყვანა რეგრესიის განტოლებაში რჩება შეუსაბამო.
    შეგვიძლია დავასკვნათ, რომ რეგრესიული განტოლების აგებისას უნდა შეირჩეს x 1, x 2 ფაქტორები.

    მაგალითი No2. 30 დაკვირვებისთვის დაწყვილებული კორელაციის კოეფიციენტების მატრიცა შემდეგი აღმოჩნდა:

    x 1x 2x 3
    1,0
    x 10,30 1,0
    x 20,60 0,10 1,0
    x 30,40 0,15 0,80 1,0
    შეაფასეთ ფაქტორების მრავალმხრივობა. ააგეთ რეგრესიის განტოლება სტანდარტული სკალაზე და გამოიტანეთ დასკვნები.
    გაითვალისწინეთ, რომ ზოგიერთ შემთხვევაში, მულტიკოლინეარულობა არ არის ისეთი სერიოზული „ბოროტება“, რომ მნიშვნელოვანი ძალისხმევა უნდა გაკეთდეს მის იდენტიფიცირებასა და აღმოფხვრაზე. ძირითადად, ეს ყველაფერი დამოკიდებულია კვლევის მიზნებზე.
    თუ მოდელის მთავარი ამოცანაა დამოკიდებული ცვლადის მომავალი მნიშვნელობების პროგნოზირება, მაშინ განსაზღვრის საკმარისად დიდი კოეფიციენტით R2(gt; 0.9), მულტიკოლნეარობის არსებობა ჩვეულებრივ გავლენას არ ახდენს მოდელის პროგნოზირებულ თვისებებზე (თუ მომავალში კორელაციურ ცვლადებს შორის იგივე ურთიერთობები შენარჩუნდება, როგორც ადრე ).
    თუ საჭიროა იმის დადგენა, თუ რამდენად გავლენას ახდენს თითოეული ახსნა-განმარტებადი ცვლადი დამოკიდებულ ცვლადზე, მაშინ მულტიკოლინეარულობა, რომელიც იწვევს უფრო დიდ სტანდარტულ შეცდომებს, სავარაუდოდ ამახინჯებს ცვლადებს შორის ჭეშმარიტ ურთიერთობებს. ამ სიტუაციაში მულტიკოლინეარულობა სერიოზული პრობლემაა.
    არ არსებობს მულტიკოლინეარობის აღმოფხვრის ერთი მეთოდი, რომელიც ნებისმიერ შემთხვევაში შესაფერისია. ეს იმიტომ ხდება, რომ მულტიკოლინეარობის მიზეზები და შედეგები ორაზროვანია და დიდწილად დამოკიდებულია ნიმუშის შედეგებზე.
    ცვლად(ებ)ის გამორიცხვა მოდელიდან
    მულტიკოლნეარობის აღმოფხვრის უმარტივესი მეთოდია მოდელიდან ერთი ან რამდენიმე კორელაციური ცვლადის გამორიცხვა. ამ მეთოდის გამოყენებისას საჭიროა გარკვეული სიფრთხილე. ამ სიტუაციაში შესაძლებელია სპეციფიკაციების შეცდომები, ამიტომ გამოყენებული ეკონომეტრიულ მოდელებში მიზანშეწონილია არ გამოირიცხოს ახსნა-განმარტებადი ცვლადები, სანამ მულტიკოლინეარობა არ გახდება სერიოზული პრობლემა.
    მეტი მონაცემების ან ახალი ნიმუშის მიღება
    ვინაიდან მულტიკოლინეარულობა პირდაპირ დამოკიდებულია ნიმუშზე, შესაძლებელია, რომ სხვა ნიმუშით არ იყოს მულტიკოლნეარულობა ან არ იყოს ისეთი სერიოზული. ზოგჯერ, მულტიკოლინეარობის შესამცირებლად, საკმარისია ნიმუშის ზომის გაზრდა. მაგალითად, თუ იყენებთ წლიურ მონაცემებს, შეგიძლიათ გადახვიდეთ კვარტალურ მონაცემებზე. მონაცემთა რაოდენობის გაზრდა ამცირებს რეგრესიის კოეფიციენტების დისპერსიას და ამით ზრდის მათ სტატისტიკურ მნიშვნელობას. თუმცა, ახალი ნიმუშის მიღება ან ძველის გაფართოება ყოველთვის არ არის შესაძლებელი ან დაკავშირებულია სერიოზულ ხარჯებთან. გარდა ამისა, ამ მიდგომამ შეიძლება გაზარდოს ავტოკორელაცია. ეს პრობლემები ზღუდავს ამ მეთოდის გამოყენებას.
    მოდელის სპეციფიკაციის შეცვლა
    ზოგიერთ შემთხვევაში, მულტიკოლინეარობის პრობლემა შეიძლება მოგვარდეს მოდელის სპეციფიკაციის შეცვლით: ან მოდელის ფორმის შეცვლით, ან ახსნა-განმარტებითი ცვლადების დამატებით, რომლებიც არ იყო გათვალისწინებული თავდაპირველ მოდელში, მაგრამ მნიშვნელოვნად მოქმედებს დამოკიდებულ ცვლადზე. თუ ეს მეთოდი გამართლებულია, მაშინ მისი გამოყენება ამცირებს კვადრატული გადახრების ჯამს, რითაც ამცირებს რეგრესიის სტანდარტულ შეცდომას. ეს იწვევს კოეფიციენტების სტანდარტული შეცდომების შემცირებას.
    წინასწარი ინფორმაციის გამოყენება ზოგიერთი პარამეტრის შესახებ
    ზოგჯერ, მრავალჯერადი რეგრესიის მოდელის აგებისას, შეგიძლიათ გამოიყენოთ წინასწარი ინფორმაცია, კერძოდ, ზოგიერთი რეგრესიის კოეფიციენტის ცნობილი მნიშვნელობები.
    სავარაუდოა, რომ კოეფიციენტების მნიშვნელობები გამოთვლილი ზოგიერთი წინასწარი (ჩვეულებრივ უფრო მარტივი) მოდელისთვის ან მსგავსი მოდელისთვის, რომელიც დაფუძნებულია ადრე მიღებულ ნიმუშზე, შეიძლება გამოყენებულ იქნას ამჟამად შემუშავებული მოდელისთვის.
    ყველაზე მნიშვნელოვანი განმარტებითი ცვლადების შერჩევა. ელემენტების თანმიმდევრული შეერთების პროცედურა
    ნაკლებ განმარტებით ცვლადებზე გადასვლამ შეიძლება შეამციროს ურთიერთდამოკიდებულების მახასიათებლით მოწოდებული ინფორმაციის დუბლირება. ეს არის ზუსტად ის, რასაც ვხვდებით განმარტებითი ცვლადების მულტიკოლნეარობის შემთხვევაში.
    დაე

    მრავალჯერადი კოეფიციენტი
    კორელაციები დამოკიდებულ ცვლადს Y და ახსნითი ცვლადების სიმრავლეს შორის X 1,X 2,...,Xm. იგი განისაზღვრება, როგორც ჩვეულებრივი წყვილი კორელაციის კოეფიციენტი Y-სა და ხაზოვან ფუნქციას შორის
    რეგრესია Y = b0 + KX1 + b2X2+... + bmXm. ნება და = R-1 - მატრიცა შებრუნებული მატრიცის R:


    შემდეგ კოეფიციენტის კვადრატი Ry.X = Rr(xi,x2,..,x) შეიძლება გამოითვალოს ფორმულის გამოყენებით:


    განსაზღვრის R2y.X კოეფიციენტის შეფასებას R*2.X, შესწორებული მიუკერძოებლად, აქვს ფორმა:

    (თუ ფორმულა (6.7) იძლევა უარყოფით რიცხვს, მაშინ დავუშვათ


    ნდობის ქვედა ზღვარი

    განსაზღვრული
    ფორმულის მიხედვით:

    პრაქტიკაში, როდესაც გადაწყვეტთ, რომელი განმარტებითი ცვლადები უნდა იყოს შეტანილი მოდელში, ხშირად გამოიყენება ელემენტების თანმიმდევრული დამატების პროცედურა.
    (j = 1, 2,..., მ) . სადაც

    ემთხვევა ჩვეულებრივ კვადრატს
    წყვილის კორელაციის კოეფიციენტი

    დაე


    მაშინ ცვლადი xp იქნება ყველაზე ინფორმაციული. შემდეგ გამოითვლება მიუკერძოებლობისთვის შესწორებული კოეფიციენტი
    (m = 1-ისთვის) და მისი ქვედა ნდობის ზღვარი R2 წთ (1) .


    წყვილი jxp,xq უფრო ინფორმატიული იქნება). შემდეგ გამოითვლება მიუკერძოებლობის გამო შესწორებული კოეფიციენტი (m = 2-ზე)
    და მისი ქვედა ნდობის ზღვარი R2 წთ (2) .

    პროცედურა გრძელდება მანამ, სანამ არ დაკმაყოფილდება შემდეგი პირობა საფეხურზე (+1-მდე):
    შემდეგ მოდელში შედის პირველ ნაბიჯებში მიღებული ყველაზე ინფორმაციული ცვლადები. გაითვალისწინეთ, რომ გამოთვლებში გამოიყენება ფორმულები (6.7) და (6.8), რომლებშიც m-ის ნაცვლად მიღებულია k საფეხურის ნომრის შესაბამისი მნიშვნელობა.
    ფაქტობრივად, ეს მეთოდი არ იძლევა გარანტიას, რომ ჩვენ გავთავისუფლდებით მულტიკოლინეარობისგან.
    ასევე გამოიყენება მულტიკოლინეარობის აღმოფხვრის სხვა მეთოდები.
    მაგალითი 6.1. ხელმისაწვდომია შემდეგი პირობითი მონაცემები (ცხრილი 6.1):
    ცხრილი 6.1
    მონაცემები გვირილის ჯაჭვის მეთოდისთვის


    X1

    X2

    X3


    1

    1,5

    0,7

    12

    2

    2,5

    1,2

    20

    3

    1

    1,4

    15

    4

    5,5

    1,9

    41

    5

    3

    2,5

    33

    6

    3

    3,1

    35

    7

    2,8

    3,5

    38

    8

    0,5

    4

    28

    9

    4

    3,8

    47

    10

    2

    5,3

    40

    განვიხილოთ თითოეული ახსნითი ცვლადის დამოკიდებულ ცვლადზე გავლენა ცალ-ცალკე. წყვილის კორელაციის კოეფიციენტების გამოთვლით, აღმოვაჩენთ, რომ კოეფიციენტს აქვს უდიდესი მნიშვნელობა

    შემდეგ:


    განვიხილოთ ცვლადების (x1, x2) და (x1, x3) წყვილის გავლენა დამოკიდებულ ცვლადზე. პირველ რიგში, განიხილეთ ცვლადის წყვილის გავლენა (x1, x2).



    icuvum uvjpcuuivi, ykhsdul rsimsldsіtshіm msiida ііі^ісдіїслп-
    ცვლადების დამატებისას განტოლებაში უნდა იყოს შეტანილი ორი ახსნითი ცვლადი. ამრიგად, თეორიული განტოლება მიიღებს ფორმას:
    სავარცხლის მეთოდი
    განვიხილოთ „ქედის მეთოდი“ („ქედის რეგრესია“) მულტიკოლნეარობის აღმოსაფხვრელად. მეთოდი შემოგვთავაზა A.E. Hoerl-მა 1962 წელს და გამოიყენება მაშინ, როდესაც მატრიცა (xtX) ახლოსაა სინგულართან. მცირე რიცხვი (0.1-დან 0.4-მდე) ემატება მატრიცის დიაგონალურ ელემენტებს (xtX). ამ შემთხვევაში მიიღება განტოლების პარამეტრების მიკერძოებული შეფასებები. მაგრამ ასეთი შეფასებების სტანდარტული შეცდომები მულტიკოლინეარობის შემთხვევაში უფრო დაბალია, ვიდრე ჩვეულებრივი უმცირესი კვადრატების მეთოდით მოცემული შეცდომები.
    მაგალითი 6.2. საწყისი მონაცემები წარმოდგენილია „ცხრილი 6. 2 განმარტებითი ცვლადების კორელაციის კოეფიციენტი

    Რა
    მიუთითებს ძლიერ მულტიკოლინეარულობაზე.
    ცხრილი 6.2
    მულტიკოლინეარობის შესწავლის მონაცემები ქედის მეთოდით


    x1

    x2


    1

    1,4

    7

    2

    3,1

    12


    შემდეგ მივიღებთ განტოლებას y = 2,63 +1,37x1 + 1,95x2. ინვერსიული მატრიცის დიაგონალური ელემენტები მნიშვნელოვნად შემცირდება და ტოლი იქნება z00 = 0,45264, z11 = 1,57796, z00 = 0,70842, რაც იწვევს კოეფიციენტების სტანდარტული შეცდომების შემცირებას.
    Შემაჯამებელი
    მთავარ შედეგებს შორის, რაც შეიძლება გამოიწვიოს მრავალმხრივობამ, არის შემდეგი:
    1. t-ტესტის გამოყენებით მრავალჯერადი რეგრესიის კოეფიციენტების უმნიშვნელოობის შესახებ ძირითადი ჰიპოთეზის ტესტირებისას, უმეტეს შემთხვევაში იგი მიიღება, მაგრამ თავად რეგრესიის განტოლება, როდესაც ტესტირება A-ტესტის გამოყენებით, მნიშვნელოვანი აღმოჩნდება, რაც მიუთითებს გადაჭარბებულ მნიშვნელობაზე. მრავალჯერადი კორელაციის კოეფიციენტის;
    2. მრავლობითი რეგრესიის განტოლების კოეფიციენტების მიღებული შეფასებები ძირითადად არაგონივრულად არის გაბერილი ან აქვს არასწორი ნიშნები;
    3. ორიგინალური მონაცემებიდან ერთი ან ორი დაკვირვების დამატება ან გამორიცხვა ძლიერ გავლენას ახდენს მოდელის კოეფიციენტების შეფასებაზე;
    4. მრავალმხრივი რეგრესიის მოდელში მულტიკოლნეარობის არსებობამ შესაძლოა ის არასასურველი გახადოს შემდგომი გამოყენებისთვის (მაგალითად, პროგნოზების გასაკეთებლად).
    თვითტესტის კითხვები
    1. რა არის მულტიკოლინეარულობა?
    2. რა ინდიკატორები მიუთითებს მულტიკოლინალურობის არსებობაზე?
    3. რა არის XTX მატრიცის განმსაზღვრელი სრულყოფილი მულტიკოლნეარობის შემთხვევაში?
    4. რა შეიძლება ითქვას ახსნა-განმარტებითი ცვლადების კოეფიციენტების მნიშვნელობაზე მულტიკოლნეარობის შემთხვევაში?
    5. რა ტრანსფორმაცია ხდება ქედის მეთოდში, რას იწვევს?
    6. როგორია პროცედურა ახსნა-განმარტებითი ცვლადების რაოდენობის თანმიმდევრულად გაზრდის მეთოდში?
    7. რას აჩვენებს კორელაციის კოეფიციენტი?
    8. რას აჩვენებს ნაწილობრივი კორელაციის კოეფიციენტი?