Оның көптеген қолданбалары бар, өйткені ол берілген функцияны басқа қарапайымдарымен шамамен көрсетуге мүмкіндік береді. LSM бақылауларды өңдеуде өте пайдалы болуы мүмкін және ол кездейсоқ қателерді қамтитын басқаларының өлшеу нәтижелеріне негізделген кейбір шамаларды бағалау үшін белсенді қолданылады. Бұл мақалада сіз Excel бағдарламасында ең кіші квадраттарды есептеуді қалай орындау керектігін үйренесіз.

Нақты мысалды пайдалана отырып, мәселені тұжырымдау

Екі X және Y көрсеткіші бар делік. Сонымен қатар, Y X-ға тәуелді. OLS бізді регрессиялық талдау тұрғысынан қызықтыратындықтан (Excel-де оның әдістері кіріктірілген функцияларды қолдану арқылы жүзеге асырылады), біз дереу мынаны қарастыруға көшуіміз керек. нақты мәселе.

Сонымен, X шаршы метрмен өлшенетін азық-түлік дүкенінің бөлшек сауда алаңы, ал Y миллион рубльмен өлшенетін жылдық тауар айналымы болсын.

Дүкенде осы немесе басқа сауда орындары болса, онда қандай айналым (Y) болатынын болжау талап етіледі. Гипермаркет дүңгіршекке қарағанда көбірек тауар сататындықтан, Y = f (X) функциясы өсетіні анық.

Болжау үшін пайдаланылатын бастапқы деректердің дұрыстығы туралы бірнеше сөз

Бізде n дүкенге арналған деректер арқылы құрастырылған кесте бар делік.

Математикалық статистикаға сәйкес, кем дегенде 5-6 нысан бойынша деректер зерттелсе, нәтиже азды-көпті дұрыс болады. Сонымен қатар, «аномальды» нәтижелерді пайдалану мүмкін емес. Атап айтқанда, элиталық шағын бутиктің «масмаркет» класындағы ірі сауда нүктелерінің айналымынан бірнеше есе артық айналымы болуы мүмкін.

Әдістің мәні

Кесте деректерін декарттық жазықтықта M 1 (x 1, y 1), ... M n (x n, y n) нүктелері түрінде бейнелеуге болады. Енді есептің шешімі M 1, M 2, .. M n нүктелеріне мүмкіндігінше жақын өтетін графигі бар y = f (x) жуықтау функциясын таңдауға келтіріледі.

Әрине, сіз жоғары дәрежелі көпмүшені пайдалана аласыз, бірақ бұл опцияны жүзеге асыру қиын ғана емес, сонымен қатар жай дұрыс емес, өйткені ол анықталуы керек негізгі трендті көрсетпейді. Ең ақылға қонымды шешім - эксперименттік мәліметтерді, дәлірек айтқанда, a және b коэффициенттерін ең жақсы жуықтайтын y = ax + b түзуін іздеу.

Дәлдік бағалау

Кез келген жуықтау кезінде оның дәлдігін бағалау ерекше маңызға ие. x i нүктесі үшін функционалдық және тәжірибелік мәндер арасындағы айырмашылықты (ауытқуды) e i арқылы белгілейік, яғни e i = y i - f (x i).

Әлбетте, жуықтау дәлдігін бағалау үшін сіз ауытқулар қосындысын пайдалана аласыз, яғни Х-тің Y-ге тәуелділігін шамамен көрсету үшін түзу сызықты таңдағанда, ең аз мәні барға артықшылық беру керек. барлық қарастырылатын нүктелердегі сома e i. Дегенмен, бәрі оңай емес, өйткені оң ауытқулармен қатар теріс де болады.

Мәселені ауытқу модульдері немесе олардың квадраттары арқылы шешуге болады. Соңғы әдіс ең кең таралған. Ол көптеген салаларда қолданылады, соның ішінде регрессиялық талдау (Excel-де екі кірістірілген функцияны пайдалана отырып жүзеге асырылады) және өзінің тиімділігін бұрыннан дәлелдеген.

Ең кіші квадрат әдісі

Өздеріңіз білетіндей, Excel бағдарламасында таңдалған ауқымда орналасқан барлық мәндердің мәндерін есептеуге мүмкіндік беретін кірістірілген AutoSum функциясы бар. Осылайша, бізге өрнектің мәнін есептеуге ештеңе кедергі болмайды (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

Математикалық белгілерде бұл келесідей көрінеді:

Бастапқыда түзу сызықты қолдану арқылы жуықтау туралы шешім қабылданғандықтан, бізде:

Осылайша, X және Y шамаларының нақты тәуелділігін ең жақсы сипаттайтын түзуді табу міндеті екі айнымалы функцияның минимумын есептеуге келеді:

Ол үшін жаңа a және b айнымалыларына қатысты жартылай туындыларды нөлге теңестіріп, 2 белгісізі бар екі теңдеуден тұратын қарабайыр жүйені шешу керек:

Бірнеше қарапайым түрлендірулерден кейін, соның ішінде 2-ге бөлу және қосындыларды өңдеу, біз мынаны аламыз:

Оны шешу, мысалы, Крамер әдісін қолдана отырып, біз белгілі бір коэффициенттері бар стационарлық нүктені аламыз * және b *. Бұл ең аз, яғни белгілі бір аумақ үшін дүкеннің қандай айналымы болатынын болжау үшін y = a * x + b * түзу сызығы қолайлы, бұл қарастырылып отырған мысал үшін регрессия үлгісі болып табылады. Әрине, бұл сізге нақты нәтижені табуға мүмкіндік бермейді, бірақ бұл сізге белгілі бір аймақты дүкен несиесіне сатып алу өте тиімді болатыны туралы түсінік алуға көмектеседі.

Excel бағдарламасында ең кіші квадраттарды қалай жүзеге асыруға болады

Excel бағдарламасында ең кіші квадраттарды пайдаланып мәндерді есептеу функциясы бар. Оның келесі пішіні бар: «TREND» (белгілі Y мәндері; белгілі X мәндері; жаңа Х мәндері; тұрақты). Excel бағдарламасында OLS есептеу формуласын кестемізге қолданайық.

Ол үшін Excel бағдарламасындағы ең кіші квадраттар әдісімен есептеу нәтижесі көрсетілетін ұяшыққа «=» белгісін енгізіп, «TREND» функциясын таңдаңыз. Ашылған терезеде тиісті өрістерді толтырып, бөлектеңіз:

  • Y үшін белгілі мәндер ауқымы (бұл жағдайда тауар айналымы туралы деректер);
  • диапазон x 1 , …x n , яғни сауда алаңының көлемі;
  • x-тің белгілі және белгісіз мәндері, ол үшін айналым көлемін білу қажет (олардың жұмыс парағында орналасуы туралы ақпаратты төменде қараңыз).

Сонымен қатар, формулада «Const» логикалық айнымалысы бар. Сәйкес өріске 1 енгізсеңіз, бұл b = 0 деп есептей отырып, есептеулерді орындау керек дегенді білдіреді.

Егер сізге бірнеше x мәніне болжамды білу қажет болса, формуланы енгізгеннен кейін «Enter» пернесін баспау керек, бірақ пернетақтада «Shift» + «Control» + «Enter» тіркесімін теру керек.

Кейбір мүмкіндіктер

Регрессиялық талдау тіпті манекендерге де қол жетімді болуы мүмкін. Белгісіз айнымалылар массивінің мәнін болжауға арналған Excel формуласын - TREND - тіпті ең кіші квадраттар туралы ешқашан естімегендер де пайдалана алады. Оның жұмысының кейбір ерекшеліктерін білу жеткілікті. Сондай-ақ:

  • Егер сіз y айнымалысының белгілі мәндерінің ауқымын бір жолға немесе бағанға орналастырсаңыз, онда x белгілі мәндері бар әрбір жолды (бағанды) бағдарлама жеке айнымалы ретінде қабылдайды.
  • TREND терезесінде белгілі x диапазоны көрсетілмесе, Excel бағдарламасында функцияны пайдаланған кезде бағдарлама оны бүтін сандардан тұратын массив ретінде қарастырады, олардың саны берілген мәндері бар диапазонға сәйкес келеді. айнымалы y.
  • «Болжамды» мәндердің массивін шығару үшін трендті есептеуге арналған өрнек массив формуласы ретінде енгізілуі керек.
  • Егер x-тің жаңа мәндері көрсетілмесе, TREND функциясы оларды белгілі мәндерге тең деп санайды. Егер олар көрсетілмесе, онда аргумент ретінде 1-массив алынады; 2; 3; 4;…, ол бұрыннан көрсетілген y параметрлері бар диапазонға сәйкес.
  • Жаңа x мәндерін қамтитын ауқымда берілген y мәндерін қамтитын ауқыммен бірдей немесе бірнеше жолдар немесе бағандар болуы керек. Басқаша айтқанда, ол тәуелсіз айнымалыларға пропорционалды болуы керек.
  • Белгілі x мәндері бар массив бірнеше айнымалыларды қамтуы мүмкін. Алайда, егер біз тек біреуі туралы айтатын болсақ, онда x және y берілген мәндері бар диапазондар пропорционалды болуы керек. Бірнеше айнымалы болған жағдайда, берілген y мәндері бар диапазон бір бағанға немесе бір жолға сәйкес келуі керек.

БОЛЖАУ функциясы

Бірнеше функцияларды қолдану арқылы жүзеге асырылады. Солардың бірі «Болжау» деп аталады. Ол «TREND-ке» ұқсас, яғни ол ең кіші квадраттар әдісін қолданатын есептеулер нәтижесін береді. Алайда Y мәні белгісіз бір Х үшін ғана.

Енді сіз Excel бағдарламасында сызықтық тренд бойынша белгілі бір көрсеткіштің болашақ мәнін болжауға мүмкіндік беретін манекендерге арналған формулаларды білесіз.

Ол ғылымның және практикалық қызметтің әртүрлі салаларында кеңінен қолданылады. Бұл физика, химия, биология, экономика, әлеуметтану, психология және т.б. болуы мүмкін. Тағдырдың қалауымен мен экономикамен жиі айналысуға тура келеді, сондықтан бүгін мен сізге таңғажайып елге сапар ұйымдастырамын. Эконометрика=) ...Қалай қаламайсың?! Бұл өте жақсы – тек шешім қабылдау керек! ...Бірақ сіз міндетті түрде қалаған нәрсе - мәселелерді шешуді үйрену ең кіші квадраттар әдісі. Ал әсіресе ынталы оқырмандар оларды дәл ғана емес, сонымен бірге ӨТЕ ТЕЗ шешуді үйренеді ;-) Бірақ алдымен мәселенің жалпы тұжырымы+ ілеспе мысал:

Белгілі бір пәндік саладағы сандық өрнекке ие көрсеткіштерді зерттейік. Бұл ретте көрсеткіш көрсеткішке байланысты деуге толық негіз бар. Бұл болжам ғылыми гипотеза болуы мүмкін немесе негізгі жалпы мағынаға негізделген. Дегенмен, ғылымды бір жаққа қалдырып, тәбетті көбірек зерттейік, атап айтқанда, азық-түлік дүкендері. деп белгілейік:

– азық-түлік дүкенінің бөлшек сауда алаңы, ш.м.,
– азық-түлік дүкенінің жылдық айналымы, миллион рубль.

Дүкен аумағы неғұрлым үлкен болса, көп жағдайда оның айналымы соғұрлым көп болатыны анық.

Бақылаулар/тәжірибелер/есептер/билерді домбырамен орындағаннан кейін біздің қолымызда сандық деректер бар делік:

Азық-түлік дүкендерінде бәрі түсінікті деп ойлаймын: - бұл 1-ші дүкеннің ауданы, - оның жылдық айналымы, - 2-ші дүкеннің ауданы, - оның жылдық айналымы және т.б. Айтпақшы, құпия материалдарға қол жеткізудің қажеті жоқ - тауар айналымының жеткілікті дәл бағасын мыналар арқылы алуға болады. математикалық статистика. Дегенмен, алаңдамай-ақ қояйық, коммерциялық тыңшылық курсы қазірдің өзінде ақылы =)

Кестелік мәліметтерді нүкте түрінде жазуға және таныс формада бейнелеуге де болады Декарттық жүйе .

Маңызды сұраққа жауап берейік: Сапалы зерттеу үшін қанша ұпай керек?

Көбірек болса жақсы. Ең аз рұқсат етілген жиынтық 5-6 ұпайдан тұрады. Сонымен қатар, деректер көлемі аз болған кезде, үлгіге «аномальды» нәтижелерді қосу мүмкін емес. Мәселен, мысалы, шағын элиталық дүкен «өз әріптестерінен» көбірек тапсырыстар ала алады, осылайша сіз табу керек жалпы үлгіні бұрмалайды!

Қарапайым тілмен айтқанда, біз функцияны таңдауымыз керек, кестеол нүктелерге мүмкіндігінше жақын өтеді . Бұл функция деп аталады жуықтау (апроксимация - жуықтау)немесе теориялық функция . Жалпы айтқанда, бұл жерде бірден айқын «талапкер» пайда болады - графигі БАРЛЫҚ нүктелер арқылы өтетін жоғары дәрежелі көпмүше. Бірақ бұл опция күрделі және жиі дұрыс емес. (себебі график үнемі «цикл болады» және негізгі трендті нашар көрсетеді).

Осылайша, ізделетін функция өте қарапайым болуы керек және сонымен бірге тәуелділікті адекватты түрде көрсетуі керек. Сіз болжағандай, мұндай функцияларды табу әдістерінің бірі деп аталады ең кіші квадраттар әдісі. Алдымен оның мәнін жалпылама түрде қарастырайық. Кейбір функциялар шамамен эксперименттік деректерге рұқсат етіңіз:


Бұл жуықтау дәлдігін қалай бағалауға болады? Сондай-ақ эксперименттік және функционалдық мәндер арасындағы айырмашылықтарды (ауытқуларды) есептейік (сызбаны оқимыз). Ақылға келетін бірінші ой - бұл соманың қаншалықты үлкен екенін бағалау, бірақ мәселе айырмашылықтар теріс болуы мүмкін. (Мысалы, ) және мұндай жинақтау нәтижесіндегі ауытқулар бірін-бірі жоққа шығарады. Сондықтан, жуықтау дәлдігін бағалау ретінде ол қосындыны алуды өтінеді. модульдерауытқулар:

немесе құлаған: (егер біреу білмесе: – бұл қосынды белгішесі және – 1-ден -ге дейінгі мәндерді қабылдайтын көмекші «есептеуіш» айнымалысы).

Әртүрлі функциялары бар эксперименттік нүктелерді жуықтау арқылы біз әртүрлі мәндерді аламыз және бұл қосынды қай жерде аз болса, бұл функция дәлірек болады.

Мұндай әдіс бар және ол аталады ең аз модуль әдісі. Алайда іс жүзінде ол әлдеқайда кең тарады ең кіші квадрат әдісі, онда ықтимал теріс мәндер модуль арқылы емес, ауытқуларды квадраттау арқылы жойылады:

, содан кейін күш-жігер квадраттық ауытқулардың қосындысы болатындай функцияны таңдауға бағытталған мүмкіндігінше аз болды. Шындығында, әдістің атауы осыдан шыққан.

Енді біз тағы бір маңызды мәселеге ораламыз: жоғарыда айтылғандай, таңдалған функция өте қарапайым болуы керек - бірақ мұндай функциялар да көп: сызықтық , гиперболалық, экспоненциалды, логарифмдік, квадраттық және т.б. Және, әрине, бұл жерде мен бірден «қызмет өрісін қысқартқым келеді». Зерттеу үшін функциялардың қай класын таңдауым керек? Қарапайым, бірақ тиімді әдіс:

– Ең оңай жолы – нүктелерді бейнелеу сызба бойынша және олардың орналасуын талдау. Егер олар түзу сызықта жүгіруге бейім болса, онда сіз іздеу керек түзудің теңдеуі оңтайлы мәндерімен және . Басқаша айтқанда, тапсырма квадраттық ауытқулардың қосындысы ең аз болатындай ОСЫНДАЙ коэффициенттерді табу болып табылады.

Егер нүктелер, мысалы, бойында орналасқан болса гипербола, онда сызықтық функция нашар жуықтауды беретіні анық. Бұл жағдайда біз гипербола теңдеуі үшін ең «қолайлы» коэффициенттерді іздейміз – квадраттардың ең аз сомасын беретіндер .

Енді екі жағдайда да біз айтып отырғанымызға назар аударыңыз екі айнымалының функциялары, кімнің дәлелдері тәуелділік параметрлерін іздеді:

Бізге стандартты мәселені шешу керек - табу екі айнымалының минималды функциясы.

Мысалымызды еске түсірейік: «дүкен» нүктелері түзу сызықта орналасады делік және бұған сенуге толық негіз бар. сызықтық тәуелділікбөлшек сауда орындарынан айналым. Квадрат ауытқуларының қосындысы болатындай «a» және «be» коэффициенттерін табайық. ең кішісі болды. Барлығы әдеттегідей - бірінші 1-ші ретті жартылай туындылар. Сәйкес сызықтық ережеСіз қосынды белгішесінің астынан ажырата аласыз:

Егер сіз бұл ақпаратты эссе немесе курстық жұмыс үшін пайдаланғыңыз келсе, мен дереккөздер тізіміндегі сілтеме үшін өте ризамын; мұндай егжей-тегжейлі есептеулерді бірнеше жерден таба аласыз:

Стандартты жүйені құрайық:

Біз әрбір теңдеуді «екіге» азайтамыз, сонымен қатар қосындыларды «бөлеміз»:

Ескерту : «a» және «be» неліктен қосынды белгішесінен тыс шығарылуы мүмкін екенін дербес талдаңыз. Айтпақшы, формальды түрде мұны сомамен жасауға болады

Жүйені «қолданбалы» түрде қайта жазайық:

содан кейін біздің мәселемізді шешу алгоритмі пайда бола бастайды:

Біз нүктелердің координаталарын білеміз бе? Біз білеміз. Сомалар таба аламыз ба? Оңай. Ең қарапайымын жасайық екі белгісіз екі сызықтық теңдеулер жүйесі(«а» және «болу»). Біз жүйені шешеміз, мысалы, Крамер әдісі, нәтижесінде біз стационарлық нүкте аламыз. Тексеру экстремум үшін жеткілікті шарт, біз осы нүктеде функцияны тексере аламыз дәл жетеді минимум. Тексеру қосымша есептеулерді қамтиды, сондықтан біз оны сахнаның артында қалдырамыз (қажет болса, жетіспейтін кадрды көруге болады). Біз қорытынды қорытынды жасаймыз:

Функция ең жақсы жол (кем дегенде кез келген басқа сызықтық функциямен салыстырғанда)эксперимент нүктелерін жақындатады . Дөрекі түрде айтқанда, оның графигі осы нүктелерге мүмкіндігінше жақын өтеді. Дәстүр бойынша эконометрикаалынған жуықтау функциясы да аталады жұпталған сызықтық регрессия теңдеуі .

Қарастырылып отырған мәселенің практикалық маңызы зор. Біздің мысалда, теңдеу. қандай тауар айналымын болжауға мүмкіндік береді («Игрек»)дүкен сату аймағының бір немесе басқа құнына ие болады («x» бір немесе басқа мағынасы). Иә, алынған болжам тек болжам болады, бірақ көп жағдайда ол өте дәл болып шығады.

Мен «нақты» сандармен бір ғана мәселені талдаймын, өйткені онда ешқандай қиындықтар жоқ - барлық есептеулер 7-8 сыныптардағы мектеп бағдарламасы деңгейінде. Жағдайлардың 95 пайызында сізден жай ғана сызықтық функцияны табу сұралады, бірақ мақаланың соңында мен оңтайлы гиперболаның, экспоненциалды және басқа да функциялардың теңдеулерін табу қиын емес екенін көрсетемін.

Шындығында, уәде етілген жақсылықтарды тарату ғана қалады - осылайша сіз мұндай мысалдарды дәл ғана емес, сонымен қатар тез шешуге үйрене аласыз. Біз стандартты мұқият зерттейміз:

Тапсырма

Екі көрсеткіш арасындағы байланысты зерттеу нәтижесінде келесі сандар жұптары алынды:

Ең кіші квадраттар әдісін қолданып, эмпирикалыққа жақсы жақындайтын сызықтық функцияны табыңыз (тәжірибелі)деректер. Декарттық тікбұрышты координаталар жүйесіндегі жуықтау функциясының графигін және эксперименттік нүктелерді салуға болатын сызбаны жасаңыз. . Эмпирикалық және теориялық мәндер арасындағы квадраттық ауытқулардың қосындысын табыңыз. Мүмкіндік жақсырақ болатынын біліңіз (ең кіші квадраттар әдісі тұрғысынан)эксперимент нүктелерін жақындату.

Назар аударыңыз, «х» мағыналары табиғи және бұл тән мағыналы мағынаға ие, мен бұл туралы сәл кейінірек айтамын; бірақ олар, әрине, бөлшек болуы мүмкін. Сонымен қатар, белгілі бір тапсырманың мазмұнына байланысты «X» және «ойын» мәндері толығымен немесе ішінара теріс болуы мүмкін. Бізге «бетсіз» тапсырма берілді, біз оны бастаймыз шешім:

Жүйенің шешімі ретінде оңтайлы функцияның коэффициенттерін табамыз:

Неғұрлым ықшам жазу үшін «есептегіш» айнымалы мәнді алып тастауға болады, өйткені жинақтау 1-ден -ге дейін орындалатыны анық.

Қажетті сомаларды кесте түрінде есептеу ыңғайлы:


Есептеулерді микрокалькуляторда жүргізуге болады, бірақ Excel бағдарламасын пайдалану әлдеқайда жақсы - тезірек және қатесіз; қысқа бейнені қараңыз:

Осылайша, біз келесіні аламыз жүйесі:

Мұнда екінші теңдеуді 3 пен көбейтуге болады 1-ші теңдеудің мүшесінен 2-ші мүшесін азайт. Бірақ бұл сәттілік - іс жүзінде жүйелер көбінесе сыйлық емес, мұндай жағдайларда ол үнемдейді Крамер әдісі:
, бұл жүйеде бірегей шешім бар дегенді білдіреді.

Тексерейік. Мен сіз қаламайтыныңызды түсінемін, бірақ неге қателерді жіберіп алмау керек? Табылған шешімін жүйенің әрбір теңдеуінің сол жағына ауыстырайық:

Сәйкес теңдеулердің оң жақтары алынады, бұл жүйенің дұрыс шешілгенін білдіреді.

Осылайша, қажетті жуықтау функциясы: – бастап барлық сызықтық функцияларЭксперименттік деректерді ең жақсы жақындататын ол.

Ұнайды Түзу дүкен айналымының оның ауданына тәуелділігі, табылған тәуелділігі болып табылады кері («көп, соғұрлым аз» қағидасы), және бұл факт бірден теріс арқылы ашылады еңіс. Функция белгілі бір көрсеткіштің 1 бірлікке жоғарылауымен тәуелді көрсеткіштің мәні төмендейтінін айтады орташа 0,65 бірлікке. Олар айтқандай, қарақұмықтың бағасы неғұрлым жоғары болса, соғұрлым аз сатылады.

Жақындау функциясының графигін салу үшін оның екі мәнін табамыз:

және сызбаны орындаңыз:


Салынған түзу деп аталады тренд сызығы (атап айтқанда, сызықтық тренд сызығы, яғни жалпы жағдайда тренд түзу болуы міндетті емес). «Трендте болу» деген сөз баршаға таныс және менің ойымша, бұл терминге қосымша түсініктемелер қажет емес.

Квадраттық ауытқулардың қосындысын есептейік эмпирикалық және теориялық құндылықтар арасында. Геометриялық тұрғыдан бұл «таңқурай» сегменттерінің ұзындықтарының квадраттарының қосындысы (оның екеуі өте кішкентай, олар тіпті көрінбейді).

Есептерді кестеде қорытындылайық:


Қайтадан, оларды қолмен жасауға болады, мен 1-тармаққа мысал келтіремін:

бірақ мұны бұрыннан белгілі әдіспен жасау әлдеқайда тиімді:

Тағы да қайталаймыз: Алынған нәтиженің мәні неде?бастап барлық сызықтық функциялар y функциясы көрсеткіш ең кіші, яғни оның отбасында ол ең жақсы жуықтау болып табылады. Айтпақшы, мәселенің соңғы сұрағы кездейсоқ емес: егер ұсынылған экспоненциалды функция болса ше? эксперимент нүктелерін жақындатқан дұрыс па?

Квадраттық ауытқулардың сәйкес сомасын табайық - ажырату үшін мен оларды «эпсилон» әрпімен белгілеймін. Техника дәл солай:


Және тағы да, 1-ші нүкте үшін есептеулер:

Excel бағдарламасында біз стандартты функцияны қолданамыз EXP (синтаксисті Excel анықтамасынан табуға болады).

Қорытынды: , яғни экспоненциалды функция түзу сызықтан да нашар эксперименттік нүктелерге жақындайды. .

Бірақ бұл жерде «нашар» екенін атап өткен жөн әлі білдірмейді, не жаман. Енді мен осы экспоненциалды функцияның графигін құрдым - және ол да нүктелерге жақын өтеді - аналитикалық зерттеулерсіз қай функцияның дәлірек екенін айту қиынға соғады.

Бұл шешімді аяқтайды және мен аргументтің табиғи құндылықтары туралы сұраққа қайта ораламын. Әртүрлі зерттеулерде, әдетте, экономикалық немесе әлеуметтанулық, табиғи «Х» айларды, жылдарды немесе басқа тең уақыт аралығын санау үшін қолданылады. Мысалы, келесі мәселені қарастырайық.

Эксперименттік мәліметтерді жақындату – тәжірибелік жолмен алынған деректерді түйіндік нүктелерде бастапқы мәндермен (тәжірибе немесе эксперимент кезінде алынған деректер) ең жақын өтетін немесе сәйкес келетін аналитикалық функциямен ауыстыруға негізделген әдіс. Қазіргі уақытта аналитикалық функцияны анықтаудың екі жолы бар:

Өтетін n-дәрежелі интерполяциялық көпмүшені құру арқылы тікелей барлық нүктелер арқылыберілген деректер массиві. Бұл жағдайда жуықтау функциясы келесі түрде беріледі: Лагранж түріндегі интерполяциялық көпмүшелік немесе Ньютон түріндегі интерполяциялық көпмүшелік.

Өтетін n-дәрежелі жуықтау көпмүшені құру арқылы нүктелеріне тікелей жақын жердеберілген деректер массивінен. Осылайша, жуықтау функциясы эксперимент кезінде туындауы мүмкін барлық кездейсоқ шуды (немесе қателерді) тегістейді: эксперимент кезінде өлшенетін мәндер өздерінің кездейсоқ заңдарына (өлшеу немесе құрал қателері, дәлсіздік немесе эксперименттік) сәйкес өзгеретін кездейсоқ факторларға байланысты. қателер). Бұл жағдайда жуықтау функциясы ең кіші квадраттар әдісі арқылы анықталады.

Ең кіші квадрат әдісі(ағылшын әдебиетіндегі Ordinary Least Squares, OLS) – эксперименттік деректердің берілген массивінен нүктелерге ең жақын жерде құрастырылған жуықтау функциясын анықтауға негізделген математикалық әдіс. F(x) бастапқы және жуықтау функцияларының жақындығы сандық өлшеммен анықталады, атап айтқанда: F(x) жуықтау қисығынан эксперимент деректерінің квадраттық ауытқуларының қосындысы ең кіші болуы керек.

Кіші квадраттар әдісін қолданып құрастырылған жуықтау қисығы

Ең кіші квадраттар әдісі қолданылады:

Теңдеулер саны белгісіздер санынан асатын кезде артық анықталған теңдеулер жүйесін шешу;

Қарапайым (артық анықталмаған) сызықты емес теңдеулер жүйесі жағдайында шешімін табу;

Кейбір жуықтау функциясымен нүкте мәндерін жуықтау үшін.

Ең кіші квадраттар әдісін қолданатын жуықтау функциясы берілген эксперименттік деректер массивінен есептелген жуықтау функциясының квадраттық ауытқуларының ең аз қосындысының шартынан анықталады. Ең кіші квадраттар әдісінің бұл критерийі келесі өрнек түрінде жазылады:

Түйінді нүктелердегі есептелген жуықтау функциясының мәндері,

Түйін нүктелеріндегі эксперименттік деректердің берілген массиві.

Квадраттық критерийдің көпмүшелік жуықтау функцияларымен жуықтау есебінің бірегей шешімін қамтамасыз ететін дифференциалдығы сияқты бірқатар «жақсы» қасиеттері бар.

Есептің шарттарына байланысты жуықтау функциясы m дәрежелі көпмүше болып табылады

Жақындау функциясының дәрежесі түйіндік нүктелердің санына тәуелді емес, бірақ оның өлшемі әрқашан берілген тәжірибелік деректер массивінің өлшемінен (нүктелер саны) аз болуы керек.

∙ Егер жуықтау функциясының дәрежесі m=1 болса, онда кестелік функцияны түзу сызықпен жуықтаймыз (сызықтық регрессия).

∙ Егер жуықтау функциясының дәрежесі m=2 болса, онда кесте функциясын квадраттық параболамен жуықтаймыз (квадрат жуықтау).

∙ Егер жуықтау функциясының дәрежесі m=3 болса, онда кестелік функцияны текше параболамен жақындатамыз (кубтық жуықтау).

Жалпы жағдайда берілген кесте мәндері үшін жуықтап m дәрежелі көпмүшелік құру қажет болғанда, барлық түйін нүктелері бойынша квадраттық ауытқулар қосындысының минимумының шарты келесі түрде қайта жазылады:

- m дәрежелі жуықтау көпмүшесінің белгісіз коэффициенттері;

Кесте мәндерінің саны көрсетілген.

Функцияның минимумының болуының қажетті шарты оның белгісіз айнымалыларға қатысты жартылай туындыларының нөлге теңдігі болып табылады. . Нәтижесінде келесі теңдеулер жүйесін аламыз:

Алынған сызықтық теңдеулер жүйесін түрлендірейік: жақшаларды ашып, бос мүшелерді өрнектің оң жағына жылжытыңыз. Нәтижесінде сызықтық алгебралық өрнектер жүйесі келесі түрде жазылады:

Бұл сызықтық алгебралық өрнектер жүйесін матрицалық түрде қайта жазуға болады:

Нәтижесінде m+1 белгісіздерден тұратын m+1 өлшемді сызықтық теңдеулер жүйесі алынды. Бұл жүйені сызықтық алгебралық теңдеулерді шешудің кез келген әдісімен шешуге болады (мысалы, Гаусс әдісі). Шешімнің нәтижесінде жуықтау функциясының бастапқы деректерден квадраттық ауытқуларының минималды қосындысын қамтамасыз ететін жуықтау функциясының белгісіз параметрлері табылады, яғни. мүмкін болатын ең жақсы квадраттық жуықтау. Бастапқы деректердің тіпті бір мәні өзгерсе, барлық коэффициенттер өздерінің мәндерін өзгертетінін есте ұстаған жөн, өйткені олар бастапқы деректермен толығымен анықталады.

Сызықтық тәуелділік бойынша бастапқы деректерді жуықтау

(сызықтық регрессия)

Мысал ретінде сызықтық тәуелділік түрінде көрсетілген жуықтау функциясын анықтау әдістемесін қарастырайық. Ең кіші квадраттар әдісіне сәйкес квадраттық ауытқулар қосындысының минимумының шарты келесі түрде жазылады:

Кесте түйіндерінің координаттары;

Сызықтық тәуелділік ретінде көрсетілген жуықтау функциясының белгісіз коэффициенттері.

Функцияның минимумының болуының қажетті шарты оның белгісіз айнымалыларға қатысты жартылай туындыларының нөлге теңдігі болып табылады. Нәтижесінде келесі теңдеулер жүйесін аламыз:

Алынған сызықтық теңдеулер жүйесін түрлейік.

Алынған сызықтық теңдеулер жүйесін шешеміз. Аналитикалық түрдегі жуықтау функциясының коэффициенттері келесі түрде анықталады (Крамер әдісі):

Бұл коэффициенттер берілген кестелік мәндерден (эксперименттік деректер) жуықтау функциясының квадраттарының қосындысын азайту критерийіне сәйкес сызықтық жуықтау функциясын құруды қамтамасыз етеді.

Ең кіші квадраттар әдісін жүзеге асыру алгоритмі

1. Бастапқы деректер:

N өлшемдер саны бар эксперименттік деректер массиві көрсетілген

Жақындаушы көпмүшенің дәрежесі (m) көрсетілген

2. Есептеу алгоритмі:

2.1. Өлшемдері бар теңдеулер жүйесін құру үшін коэффициенттер анықталады

Теңдеулер жүйесінің коэффициенттері (теңдеудің сол жағы)

- теңдеулер жүйесінің шаршы матрицасының баған нөмірінің индексі

Сызықтық теңдеулер жүйесінің еркін мүшелері (теңдеудің оң жағы)

- теңдеулер жүйесінің шаршы матрицасының жол нөмірінің индексі

2.2. Өлшемі бар сызықтық теңдеулер жүйесін құру .

2.3. m дәрежелі жуық көпмүшенің белгісіз коэффициенттерін анықтау үшін сызықтық теңдеулер жүйесін шешу.

2.4 Барлық түйін нүктелеріндегі бастапқы мәндерден жуықтаушы көпмүшенің квадраттық ауытқуларының қосындысын анықтау

Квадраттық ауытқулар қосындысының табылған мәні ең аз мүмкін.

Басқа функцияларды қолдану арқылы жуықтау

Ең кіші квадраттар әдісіне сәйкес бастапқы деректерді жуықтау кезінде кейде жуықтау функциясы ретінде логарифмдік функция, көрсеткіштік функция және дәреже функциясы қолданылатынын атап өткен жөн.

Логарифмдік жуықтау

Жақындау функциясы келесі түрдегі логарифмдік функциямен берілген жағдайды қарастырайық:

Ең кіші квадраттар әдісінің мәні мынада кез келген кездейсоқ құбылыстың уақыт немесе кеңістіктегі даму тенденциясын жақсы сипаттайтын тренд моделінің параметрлерін табуда (тренд – осы даму тенденциясын сипаттайтын сызық). Ең кіші квадраттар әдісінің (LSM) міндеті тек қандай да бір тренд моделін табу ғана емес, ең жақсы немесе оңтайлы модельді табу болып табылады. Бақыланатын нақты мәндер мен сәйкес есептелген тренд мәндері арасындағы квадраттық ауытқулардың қосындысы минималды (ең кіші) болса, бұл модель оңтайлы болады:

мұндағы бақыланатын нақты мән арасындағы квадраттық ауытқу

және сәйкес есептелген тренд мәні,

Зерттелетін құбылыстың нақты (байқалатын) мәні,

Тренд моделінің есептелген мәні,

Зерттелетін құбылысты бақылау саны.

MNC өз бетімен өте сирек қолданылады. Әдетте, ол көбінесе корреляциялық зерттеулерде қажетті техникалық әдіс ретінде ғана қолданылады. OLS ақпараттық негізі тек сенімді статистикалық қатар болуы мүмкін екенін есте ұстаған жөн, ал бақылаулар саны 4-тен кем болмауы керек, әйтпесе OLS тегістеу процедуралары ақыл-ойды жоғалтуы мүмкін.

MNC құралдар жинағы келесі процедураларға дейін төмендейді:

Бірінші процедура. Таңдалған фактор-аргумент өзгерген кезде нәтиже атрибутын өзгерту тенденциясы бар ма, әлде басқаша айтқанда, « арасында байланыс бар ма екен. сағ « Және » X ».

Екінші процедура. Қандай сызық (траектория) осы үрдісті жақсы сипаттай алатыны немесе сипаттай алатыны анықталады.

Үшінші процедура.

Мысал. Зерттелетін шаруашылық бойынша күнбағыстың орташа шығымдылығы туралы мәліметтер бар делік (9.1-кесте).

9.1-кесте

Бақылау нөмірі

Өнімділік, ц/га

Біздің елімізде күнбағыс өндірісіндегі технология деңгейі соңғы 10 жыл ішінде іс жүзінде өзгермегендіктен, бұл талданатын кезеңдегі шығымдылықтың ауытқуы ауа-райы мен климаттық жағдайлардың ауытқуларына өте тәуелді болғанын білдіреді. Бұл шынымен рас па?

Бірінші OLS процедурасы. Талданатын 10 жылдағы ауа-райы мен климаттық жағдайлардың өзгеруіне байланысты күнбағыс өнімділігінің өзгеру үрдісінің болуы туралы гипотеза тексерілді.

Бұл мысалда « ж «күнбағыс өнімін алған жөн, ал үшін» x » – талданатын кезеңдегі бақыланатын жылдың саны. арасында қандай да бір байланыстың болуы туралы гипотезаны тексеру» x « Және » ж «екі жолмен орындалуы мүмкін: қолмен және компьютерлік бағдарламаларды пайдалану. Әрине, компьютерлік технологияның болуымен бұл мәселені өздігінен шешуге болады. Бірақ MNC құралдарын жақсырақ түсіну үшін « арасындағы қарым-қатынастың болуы туралы гипотезаны тексерген жөн. x « Және » ж » қолмен, тек қалам мен қарапайым калькулятор қолыңызда болғанда. Мұндай жағдайларда трендтің болуы туралы гипотезаны талданатын динамика қатарының графикалық кескінінің орналасуы - корреляция өрісі арқылы көзбен тексерген дұрыс:

Біздің мысалдағы корреляция өрісі баяу өсетін сызықтың айналасында орналасқан. Мұның өзi күнбағыс түсiмiнiң өзгеруiнде белгiлi бiр тенденцияның бар екендiгiн көрсетедi. Корреляциялық өріс шеңберге, шеңберге, қатаң тік немесе қатаң көлденең бұлтқа ұқсағанда немесе ретсіз шашыраңқы нүктелерден тұратын кезде ғана қандай да бір тенденцияның болуы туралы айту мүмкін емес. Барлық басқа жағдайларда арасындағы байланыстың болуы туралы гипотеза « x « Және » ж «, және зерттеуді жалғастырыңыз.

Екінші OLS процедурасы. Талданатын кезеңдегі күнбағыс өнімділігінің өзгеру тенденциясын қай сызық (траектория) жақсы сипаттай алатыны немесе сипаттай алатыны анықталады.

Егер сізде компьютерлік технология болса, оңтайлы трендті таңдау автоматты түрде жүреді. «Қолмен» өңдеуде оңтайлы функцияны таңдау, әдетте, көрнекі түрде - корреляция өрісінің орналасуы бойынша жүзеге асырылады. Яғни, графиктің түріне қарай эмпирикалық трендке (нақты траекторияға) жақсы сәйкес келетін сызықтың теңдеуі таңдалады.

Белгілі болғандай, табиғатта функционалдық тәуелділіктердің алуан түрлілігі бар, сондықтан олардың кішкене бөлігін де көрнекі түрде талдау өте қиын. Бақытымызға орай, нақты экономикалық тәжірибеде көптеген қатынастарды парабола немесе гипербола немесе түзу сызық арқылы өте дәл сипаттауға болады. Осыған байланысты, ең жақсы функцияны таңдаудың «қолмен» опциясымен сіз өзіңізді тек осы үш үлгімен шектей аласыз.

Гипербола:

Екінші ретті парабола: :

Біздің мысалда талданатын 10 жыл ішінде күнбағыс өнімділігінің өзгеру тенденциясы түзу сызықпен жақсы сипатталатынын байқау қиын емес, сондықтан регрессия теңдеуі түзу сызықтың теңдеуі болады.

Үшінші процедура. Бұл сызықты сипаттайтын регрессия теңдеуінің параметрлері есептеледі немесе басқаша айтқанда, ең жақсы тренд үлгісін сипаттайтын аналитикалық формула анықталады.

Регрессия теңдеуінің параметрлерінің мәндерін табу, біздің жағдайда және параметрлері OLS ядросы болып табылады. Бұл процесс қалыпты теңдеулер жүйесін шешуге келеді.

(9.2)

Бұл теңдеулер жүйесін Гаусс әдісімен оңай шешуге болады. Еске салайық, шешім нәтижесінде біздің мысалда және параметрлерінің мәндері табылды. Осылайша, табылған регрессия теңдеуі келесі түрге ие болады:

Ең кіші квадрат әдісі

Ең кіші квадрат әдісі ( OLS, OLS, қарапайым ең кіші квадраттар) - үлгілік мәліметтерді пайдалана отырып, регрессиялық модельдердің белгісіз параметрлерін бағалауға арналған регрессиялық талдаудың негізгі әдістерінің бірі. Әдіс регрессия қалдықтарының квадраттарының қосындысын азайтуға негізделген.

Айта кету керек, ең кіші квадраттар әдісінің өзін кез келген аймақтағы есепті шешу әдісі деп атауға болады, егер шешім қажетті айнымалылардың кейбір функцияларының квадраттарының қосындысын минимизациялаудың қандай да бір критерийінде жатса немесе қанағаттандырса. Сондықтан ең кіші квадраттар әдісін берілген функцияны басқа (қарапайым) функциялар арқылы жуықтап көрсету (жақындату) үшін, теңдеулерді немесе шектеулерді қанағаттандыратын, саны осы шамалардың санынан асатын шамалардың жиынын табу кезінде де қолдануға болады. , т.б.

MNC мәні

(Түсіндірілген) айнымалы арасындағы ықтималдық (регрессия) байланыстың кейбір (параметрлік) моделі берілсін. жжәне көптеген факторлар (түсіндірмелі айнымалылар) x

мұндағы белгісіз модель параметрлерінің векторы

- кездейсоқ модель қатесі.

Осы айнымалы мәндердің үлгілік бақылаулары да болсын. Бақылау нөмірі () болсын. Содан кейін бақылаудағы айнымалылардың мәндері. Содан кейін b параметрлерінің берілген мәндері үшін түсіндірілетін y айнымалысының теориялық (модельдік) мәндерін есептеуге болады:

Қалдықтардың мөлшері b параметрлерінің мәндеріне байланысты.

Ең кіші квадраттар әдісінің мәні (қарапайым, классикалық) қалдық квадраттарының қосындысы болатын b параметрлерін табу (ағыл. Квадраттардың қалдық қосындысы) минималды болады:

Жалпы жағдайда бұл мәселені сандық оңтайландыру (минимизация) әдістерімен шешуге болады. Бұл жағдайда олар туралы айтады сызықты емес ең кіші квадраттар(NLS немесе NLLS - ағылшын) Сызықты емес ең кіші квадраттар). Көптеген жағдайларда аналитикалық шешімді алуға болады. Минимизациялау есебін шешу үшін функцияның стационарлық нүктелерін b белгісіз параметрлеріне қатысты дифференциалдау, туындыларын нөлге теңестіріп, алынған теңдеулер жүйесін шешу керек:

Модельдің кездейсоқ қателері қалыпты түрде үлестірілсе, бірдей дисперсияға ие және өзара байланыссыз болса, OLS параметрінің бағалаулары максималды ықтималдық бағалауларымен (MLM) бірдей болады.

Сызықтық модель жағдайында OLS

Регрессияға тәуелділік сызықтық болсын:

Болсын жтүсіндірілетін айнымалының бақылауларының бағандық векторы болып табылады және факторлық бақылаулардың матрицасы (матрица жолдары - берілген бақылаудағы фактор мәндерінің векторлары, бағандар - берілген фактор мәндерінің векторы барлық бақылауларда). Сызықтық модельдің матрицалық көрінісі:

Сонда түсіндірілетін айнымалының бағалау векторы мен регрессия қалдықтарының векторы тең болады.

Сәйкесінше, регрессия қалдықтарының квадраттарының қосындысы тең болады

Параметрлер векторына қатысты бұл функцияны дифференциялау және туындыларды нөлге теңестіру, біз теңдеулер жүйесін аламыз (матрицалық түрде):

.

Бұл теңдеулер жүйесінің шешімі сызықтық модель үшін ең кіші квадраттарды бағалаудың жалпы формуласын береді:

Аналитикалық мақсаттар үшін бұл формуланың соңғы нұсқасы пайдалы. Егер регрессиялық модельде деректер орталықтандырылған, онда бұл көріністе бірінші матрица факторлардың таңдамалы коварианттық матрицасының мағынасына ие, ал екіншісі тәуелді айнымалысы бар факторлардың коварианттық векторы болып табылады. Егер қосымша деректер болса нормаланған MSE-ге (яғни, сайып келгенде стандартталған), онда бірінші матрица факторлардың таңдамалы корреляциялық матрицасының мағынасына ие болады, екінші вектор - тәуелді айнымалымен факторлардың таңдау корреляциясының векторы.

Модельдер үшін OLS бағалауларының маңызды қасиеті тұрақтымен- құрастырылған регрессия сызығы үлгі деректердің ауырлық центрі арқылы өтеді, яғни теңдік орындалады:

Атап айтқанда, төтенше жағдайда, жалғыз регрессор тұрақты болған кезде, біз жалғыз параметрдің OLS бағалауы (тұрақтының өзі) түсіндірілетін айнымалының орташа мәніне тең екенін табамыз. Яғни, үлкен сандар заңдарынан жақсы қасиеттерімен белгілі орташа арифметикалық шама да ең кіші квадраттарды бағалау болып табылады - ол одан квадраттық ауытқулардың ең аз сомасының критерийін қанағаттандырады.

Мысалы: ең қарапайым (жұптық) регрессия

Жұптастырылған сызықтық регрессия жағдайында есептеу формулалары жеңілдетілген (сіз матрицалық алгебрасыз жасай аласыз):

OLS бағалаушыларының қасиеттері

Ең алдымен, сызықтық модельдер үшін OLS бағалары жоғарыда келтірілген формуладан төмендегідей сызықтық бағалар болып табылатынын атап өтеміз. Бейтарап OLS бағалаулары үшін регрессиялық талдаудың ең маңызды шартын орындау қажет және жеткілікті: факторларға байланысты кездейсоқ қатенің математикалық күтуі нөлге тең болуы керек. Бұл шарт, атап айтқанда, қанағаттандырылады, егер

  1. кездейсоқ қателердің математикалық күтуі нөлге тең, және
  2. факторлар мен кездейсоқ қателер тәуелсіз кездейсоқ шама болып табылады.

Екінші шарт – факторлардың экзогенділік шарты – іргелі. Егер бұл қасиет орындалмаса, онда кез келген бағалау өте қанағаттанарлықсыз болады деп болжауға болады: олар тіпті дәйекті болмайды (яғни, деректердің өте үлкен көлемі бұл жағдайда жоғары сапалы бағалаулар алуға мүмкіндік бермейді). ). Классикалық жағдайда кездейсоқ қателіктен айырмашылығы факторлардың детерминизмі туралы күштірек болжам жасалады, бұл автоматты түрде экзогендік шарттың орындалғанын білдіреді. Жалпы жағдайда бағалаулардың дәйектілігі үшін матрицаның кейбір сингулярлық емес матрицаға жинақталуымен бірге экзогендік шартты қанағаттандыру жеткілікті, өйткені таңдама көлемі шексіздікке дейін өседі.

Жүйелілік пен бейтараптықтан басқа (қарапайым) ең кіші квадраттардың бағалаулары да тиімді болуы үшін (сызықты бейтарап бағалаулар класындағы ең жақсы) кездейсоқ қатенің қосымша қасиеттері орындалу керек:

Бұл жорамалдарды кездейсоқ қателік векторының коварианттық матрицасы үшін тұжырымдауға болады

Осы шарттарды қанағаттандыратын сызықтық модель деп аталады классикалық. Классикалық сызықтық регрессияға арналған OLS бағалаулары барлық сызықтық бейтарап бағалаулар класында бейтарап, дәйекті және ең тиімді бағалау болып табылады (ағылшын әдебиетінде кейде аббревиатура қолданылады КӨК (Үздік сызықтық негізсіз бағалаушы) - ең жақсы сызықтық бейтарап бағалау; орыс әдебиетінде Гаусс-Марков теоремасы жиі келтіріледі). Көрсету оңай болғандықтан, коэффициентті бағалау векторының коварианттық матрицасы мынаған тең болады:

Жалпыланған OLS

Ең кіші квадраттар әдісі кең жалпылауға мүмкіндік береді. Қалдықтардың квадраттарының қосындысын азайтудың орнына, қалдық векторының кейбір оң анықталған квадраттық түрін минимизациялауға болады, мұндағы кейбір симметриялы оң анықталған салмақ матрицасы. Кәдімгі ең кіші квадраттар бұл тәсілдің ерекше жағдайы болып табылады, мұнда салмақ матрицасы сәйкестік матрицасына пропорционал болады. Симметриялық матрицалар (немесе операторлар) теориясынан белгілі болғандай, мұндай матрицалар үшін ыдырау жүреді. Демек, көрсетілген функционалдық келесі түрде ұсынылуы мүмкін, яғни бұл функцияны кейбір түрлендірілген «қалдықтардың» квадраттарының қосындысы ретінде көрсетуге болады. Осылайша, ең кіші квадраттар әдістерінің класын – LS әдістерін (Ең кіші квадраттар) ажыратуға болады.

(Айткен теоремасы) жалпылама сызықтық регрессия моделі үшін (кездейсоқ қателердің коварианттық матрицасына ешқандай шектеулер қойылмаған) ең тиімдісі (сызықты бейтарап бағалаулар класында) бағалаулар деп аталатыны дәлелденді. жалпыланған ең кіші квадраттар (GLS - жалпыланған ең кіші квадраттар)- Кездейсоқ қателердің кері ковариациялық матрицасына тең салмақ матрицасы бар LS әдісі: .

Сызықтық модельдің параметрлерін GLS бағалау формуласының пішіні бар екенін көрсетуге болады

Осы бағалаулардың коварианттық матрицасы сәйкесінше тең болады

Шын мәнінде, OLS мәні бастапқы деректердің белгілі (сызықтық) түрлендіруінде (Р) және түрлендірілген деректерге қарапайым OLS қолдануында жатыр. Бұл түрлендірудің мақсаты трансформацияланған деректер үшін кездейсоқ қателер классикалық болжамдарды қанағаттандырады.

Салмақталған OLS

Диагональды салмақ матрицасы (және демек, кездейсоқ қателердің коварианттық матрицасы) жағдайында бізде өлшенген ең кіші квадраттар (WLS) деп аталатындар бар. Бұл жағдайда үлгі қалдықтарының квадраттарының өлшенген сомасы минимизацияланады, яғни әрбір бақылау осы бақылаудағы кездейсоқ қатенің дисперсиясына кері пропорционалды «салмақ» алады: . Іс жүзінде деректер бақылауларды салмақтау арқылы түрлендіріледі (кездейсоқ қателердің болжалды стандартты ауытқуына пропорционалды мөлшерге бөлу), ал өлшенген деректерге қарапайым OLS қолданылады.

Тәжірибеде MNC қолданудың кейбір ерекше жағдайлары

Сызықтық тәуелділіктің жуықтауы

Белгілі бір скаляр шаманың белгілі бір скаляр шамаға тәуелділігін зерттеу нәтижесінде (Бұл, мысалы, кернеудің ток күшіне тәуелділігі болуы мүмкін: , мұндағы тұрақты шама, кедергісі болуы мүмкін) жағдайды қарастырайық. өткізгіш), осы шамаларды өлшеу жүргізілді, нәтижесінде мәндер және олардың сәйкес мәндері. Өлшеу деректері кестеде жазылуы керек.

Кесте. Өлшеу нәтижелері.

Өлшем №.
1
2
3
4
5
6

Сұрақ туындайды: тәуелділікті жақсы сипаттау үшін коэффициенттің қандай мәнін таңдауға болады? Ең кіші квадраттар әдісіне сәйкес бұл мән мәндердің мәндерден квадраттық ауытқуларының қосындысы болатындай болуы керек.

минималды болды

Квадраттық ауытқулардың қосындысы бір экстремумға ие - бұл формуланы қолдануға мүмкіндік беретін минимум. Осы формуладан коэффициенттің мәнін табайық. Ол үшін оның сол жағын келесідей түрлендіреміз:

Соңғы формула коэффициенттің мәнін табуға мүмкіндік береді, бұл мәселеде қажет болды.

Оқиға

19 ғасырдың басына дейін. ғалымдарда белгісіздер саны теңдеулер санынан аз болатын теңдеулер жүйесін шешудің белгілі бір ережелері болмады; Осы уақытқа дейін теңдеулердің түріне және калькуляторлардың тапқырлығына байланысты жеке әдістер қолданылды, сондықтан бір бақылау деректеріне негізделген әртүрлі калькуляторлар әртүрлі қорытындыларға келді. Бұл әдісті алғаш рет Гаусс (1795) қолданды, ал Лежендр (1805) оны өз бетінше тауып, қазіргі атауымен (француз. Moindres quarrés әдісі ). Лаплас әдісті ықтималдықтар теориясымен байланыстырды, ал американдық математигі Адрейн (1808) оның ықтималдық-теориялық қосымшаларын қарастырды. Әдіс Энке, Бессель, Хансен және т.б.ның одан әрі зерттеулері арқылы кеңінен таралып, жетілдірілді.

OLS қолданбасының балама түрлері

Ең кіші квадраттар әдісінің идеясын регрессиялық талдауға тікелей қатысы жоқ басқа жағдайларда да қолдануға болады. Мәселе мынада, квадраттардың қосындысы векторлар үшін ең көп тараған жақындық өлшемдерінің бірі болып табылады (Ақыр өлшемді кеңістіктердегі евклидтік метрика).

Қолданбалардың бірі – теңдеулер саны айнымалылар санынан көп болатын сызықтық теңдеулер жүйесінің «шешімі»

мұндағы матрица шаршы емес, өлшемі тікбұрышты.

Мұндай теңдеулер жүйесі, жалпы жағдайда, шешімі жоқ (егер ранг шын мәнінде айнымалылар санынан көп болса). Сондықтан бұл жүйені және векторлары арасындағы «қашықтықты» азайту үшін осындай векторды таңдау мағынасында ғана «шешу» мүмкін. Ол үшін жүйелік теңдеулердің сол және оң жақтары арасындағы айырмашылықтардың квадраттарының қосындысын минимизациялау критерийін қолдануға болады, яғни. Бұл минимизациялау есебін шешу келесі теңдеулер жүйесін шешуге әкелетінін көрсету оңай