Algoritam rješenja najmanjih kvadrata. Linearna regresija. Korištenje metode najmanjih kvadrata (OLS). Korištenje ugrađenih funkcija programa Excel

Tema 2. SISTEMI LINEARNIH ALGEBRSKIH JEDNAČINA.

Osnovni koncepti.

Definicija 1. Sistem m linearne jednačine With n nepoznanice je sistem oblika:

gdje i - brojevi.

Definicija 2. Rješenje sistema (I) je skup nepoznanica u kojem svaka jednačina ovog sistema postaje identitet.

Definicija 3. Sistem (I) se zove joint, ako ima barem jedno rješenje i non-joint, ako nema rješenja. Zglobni sistem se zove siguran, ako ima jedinstveno rješenje, i neizvjesno inače.

Definicija 4. Jednačina oblika

pozvao nula, a jednačina je oblika

pozvao nekompatibilno. Očigledno, sistem jednačina koji sadrži nekompatibilnu jednačinu je nekonzistentan.

Definicija 5. Zovu se dva sistema linearnih jednačina ekvivalentno, ako svako rješenje jednog sistema služi kao rješenje za drugi i, obrnuto, svako rješenje drugog sistema je rješenje za prvi.

Matrični prikaz sistema linearnih jednačina.

Razmotrimo sistem (I) (vidi §1).

Označimo:

Matrica koeficijenata za nepoznate

,

Matrica - kolona slobodnih pojmova

Matrica – kolona nepoznatih

.

Definicija 1. Matrica se zove glavna matrica sistema(I), a matrica je proširena matrica sistema (I).

Po definiciji jednakosti matrica, sistem (I) odgovara matričnoj jednakosti:

.

Desna strana ove jednakosti po definiciji proizvoda matrica ( vidi definiciju 3 § 5 poglavlje 1) može se faktorizirati:

, tj.

Jednakost (2) pozvao matrična notacija sistema (I).

Rješavanje sistema linearnih jednačina korištenjem Cramerove metode.

Neka u sistemu (I) (vidi §1) m=n, tj. broj jednačina je jednak broju nepoznatih, a glavna matrica sistema je nesingularna, tj. . Tada sistem (I) iz §1 ima jedinstveno rješenje

gdje je Δ = det A zove se glavni determinanta sistema(I), Δ i se dobija iz determinante Δ zamjenom i kolonu u kolonu slobodnih članova sistema (I).

Primjer: Riješite sistem koristeći Cramerovu metodu:

.

Po formulama (3) .

Izračunavamo determinante sistema:

,

,

,

.

Da bismo dobili determinantu, prvi stupac u determinanti zamijenili smo stupcem slobodnih pojmova; zamjenjujući 2. stupac u determinanti kolonom slobodnih pojmova, dobijamo ; na sličan način, zamjenom 3. stupca u determinanti kolonom slobodnih pojmova, dobijamo . Sistemsko rješenje:

Rješavanje sistema linearnih jednačina korištenjem inverzna matrica.

Pustiti u sistem (I) (vidi §1) m=n a glavna matrica sistema je nesingularna. Zapišimo sistem (I) u matričnom obliku ( vidi §2):

jer matrica A nesingularna, onda ima inverznu matricu ( vidi teoremu 1 §6 poglavlja 1). Pomnožimo obje strane jednakosti (2) na matricu, onda

. (3)

Po definiciji inverzne matrice. Od jednakosti (3) imamo

Riješite sistem koristeći inverznu matricu

.

Označimo

; ; .

U primjeru (§ 3) izračunali smo determinantu, dakle, matricu A ima inverznu matricu. Tada na snazi (4) , tj.

. (5)

Nađimo matricu ( vidi §6 poglavlje 1)

, , ,

, , ,

, , ,

,

.

Gaussova metoda.

Neka je zadan sistem linearnih jednačina:

. (ja)

Potrebno je pronaći sva rješenja sistema (I) ili se uvjeriti da je sistem nekonzistentan.

Definicija 1.Nazovimo to elementarnom transformacijom sistema(I) bilo koju od tri radnje:

1) precrtavanje nulte jednačine;

2) dodavanjem obe strane jednačine odgovarajućih delova druge jednačine, pomnoženih brojem l;

3) zamena članova u jednačinama sistema tako da nepoznate sa istim brojevima u svim jednačinama zauzimaju ista mesta, tj. ako smo, na primjer, u 1. jednačini promijenili 2. i 3. član, onda se isto mora učiniti u svim jednačinama sistema.

Gaussova metoda se sastoji u tome da se sistem (I) uz pomoć elementarnih transformacija svodi na ekvivalentan sistem čije se rješenje direktno pronalazi ili se utvrđuje njegova nerješivost.

Kao što je opisano u §2, sistem (I) je jedinstveno određen svojom proširenom matricom i svaka elementarna transformacija sistema (I) odgovara elementarnoj transformaciji proširene matrice:

.

Transformacija 1) odgovara brisanju nultog reda u matrici, transformacija 2) je ekvivalentna dodavanju drugog reda u odgovarajući red matrice, pomnoženog brojem l, transformacija 3) je ekvivalentna preuređenju kolona u matrici.

Lako je vidjeti da, naprotiv, svaka elementarna transformacija matrice odgovara elementarnoj transformaciji sistema (I). Zbog navedenog, umjesto operacija sa sistemom (I), radićemo sa proširenom matricom ovog sistema.

U matrici, 1. stupac se sastoji od koeficijenata za x 1, 2. kolona - od koeficijenata za x 2 itd. Ako su kolone preuređene, treba uzeti u obzir da je ovaj uvjet prekršen. Na primjer, ako zamijenimo 1. i 2. stupac, tada će 1. stupac sada sadržavati koeficijente za x 2, au 2. koloni - koeficijenti za x 1.

Sistem (I) ćemo riješiti Gausovom metodom.

1. Precrtajte sve nulte redove u matrici, ako ih ima (tj., precrtajte sve nulte jednačine u sistemu (I).

2. Provjerimo da li među redovima matrice postoji red u kojem su svi elementi osim posljednjeg jednaki nuli (nazovimo takav red nekonzistentnim). Očigledno, takva linija odgovara nekonzistentnoj jednačini u sistemu (I), dakle sistem (I) nema rješenja i tu se proces završava.

3. Neka matrica ne sadrži nekonzistentne redove (sistem (I) ne sadrži nekonzistentne jednačine). Ako a 11 =0, onda u 1. redu nalazimo neki element (osim zadnjeg) koji nije nula i preuređujemo kolone tako da u 1. redu nema nule na 1. mjestu. Sada ćemo to pretpostaviti (tj. zamijenit ćemo odgovarajuće članove u jednačinama sistema (I)).

4. Pomnožite 1. red sa i dodajte rezultat sa 2. linijom, zatim pomnožite 1. red sa i dodajte rezultat sa 3. linijom, itd. Očigledno, ovaj proces je ekvivalentan eliminisanju nepoznatog x 1 iz svih jednačina sistema (I), osim prve. U novoj matrici dobijamo nule u 1. koloni ispod elementa a 11:

.

5. Precrtajmo sve nulte redove u matrici, ako ih ima, i provjerimo da li postoji nekonzistentan red (ako postoji, onda je sistem nekonzistentan i rješenje se tu završava). Hajde da proverimo da li će ih biti a 22 / =0, ako da, onda ćemo u 2. redu pronaći element različit od nule i preurediti stupce tako da . Zatim pomnožite elemente 2. reda sa i dodati sa odgovarajućim elementima 3. reda, zatim - elemente 2. reda dalje i dodajmo sa odgovarajućim elementima 4. reda, itd., dok ne dobijemo nule ispod a 22/

.

Preduzete radnje su ekvivalentne eliminaciji nepoznatog x 2 iz svih jednačina sistema (I), osim za 1. i 2.. Pošto je broj redova konačan, nakon konačnog broja koraka dobijamo da je sistem ili nekonzistentan, ili da završimo sa matricom koraka ( vidi definiciju 2 §7 poglavlje 1) :

,

Napišimo sistem jednačina koji odgovara matrici. Ovaj sistem je ekvivalentan sistemu (I)

.

Iz posljednje jednačine izražavamo; zamijeniti u prethodnu jednačinu, pronaći, itd., dok ne dobijemo .

Napomena 1. Dakle, pri rješavanju sistema (I) Gausovom metodom dolazimo do jednog od sljedećih slučajeva.

1. Sistem (I) je nedosljedan.

2. Sistem (I) ima jedinstveno rješenje ako je broj redova u matrici jednak broju nepoznatih ().

3. Sistem (I) ima beskonačan broj rješenja ako je broj redova u matrici manji od broja nepoznatih ().

Stoga vrijedi sljedeća teorema.

Teorema. Sistem linearnih jednačina je ili nekonzistentan, ima jedinstveno rješenje ili ima beskonačan broj rješenja.

Primjeri. Riješite sistem jednadžbi Gaussovom metodom ili dokažite njegovu nekonzistentnost:

A) ;

b) ;

V) .

a) Prepišimo dati sistem u obliku:

.

Zamijenili smo 1. i 2. jednadžbu originalnog sistema da bismo pojednostavili proračune (umjesto razlomaka, radićemo samo s cijelim brojevima koristeći ovo preuređenje).

Kreirajmo proširenu matricu:

.

Ne postoje nulte linije; nema nekompatibilnih linija, ; Isključimo 1. nepoznatu iz svih jednačina sistema osim prve. Da biste to učinili, pomnožite elemente 1. reda matrice sa “-2” i dodajte ih sa odgovarajućim elementima 2. reda, što je ekvivalentno množenju 1. jednadžbe sa “-2” i dodavanju sa 2. jednačina. Zatim elemente 1. reda pomnožimo sa “-3” i saberemo ih sa odgovarajućim elementima trećeg reda, tj. pomnožite 2. jednačinu datog sistema sa “-3” i dodajte je 3. jednačini. Dobijamo

.

Matrica odgovara sistemu jednačina

Metoda inverzne matrice nije teško ako znaš opšti principi raditi sa matričnim jednadžbama i, naravno, biti u stanju izvoditi elementarne algebarske operacije.

Rješavanje sistema jednačina metodom inverzne matrice. Primjer.

Najprikladniji način za razumijevanje metode inverzne matrice je jasan primjer. Uzmimo sistem jednačina:

Prvi korak u rješavanju ovog sistema jednačina je pronalaženje determinante. Stoga, transformirajmo naš sistem jednačina u sljedeću matricu:

I nalazimo potrebnu odrednicu:

Formula koja se koristi za rješavanje matričnih jednadžbi je sljedeća:

Dakle, da bismo izračunali X, trebamo odrediti vrijednost matrice A-1 i pomnožiti je sa b. Još jedna formula će nam pomoći u tome:

U ovom slučaju će biti transponovana matrica- odnosno isti originalni, ali napisan ne u redovima, već u kolonama.

To ne treba zaboraviti metoda inverzne matrice, kao i Cramerova metoda, pogodna je samo za sisteme u kojima je determinanta veća ili manja od nule. Ako je determinanta jednaka nuli, potrebno je koristiti Gaussovu metodu.

Sljedeći korak je sastavljanje matrice minora, a to je sljedeća šema:

Kao rezultat, dobili smo tri matrice - minore, algebarske sabirke i transponovanu matricu algebarskih sabiraka. Sada možete nastaviti sa stvarnom kompilacijom inverzne matrice. Već znamo formulu. Za naš primjer to će izgledati ovako.

Koji nalazi najširu primenu u raznim oblastima nauke i praktične aktivnosti. To može biti fizika, hemija, biologija, ekonomija, sociologija, psihologija i tako dalje i tako dalje. Voljom sudbine, često moram da se bavim ekonomijom, i zato ću danas za vas organizovati putovanje u neverovatnu zemlju tzv. Ekonometrija=) ...Kako ne želiš?! Tamo je jako dobro – samo treba da se odlučite! ...Ali ono što sigurno želite je naučiti kako rješavati probleme metoda najmanjih kvadrata. A posebno marljivi čitaoci naučiće da ih rešavaju ne samo precizno, već i VEOMA BRZO ;-) Ali prvo opšta izjava o problemu+ prateći primjer:

Pretpostavimo da se u određenoj predmetnoj oblasti proučavaju indikatori koji imaju kvantitativni izraz. Istovremeno, postoje svi razlozi za vjerovanje da indikator ovisi o indikatoru. Ova pretpostavka može biti ili naučna hipoteza ili bazirana na elementarnoj osnovi zdrav razum. Ostavimo, međutim, nauku po strani i istražimo privlačnija područja – naime, trgovine prehrambenim proizvodima. Označimo sa:

– maloprodajni prostor trgovine, m2,
– godišnji promet prehrambene prodavnice, milion rubalja.

Apsolutno je jasno da što je veća površina prodavnice, to će u većini slučajeva biti veći njen promet.

Pretpostavimo da nakon izvođenja zapažanja/eksperimenata/proračunavanja/plesa uz tamburu imamo na raspolaganju numeričke podatke:

Sa prehrambenim prodavnicama mislim da je sve jasno: - ovo je površina 1. prodavnice, - njen godišnji promet, - površina 2. prodavnice, - njen godišnji promet itd. Uzgred, uopšte nije potrebno imati pristup klasifikovanim materijalima - prilično tačna procena trgovinskog prometa može se dobiti pomoću matematičke statistike. Međutim, nemojmo se ometati, kurs komercijalne špijunaže je već plaćen =)

Tabelarni podaci se također mogu napisati u obliku tačaka i prikazati u poznatom obliku Kartezijanski sistem .

Odgovorimo na jedno važno pitanje: Koliko bodova je potrebno za kvalitativnu studiju?

Što veće, to bolje. Minimalni prihvatljivi set sastoji se od 5-6 bodova. Osim toga, kada je količina podataka mala, “anomalni” rezultati se ne mogu uključiti u uzorak. Tako, na primjer, mala elitna radnja može zaraditi redove veličine više od "njegovih kolega", čime se iskrivljuje opšti obrazac, to je ono što trebate pronaći!

Vrlo jednostavno rečeno, moramo odabrati funkciju, raspored koji prolazi što bliže tačkama . Ova funkcija se zove aproksimativno (aproksimacija - aproksimacija) ili teorijska funkcija . Uopšteno govoreći, ovdje se odmah pojavljuje očigledan "konkurent" - polinom visokog stepena, čiji graf prolazi kroz SVE tačke. Ali ova opcija je komplikovana i često jednostavno netočna. (pošto će se grafikon stalno "petljati" i loše odražavati glavni trend).

Dakle, tražena funkcija mora biti prilično jednostavna i istovremeno adekvatno odražavati ovisnost. Kao što možete pretpostaviti, jedna od metoda za pronalaženje takvih funkcija se zove metoda najmanjih kvadrata. Prvo, pogledajmo njegovu suštinu općenito. Neka neka funkcija aproksimira eksperimentalne podatke:


Kako procijeniti tačnost ove aproksimacije? Izračunajmo i razlike (odstupanja) između eksperimentalne i funkcionalne vrijednosti (učimo crtež). Prva misao koja vam pada na pamet je procijeniti koliki je zbroj, ali problem je što razlike mogu biti negativne (Na primjer, ) a odstupanja kao rezultat takvog zbrajanja će se poništiti. Stoga, kao procjenu tačnosti aproksimacije, treba uzeti zbir moduli odstupanja:

ili srušeno: (u slučaju da neko ne zna: – ovo je ikona sume, i – pomoćna varijabla „brojača“, koja uzima vrijednosti od 1 do ).

Aproksimacijom eksperimentalnih tačaka različitim funkcijama dobićemo različita značenja, i očito, gdje je ovaj iznos manji, ta funkcija je tačnija.

Takav metod postoji i zove se metoda najmanjeg modula. Međutim, u praksi je postao mnogo rašireniji metoda najmanjeg kvadrata, u kojem je moguće negativne vrijednosti se ne eliminišu modulom, već kvadriranjem odstupanja:

, nakon čega se radi na odabiru funkcije takve da je zbir kvadrata odstupanja bio što manji. Zapravo, odatle potiče naziv metode.

A sada se vraćamo na još jednu važnu točku: kao što je gore navedeno, odabrana funkcija bi trebala biti prilično jednostavna - ali postoji i mnogo takvih funkcija: linearno , hiperbolično, eksponencijalna, logaritamski, kvadratni itd. I, naravno, ovdje bih odmah želio „smanjiti polje aktivnosti“. Koju klasu funkcija trebam odabrati za istraživanje? Primitivno, ali efektivna tehnika:

– Najlakši način je da prikažete tačke na crtežu i analizirati njihovu lokaciju. Ako imaju tendenciju da trče u pravoj liniji, onda biste trebali potražiti jednačina prave sa optimalnim vrijednostima i . Drugim riječima, zadatak je pronaći TAKVE koeficijente tako da zbir kvadrata odstupanja bude najmanji.

Ako se tačke nalaze, na primjer, duž hiperbola, onda je očito jasno da će linearna funkcija dati lošu aproksimaciju. U ovom slučaju tražimo najpovoljnije koeficijente za jednadžbu hiperbole – oni koji daju minimalni zbir kvadrata .

Sada imajte na umu da u oba slučaja govorimo funkcije dvije varijable, čiji su argumenti pretraživali parametre zavisnosti:

A u suštini moramo riješiti standardni problem - pronaći minimalna funkcija dvije varijable.

Prisjetimo se našeg primjera: pretpostavimo da se tačke "prodavnice" obično nalaze u pravoj liniji i postoji svaki razlog vjerovati da linearna zavisnost promet od maloprodajnog prostora. Nađimo TAKVE koeficijente “a” i “be” takve da je zbir kvadrata odstupanja bio najmanji. Sve je kao i obično - prvo Parcijalni derivati ​​1. reda. Prema pravilo linearnosti Možete razlikovati odmah ispod ikone sume:

Ako želite da iskoristite ove informacije za esej ili seminarski rad, bit ću vam veoma zahvalan na linku na listi izvora, na nekoliko mjesta ćete naći ovako detaljne proračune:

Kreirajmo standardni sistem:

Svaku jednačinu smanjujemo za "dva" i, pored toga, "razbijamo" zbrojeve:

Bilješka : nezavisno analizirati zašto se “a” i “be” mogu izdvojiti izvan ikone zbira. Inače, formalno se to može učiniti sa sumom

Prepišimo sistem u "primijenjenom" obliku:

nakon čega počinje da se pojavljuje algoritam za rješavanje našeg problema:

Znamo li koordinate tačaka? Mi znamo. Iznosi možemo li ga naći? Lako. Hajde da napravimo najjednostavnije sistem dvije linearne jednadžbe u dvije nepoznate(“a” i “biti”). Rešavamo sistem, npr. Cramerova metoda, kao rezultat toga dobijamo stacionarnu tačku. Provjeravam dovoljan uslov za ekstrem, možemo potvrditi da je u ovom trenutku funkcija dostiže tačno minimum. Provjera uključuje dodatne proračune i stoga ćemo je ostaviti iza scene (ako je potrebno, okvir koji nedostaje može se vidjeti). Izvlačimo konačan zaključak:

Funkcija najbolji način (barem u usporedbi s bilo kojom drugom linearnom funkcijom) približava eksperimentalne tačke . Grubo govoreći, njegov graf prolazi što je moguće bliže ovim tačkama. U tradiciji ekonometrija rezultirajuća aproksimirajuća funkcija se također poziva uparena jednačina linearne regresije .

Problem koji se razmatra ima veliki praktični značaj. U našem primjeru, jednadžba. omogućava vam da predvidite koji trgovinski promet ("Igrek") trgovina će imati jednu ili drugu vrijednost prodajnog prostora (jedno ili drugo značenje "x"). Da, rezultirajuća prognoza će biti samo prognoza, ali će se u mnogim slučajevima pokazati prilično tačnom.

Analizirat ću samo jedan problem sa "pravim" brojevima, jer u tome nema poteškoća - svi proračuni su na nivou školski program 7-8 razreda. U 95 posto slučajeva od vas će se tražiti da pronađete samo linearnu funkciju, ali na samom kraju članka pokazaću da nije teže pronaći jednadžbe optimalne hiperbole, eksponencijalne i nekih drugih funkcija.

U stvari, ostaje samo distribuirati obećane dobrote - tako da možete naučiti rješavati takve primjere ne samo precizno, već i brzo. Pažljivo proučavamo standard:

Zadatak

Kao rezultat proučavanja odnosa između dva indikatora, dobijeni su sljedeći parovi brojeva:

Koristeći metodu najmanjih kvadrata, pronađite linearnu funkciju koja najbolje aproksimira empirijsku (iskusan) podaci. Napravite crtež na kojem ćete konstruirati eksperimentalne točke i graf aproksimirajuće funkcije u kartezijanskom pravokutnom koordinatnom sistemu . Pronađite zbroj kvadrata odstupanja između empirijske i teorijske vrijednosti. Saznajte da li bi ova funkcija bila bolja (sa stanovišta metode najmanjih kvadrata) približiti eksperimentalne tačke.

Imajte na umu da su značenja “x” prirodna, a ovo ima karakteristično smisleno značenje, o kojem ću govoriti malo kasnije; ali oni, naravno, mogu biti i razlomci. Osim toga, ovisno o sadržaju određenog zadatka, vrijednosti "X" i "igra" mogu biti potpuno ili djelomično negativne. Pa, dobili smo zadatak „bez lica“ i počinjemo ga rješenje:

Nalazimo koeficijente optimalne funkcije kao rješenje sistema:

U svrhu kompaktnijeg snimanja, varijabla “counter” može se izostaviti, jer je već jasno da se zbrajanje vrši od 1 do .

Pogodnije je izračunati potrebne količine u obliku tabele:


Izračuni se mogu izvršiti na mikrokalkulatoru, ali je mnogo bolje koristiti Excel - i brže i bez grešaka; pogledajte kratak video:

Tako dobijamo sledeće sistem:

Ovdje možete pomnožiti drugu jednačinu sa 3 i oduzmi 2. od 1. jednačine član po član. Ali to je sreća - u praksi sistemi često nisu dar, au takvim slučajevima štedi Cramerova metoda:
, što znači da sistem ima jedinstveno rješenje.

Hajde da proverimo. Razumijem da ne želite, ali zašto preskakati greške tamo gdje se apsolutno ne mogu propustiti? Zamenimo pronađeno rešenje u levu stranu svake jednačine sistema:

Dobijene su desne strane odgovarajućih jednačina, što znači da je sistem ispravno riješen.

Dakle, željena aproksimirajuća funkcija: – od svima linearne funkcije Ona je ta koja najbolje aproksimira eksperimentalne podatke.

Za razliku od ravno zavisnost prometa prodavnice od njene površine, pronađena zavisnost je obrnuto (princip "što više, to manje"), a ovu činjenicu odmah otkriva negativac nagib. Funkcija nam govori da povećanjem određenog indikatora za 1 jedinicu, vrijednost zavisnog indikatora opada prosjek za 0,65 jedinica. Kako kažu, što je veća cijena heljde, to se manje prodaje.

Da bismo nacrtali graf aproksimirajuće funkcije, nalazimo njene dvije vrijednosti:

i izvedite crtež:


Konstruisana prava linija se zove linija trenda (naime, linearna linija trenda, tj opšti slučaj trend nije nužno ravna linija). Svima je poznat izraz „biti u trendu“ i mislim da ovaj termin ne treba dodatno komentarisati.

Izračunajmo zbir kvadrata odstupanja između empirijskih i teorijskih vrijednosti. Geometrijski, ovo je zbir kvadrata dužina segmenata "maline" (od kojih su dva toliko mala da se ni ne vide).

Sumiramo proračune u tabeli:


Opet, mogu se raditi ručno za svaki slučaj, dat ću primjer za 1. točku:

ali mnogo je efikasnije to učiniti na već poznati način:

Ponavljamo još jednom: Šta znači dobijeni rezultat? Od sve linearne funkcije y funkcija indikator je najmanji, odnosno u svojoj porodici je najbolja aproksimacija. I ovdje, usput, konačno pitanje problema nije slučajno: šta ako predložena eksponencijalna funkcija da li bi bilo bolje približiti eksperimentalne tačke?

Nađimo odgovarajući zbir kvadrata odstupanja - da bismo ih razlikovali, označit ću ih slovom "epsilon". Tehnika je potpuno ista:


I opet, za svaki slučaj, kalkulacije za 1. tačku:

U Excelu koristimo standardnu ​​funkciju EXP (sintaksu možete pronaći u Excel pomoći).

Zaključak: , što znači da eksponencijalna funkcija aproksimira eksperimentalne tačke lošije od prave linije .

Ali ovdje treba napomenuti da je „gore“. ne znači još, šta nije uredu. Sada sam napravio graf ove eksponencijalne funkcije - i on takođe prolazi blizu tačaka - toliko da je bez analitičkog istraživanja teško reći koja je funkcija tačnija.

Ovim je rješenje završeno i vraćam se na pitanje prirodnih vrijednosti argumenta. U različitim studijama, obično ekonomskim ili sociološkim, prirodni "X" se koriste za brojenje mjeseci, godina ili drugih jednakih vremenskih intervala. Razmotrite, na primjer, sljedeći problem.

Aproksimacija eksperimentalnih podataka je metoda koja se temelji na zamjeni eksperimentalno dobivenih podataka analitičkom funkcijom koja najbliže prolazi ili se podudara u čvornim točkama s izvornim vrijednostima (podaci dobiveni tijekom eksperimenta ili eksperimenta). Trenutno postoje dva načina za definiranje analitičke funkcije:

Konstruisanjem interpolacionog polinoma n stepena koji prolazi direktno kroz sve tačke dati niz podataka. U ovom slučaju, aproksimirajuća funkcija je predstavljena u obliku: interpolacijskog polinoma u Lagrangeovom obliku ili interpolacijskog polinoma u Newtonovom obliku.

Konstruiranjem n-stepenog aproksimiranog polinoma koji prolazi u neposrednoj blizini tačaka iz datog niza podataka. Dakle, aproksimirajuća funkcija izglađuje sav slučajni šum (ili greške) koji se može pojaviti tijekom eksperimenta: izmjerene vrijednosti tijekom eksperimenta zavise od slučajnih faktora koji fluktuiraju prema vlastitim slučajnim zakonima (greške mjerenja ili instrumenta, nepreciznost ili eksperimentalni greške). U ovom slučaju, aproksimirajuća funkcija se određuje metodom najmanjih kvadrata.

Metoda najmanjeg kvadrata(u engleskoj književnosti Ordinary Least Squares, OLS) - matematička metoda, na osnovu definicije aproksimirajuće funkcije, koja je konstruisana u najbližoj blizini tačaka iz datog niza eksperimentalnih podataka. Bliskost izvorne i aproksimirajuće funkcije F(x) određena je numeričkom mjerom, odnosno: zbir kvadrata odstupanja eksperimentalnih podataka od aproksimirajuće krive F(x) treba da bude najmanji.

Aproksimirajuća kriva konstruirana metodom najmanjih kvadrata

Koristi se metoda najmanjih kvadrata:

Za rješavanje preodređenih sistema jednačina kada broj jednačina premašuje broj nepoznatih;

Naći rješenje u slučaju običnih (ne preodređenih) nelinearnih sistema jednačina;

Za aproksimaciju vrijednosti tačaka nekom aproksimirajućom funkcijom.

Aproksimirajuća funkcija metodom najmanjih kvadrata određena je iz uvjeta minimalnog zbira kvadrata odstupanja izračunate aproksimativne funkcije iz datog niza eksperimentalnih podataka. Ovaj kriterij metode najmanjih kvadrata zapisuje se kao sljedeći izraz:

Vrijednosti izračunate aproksimirajuće funkcije u čvornim točkama,

Dati niz eksperimentalnih podataka na čvornim tačkama.

Kvadratni kriterij ima niz “dobrih” svojstava, kao što je diferencijabilnost, pružajući jedinstveno rješenje problema aproksimacije sa polinomskim aproksimirajućim funkcijama.

U zavisnosti od uslova problema, aproksimirajuća funkcija je polinom stepena m

Stepen aproksimirajuće funkcije ne zavisi od broja čvornih tačaka, ali njena dimenzija uvek mora biti manja od dimenzije (broja tačaka) datog eksperimentalnog niza podataka.

∙ Ako je stepen aproksimirajuće funkcije m=1, tada tabelarnu funkciju aproksimiramo ravnom linijom (linearna regresija).

∙ Ako je stepen aproksimirajuće funkcije m=2, tada tabelu funkciju aproksimiramo kvadratnom parabolom (kvadratna aproksimacija).

∙ Ako je stepen aproksimirajuće funkcije m=3, tada tabelu funkciju aproksimiramo kubnom parabolom (kubična aproksimacija).

U opštem slučaju, kada je potrebno konstruisati aproksimativni polinom stepena m za date vrednosti tabele, uslov za minimum zbira kvadrata odstupanja po svim čvornim tačkama se prepisuje u sledećem obliku:

- nepoznati koeficijenti aproksimirajućeg polinoma stepena m;

Broj navedenih vrijednosti u tabeli.

Neophodan uslov za postojanje minimuma funkcije je jednakost sa nulom njenih parcijalnih izvoda u odnosu na nepoznate varijable . Kao rezultat dobijamo sledeći sistem jednačina:

Transformirajmo rezultat linearni sistem jednadžbe: otvorite zagrade i pomjerite slobodne članove na desnu stranu izraza. Kao rezultat, rezultujući sistem linearnih algebarskih izraza biće napisan u sledećem obliku:

Ovaj sistem linearni algebarski izrazi mogu se prepisati u matričnom obliku:

Kao rezultat, dobijen je sistem linearnih jednadžbi dimenzije m+1, koji se sastoji od m+1 nepoznatih. Ovaj sistem se može riješiti bilo kojom metodom za rješavanje linearnih problema. algebarske jednačine(na primjer, Gausovom metodom). Kao rezultat rješenja naći će se nepoznati parametri aproksimirajuće funkcije koji daju minimalni zbir kvadrata odstupanja aproksimirajuće funkcije od izvornih podataka, tj. najbolja moguća kvadratna aproksimacija. Treba imati na umu da ako se promijeni čak i jedna vrijednost izvornih podataka, svi koeficijenti će promijeniti svoje vrijednosti, jer su u potpunosti određeni izvornim podacima.

Aproksimacija izvornih podataka linearnom zavisnošću

(linearna regresija)

Kao primjer, razmotrimo tehniku ​​za određivanje aproksimirajuće funkcije, koja je specificirana u obliku linearne zavisnosti. U skladu sa metodom najmanjih kvadrata, uslov za minimum zbira kvadrata odstupanja zapisuje se u sledećem obliku:

Koordinate čvorova tablice;

Nepoznati koeficijenti aproksimirajuće funkcije, koja je specificirana kao linearna ovisnost.

Neophodan uslov za postojanje minimuma funkcije je jednakost nuli njenih parcijalnih izvoda u odnosu na nepoznate varijable. Kao rezultat dobijamo sledeći sistem jednačina:

Hajde da transformišemo rezultirajući linearni sistem jednačina.

Rezultujući sistem linearnih jednačina rešavamo. Koeficijenti aproksimirajuće funkcije u analitičkom obliku određuju se na sljedeći način (Cramerova metoda):

Ovi koeficijenti osiguravaju konstrukciju linearne aproksimirajuće funkcije u skladu s kriterijem minimiziranja sume kvadrata aproksimirajuće funkcije iz zadanih tabličnih vrijednosti (eksperimentalni podaci).

Algoritam za implementaciju metode najmanjih kvadrata

1. Početni podaci:

Naveden je niz eksperimentalnih podataka sa brojem mjerenja N

Specificira se stepen aproksimirajućeg polinoma (m).

2. Algoritam proračuna:

2.1. Koeficijenti se određuju za konstruisanje sistema jednačina sa dimenzijama

Koeficijenti sistema jednadžbi (lijeva strana jednadžbe)

- indeks broja kolone kvadratne matrice sistema jednačina

Slobodni članovi sistema linearnih jednačina (desna strana jednačine)

- indeks broja reda kvadratne matrice sistema jednačina

2.2. Formiranje sistema linearnih jednačina sa dimenzijom .

2.3. Rješavanje sistema linearnih jednadžbi za određivanje nepoznatih koeficijenata aproksimirajućeg polinoma stepena m.

2.4 Određivanje sume kvadrata odstupanja aproksimativnog polinoma od originalnih vrijednosti u svim čvornim točkama.

Pronađena vrijednost zbira kvadrata odstupanja je najmanja moguća.

Aproksimacija pomoću drugih funkcija

Treba napomenuti da se prilikom aproksimacije izvornih podataka u skladu s metodom najmanjih kvadrata, ponekad kao aproksimirajuća funkcija koriste logaritamska funkcija, eksponencijalna funkcija i funkcija stepena.

Logaritamska aproksimacija

Razmotrimo slučaj kada je data aproksimirajuća funkcija logaritamska funkcija tip: