Sunday 13 August 2017

Bewegende Gemiddelde Regressie Stata


Bewegende gemiddeldes bewegende gemiddeldes Met konvensionele datastelle die gemiddelde waarde is dikwels die eerste, en een van die mees bruikbare, opsommingstatistiek te bereken. Wanneer data in die vorm van 'n tydreeks, die reeks beteken is 'n nuttige maatstaf, maar nie die dinamiese aard van die data weerspieël. Gemiddelde waardes bereken oor kortsluiting periodes, hetsy voor die huidige tydperk of gesentreer op die huidige tydperk, is dikwels meer nuttig. Omdat so 'n gemiddelde waardes sal wissel, of beweeg, soos die huidige tydperk beweeg van tyd t 2, t 3. ens staan ​​hulle bekend as bewegende gemiddeldes (Mas). 'N Eenvoudige bewegende gemiddelde is (tipies) die ongeweegde gemiddelde van k voor waardes. 'N eksponensieel geweeg bewegende gemiddelde is in wese dieselfde as 'n eenvoudige bewegende gemiddelde, maar met bydraes tot die gemiddelde geweegde deur hul nabyheid aan die huidige tyd. Want daar is nie een nie, maar 'n hele reeks bewegende gemiddeldes vir enige gegewe reeks, die stel van Mas kan hulself getrek word op grafieke, ontleed as 'n reeks, en gebruik in die modellering en voorspelling. 'N verskeidenheid van modelle kan gebou word met behulp van bewegende gemiddeldes, en dit is bekend as MA modelle. As sulke modelle word gekombineer met outoregressiewe (AR) modelle die gevolglike saamgestelde modelle is bekend as ARMA of ARIMA modelle (die Ek is vir geïntegreerde). Eenvoudige bewegende gemiddeldes Sedert 'n tydreeks kan as 'n stel waardes beskou word,, t 1,2,3,4, N die gemiddeld van hierdie waardes kan bereken word. As ons aanvaar dat N is nogal groot, en ons kies 'n heelgetal k wat is veel kleiner as n. kan ons 'n stel van blok gemiddeldes, of eenvoudig bewegende gemiddeldes (van orde k) bereken: Elke maat verteenwoordig die gemiddelde van al die datawaardes oor 'n interval van k waarnemings. Let daarop dat die eerste moontlike MA van orde k gt0 is dat vir t k. Meer in die algemeen kan ons die ekstra onderskrif val in die uitdrukkings bo en skryf: Dit bepaal dat die geskatte gemiddelde op tydstip t is die eenvoudige gemiddelde van die waargeneem waarde op tydstip t en die voorafgaande k -1 tyd stappe. As gewigte word toegepas wat die bydrae van waarnemings wat verder weg in die tyd is verminder, is die bewegende gemiddelde gesê eksponensieel word stryk. Bewegende gemiddeldes word dikwels gebruik as 'n vorm van vooruitskatting, waardeur die beraamde waarde vir 'n reeks op tydstip t 1, S T1. geneem word as die MA vir die tydperk tot en met tyd t. bv vandag se skatting is gebaseer op 'n gemiddelde van vorige aangeteken waardes tot en met gister se (vir daaglikse data). Eenvoudige bewegende gemiddeldes kan gesien word as 'n vorm van gladstryking. In die onderstaande diagram getoon word byvoorbeeld het die lugbesoedeling dataset getoon in die inleiding tot hierdie onderwerp is aangevul deur 'n 7-daagse bewegende gemiddelde (MA) reël, hier in rooi. Soos gesien kan word, die MA lyn glad uit die pieke en trôe in die data en kan baie nuttig wees in die identifisering van tendense wees. Die standaard toekomsgerigte berekening formule beteken dat die eerste k -1 datapunte het geen MA waarde, maar daarna berekeninge uit te brei na die finale data punt in die reeks. PM10 daaglikse gemiddelde waardes, Greenwich bron: London Luggehalte Network, www. londonair. org. uk Een rede vir die berekening van eenvoudige bewegende gemiddeldes op die voorgeskrewe wyse, is dat dit in staat stel om waardes te bereken vir alle tydgleuwe van tyd tk tot op hede en as 'n nuwe meting verkry vir tyd t 1, die MA vir tyd t 1 kan die reeds bereken stel bygevoeg. Dit bied 'n eenvoudige prosedure vir 'n dinamiese datastelle. Daar is egter 'n paar probleme met hierdie benadering. Dit is redelik om te argumenteer dat die gemiddelde waarde van die afgelope 3 periodes, sê, moet geleë wees op tyd t -1, nie tyd t. en vir 'n MA oor 'n gelyke getal periodes miskien is dit moet geleë wees by die middelpunt tussen twee tyd intervalle. 'N oplossing vir hierdie probleem is om gesentreer MA berekeninge, waarin die MA op tydstip t is die gemiddeld van 'n simmetriese stel waardes rondom t gebruik. Ten spyte van die ooglopende meriete, is hierdie benadering nie oor die algemeen gebruik word, want dit vereis dat data is beskikbaar vir toekomstige gebeure, wat nie die geval mag wees. In gevalle waar analise is geheel en al van 'n bestaande reeks, kan die gebruik van gesentreer Mas beter wees. Eenvoudige bewegende gemiddeldes kan beskou word as 'n vorm van gladstryking, die verwydering van 'n paar hoë frekwensie komponente van 'n tydreeks en beklemtoon (maar nie die verwydering van) tendense in 'n soortgelyke wyse as die algemene opvatting van digitale filter. Inderdaad, bewegende gemiddeldes is 'n vorm van lineêre filter. Dit is moontlik om 'n bewegende gemiddelde berekening van toepassing op 'n reeks wat reeds stryk, dit wil sê glad of filter 'n reeds stryk reeks. Byvoorbeeld, met 'n bewegende gemiddelde van orde 2, ons kan dit beskou as synde bereken met behulp van gewigte, sodat die MA by x 2 0.5 x 1 0.5 x 2. Net so, die MA by x 3 0.5 x 2 0.5 x 3. As ons dien 'n tweede vlak van gladstryking of filter, ons het 0,5 x 2 0.5 x 3 0.5 (0.5 x 1 0.5 x 2) 0.5 (0.5 x 2 0.5 x 3) 0.25 x 1 0.5 x 2 0,25 x 3 dws die 2-stadium filter proses (of konvolusie) het 'n wisselvallig geweegde simmetriese bewegende gemiddelde, met gewigte vervaardig. Veelvuldige konvolusie kan ingewikkeld geweegde bewegende gemiddeldes, waarvan sommige is gevind veral gebruik in gespesialiseerde velde, soos in lewensversekering berekeninge te produseer. Bewegende gemiddeldes gebruik kan word om periodieke effekte verwyder indien bereken met die lengte van die periodisiteit as 'n bekende. Byvoorbeeld, met 'n maandelikse data seisoenale variasies dikwels verwyder kan word (indien dit die doel) deur toe te pas 'n simmetriese 12 maande bewegende gemiddelde met al maande gelyke gewigte, behalwe die eerste en laaste wat geweeg deur 1/2. Dit is omdat daar sal 13 maande in die simmetriese model (huidige tyd, t / -. 6 maande). Die totale is gedeel deur 12. Soortgelyke prosedures kan vir enige goed gedefinieerde periodisiteit word aangeneem. Eksponensieel geweeg bewegende gemiddeldes (EWMA) Met die eenvoudige bewegende gemiddelde formule: alle waarnemings is ewe geweegde. As ons noem hulle die gelyke gewigte, Alpha t. elk van die k gewigte sou gelyk 1 / k. sodat die som van die gewigte sal wees 1, en die formule sou wees: Ons het reeds gesien dat verskeie programme van hierdie proses lei tot die gewigte wissel. Met eksponensieel geweeg bewegende gemiddeldes die bydrae tot die gemiddelde waarde van waarnemings wat meer verwyder betyds beraadslaag verminder, en sodoende meer onlangse (plaaslike) gebeure beklemtoon. In wese 'n glad parameter, 0lt Alpha LT1, is bekend gestel, en die formule hersien om 'n simmetriese weergawe van hierdie formule van die vorm sal wees: As die gewigte in die simmetriese model is gekies as die terme van die bepalings van die binomiale uitbreiding, (1/21/2) 2S. hulle sal vat om 1, en as Q groot word, sal die normaalverdeling benader. Dit is 'n vorm van kern gewig, met die Binomiale optree as die kern funksie. Die twee stadium konvolusie in die vorige subartikel beskryf is juis hierdie reëling, met Q 1, opbrengs die gewigte. In eksponensiële gladstryking is dit nodig om 'n stel gewigte gebruik wat som tot 1 en wat verminder in grootte meetkundig. Die gewigte gebruik is tipies van die vorm: Om te wys dat hierdie gewigte op te som tot 1, oorweeg die uitbreiding van 1 / as 'n reeks. Ons kan skryf en die uitdrukking in hakies gebruik te maak van die binomiale formule (1- x) p brei. waar x (1-) en p -1, wat gee: Dit bied dan 'n vorm van geweegde bewegende gemiddelde van die vorm: Hierdie opsomming kan geskryf word as 'n herhaling verhouding: wat berekening grootliks vereenvoudig, en vermy die probleem wat die gewig regime moet streng oneindige wees vir die gewigte op te som tot 1 (vir klein waardes van alfa. hierdie is tipies nie die geval). Die notasie wat gebruik word deur verskillende skrywers wissel. Sommige gebruik die letter S aan te dui dat die formule is in wese 'n reëlmatige veranderlike, en skryf: terwyl die beheerteorie literatuur gebruik dikwels Z eerder as S vir die eksponensieel geweeg of glad waardes (sien, byvoorbeeld, Lucas en Saccucci, 1990, LUC1 , en die NIST webwerf vir meer besonderhede en uitgewerkte voorbeelde). Bogenoemde aangehaal formules uit die werk van Roberts (1959 ROB1), maar Hunter (1986, HUN1) gebruik 'n uitdrukking van die vorm: wat meer geskik is vir gebruik in 'n paar prosedures kan wees. Met alfa 1 die gemiddelde skatting is eenvoudig sy gemeet waarde (of die waarde van die vorige data-item). Met 0,5 die skatting is die eenvoudige bewegende gemiddelde van die huidige en vorige metings. In voorspellingsmodelle die waarde, S t. word dikwels gebruik as die skatting of voorspelling waarde vir die volgende tydperk, dit wil sê as die skatting vir x op tydstip t 1. So ons het: Dit dui aan dat die voorspelling waarde op tydstip t 1 is 'n kombinasie van die vorige eksponensieel geweeg bewegende gemiddelde plus 'n komponent wat die geweegde voorspelling fout, Epsilon verteenwoordig. op tyd t. Die aanvaarding van 'n tydreeks gegee en 'n voorspelling is nodig, word 'n waarde vir Alpha vereis. Dit kan geskat word van die bestaande data deur die evaluering van die som van 'n vierkant voorspelling foute te kry met wisselende waardes van Alpha vir elke T 2,3. die opstel van die eerste skatting van die eerste waargenome data waarde wees, x 1. In beheer aansoeke ter waarde van Alpha is belangrik in wat gebruik word in die bepaling van die boonste en onderste beheer perke, en raak die gemiddelde duur lank (ARL) verwag voor hierdie beheer perke is gebreek (onder die aanname dat die tyd reeks verteenwoordig 'n stel van ewekansige, identies verdeelde onafhanklike veranderlikes met 'n gemeenskaplike variansie). Onder hierdie omstandighede die variansie van die beheer statistiek: is (Lucas en Saccucci, 1990): beheer perke word gewoonlik gestel as vaste veelvoude van hierdie asimptotiese variansie, bv / - 3 keer die standaardafwyking. 1,134 en die proses sal een of ander perk in 500 bereik - As alfa 0,25, byvoorbeeld, en die data wat gemonitor word aangeneem dat 'n normale verspreiding, N (0,1) het, terwyl dit in beheer, die beheer perke sal / kan stappe op die gemiddelde. Lucas en Saccucci (1990 LUC1) lei die ARLs vir 'n wye verskeidenheid van alfa waardes en onder verskillende aannames met behulp van Markov Chain prosedures. Hulle tabuleer die resultate, insluitend die verskaffing van ARLs wanneer die gemiddelde van die beheerproses is verskuif deur sommige verskeie van die standaardafwyking. Byvoorbeeld, met 'n 0.5 verskuiwing met alfa 0,25 die ARL is minder as 50 keer stappe. Die hierbo beskryf benaderings staan ​​bekend as een eksponensiële gladstryking. as die prosedures wat eenmaal aan die tydreeks toegepas en dan ontleed of beheer prosesse uit op die gevolglike stryk dataset gedra. As die dataset sluit 'n tendens en / of seisoenale komponente, twee - of drie-fase eksponensiële gladstryking kan hieronder toegedien word as 'n middel van die verwydering (uitdruklik modellering) hierdie effekte (sien verder, die afdeling oor vooruitskatting., En die NIST uitgewerkte voorbeeld ). CHA1 Chat Field C (1975) die ontleding van Times Reeks: teorie en praktyk. Chapman en Hall, Londen HUN1 Hunter J S (1986) Die eksponensieel geweeg bewegende gemiddelde. J van kwaliteit Tegnologie, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) eksponensieel Geweegde Moving Gemiddelde beheer Skemas: Properties en verbeteringe. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) beheer Chart Toetse Op grond van Meetkundige bewegende gemiddeldes. Technometrics, 1, 239-250Stata: Ontleding en statistiese sagteware Nicholas J. Cox, Durham Universiteit, die Verenigde Koninkryk Christopher Baum, Boston College egen, MA () en sy beperkinge Statarsquos mees voor die hand liggend bevel vir die berekening van bewegende gemiddeldes is die ma () funksie van egen. Gegewe 'n uitdrukking, dit skep 'n - periode bewegende gemiddelde van daardie uitdrukking. By verstek, is geneem as 3. moet vreemd wees. Maar, soos die handleiding inskrywing dui, egen, MA () mag nie gekombineer word met die varlist:. en, net vir hierdie rede is dit nie van toepassing op paneel data. In elk geval, dit staan ​​buite die stel instruksies wat spesifiek vir tydreekse geskryf sien tydreekse vir meer inligting. Alternatiewe benaderings tot bereken bewegende gemiddeldes vir paneel data, is daar ten minste twee keuses. Beide is afhanklik van die dataset nadat vooraf tsset. Dit is baie moeite werd te doen: nie alleen kan bespaar jy jouself herhaaldelik spesifiseer paneel veranderlike en tyd veranderlike, maar Stata optree slim enige gapings in die data gegee. 1. Skryf jou eie definisie met behulp genereer Gebruik time-reeks operateurs soos L. en F.. gee die definisie van die bewegende gemiddelde as die argument om 'n te genereer verklaring. As jy dit doen, jy, natuurlik, nie beperk tot die gelyke gewigte (ongeweegde) gesentreer bewegende gemiddeldes bereken deur egen, MA (). Byvoorbeeld, ewe-geweeg drie-tydperk bewegende gemiddeldes sal deur gegee word en 'n paar gewigte kan maklik gespesifiseerde: Jy kan natuurlik, spesifiseer 'n uitdrukking soos log (myvar) in plaas van 'n veranderlike naam soos myvar. Een groot voordeel van hierdie benadering is dat Stata doen outomaties die regte ding vir paneel data: voorste en agter waardes uitgewerk binne panele, net soos logika dikteer hulle behoort te wees. Die mees noemenswaardige nadeel is dat die command line eerder lank kan kry as die bewegende gemiddelde behels verskeie terme. Nog 'n voorbeeld is 'n eensydige bewegende gemiddelde wat slegs gebaseer is op vorige waardes. Dit kan nuttig wees vir die opwekking van 'n aangepaste verwagting van wat 'n veranderlike sal suiwer gebaseer op inligting tot op hede: wat kan iemand voorspelling vir die huidige tydperk gebaseer op die afgelope vier waardes, met behulp van 'n vaste gewig skema (A 4-tydperk lag kan wees veral algemeen gebruik met kwartaallikse tijdreeksen.) 2. gebruik egen, filter () van SSC gebruik die gebruiker geskryf egen funksie filter () van die egenmore pakket op SSC. In Stata 7 (opgedateer na 14 November 2001), kan jy die pakket installeer deur waarna help egenmore punte om besonderhede oor filter (). Die twee voorbeelde hierbo sou word gelewer (In hierdie vergelyking genereer die benadering is dalk meer deursigtig, maar ons sal 'n voorbeeld van die teenoorgestelde in 'n oomblik sien.) Die lags is 'n numlist. lei dat negatiewe lags: in hierdie geval -1/1 brei om -1 0 1 of lei 1, lag 0, lag 1. Die Coëf ficients, 'n ander numlist, vermeerder die ooreenstemmende sloerende of leidende items: in hierdie geval die items is F1.myvar. myvar en L1.myvar. Die effek van die opsie normaliseer is aan elke koëffisiënt skaal deur die som van die koëffisiënte sodat Coëf (1 1 1) normaliseer is gelykstaande aan koëffisiënte van 1/3 1/3 1/3 en Coëf (1 2 1) normaliseer is gelykstaande om koëffisiënte van 1/4 1/2 1/4. Jy moet nie net die lags, maar ook die koëffisiënte spesifiseer. Omdat egen, MA () gee die ewe geweegde geval, die belangrikste rasionaal vir egen, filter () is om die ongelyk geweegde geval, waarvoor jy moet koëffisiënte spesifiseer ondersteun. Dit kan ook gesê word dat die verpligting om gebruikers te koëffisiënte spesifiseer 'n bietjie ekstra druk op hulle om te dink oor wat koëffisiënte wat hulle wil. Die belangrikste rede vir gelyke gewigte is, ons dink, eenvoud, maar gelyke gewigte het gemeen frekwensiedomein eienskappe, om net 'n oorweging te noem. Die derde voorbeeld hierbo kan óf waarvan net omtrent so ingewikkeld as die genereer benadering. Daar is gevalle waar egen, filter () gee 'n eenvoudiger formulering as genereer. As jy 'n nege-termyn binomiaal filter, wat klimatoloë nuttig vind wil, kyk dan miskien minder aaklig as, en makliker om reg as kry, net soos met die genereer benadering, egen, filter () werk behoorlik met paneel data. Trouens, soos hierbo genoem, dit hang af van die dataset nadat vooraf tsset. 'N Grafiese punt Na die berekening van jou bewegende gemiddeldes, sal jy waarskynlik wil hê om te kyk na 'n grafiek. Die gebruiker geskrewe tsgraph is slim oor tsset datastelle. Installeer dit in 'n up-to-date Stata 7 deur SSC Inst tsgraph. Wat van subsetting met as een van die bogenoemde voorbeelde maak gebruik van as beperkings. Om die waarheid te egen, sal ma () nie toelaat dat indien gespesifiseer word. Soms mense wil gebruik as die berekening bewegende gemiddeldes, maar die gebruik daarvan is 'n bietjie meer ingewikkeld as wat dit is gewoonlik. Wat sou jy verwag van 'n bewegende gemiddelde bereken met as. Kom ons identifiseer twee moontlikhede: Swak interpretasie: Ek dont wil enige resultate vir die uitgesluit Waarnemings sien. Sterk interpretasie: Ek dont selfs wil hê jy moet die waardes vir die uitgesluit waarnemings. Hier is 'n konkrete voorbeeld. Veronderstel as gevolg van 'n paar as voorwaarde, waarnemings 1-42 ingesluit maar nie Waarnemings 43 op. Maar die bewegende gemiddelde vir 42 sal afhang, onder andere, op die waarde vir waarneming 43 as die gemiddelde strek heen en weer en is van lengte ten minste 3, en dit sal op soortgelyke wyse afhanklik van 'n paar van die waarnemings 44 en verder in sekere omstandighede. Ons raaiskoot is dat die meeste mense sal gaan vir die swak interpretasie, maar of dit korrek is, beteken egen, filter () nie ondersteun as óf. Jy kan altyd ignoreer wat jy donrsquot wil of selfs ongewenste waardes stel om daarna ontbreek deur die gebruik van te vervang. 'N Nota oor vermiste resultate aan die einde van 'n reeks Omdat bewegende gemiddeldes is funksies van sloerings en lei, egen, MA () produseer ontbreek waar die lags en lei nie bestaan ​​nie, aan die begin en einde van die reeks. 'N opsie nomiss dwing die berekening van korter, uncentered bewegende gemiddeldes vir die sterte. In teenstelling hiermee het nie genereer word nie egen, filter () doen, of laat, niks spesiaal ontbreek resultate te vermy. Indien enige van die waardes wat nodig is vir die berekening ontbreek, dan is dit gevolg ontbreek. Dit is aan gebruikers om te besluit of en watter korrektiewe chirurgie nodig is vir sulke waarnemings, vermoedelik na te kyk na die datastel en die oorweging van enige onderliggende wetenskap wat tot bear. A tydreekse gebring kan word is 'n reeks waarnemings van 'n periodieke ewekansige veranderlike. Voorbeelde hiervan is die maandelikse vraag na 'n produk, die jaarlikse eerstejaars inskrywing in 'n departement van die Universiteit en die daaglikse vloei in 'n rivier. Tydreeks is belangrik vir operasionele navorsing, want hulle is dikwels die bestuurders van beslissing modelle. 'N inventaris model ramings van toekomstige eise vereis, 'n kursus skedulering en personeel model vir 'n universiteit departement vereis ramings van toekomstige student invloei, en 'n model vir die verskaffing van waarskuwings aan die bevolking in 'n rivier bekken vereis skattings van riviervloei vir die onmiddellike toekoms. Tydreeksanalise bied gereedskap vir die kies van 'n model wat die tydreeks beskryf en met behulp van die model om toekomstige gebeure te voorspel. Modellering van die tydreeks is 'n statistiese probleem omdat waargeneem data word gebruik in berekeningsprosedures die koëffisiënte van 'n vermeende model skat. Modelle aanvaar dat waarnemings wissel lukraak oor 'n onderliggende gemiddelde waarde wat 'n funksie van tyd. Op hierdie bladsye beperk ons ​​aandag aan die gebruik van historiese tydreeksdata 'n tyd afhanklik model skat. Die metodes is geskik vir 'n outomatiese, korttermyn voorspelling van dikwels gebruik inligting waar die onderliggende oorsake van tyd variasie is nie merkbaar verander in die tyd. In die praktyk word die voorspellings afgelei deur hierdie metodes daarna gewysig deur menslike ontleders wat inligting nie beskikbaar by die historiese data te inkorporeer. Ons primêre doel van hierdie artikel is om die vergelykings te bied vir die vier voorspelling metodes gebruik in die vooruitskatting add-in: bewegende gemiddelde, eksponensiële gladstryking, regressie en dubbel eksponensiële gladstryking. Dit is genoem glad metodes. Metodes nie oorweeg sluit kwalitatiewe vooruitskatting, meervoudige regressie, en outoregressiewe metodes (ARIMA). Diegene wat belangstel in meer uitgebreide dekking moet die voorspelling Beginsels webwerf te besoek of lees een van die verskeie uitstekende boeke oor die onderwerp. Ons gebruik die boek vooruitskatting. deur Makridakis, wielmaker en McGee, John Wiley amp Sons, 1983. Om die Excel Voorbeelde werkboek gebruik, moet jy die vooruitskatting add-in geïnstalleer. Kies die opdrag Herskakel om die skakels na die add-in te stel. Hierdie bladsy beskryf die gebruik van eenvoudige voorspelling en die notasie wat gebruik word vir die analise modelle. Dit eenvoudigste vooruitskatting metode is die bewegende gemiddelde skatting. Die metode eenvoudig gemiddeldes van die laaste m waarnemings. Dit is nuttig vir tydreekse met 'n stadig veranderende gemiddelde. Hierdie metode van mening dat die hele verlede in sy voorspelling, maar weeg onlangse ervaring swaarder as minder onlangse. Die berekeninge is eenvoudig omdat slegs die raming van die vorige tydperk en die huidige data die nuwe skatting bepaal. Die metode is nuttig vir tydreekse met 'n stadig veranderende gemiddelde. Die bewegende gemiddelde metode nie goed reageer op 'n tydreeks wat die styging of daling met tyd. Hier sluit ons 'n lineêre tendens term in die model. Die regressie benaderde model deur die bou van 'n lineêre vergelyking wat die kleinste kwadrate geskik is om die laaste m observations. Moving Gemiddelde Hierdie voorbeeld leer jy hoe om die bewegende gemiddelde van 'n tydreeks in Excel bereken bied. 'N bewegende avearge gebruik te stryk onreëlmatighede (pieke en dale) om maklik tendense herken. 1. In die eerste plek kan 'n blik op ons tyd reeks. 2. Klik op die blad Data, kliek Data-analise. Nota: cant vind die Data-analise knoppie Klik hier om die analise ToolPak add-in te laai. 3. Kies bewegende gemiddelde en klik op OK. 4. Klik op die insette Range boks en kies die reeks B2: M2. 5. Klik op die boks interval en tik 6. 6. Klik in die uitset Range boks en kies sel B3. 8. Teken 'n grafiek van hierdie waardes. Verduideliking: omdat ons die interval stel om 6, die bewegende gemiddelde is die gemiddeld van die vorige 5 datapunte en die huidige data punt. As gevolg hiervan, is pieke en dale stryk uit. Die grafiek toon 'n toenemende tendens. Excel kan nie bereken die bewegende gemiddelde vir die eerste 5 datapunte, want daar is nie genoeg vorige datapunte. 9. Herhaal stappe 2 tot 8 vir interval 2 en interval 4. Gevolgtrekking: Hoe groter die interval, hoe meer die pieke en dale is glad nie. Hoe kleiner die interval, hoe nader die bewegende gemiddeldes is om die werklike data punte. Hou jy van hierdie gratis webwerf Deel asseblief hierdie bladsy op GoogleThis is 'n basiese vraag oor Box-Jenkins MA modelle. Soos ek dit verstaan, 'n MA-model is basies 'n lineêre regressie van tyd-reeks waardes Y teen vorige fout terme et. e. Dit is, die waarneming Y eerste agteruitgang teen sy vorige waardes Y. Y en dan een of meer Y - hoed waardes word gebruik as die fout terme vir die MA-model. Maar hoe is die fout terme bereken in 'n ARIMA (0, 0, 2) model As die MA-model gebruik word sonder 'n outoregressiewe deel en dus geen geskatte waarde, hoe kan ek dalk 'n fout termyn gevra 7 April 12 aan 00:48 MA model Beraming: Kom ons neem 'n reeks met 100 keer punte, en sê dit word gekenmerk deur MA (1) model met geen onderskep. Toe die model word gegee deur ytvarepsilont-thetavarepsilon, quad t1,2, cdots, 100quad (1) Die term hier fout nie waargeneem word. So om hierdie te kry, Posbus et al. Tydreeksanalise: Vooruitskatting en beheer (3rd Edition). bladsy 228. dui daarop dat die foutterm rekursief deur bereken word, dus die foutterm vir T1 is, varepsilon y thetavarepsilon Nou kan ons nie hierdie te bereken sonder om te weet die waarde van theta. So om hierdie te kry, moet ons die aanvanklike of Voorlopige raming van die model bereken, verwys na Box et al. van genoemde boek, Afdeling 6.3.2 bladsy 202 meld dat: Daar is getoon dat die eerste Q outokorrelasies van MA (Q) proses is nul en geskryf kan word in terme van die parameters van die model as rhokdisplaystylefrac theta1theta theta2theta cdotstheta thetaq quad k1,2, cdots, q Die uitdrukking bo forrho1, rho2cdots, rhoq in terme theta1, theta2, cdots, thetaq, voorrade Q vergelykings in Q onbekendes. Voorlopige ramings van die thetas kan verkry word deur die vervanging van skattings rk vir rhok in bostaande vergelyking Let daarop dat rk is die beraamde outokorrelasie. Daar is meer bespreking in Afdeling 6.3 - Aanvanklike skattings vir die parameters. Lees op daardie. Nou, in die veronderstelling ons kry die aanvanklike skatting theta0.5. Dan, varepsilon y 0.5varepsilon Nou, nog 'n probleem is wat ons hoef nie waarde vir varepsilon0 omdat t begin by 1, en so het ons nie kan bereken varepsilon1. Gelukkig is daar twee metodes twee hierdie verkry, Voorwaardelike Waarskynlikheid Onvoorwaardelike Waarskynlikheid Volgens Box et al. Artikel 7.1.3 bladsy 227. die waardes van varepsilon0 vervang kan word na nul as 'n benadering as N is matige of groot, hierdie metode is Voorwaardelike Waarskynlikheid. Andersins, is onvoorwaardelik Waarskynlikheid gebruik, waarin die waarde van varepsilon0 is verkry deur back-vooruitskatting, Posbus et al. E-pos hierdie metode. Lees meer oor back-vooruitskatting by Afdeling 7.1.4 bladsy 231. Na die verkryging van die aanvanklike ramings en waarde van varepsilon0, dan uiteindelik ons ​​kan voortgaan met die rekursiewe berekening van die foutterm. Dan is die finale stadium om te skat die parameter van die model (1), onthou dit is nie die voorlopige skatting meer. In die skatte van die parameter theta, ek gebruik Nonlinear Skatting prosedure, veral die Levenberg-Marquardt algoritme, aangesien MA modelle is lineêre op sy parameter.

No comments:

Post a Comment