Monday, October 10, 2016

Gesentreerde bewegende gemiddelde seisoenaliteit

Wanneer die berekening van 'n lopende bewegende gemiddelde, die plasing van die gemiddelde in die middel tydperk sinvol In die vorige voorbeeld het ons bereken die gemiddeld van die eerste 3 tydperke en sit dit langs tydperk 3. Ons kan die gemiddelde geplaas in die middel van die tyd interval van drie tydperke, dit is, langs tydperk 2. dit werk goed met vreemde tydperke, maar nie so goed vir selfs tydperke. So waar sou ons plaas die eerste bewegende gemiddelde wanneer M 4 Tegnies, sou die bewegende gemiddelde op t 2.5, 3.5 val. Om hierdie probleem wat ons glad Mas using 2. So glad ons die stryk waardes As ons gemiddeld 'n gelyke getal terme te vermy, moet ons die stryk waardes glad Die volgende tabel toon die resultate met behulp van M 4.Spreadsheet implementering van seisoenale aanpassing en eksponensiële gladstryking Dit is maklik om seisoenale aanpassing voer en pas eksponensiële gladstryking modelle met behulp van Excel. Die skerm beelde en kaarte hieronder is geneem uit 'n sigblad wat is opgestel om multiplikatiewe seisoenale aanpassing en lineêre eksponensiële gladstryking op die volgende kwartaallikse verkope data van Buitenboord Marine illustreer: Om 'n afskrif van die sigbladlêer self te bekom, kliek hier. Die weergawe van lineêre eksponensiële gladstryking wat hier gebruik sal word vir doeleindes van demonstrasie is Brown8217s weergawe, bloot omdat dit geïmplementeer kan word met 'n enkele kolom van formules en daar is net een glad konstante te optimaliseer. Gewoonlik is dit beter om Holt8217s weergawe dat afsonderlike glad konstantes vir vlak en tendens het gebruik. Die vooruitskatting proses verloop soos volg: (i) die eerste keer die data is seisoenaal-aangepaste (ii) dan voorspellings gegenereer vir die seisoenaal-aangepaste data via lineêre eksponensiële gladstryking en (iii) Ten slotte het die seisoensaangesuiwerde voorspellings is quotreseasonalizedquot om voorspellings vir die oorspronklike reeks te verkry . Die aanpassingsproses seisoenale word in kolomme gedoen D deur G. Die eerste stap in seisoenale aanpassing is om te bereken 'n gesentreerde bewegende gemiddelde (hier opgevoer in kolom D). Dit kan gedoen word deur die gemiddelde van twee een-jaar-wye gemiddeldes wat geneutraliseer deur 'n tydperk relatief tot mekaar. ( 'N kombinasie van twee geneutraliseer gemiddeldes eerder as 'n enkele gemiddelde nodig vir sentrering doeleindes wanneer die aantal seisoene is selfs.) Die volgende stap is om die verhouding te bereken om bewegende gemiddelde --i. e. die oorspronklike data gedeel deur die bewegende gemiddelde in elke tydperk - wat hier uitgevoer word in kolom E. (Dit is ook die quottrend-cyclequot komponent van die patroon genoem, sover tendens en besigheid-siklus effekte kan oorweeg word om almal wat bly nadat gemiddeld meer as 'n geheel jaar se data. natuurlik, maand-tot-maand veranderinge wat nie as gevolg van seisoenale kan bepaal word deur baie ander faktore, maar die 12-maande-gemiddelde glad oor hulle 'n groot mate.) die na raming seisoenale indeks vir elke seisoen word bereken deur die eerste gemiddeld al die verhoudings vir daardie spesifieke seisoen, wat gedoen word in selle G3-G6 behulp van 'n AVERAGEIF formule. Die gemiddelde verhoudings word dan verklein sodat hulle som presies 100 keer die aantal periodes in 'n seisoen, of 400 in hierdie geval, wat gedoen word in selle H3-H6. Onder in kolom F, word VLOOKUP formules wat gebruik word om die toepaslike seisoenale indeks waarde in elke ry van die datatabel voeg, volgens die kwartaal van die jaar wat dit verteenwoordig. Die gesentreerde bewegende gemiddelde en die seisoensaangepaste data beland lyk soos hierdie: Let daarop dat die bewegende gemiddelde lyk tipies soos 'n gladder weergawe van die seisoensaangepaste reeks, en dit is korter aan beide kante. Nog 'n werkblad in dieselfde Excel lêer toon die toepassing van die lineêre eksponensiële gladstryking model om die seisoensaangepaste data, begin in kolom G. 'n Waarde vir die glad konstante (alfa) bo die voorspelling kolom ingeskryf (hier, in sel H9) en vir gerief dit die omvang naam quotAlpha. quot (die naam is opgedra deur die opdrag quotInsert / naam / Createquot.) die LES model is geïnisialiseer deur die oprigting van die eerste twee voorspellings gelyk aan die eerste werklike waarde van die seisoensaangepaste reeks toegeken. Die formule wat hier gebruik word vir die LES voorspelling is die enkel-vergelyking rekursiewe vorm van Brown8217s model: Hierdie formule is in die sel wat ooreenstem met die derde tydperk (hier, sel H15) aangegaan en kopieer af van daar af. Let daarop dat die LES voorspelling vir die huidige tydperk verwys na die twee voorafgaande waarnemings en die twee voorafgaande voorspelling foute, sowel as om die waarde van alfa. So, die voorspelling formule in ry 15 slegs verwys na data wat beskikbaar is in ry 14 en vroeër was. (Natuurlik, as ons wou eenvoudig in plaas van lineêre eksponensiële gladstryking te gebruik, kan ons die SES formule hier vervang in plaas. Ons kan ook gebruik Holt8217s eerder as Brown8217s LES model, wat nog twee kolomme van formules sou vereis dat die vlak en tendens bereken wat gebruik word in die vooruitsig.) die foute word bereken in die volgende kolom (hier, kolom J) deur die aftrekking van die voorspellings van die werklike waardes. Die wortel beteken kwadraat fout is bereken as die vierkantswortel van die variansie van die foute plus die vierkant van die gemiddelde. (Dit volg uit die wiskundige identiteit. MSE afwyking (foute) (gemiddeld (foute)) 2) By die berekening van die gemiddelde en variansie van die foute in hierdie formule, is die eerste twee periodes uitgesluit omdat die model vooruitskatting nie eintlik nie begin totdat die derde tydperk (ry 15 op die sigblad). Die optimale waarde van alfa kan óf gevind word deur die hand verander alfa tot die minimum RMSE is gevind, of anders kan jy die quotSolverquot gebruik om 'n presiese minimering. Die waarde van alfa dat die Solver gevind word hier (alpha0.471) getoon. Dit is gewoonlik 'n goeie idee om die foute van die model (in omskep eenhede) te plot en ook om te bereken en stip hul outokorrelasies by lags van tot een seisoen. Hier is 'n tydreeks plot van die (seisoenaangepaste) foute: Die fout outokorrelasies word bereken deur gebruik te maak van die funksie CORREL () om die korrelasies van die foute te bereken met hulself uitgestel word deur een of meer periodes - besonderhede word in die sigblad model . Hier is 'n plot van die outokorrelasies van die foute by die eerste vyf lags: Die outokorrelasies by lags 1 tot 3 is baie naby aan nul, maar die pen op lag 4 (wie se waarde is 0.35) is 'n bietjie lastig - dit dui daarop dat die seisoenale aanpassing proses het nie heeltemal suksesvol. Maar dit is eintlik net effens betekenisvol. 95 betekenis bands om te toets of outokorrelasies is aansienlik verskil van nul is min of meer plus-of-minus 2 / SQRT (N-k), waar n die steekproefgrootte en k is die lag. Hier N 38 en k wissel van 1 tot 5, so die vierkant-wortel-van-n-minus-k is ongeveer 6 vir almal, en vandaar die perke vir die toets van die statistiese betekenisvolheid van afwykings van nul is min of meer plus - of-minus 2/6, of 0.33. As jy die waarde van alfa wissel met die hand in hierdie Excel model, kan jy die effek op die tydreeks en outokorrelasie erwe van die foute in ag te neem, sowel as op die wortel-gemiddelde-kwadraat fout, wat onder sal wees geïllustreer. Aan die onderkant van die sigblad, is die voorspelling formule quotbootstrappedquot in die toekoms deur bloot vervang voorspellings vir werklike waardes by die punt waar die werklike data loop uit - d. w.z. waar quotthe futurequot begin. (Met ander woorde, in elke sel waar 'n toekomstige datawaarde sou plaasvind, 'n selverwysing is ingevoeg wat daarop dui dat die voorspelling gemaak vir daardie tydperk.) Al die ander formules is eenvoudig van bo af gekopieer: Let daarop dat die foute vir voorspellings van die toekoms is al bereken as nul. Dit beteken nie dat die werklike foute sal nul wees nie, maar eerder dit weerspieël bloot die feit dat vir doeleindes van voorspelling is ons veronderstelling dat die toekoms data die voorspellings sal gelyk gemiddeld. Die gevolglike LES voorspellings vir die seisoenaal-aangepaste data soos volg lyk: Met hierdie besondere waarde van Alpha, wat is optimaal vir een-periode-vooruit voorspellings, die geprojekteerde tendens is effens opwaarts, wat die plaaslike tendens wat oor die afgelope 2 jaar is waargeneem of so. Vir ander waardes van Alpha dalk 'n heel ander tendens projeksie verkry. Dit is gewoonlik 'n goeie idee om te sien wat gebeur met die langtermyn-tendens projeksie wanneer Alpha is uiteenlopend, omdat die waarde wat die beste vir 'n kort termyn vooruitskatting sal nie noodwendig die beste waarde vir die voorspelling van die meer verre toekoms wees. Byvoorbeeld, hier is die resultaat wat verkry word indien die waarde van alfa hand is ingestel op 0,25: Die geprojekteerde langtermyn-tendens is nou negatiewe eerder as positiewe Met 'n kleiner waarde van Alpha model plaas meer gewig op ouer data in sy skatting van die huidige vlak en tendens, en sy voorspellings langtermyn weerspieël die afwaartse neiging waargeneem oor die afgelope 5 jaar, eerder as die meer onlangse opwaartse neiging. Hierdie grafiek ook duidelik illustreer hoe die model met 'n kleiner waarde van Alpha is stadiger te reageer op quotturning pointsquot in die data en dus geneig is om 'n fout van die dieselfde teken maak vir baie tye in 'n ry. Die 1-stap-ahead voorspelling foute is groter gemiddeld as dié verkry voordat (RMSE van 34,4 eerder as 27.4) en sterk positief autocorrelated. Die lag-1 outokorrelasie van 0,56 oorskry grootliks die waarde van 0.33 hierbo bereken vir 'n statisties beduidende afwyking van nul. As 'n alternatief vir slingerspoed die waarde van alfa ten einde meer konserwatisme te voer in 'n lang termyn voorspellings, is 'n quottrend dampeningquot faktor soms by die model ten einde te maak die geprojekteerde tendens plat uit na 'n paar periodes. Die finale stap in die bou van die voorspelling model is om die LES voorspellings quotreasonalizequot deur hulle deur die toepaslike seisoenale indekse te vermenigvuldig. So, die reseasonalized voorspellings in kolom Ek is net die produk van die seisoenale indekse in kolom F en die seisoensaangepaste LES voorspellings in kolom H. Dit is relatief maklik om vertrouensintervalle bereken vir een-stap-ahead voorspellings gemaak deur hierdie model: eerste bereken die RMSE (wortel-gemiddelde-kwadraat fout, wat net die vierkantswortel van die MSE) en dan bereken 'n vertrouensinterval vir die seisoensaangepaste voorspel deur optelling en aftrekking twee keer die RMSE. (Oor die algemeen 'n 95 vertrouensinterval vir 'n een-tydperk lig voorspelling is min of meer gelyk aan die punt voorspelling plus-of-minus twee keer die geskatte standaardafwyking van die voorspelling foute, die aanvaarding van die fout verspreiding is ongeveer normale en die steekproefgrootte groot genoeg is, sê, 20 of meer. Hier is die RMSE eerder as die monster standaardafwyking van die foute is die beste raming van die standaard afwyking van toekomstige vooruitsig foute, want dit neem vooroordeel sowel toevallige variasies in ag.) die vertroue perke vir die seisoensaangepaste voorspelling is dan reseasonalized. saam met die voorspelling, deur hulle met die toepaslike seisoenale indekse te vermenigvuldig. In hierdie geval is die RMSE is gelyk aan 27.4 en die seisoensaangepaste voorspelling vir die eerste toekoms tydperk (Desember-93) is 273,2. sodat die seisoensaangepaste 95 vertrouensinterval is 273,2-227,4 218,4 te 273.2227.4 328,0. Vermenigvuldig hierdie perke deur Decembers seisoenale indeks van 68,61. Ons kry onderste en boonste vertroue grense van 149,8 en 225,0 rondom die Desember-93 punt voorspelling van 187,4. Vertroue perke vir voorspellings meer as een tydperk wat voorlê, sal oor die algemeen uit te brei as die voorspelling horison toeneem, as gevolg van onsekerheid oor die vlak en tendens asook die seisoenale faktore, maar dit is moeilik om hulle te bereken in die algemeen deur analitiese metodes. (Die geskikte manier om vertroue perke vir die LES voorspelling bereken is deur die gebruik van ARIMA teorie, maar die onsekerheid in die seisoenale indekse is 'n ander saak.) As jy 'n realistiese vertroue interval vir 'n voorspelling wil meer as een tydperk wat voorlê, met al die bronne van fout in ag, jou beste bet is om empiriese metodes gebruik: byvoorbeeld, 'n vertrouensinterval vir 'n 2-stap vorentoe voorspel verkry, jy kan 'n ander kolom skep op die sigblad om 'n 2-stap-ahead voorspelling bereken vir elke tydperk ( deur Opstarten die een-stap-ahead voorspelling). bereken dan die RMSE van die 2-stap-ahead voorspelling foute en gebruik dit as die basis vir 'n 2-stap-ahead vertroue interval. Moving Gemiddeldes en gesentreer Bewegende Gemiddeldes n paar punte oor seisoenaliteit in 'n tydreeks beer herhaal, selfs al dit lyk asof hulle voor die hand liggend. Een daarvan is dat die term 8220season8221 nie noodwendig verwys na die vier seisoene van die jaar wat die gevolg is van die kantel van die Earth8217s as. In predictive analytics, 8220season8221 beteken dikwels juis dat, omdat baie van die verskynsels wat ons bestudeer nie wissel saam met die vordering van die lente deur die winter: verkope van die winter of somer rat, insidensie van sekere wydverspreide siektes, weersomstandighede wat veroorsaak word deur die ligging van die jetstream en veranderinge in die temperatuur van die water in die oostelike Stille Oseaan, en so aan. Ewe, kan gebeure wat gereeld voorkom op te tree soos meteorologiese seisoene, selfs al is hulle net 'n vaag verbinding met die seizoenen. Agt-uur skofte in hospitale en fabrieke kry dikwels uitgedruk in die voorkoms van innames en uitgawes van energie daar, 'n seisoen is agt uur lank en die seisoene siklus elke dag, nie elke jaar. Sperdatums vir belasting sein die begin van 'n vloed van dollars in munisipale, staats-en federale skatkamers daar, kan die seisoen een jaar lank (persoonlike inkomstebelasting), ses maande (eiendomsbelasting in baie lande), kwartaallikse (baie korporatiewe belasting ), en so aan. It8217s 'n bietjie vreemd dat ons die woord 8220season8221 algemeen verwys na die gereeld herhalende periode van tyd, maar geen algemene term vir die tydperk waartydens een volle draai van die seisoene kom. 8220Cycle8221 is moontlik, maar in analytics en vooruitskatting daardie kwartaal gewoonlik na 'n tydperk van onbepaalde lengte, beteken soos 'n sakesiklus. In die afwesigheid van 'n beter term, I8217ve gebruik 8220encompassing period8221 in hierdie en daaropvolgende hoofstukke. Dit isn8217t net terminologiese gesug. Die maniere identifiseer ons seisoene en die tydperk waartydens die seisoene draai het ware, indien dikwels klein, implikasies vir hoe ons die gevolge daarvan te meet. Die volgende afdelings bespreek hoe sommige ontleders verskil die manier waarop hulle ook vertroud te bewegende gemiddeldes na gelang van die aantal seisoene is vreemd of selfs. Die gebruik van bewegende gemiddeldes In plaas van Simple Gemiddeldes Veronderstel dat 'n groot stad is die oorweging van die herverdeling van die verkeerspolisie om die voorkoms van bestuur terwyl verswakte, wat die stad is van mening is steeds beter aan te spreek. Vier weke gelede het nuwe wetgewing in werking getree het, die wettiging van die besit en ontspanningsgebruik van dagga. Sedertdien het die daaglikse aantal verkeer arrestasies vir DWI blyk te wees trending op. Kompliserende sake is die feit dat die aantal arrestasies blyk te piek op Vrydae en Saterdae. Plan vir mannekrag vereistes in die toekoms te help, you8217d graag enige onderliggende tendens that8217s tot stand gebring voorspel. You8217d ook graag die ontplooiing van jou hulpbronne tyd om rekening van enige naweek verwant seisoenaliteit neem that8217s plaasvind. Figuur 5.9 het die betrokke inligting wat jy het om te werk met. Figuur 5.9 Met hierdie datastel, elke dag van die week maak 'n seisoen. Selfs deur net eyeballing die grafiek in Figuur 5.9. jy kan sê dat die tendens van die aantal daaglikse arrestasies is tot. You8217ll moet beplan om die aantal verkeersbeamptes uit te brei, en hoop dat die tendens vlakke af gou. Verdere, die data dra uit die idee dat meer arrestasies voorkom gereeld op Vrydae en Saterdae, sodat jou hulpbrontoekenning moet diegene spykers aan te spreek. Maar jy moet die onderliggende tendens kwantifiseer, te bepaal hoeveel bykomende polisie you8217ll moet op te bring. Jy moet ook die verwagte grootte van die naweek spykers kwantifiseer, te bepaal hoeveel bykomende polisie jy hoef te kyk vir wisselvallige bestuurders op daardie dae. Die probleem is dat as van nog jy don8217t weet hoeveel van die daaglikse toename is te danke aan tendens en hoeveel is te danke aan daardie naweek effek. Jy kan begin deur detrending die tydreeks. Vroeër in hierdie hoofstuk, in 8220Simple Seisoene gemiddeldes, 8221 sien jy 'n voorbeeld van hoe om 'n tydreeks detrend om die seisoenale effekte met behulp van die metode van eenvoudige gemiddeldes isoleer. In hierdie afdeling you8217ll sien hoe om dit te doen deur gebruik te maak beweeg averages8212very waarskynlik, is die bewegende-gemiddeldes benadering meer dikwels gebruik word in predictive analytics as die eenvoudige-gemiddeldes benadering. Daar is verskeie redes vir die groter gewildheid van bewegende gemiddeldes, onder hulle, wat op die roering-gemiddeldes benadering jou nie vra om jou data te val in die proses van kwantifisering n tendens. Onthou dat die vorige voorbeeld het dit nodig om kwartaallikse gemiddeldes val om jaarlikse gemiddeldes, bereken 'n jaarlikse tendens, en dan versprei 'n kwart van die jaarlikse tendens oor elke kwartaal van die jaar. Dit stap is nodig om tendens van die seisoenale effekte verwyder. In teenstelling hiermee het die bewegende-gemiddeldes benadering maak dit moontlik om die tydreeks detrend sonder om dié soort van intrige. Figuur 5.10 toon hoe die bewegende-gemiddeldes benadering werk in die huidige voorbeeld. Figuur 5.10 Die bewegende gemiddelde in die tweede grafiek verduidelik die onderliggende tendens. Figuur 5.10 gee 'n bewegende gemiddelde kolom, en 'n kolom vir spesifieke seasonals. om die wat in Figuur 5.9 data. Beide toevoegings vereis 'n bespreking. Die spykers in hegtenis wat plaasvind oor naweke gee jou rede om te glo dat you8217re werk met seisoene wat eens elke week herhaal. Daarom begin deur om die gemiddelde vir die omvattende period8212that is, die eerste sewe seisoene, Maandag tot Sondag. Die formule vir die gemiddelde in sel D5, die eerste beskikbare bewegende gemiddelde, is soos volg: Dit formule gekopieer en geplak af deur sel D29, sodat jy 25 bewegende gemiddeldes gebaseer op 25 lopies van sewe agtereenvolgende dae. Let daarop dat ten einde beide die eerste en die laaste paar waarnemings in die tydreeks te wys, het ek verborge rye 10 deur 17 Jy kan dit sigbaar te maak, as jy wil, in hierdie chapter8217s werkboek, beskikbaar by die publisher8217s webwerf. Maak 'n meervoudige keuse van sigbare rye 9 en 18, regs-kliek op een van hul ry kop, en kies Wys uit die snel menu. As jy 'n worksheet8217s rye weg te steek, as I8217ve gedoen in figuur 5.10. enige Geoktrooieerde data in die verborge rye is ook weggesteek op die grafiek. Die x-as etikette identifiseer net die datapunte wat op die grafiek verskyn. Omdat elke bewegende gemiddelde in Figuur 5.10 sluit sewe dae, is geen bewegende gemiddelde saam met die eerste drie of laaste drie werklike waarnemings. Kopieer en plak die formule in sel D5 op 'n dag tot sel D4 loop jy uit observations8212there is geen waarneming opgeneem in sel C1. Net so, is daar geen bewegende gemiddelde hieronder sel D29 aangeteken. Kopieer en plak die formule in D29 in D30 sou 'n waarneming in sel C33 vereis, en geen waarneming is beskikbaar vir die dag wat sel sou verteenwoordig. Dit sou moontlik wees, natuurlik, om die lengte van die bewegende gemiddelde verkort om, sê, vyf in plaas van sewe. Deur dit te doen sal beteken dat die bewegende gemiddelde formules in figuur 5.10 kan begin in sel D4 in plaas van D5. Maar in hierdie soort ontleding, jy wil die lengte van die bewegende gemiddelde van die aantal seisoene gelyk: sewe dae in 'n week vir gebeure wat weekliks herhaal impliseer 'n bewegende gemiddelde lengte sewe en vier kwartale in 'n jaar vir die gebeure wat jaarliks ​​herhaal impliseer 'n bewegende gemiddelde lengte vier. Saam soortgelyke lyne, ons oor die algemeen seisoenale effekte op so 'n manier dat hulle totaal nul binne die omvattende tydperk kwantifiseer. As jy in hierdie chapter8217s eerste artikel gesien het, op eenvoudige gemiddeldes, dit word gedoen deur die berekening van die gemiddelde van (sê) die vier kwartale in 'n jaar, en dan trek die gemiddelde vir die jaar uit elke kwartaallikse figuur. Sodoende verseker dat die totale van die seisoenale effekte is nul. Op sy beurt het that8217s nuttig omdat dit sit die seisoenale effekte op 'n gemeenskaplike footing8212a somer effek van 11 is so ver van die gemiddelde as 'n winter effek van 821111. As jy wil vyf seisoene in plaas van sewe gemiddeld tot jou bewegende gemiddelde te kry, you8217re beter af om 'n verskynsel wat elke vyf seisoene in plaas van sewe herhaal. Maar wanneer jy die gemiddeld van die seisoenale effekte later in die proses te neem, die gemiddeldes is onwaarskynlik dat som aan nul. It8217s nodig op daardie stadium te lyn met sy wil, of te normaliseer. die gemiddeldes sodat hulle som is nul. Wanneer that8217s gedoen, die gemiddelde seisoenale gemiddeldes druk die effek op 'n tydperk van behoort aan 'n bepaalde seisoen. Sodra genormaliseer, is die seisoenale gemiddeldes genoem die seisoenale indekse wat hierdie hoofstuk reeds 'n paar keer genoem. You8217ll sien hoe dit werk later in hierdie hoofstuk, in 8220Detrending die reeks met bewegende Averages.8221 Verstaan ​​Spesifieke Seasonals Figuur 5.10 toon ook wat is spesifieke seasonals in kolom E. genoem Hulle is what8217s links na aftrekking van die bewegende gemiddelde van die werklike waarneming. Om 'n gevoel van wat die spesifieke seasonals verteenwoordig te kry, kyk na die bewegende gemiddelde in sel D5. Dit is die gemiddeld van die waarnemings in C2: C8. Die afwykings van elke waarneming van die bewegende gemiddelde (byvoorbeeld, C2 8211 D5) is gewaarborg om op te som 'n kenmerk van 'n gemiddelde zero8212that8217s. Dus, elke afwyking gee uitdrukking aan die effek van wat verband hou met daardie spesifieke dag in daardie spesifieke week. It8217s n spesifieke seisoen, then8212specific omdat die afwyking van toepassing op daardie spesifieke Maandag of Dinsdag en so aan, en seisoenale want in hierdie voorbeeld we8217re elke dag behandel asof dit 'n tyd lank in die omvattende tydperk van 'n week. Omdat elke spesifieke seisoenale maatreëls die effek van wat in daardie tyd ten 224-vis die bewegende gemiddelde vir daardie groep (hier) sewe seisoene, kan jy daarna Gemiddeld spesifieke seasonals vir 'n bepaalde seisoen (byvoorbeeld, al die Vrydae in jou tydreekse) om te skat wat season8217s algemeen, eerder as spesifieke, effek. Dit gemiddelde word nie beskaamd deur 'n onderliggende tendens in die tydreeks, want elke spesifieke seisoenale uitdrukking aan 'n afwyking van sy eie besondere bewegende gemiddelde. Aanpassing van die Moving Gemiddeldes There8217s ook die kwessie van die aanpassing van die bewegende gemiddeldes met die oorspronklike datastel. In Figuur 5.10. Ek het elke bewegende gemiddelde lyn met die middelpunt van die reeks waarnemings wat dit insluit. So, byvoorbeeld, die formule sel D5 gemiddeldes in die waarnemings in C2: C8, en ek het dit in lyn met die vierde waarneming, die middelpunt van die gemiddeld reeks, deur dit in ry 5. Hierdie reëling is die sogenaamde 'n gesentreerde bewegende gemiddelde . en baie ontleders verkies om elke bewegende gemiddelde in lyn met die middelpunt van die waarnemings wat dit gemiddeldes. Hou in gedagte dat in hierdie konteks, 8220midpoint8221 verwys na die middel van 'n tydsduur: Donderdag is die middelpunt van Maandag tot Sondag. Dit verwys nie na die mediaan van die waargeneem waardes, hoewel natuurlik is dit dalk so uitgewerk nie in die praktyk. 'N Ander benadering is die sleep bewegende gemiddelde. In daardie geval, is elke bewegende gemiddelde lyn met die laaste opmerking dat dit averages8212and daarom roetes agter sy argumente. Dit is dikwels die voorkeur reëling as jy wil 'n bewegende gemiddelde gebruik as 'n voorspelling, soos gedoen word met eksponensiële gladstryking, omdat jou finale bewegende gemiddelde voorkom samevallende met die finale beskikbaar waarneming. Gesentreer Bewegende Gemiddeldes met ewe getalle van seisoene Ons gewoonlik neem 'n spesiale prosedure wanneer die aantal seisoene is selfs eerder as vreemd. That8217s die tipiese toedrag van sake: Daar is geneig om ewe getalle van seisoene in die omvattende tydperk vir 'n tipiese seisoene wees soos maande, kwartale, en vier jaarlikse periodes (vir verkiesings). Die probleem met 'n ewe aantal seisoene is dat daar geen middelpunt. Twee is nie die middelpunt van 'n reeks begin by 1 en eindig op 4, en nie is 3 of dit kan gesê word om een ​​te hê, sy middelpunt is 2.5. Ses is nie die middelpunt van 1 tot 12, en nie is 7 sy suiwer teoretiese middelpunt is 6.5. Om op te tree asof 'n middelpunt bestaan, moet jy 'n laag van gemiddeld bo die bewegende gemiddeldes te voeg. Sien Figuur 5.11. Figuur 5.11 Excel bied verskeie maniere om 'n gesentreerde bewegende gemiddelde te bereken. Die idee agter hierdie benadering tot om 'n bewegende gemiddelde that8217s gesentreer op 'n bestaande middelpunt toe there8217s 'n gelyke getal seisoene, is om daardie middelpunt vorentoe trek deur 'n halwe seisoen. Jy kan bereken 'n bewegende gemiddelde wat by, sê, die derde punt sou wees gesentreer in die tyd as vyf seisoene in plaas van vier saamgestel een volle draai van die kalender. That8217s gedoen deur twee agtereenvolgende bewegende gemiddeldes en hulle gemiddeld. So in Figuur 5.11. there8217s n bewegende gemiddelde in sel E6 dat gemiddeldes die waardes in D3: D9. Omdat daar vier seisoenale waardes in D3: D9, is die bewegende gemiddelde in E6 beskou as gesentreer op die denkbeeldige seisoen 2.5, 'n halwe punt kort van die eerste beskikbare kandidaat seisoen, 3. (Seisoene 1 en 2 is nie beskikbaar as middelpunte vir 'n gebrek aan data om gemiddeld voor Seisoen 1.) Let egter dat die bewegende gemiddelde sel E8 gemiddeldes in die waardes in D5: D11, die tweede deur die vyfde plek in die tydreeks. Dat die gemiddelde is gesentreer op (denkbeeldige) wys 3.5, 'n volle tydperk wat voorlê van die gemiddelde gesentreer op 2.5. Deur die gemiddeld van die twee bewegende gemiddeldes, sodat die denke gaan, kan jy die middelpunt van die eerste bewegende gemiddelde vorentoe trek met 'n halwe punt van 2,5 tot 3 That8217s wat die gemiddeldes in kolom F van figuur 5.11 doen. Cell F7 bied die gemiddelde van die bewegende gemiddeldes in E6 en E8. En die gemiddelde in F7 is in lyn met die derde data punt in die oorspronklike tydreekse, in sel D7, om te beklemtoon dat die gemiddelde is gesentreer op daardie seisoen. As jy die formule in sel F7 asook die bewegende gemiddeldes in selle E6 en E8 brei, you8217ll sien dat dit blyk om 'n geweegde gemiddelde van die eerste vyf waardes in die tyd reeks wees, met die eerste en vyfde waarde gegee word 'n gewig van 1, en die tweede deur vierde waardes gegewe 'n gewig van 2. Dit lei ons na 'n vinniger en makliker manier om 'n gesentreerde bewegende gemiddelde bereken met 'n ewe aantal seisoene. Nog in Figuur 5.11. die gewigte word gestoor in die reeks H3: H11. Hierdie formule gee die eerste gesentreerde bewegende gemiddelde, in sel I7: Dit formule terug 13,75. wat identies is aan die waarde bereken deur die dubbel-gemiddelde formule in sel F7. Die maak van die verwysing na die gewigte absolute, deur middel van die dollar tekens in H3: H11. jy kan die formule kopieer en plak dit af so ver as wat nodig is om die res van die gesentreerde bewegende gemiddeldes te kry. Detrending die reeks met bewegende gemiddeldes Wanneer jy die bewegende gemiddeldes van die oorspronklike waarnemings afgetrek om die spesifieke seasonals kry, het jy die onderliggende tendens van die reeks verwyder. What8217s links in die spesifieke seasonals is gewoonlik 'n stilstaande, horisontale reeks met twee effekte wat veroorsaak dat die spesifieke seasonals af te wyk van 'n absoluut reguit lyn: die seisoenale effekte en ewekansige fout in die oorspronklike waarnemings. Figuur 5.12 toon die resultate vir hierdie voorbeeld. Figuur 5.12 Die spesifieke seisoenale effekte vir Vrydag en Saterdag bly duidelik in die detrended reeks. Die boonste grafiek in Figuur 5.12 toon die oorspronklike daaglikse waarnemings. Beide die algemene opwaartse neiging en die naweek seisoenale spykers is duidelik. Die onderste grafiek toon die spesifieke seasonals: die resultaat van detrending die oorspronklike reeks met 'n bewegende gemiddelde filter, soos beskryf vroeër in 8220Understanding Spesifieke Seasonals.8221 Jy kan sien dat die detrended reeks is nou feitlik horisontale ( 'n lineêre tendenslyn vir die spesifieke seasonals het 'n effense afwaartse drif), maar die seisoenale Vrydag en Saterdag spykers is steeds in plek. Die volgende stap is om te beweeg na die spesifieke seasonals om die seisoenale indekse. Sien Figuur 5.13. Figuur 5.13 Die spesifieke seasonals effekte eerste gemiddeld en dan genormaliseer tot die seisoenale indekse bereik. In Figuur 5.13. die spesifieke seasonals in kolom E herrangskik in die tabel getoon in die reeks H4: N7. Die doel is eenvoudig om te maak dit makliker om die seisoenale gemiddeldes te bereken. Diegene gemiddeldes word in H11: N11. Maar die figure in H11: N11 is gemiddeldes, nie afwykings van 'n gemiddelde, en dus can8217t ons verwag dat hulle som aan nul. Ons moet nog aan te pas sodat hulle afwykings van 'n groot gemiddelde uit te druk. Dit Grand gemiddelde verskyn in sel N13, en is die gemiddelde van die seisoenale gemiddeldes. Ons kan kom by die seisoenale indekse deur af te trek die Grand gemiddelde in N13 uit elk van die seisoenale gemiddeldes. Die gevolg is in die reeks H17: N17. Hierdie seisoenale indekse is nie meer spesifiek vir 'n bepaalde bewegende gemiddelde, soos in die geval met die spesifieke seasonals in kolom E. Omdat they8217re gebaseer op 'n gemiddeld van elke geval van 'n gegewe tyd, hulle druk die gemiddelde effek van 'n gegewe tyd oor die vier weke in die tyd reeks. Verder is hulle maatstawwe van 'n season8217s8212here, 'n day8217s8212effect op verkeer arrestasies ten 224-vis die gemiddelde vir 'n tydperk van sewe dae. Ons kan nou gebruik die seisoenale indekse om die reeks deseasonalize. We8217ll gebruik die seisoen gezuiverde reeks om voorspellings te kry deur middel van lineêre regressie of Holt8217s metode van glad tendens reeks (bespreek in Hoofstuk 4). Dan voeg ons net die seisoenale indekse terug in die voorspellings vir hulle reseasonalize. Dit alles lyk in Figuur 5.14. Figuur 5.14 Nadat jy die seisoenale indekse, die afrondingswerk soos hier toegepas is dieselfde as in die metode van eenvoudige gemiddeldes. Die stappe in figuur 5.14 is grootliks dieselfde as dié in figure 5.6 en 5.7. bespreek in die volgende afdelings. Deseasonalizing die waarnemings Trek die seisoenale indekse van die oorspronklike waarnemings die data deseasonalize. Jy kan dit doen soos getoon in Figuur 5.14. waarin die oorspronklike waarnemings en die seisoenale indekse gerangskik as twee lyste begin in dieselfde ry, kolom C en F. Hierdie reëling maak dit 'n bietjie makliker om die berekeninge te struktureer. Jy kan ook die aftrek soos getoon in Figuur 5.6. waarin die oorspronklike kwartaallikse waarnemings (C12: F16), die kwartaallikse indekse (C8: F8), en die seisoen gezuiverde resultate (C20: F24) word in 'n tabelvorm. Dit reëling maak dit 'n bietjie makliker om te fokus op die seisoenale indekse en die deseasoned kwartaallikse publikasies. Voorspelling van die seisoen gezuiverde waarnemings in Figuur 5.14. die seisoen gezuiverde waarnemings is in kolom H, en in figuur 5.7 they8217re in kolom C. Ongeag of jy wil 'n regressie benadering of 'n glad benadering tot die voorspelling gebruik, it8217s bes om die seisoen gezuiverde waarnemings in 'n lys enkel-kolom te reël. In Figuur 5.14. die voorspellings in kolom J. Die volgende skikkingsformule is in die reeks J2 aangegaan: J32. Vroeër in hierdie hoofstuk, het ek daarop gewys dat as jy die x-waardes argument laat uit die TREND () function8217s argumente, Excel verskaf die standaard waardes 1. 2. N. waar n die aantal y-waardes. In die formule net gegee, H2: H32 bevat 31 y-waardes. Omdat die argument gewoonlik met die x-waardes ontbreek, Excel verskaf die standaard waardes 1. 2. 31. Dit is die waardes wat ons wil in elk geval gebruik, in kolom B, sodat die formule soos gegee is gelykstaande aan TREND (H2: H32, B2: B32). En that8217s die struktuur wat in D5: D24 van figuur 5.7: Om die Een-stap-Ahead Voorspelling Tot dusver het jy gereël vir voorspellings van die seisoen gezuiverde tydreekse van t 1 deur middel van t 31 in Figuur 5.14. en uit t 1 deur middel van t 20 in Figuur 5.7. Hierdie voorspellings uitmaak nuttige inligting vir verskeie doeleindes, insluitende die beoordeling van die akkuraatheid van die voorspellings deur middel van 'n RMSE ontleding. Maar jou hoofdoel is voorspel ten minste die volgende, soos nog waargeneem tydperk. Om dit te kry, kan jy die eerste keer voorspel van die TREND () of LINEST () funksie as you8217re behulp regressie, of van die eksponensiële gladstryking formule as you8217re behulp Holt8217s metode. Dan kan jy die gepaardgaande seisoenale indeks voeg tot die agteruitgang of glad voorspelling, om 'n voorspelling dat beide die tendens en die seisoenale effek sluit kry. In Figuur 5.14. jy die regressie voorspel in sel J33 met hierdie formule: In hierdie formule, die y-waardes in H2: H32 is dieselfde as in die ander TREND () formules in kolom J. So is die (standaard) x-waardes van 1 deur 32. Nou, al is, verskaf jy 'n nuwe x-waarde as die function8217s derde argument, wat jy TREND () vertel om te kyk in sel B33. It8217s 32. die volgende waarde van t. En Excel gee terug Die waarde 156,3 in sel J33. Die funksie TREND () in sel J33 vertel Excel, in werking tree, 8220Calculate die regressievergelyking vir die waardes in H2: H32 agteruitgang op die t-waardes 1 tot 31. Pas dit regressievergelyking om die nuwe x-waarde van 32 en die standaard van die result.8221 You8217ll dieselfde benadering geneem in sel D25 van figuur 5.7 vind. waar die formule om die een-stap-ahead voorspelling te kry, is dit: Voeg die seisoenale indekse weer in die finale stap is om die voorspellings reseasonalize deur die byvoeging van die seisoenale indekse om die tendens voorspellings, omkeer wat jy gedoen het vier stappe terug wanneer jy afgetrek die indekse van die oorspronklike waarnemings. Dit word gedoen in kolom F in Figuur 5.7 en kolom K in Figuur 5.14. Don8217t vergeet om die toepaslike seisoenale indeks vir die een-stap-ahead voorspelling voeg, met die bedrag wat in sel F25 in Figuur 5.7 en in sel K33 in Figuur 5.14 resultate. (I8217ve skadu die een-stap-ahead selle in beide figuur 5.7 en figuur 5.14 om die voorspellings na vore te bring.) Jy kan kaarte van drie vertoë van die verkeer in hegtenis data vind in Figuur 5.15. die seisoen gezuiverde reeks, die lineêre voorspelling van die seisoen gezuiverde data, en die reseasonalized voorspellings. Let daarop dat die voorspellings inkorporeer beide die algemene tendens van die oorspronklike data en sy Vrydag / Saterdag spykers. Figuur 5.15 kartering van die forecasts.5.2 Smoothing Tyd Reeks Smoothing word gewoonlik gedoen om ons te help patrone, tendense beter sien byvoorbeeld in tydreekse. Oor die algemeen glad die onreëlmatige ruheid om 'n duideliker sein sien. Vir seisoenale data, kan ons glad die seisoen, sodat ons die tendens kan identifiseer. Glad nie die geval is voorsien ons met 'n model, maar dit kan 'n goeie eerste stap in die beskrywing van die verskillende komponente van die reeks wees. Die term filter word soms gebruik om 'n glad prosedure beskryf. Byvoorbeeld, as die stryk waarde vir 'n bepaalde tyd word bereken as 'n lineêre kombinasie van waarnemings vir omliggende keer, dit kan gesê word dat weve toegepas n lineêre filter om die data (nie dieselfde as om te sê die resultaat is 'n reguit lyn, deur die manier). Die tradisionele gebruik van die term bewegende gemiddelde is dat by elke punt in die tyd wat ons bepaal (moontlik geweegde) gemiddeldes van waargenome waardes wat 'n bepaalde tyd omring. Byvoorbeeld, op tyd t. 'n gesentreerde bewegende gemiddelde lengte 3 met gelyke gewigte sal die gemiddelde waardes by tye t -1. t. en T1. Om seisoenaliteit weg te neem van 'n reeks, sodat ons kan beter sien tendens, sou ons 'n bewegende gemiddelde met 'n lengte seisoenale span gebruik. So in die stryk reeks, het elk stryk waarde is gemiddeld oor alle seisoene. Dit kan gedoen word deur te kyk na 'n eensydige bewegende gemiddelde waarin jy gemiddeld alle waardes vir die vorige jaar se data of 'n gesentreerde bewegende gemiddelde waarin jy waardes gebruik beide voor en na die huidige tyd. Vir kwartaallikse data, byvoorbeeld, ons kan 'n reëlmatige waarde vir tyd t as definieer (x t x t-1 x T-2 x t-3) / 4, die gemiddelde van hierdie tyd en die vorige 3/4. In R-kode sal dit 'n eensydige filter wees. A-gesentreerde bewegende gemiddelde skep 'n bietjie van 'n probleem wanneer ons 'n ewe getal van tydperke in die seisoenale span (soos ons gewoonlik doen). Om weg te stryk seisoenaliteit in kwartaallikse data. ten einde tendens te identifiseer, die gewone konvensie is om die bewegende gemiddelde stryk op tydstip t is om weg te stryk seisoenaliteit in maandelikse data gebruik. ten einde tendens te identifiseer, die gewone konvensie is om die bewegende gemiddelde stryk op tydstip t is wat deur gebruik gewig 1/24 pas ons om waardes by tye T6 en T6 en gewig 12/01 alle waardes te alle tye tussen T5 en T5. In die opdrag R filter, sowel spesifiseer 'n twee-sided filter wanneer ons wil waardes wat kom beide voor en na die tyd waarvoor was glad gebruik. Let daarop dat op bladsy 71 van ons boek, die skrywers gelyk gewigte van toepassing oor 'n gesentreerde seisoenale bewegende gemiddelde. Dis okay ook. Byvoorbeeld, kan 'n kwartaallikse gladder word stryk op tydstip t is frac x frac x frac xt frac x frac x A maandelikse gladder kan 'n gewig van 1/13 van toepassing op alle waardes van tye t-6 tot T6. Die kode van die skrywers gebruik op bladsy 72 maak gebruik van 'n rep bevel dat 'n waarde herhaal 'n sekere aantal kere. Hulle hoef te gebruik die parameter filter binne die opdrag filter. Voorbeeld 1 Kwartaallikse Beer Produksie in Australië in beide Les 1 en Les 4, het ons gekyk na 'n reeks kwartaallikse bier produksie in Australië. Die volgende R-kode skep 'n reëlmatige reeks waarmee ons sien die tendens patroon, en plotte hierdie tendens patroon op dieselfde grafiek as die tyd reeks. Die tweede opdrag skep en stoor die stryk reeks in die voorwerp genoem trendpattern. Let daarop dat binne die opdrag filter, die parameter genoem filter gee die koëffisiënte vir ons glad en kante 2 veroorsaak dat 'n gesentreerde glad te bereken. beerprod skandering (beerprod. dat) trendpattern filter (beerprod, filter c (1/8, 1/4, 1/4, 1/4, 1/8), sides2) plot (beerprod, Tipe B, hoof bewegende gemiddelde jaarlikse tendens ) lyne (trendpattern) Hier is die resultaat: Ons kan die tendens patroon van die datawaardes trek om 'n beter blik op die seisoen kry. Hier is hoe dit sou gebeur: seasonals beerprod - trendpattern plot (seasonals, Tipe B, hoof seisoenale patroon vir bier produksie) Die resultaat volg: Nog 'n moontlikheid vir glad reeks tendens sien is die eensydige filter trendpattern2 filter (beerprod, filter c (1/4, 1/4, 1/4, 1/4), sides1) Met hierdie, die stryk waarde is die gemiddeld van die afgelope jaar. Voorbeeld 2. VS Maandeliks werkloosheid in die huiswerk vir week 4 jy kyk na 'n maandelikse reeks VSA Werkloosheid vir 1948-1978. Hier is 'n smoothing gedoen om te kyk na die tendens. trendunemployfilter (werkloos, filterc (1 / 24,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12, 1 / 12,1 / 24), sides2) trendunemploy ts (trendunemploy, begin c (1948,1), freq 12) plot (trendunemploy, mainTrend in die VSA Werkloosheid, 1948-1978, XLab Jaar) Slegs die reëlmatige tendens is geplot. Die tweede opdrag identifiseer die kalender tyd kenmerke van die reeks. Dit maak die plot het 'n meer betekenisvolle as. Die plot volg. Vir nie-seisoenale reeks, Arent jy gebind te stryk oor 'n spesifieke span. Vir glad moet jy eksperimenteer met bewegende gemiddeldes van verskillende strek. Diegene strek van die tyd kan relatief kort wees. Die doel is om af te klop die ruwe kante om te sien wat tendens of patroon daar mag wees. Ander Smoothing Metodes (Afdeling 2.4) Afdeling 2.4 beskryf verskeie gesofistikeerde en nuttige alternatiewe vir bewegende gemiddelde glad. Die besonderhede kan oppervlakkig lyk, maar dis okay, want ons dont wil kry vasgeval in baie besonderhede vir diegene metodes. Van die alternatiewe metodes in Afdeling 2.4 beskryf, kan lowess (plaaslik geweeg regressie) die mees algemeen gebruik. Voorbeeld 2 Voortgesette Die volgende plot is glad tendens lyn vir die VSA Werkloosheid reeks, bevind die gebruik van 'n lowess gladder waarin 'n aansienlike bedrag (2/3) het bygedra tot elke stryk skatting. Let daarop dat hierdie stryk die reeks meer aggressief as die bewegende gemiddelde. Die opdragte gebruik is werkloos ts (werkloos, begin c (1948,1), freq12) plot (lowess (werkloos, f 2/3), hoof Lowess smoothing van die Amerikaanse Werkloosheid Trend) Enkellopend Eksponensiële glad die basiese vooruitskatting vergelyking vir enkele eksponensiële gladstryking Daar word dikwels gegee as hoed Alpha xt (1-alfa) hoed t teks Ons voorspel die waarde van x in die tyd T1 'n geweegde kombinasie van die waargeneem waarde op tydstip t en die geskatte waarde op tydstip t wees. Hoewel die metode 'n glad metode, staan ​​bekend as die hoofsaaklik gebruik word vir 'n kort termyn vooruitskatting. Die waarde van die smoothing konstante genoem. Vir een of ander rede, 0.2 is 'n gewilde verstek keuse van programme. Dit plaas 'n gewig van 0,2 op die mees onlangse waarneming en 'n gewig van 1 0,2 0,8 op die mees onlangse skatting. Met 'n relatief klein waarde van, sal die smoothing relatief meer uitgebreide wees. Met 'n relatief groot waarde van die smoothing is relatief minder uitgebreide as meer gewig op die waargenome waarde gestel sal word. Dit is eenvoudig 'n stap vorentoe vooruitskatting metode wat met die eerste oogopslag blyk 'n model vir die data nie nodig. Trouens, hierdie metode is soortgelyk aan die gebruik van 'n ARIMA (0,1,1) model met geen konstante. Die optimale proses is om 'n ARIMA (0,1,1) model om die waargenome dataset pas en gebruik die resultate om die waarde van vas. Dit is 'n optimale in die sin van die skep van die beste vir die reeds waargeneem data. Alhoewel die doel is glad en 'n stap vorentoe voorspel, die ekwivalensie van die ARIMA (0,1,1) model bring 'n goeie punt. Ons behoort nie blindelings toepassing eksponensiële gladstryking omdat die onderliggende proses nie goed kan beskryf deur 'n ARIMA (0,1,1). ARIMA (0,1,1) en Eksponensiële Smoothing Ekwivalensie Oorweeg 'n ARIMA (0,1,1) met gemiddelde 0 vir die eerste verskille, xt - x t-1: begin hoed amp amp xt theta1 wt amp amp xt theta1 (xt - hat t) amp amp (1 theta1) xt - theta1hat geneig. As ons toelaat dat (1 1) en dus - (1) 1, sien ons die ekwivalensie vergelyking (1) hierbo. Hoekom die metode staan ​​bekend as eksponensiële Smoothing Dit lewer die volgende: begin hoed amp amp Alpha xt (1-alfa) Alpha X (1-alfa) hoed amp amp Alpha xt alfa (1-alfa) x (1-alfa) 2hat einde voort in hierdie mode deur agtereenvolgens vervang vir die geskatte waarde aan die regterkant van die vergelyking. Dit lei tot: hoed Alpha xt alfa (1-alfa) x alfa (1-alfa) 2 x kolle alfa (1-alfa) JX kolle alfa (1-alfa) x1 teks vergelyking 2 toon dat die voorspelde waarde is 'n geweegde gemiddelde van alle afgelope waardes van die reeks, met eksponensieel verander gewigte soos ons beweeg terug in die reeks. Optimale Eksponensiële Smoothing in R Eintlik het ons net pas 'n ARIMA (0,1,1) om die data en bepaal die koëffisiënt. Ons kan die pas van die gladde ondersoek deur 'n vergelyking van die voorspelde waardes van die werklike reeks. Eksponensiële gladstryking is geneig om meer as 'n voorspelling instrument as 'n ware gladder te gebruik, so soek om te sien of ons 'n goeie passing. Voorbeeld 3. N 100 maandelikse waarnemings van die logaritme van 'n olie-prysindeks in die Verenigde State van Amerika. Die data-reeks is: 'n ARIMA (0,1,1) pas in R het 'n MA (1) koëffisiënt 0,3877. So (1 1) 1,3877 en 1- -0,3877. Die eksponensiële gladstryking vooruitskatting vergelyking hoed 1.3877xt - 0.3877hat t Ten tye 100, die waargenome waarde van die reeks is x 100 0,86601. Die voorspelde waarde vir die reeks op daardie tydstip is dus die voorspelling vir die tyd 101 is hoed 1.3877x - 0.3877hat 1,3877 (0,86601) -0,3877 (0,856789) 0,8696 aanleiding is hoe goed die gladder pas die reeks. Dit is 'n goeie passing. Dis 'n goeie teken vir vooruitskatting, die hoofdoel van hierdie gladder. Hier is die instruksies wat gebruik word om die uitset vir hierdie voorbeeld te genereer: oilindex skandering (oildata. dat) plot (oilindex, Tipe B, hoof log olie-indeks Series) expsmoothfit ARIMA (oilindex, sodat c (0,1,1)) expsmoothfit om die ARIMA resultate sien predicteds oilindex - expsmoothfitresiduals voorspelde waardes plot (oilindex, typeb, hoof eksponensiële smoothing van log olie-indeks) lyne (predicteds) 1.3877oilindex100-0.3877predicteds100 voorspelling vir tyd 101 Double eksponensiële smoothing Double eksponensiële gladstryking gebruik kan word wanneer Theres tendens (hetsy lang termyn of kort termyn), maar daar is geen seisoenaliteit. In wese die metode skep 'n voorspelling deur die kombinasie van eksponensieel stryk skattings van die tendens (helling van 'n reguit lyn) en die vlak (basies, die afsnit van 'n reguit lyn). Twee verskillende gewigte, of glad parameters, word gebruik om hierdie twee komponente by elke keer op te dateer. Die stryk is min of meer gelykstaande aan 'n eenvoudige eksponensiële gladstryking van die datawaardes en die reëlmatige tendens is min of meer gelykstaande aan 'n eenvoudige eksponensiële gladstryking van die eerste verskille. Die prosedure is gelykstaande aan pas 'n ARIMA (0,2,2) model, met geen konstante trek hom af met 'n ARIMA (0,2,2) fiks uitgevoer kan word. (1-B) 2 xt (1theta1B theta2B2) wt. Navigation6.2 bewegende gemiddeldes ma 40 elecsales, sodat 5 41 In die tweede kolom van hierdie tabel, 'n bewegende gemiddelde van orde 5 aangetoon, die verskaffing van 'n skatting van die tendens-siklus. Die eerste waarde in hierdie kolom is die gemiddeld van die eerste vyf Waarnemings (1989-1993) die tweede waarde in die 5-MA kolom is die gemiddeld van die waardes 1990-1994 en so aan. Elke waarde in die 5-MA kolom is die gemiddeld van die waarnemings in die tydperk van vyf jaar gesentreer op die ooreenstemmende jaar. Daar is geen waardes vir die eerste twee jaar of laaste twee jaar, want ons hoef nie twee waarnemings aan weerskante. In die formule hierbo, kolom 5-MA bevat die waardes van hoed met K2. Om te sien wat die tendens-siklus skatting lyk, stip ons dit saam met die oorspronklike data in figuur 6.7. plot 40 elecsales, hoof quotResidential elektrisiteit salesquot, ylab quotGWhquot. XLab quotYearquot 41 lyne 40 MA 40 elecsales, 5 41. Kol quotredquot 41 Let op hoe die tendens (in rooi) is gladder as die oorspronklike data en vang die grootste beweging van die tydreeks sonder al die geringe fluktuasies. Die bewegende gemiddelde metode nie skattings van T toelaat waar t is baie naby aan die einde van die reeks vandaar die rooi lyn nie uit te brei na die kante van die grafiek aan weerskante. Later sal ons meer gesofistikeerde metodes van die tendens-siklus skatting wat doen toelaat skattings naby die eindpunte gebruik. Die einde van die bewegende gemiddelde bepaal die gladheid van die tendens-siklus skatting. In die algemeen, 'n groter orde beteken 'n gladder kurwe. Die volgende grafiek toon die effek van die verandering van die orde van die bewegende gemiddelde vir die residensiële verkope elektrisiteit data. Eenvoudige bewegende gemiddeldes soos hierdie is gewoonlik van vreemde orde (bv 3, 5, 7, ens) Dit is sodat hulle is simmetries: in 'n bewegende gemiddelde van orde m2k1, daar is k vroeër waarnemings, k later waarnemings en die Midde-waarneming wat gemiddeld. Maar as m selfs was, sou dit nie meer simmetriese wees. Bewegende gemiddeldes van bewegende gemiddeldes Dit is moontlik om 'n bewegende gemiddelde van toepassing op 'n bewegende gemiddelde. Een van die redes hiervoor is om 'n nog-orde bewegende gemiddelde simmetriese maak. Byvoorbeeld, kan ons 'n bewegende gemiddelde van orde 4 neem, en dan nog 'n bewegende gemiddelde van orde 2 van toepassing is op die resultate. In Tabel 6.2, is dit gedoen en vir die eerste paar jaar van die Australiese kwartaallikse bier produksie data. BEER2 LT venster 40 ausbeer, begin 1992 41 ma4 LT ma 40 BEER2, sodat 4. sentrum ONWAAR 41 ma2x4 LT ma 40 BEER2, sodat 4. sentrum WAAR 41 Die notasie 2times4-MA in die laaste kolom beteken 'n 4-MA gevolg deur 'n 2-MA. Die waardes in die laaste kolom word verkry deur die neem van 'n bewegende gemiddelde van orde 2 van die waardes in die vorige kolom. Byvoorbeeld, die eerste twee waardes in die 4-MA kolom is 451,2 (443.410.420.532) / 4 en 448,8 (410.420.532.433) / 4. Die eerste waarde in die 2times4-MA kolom is die gemiddeld van die twee: 450,0 (451.2448.8) / 2. Wanneer 'n 2-MA volg op 'n bewegende gemiddelde van al orde (soos 4), is dit bekend as 'n gesentreerde bewegende gemiddelde van orde 4. Dit is omdat die resultate is nou simmetriese. Om te sien dat dit die geval is, kan ons die 2times4-MA soos volg skryf: begin hoed amp frac Bigfrac (J J J J) frac (J J J J) Big amp frac y frac14y frac14y frac14y frac18y. Uiteindelik gaan dit nou 'n geweegde gemiddelde van waarnemings, maar dit is simmetriese. Ander kombinasies van bewegende gemiddeldes is ook moontlik. Byvoorbeeld 'n 3times3-MA word dikwels gebruik, en bestaan ​​uit 'n bewegende gemiddelde van orde 3 gevolg deur 'n ander bewegende gemiddelde van orde 3. In die algemeen, moet 'n gelyke orde MA word gevolg deur 'n nog bevel MA dit simmetriese maak. Net so moet 'n vreemde orde MA word gevolg deur 'n vreemde orde MA. Skatte van die tendens-siklus met seisoenale data Die mees algemene gebruik van gesentreer bewegende gemiddeldes is in die beraming van die tendens-siklus van seisoenale data. Oorweeg die 2times4-MA: hoed frac y frac14y frac14y frac14y frac18y. Wanneer dit toegepas word om kwartaalliks data, word elke kwartaal van die jaar gegee gelyke gewig as die eerste en laaste terme van toepassing op dieselfde kwartaal in agtereenvolgende jare. Gevolglik sal die seisoenale variasie word gemiddeld uit en die gevolglike waardes van hoed t sal min of oorblywende geen seisoenale variasie het. 'N soortgelyke effek sal verkry word met behulp van 'n 2times 8-MA of 'n 2times 12-MA. In die algemeen, 'n 2times m-MA is gelykstaande aan 'n geweegde bewegende gemiddelde van orde M1 met alle waarnemings wat gewig 1 / m, behalwe vir die eerste en laaste terme wat gewigte neem 1 / (2 miljoen). So as die seisoenale tydperk is selfs en orde m, gebruik 'n 2times m-MA aan die tendens-siklus te skat. As die seisoenale tydperk is vreemd en orde m, gebruik 'n m-MA aan die tendens siklus skat. In die besonder, kan 'n 2times 12-MA gebruik word om die tendens-siklus van maandelikse data te skat en 'n 7-MA gebruik kan word om die tendens-siklus van die daaglikse data te skat. Ander keuses vir die einde van die MA sal gewoonlik lei tot tendens-siklus skattings besmet deur die seisoenaliteit in die data. Voorbeeld 6.2 Elektriese toerusting vervaardiging Figuur 6.9 toon 'n 2times12-MA toegepas op die elektriese toerusting bestellings indeks. Let daarop dat die gladde lyn toon geen seisoenaliteit dit is byna dieselfde as die tendens-siklus word in Figuur 6.2 wat na raming met behulp van 'n veel meer gesofistikeerde metode as bewegende gemiddeldes. Enige ander keuse vir die einde van die bewegende gemiddelde (behalwe vir 24, 36, ens) sou gelei tot 'n gladde lyn wat 'n paar seisoenale skommelinge toon. plot 40 elecequip, ylab quotNew bestellings indexquot. Kol quotgrayquot, hoof quotElectrical toerusting vervaardiging (Eurogebied) quot 41 lyne 40 MA 40 elecequip, sodat 12 41. Kol quotredquot 41 Geweegde bewegende gemiddeldes Kombinasies van bewegende gemiddeldes lei tot geweegde bewegende gemiddeldes. Byvoorbeeld, die 2x4-MA hierbo bespreek is gelykstaande aan 'n geweegde 5-MA met gewigte deur frac, frac, frac, frac, frac. In die algemeen kan 'n geweegde m-MA geskryf word as hoed t som k AJ y, waar k (m-1) / 2 en die gewigte word deur 'n, kolle, AK. Dit is belangrik dat die gewigte al som tot een en dat hulle simmetriese sodat 'n aj. Die eenvoudige m-MA is 'n spesiale geval waar al die gewigte is gelyk aan 1 / m. 'N Groot voordeel van geweegde bewegende gemiddeldes is dat hulle toegee n gladder skatting van die tendens-siklus. In plaas van waarnemings betree en verlaat die berekening op volle gewig, is hul gewigte stadig toegeneem en dan stadig afgeneem wat lei tot 'n gladder kurwe. Sommige spesifieke stelle gewigte is wyd gebruik word. Sommige van hierdie word in Tabel 6.3.


No comments:

Post a Comment