Centrerad Glidande Medelvärde Metoden


Glidande medelvärde. Medel av tidsseriedataobservationer lika fördelade i tid från flera på varandra följande perioder. Kallad flyttning eftersom den kontinuerligt omräknas när ny data blir tillgänglig, fortskrider den genom att släppa det tidigaste värdet och lägga till det senaste värdet. Till exempel, glidande medelvärdet av sex Månadsförsäljningen kan beräknas genom att genomsnittet av försäljningen går från januari till juni, då genomsnittet av försäljningen från februari till juli, mars till augusti, etc. Moving averages 1 minskar effekten av temporära datavariationer, 2 förbättrar Passformen av data till en linje en process som kallas utjämning för att tydligt visa datas trends och 3 markera något värde över eller under trenden. Om du beräknar något med väldigt hög varians är det bästa du kanske kan göra att figurera Ut det rörliga genomsnittet. Jag ville veta vad det rörliga genomsnittet var för data, så jag skulle få en bättre förståelse för hur vi gjorde. När du försöker lista ut några nummer som ofta ändras St du kan göra är att beräkna det glidande genomsnittliga genomsnittliga priset MAP. När du beräknar ett löpande rörligt medelvärde, är det genomsnittligt att placera medelvärdet under mellantid. I det föregående exemplet beräknade vi genomsnittet av de första 3 tidsperioderna och placerade det Bredvid period 3 Vi kunde ha lagt medelvärdet mitt i tidsintervallet av tre perioder, det vill säga intill period 2 Det fungerar bra med udda tidsperioder, men inte så bra för jämna tidsperioder Så var skulle vi placera Första glidande medelvärdet när M 4. Tekniskt sett kommer det rörliga genomsnittet att falla vid t 2 5, 3 5. För att undvika detta problem släpper vi MAs med M 2 Således släpper vi ut de jämnda värdena. Om vi ​​i genomsnitt ett jämnt antal termer, Vi behöver släta de släta värdena. Följande tabell visar resultaten med hjälp av M 4. David, ja, MapReduce är avsedd att fungera på en stor mängd data Och tanken är att i allmänhet bör kartan och reducera funktionerna inte bry sig om hur Många mappers eller hur många reducerare det finns, det är jus T optimering Om du tänker noggrant på den algoritm som jag skrev upp kan du se att det spelar ingen roll vilken mappare får vilka delar av dataen. Varje inmatningsrekord kommer att vara tillgänglig för varje reducerad operation som behöver den. Joe K 18 september 12 kl 22:30. I min förståelse är glidande medelvärde inte snygga kartor till MapReduce-paradigmet eftersom dess beräkning väsentligen skjuter fönstret över sorterade data medan MR behandlar icke-skurna rader av sorterade data Lösning jag ser är som följer a För att implementera anpassad partitioner till Kunna göra två olika skiljeväggar i två körningar I varje körning kommer dina reducerare att få olika dataområden och beräkna glidande medelvärden, där det är lämpligt att jag ska försöka illustrera. För första gången bör data för reduktionsmedel vara R1 Q1, Q2, Q3, Q4 R2 Q5 , Q6, Q7, Q8. Där kommer du att cacluate glidande medelvärde för vissa Qs. In nästa körning bör dina reducerare få data som R1 Q1 Q6 R2 Q6 Q10 R3 Q10 Q14. Och caclulate resten av glidande medelvärden Sedan måste du aggregera Results. Idea av anpassad partitioner att den kommer att ha två olika sätt att fungera - varje gång som delas i lika delar men med viss skift I en pseudokod kommer den att se ut som denna partitionsnyckel SHIFT MAXKEY numOfPartitions där SHIFT kommer att tas från konfigurationen MAXKEY maximalt värde av Nyckeln jag antar för enkelhet att de börjar med noll. RecordReader, IMHO är inte en lösning eftersom den är begränsad till specifik delning och kan inte glida över split s gränsen. En annan lösning skulle vara att genomföra anpassad logik för att dela in data som den är delaktig Av InputFormat Det kan göras att göra 2 olika bilder, liknar partitioning. answered Sep 17 12 på 8 59.

Comments

Popular Posts