Winsorizatutako batezbesteko

Winsorizatutako batezbestekoa estatistikan erabilitako batezbesteko neurri mota bat da, muturreko datuen eragina txikitzea duena helburu, Charles P. Winson bioestatistak lehen erabilia. Hontan, datu multzo bat winsorizatu egiten da, balio batzuk ordezkatuz, ondoren batazbesteko sinple bat kalkulatzeko. Goi eta behe muturreko datu kopuru bat (orokorrean ehunekoz adierazita) haren multzoaren medianatik hurbilen dagoen balioagatik ordezkatzen da, geroago balio kopuru guztiengatik zatitzeko:

B w = ( X n + . . . + X n ) + X n + 1 + . . . + X m 1 + ( X m + . . . + X m ) N {\displaystyle Bw={(X_{n}+...+X_{n})+X_{n+1}+...+X_{m-1}+(X_{m}+...+X_{m}) \over N}}

Orokorrean, moztutako batezbestekoaren antzeko funtzio bat betetzen du. Azken honek muturreko datuak formulatik kanpo uzten dituen bitartean, winsorizatutako batezbestekoak balio hauen eragina txikitu egiten du.

Adibidea

10 zenbakiko multzo bat emanda, multzo honen %60eko Winsorizatutako batezbestekoa honako hau da:

B w = ( x 3 + x 3 + x 3 ) + x 4 + x 5 + x 6 + x 7 + ( x 8 + x 8 + x 8 ) 10 {\displaystyle Bw={(x_{3}+x_{3}+x_{3})+x_{4}+x_{5}+x_{6}+x_{7}+(x_{8}+x_{8}+x_{8}) \over 10}}

x(1) eta x(2) balioak x(3)-rengatik ordezkatu dira, x(9) eta x(10) balioak x(8)-rengatik ordezkatu diren bitartean, 10etik 6 balio Winsorizatuz.

Erreferentziak

  • Wilcox, R.R.; Keselman, H.J. (2003). "Modern robust data analysis methods: Measures of central tendency". Psychological Methods. 8 (3): 254–274.https://psycnet.apa.org/doiLanding?doi=10.1037%2F1082-989X.8.3.254

Kanpo estekak

Autoritate kontrola
  • Wikimedia proiektuak
  • Wd Datuak: Q2989389
  • Wd Datuak: Q2989389