söndag 10 februari 2008

Återbesök i statistikens förlovade land

Jag känner att nyfikenheten kring statistik växer. Så jag får printa ner lite mer information. Jag har iofs inte fått någon direkt förfrågan. Iom att inlägget dök upp mitt i natten för eventuella bloggläsare och klockan nu är strax efter åtta en söndagmorgon i Sverige. Men jag ville förekomma en eventuell anstormning, som möjligen skulle komma mitt i min natt. Eller så hade jag bara lite extra statistik och skrivlust. Nåt som man kan se är dock att av de 793 olika orden så utgör de 64 vanligaste orden hälften av textmassan. Om man räknar textmassan i enheten ord, om man räknar i tecken så blir det väl lite annorlunda, men det bryr jag mig inte om nu. De tio vanligaste orden är i fallande ordning
  1. att
  2. det
  3. och

  4. jag
  5. som
  6. i
  7. inte
  8. en

Lite skrämmande att "inte" klämt sig i topp tio. Det får det bli ändring på. Negerande ord är väl inget roliga?

Jag är medveten om att jag iom att nämna orden från januari i februaris planhalva bråkar till statistiken. Men förhoppningsvis drunknar de vanliga orden i den ordinarie ordmängden. Fast lite illa känns det ju att hjälp innehavaren av plats åtta på traven.

Visst är det lite spännande med statistik? Jag har tre års träningsdata på tre olika format som jag tänkte försöka få tid att först och främst få över på ett och samma format, och sen gå igenom och leka statistik med den. Sen kan Bosse Hansson slänga sig i väggen...

Inga kommentarer: