הסבר על ההיסטוגרמות

אנונימי

הסבר על ההיסטוגרמות

שליחה על ידי אנונימי »

דף מערכת

אז מה זה ההיסטוגרמות האלה? האמת היא שזה לא מאד מסובך, אבל צריך איזה רגע מחשבה לפני שמבינים כמה זה פשוט. לרוב האנשים נופל האסימון בערך אחרי שתייםשלוש דקות, ואז הם אומרים "זה באמת לא מסובך". אבל, צריך את השתייםשלוש דקות האלה, אז קחו נשימה ארוכה, ובואו נצלול...

היסטוגרמה של התפלגות הדפים

היסטוגרמה היא טבלה שמתארת התפלגות. הטבלה הבאה מתארת התפלגות של דפים באתר לפי כמות הצפיות בהם. לדוגמא, נניח שסך כל הצפיות באתר הוא 1000, ושיש באתר 200 דפים. אז אם בכל דף היו 5 צפיות, היינו אומרים שההתפלגות היא אחידה, או במלים אחרות שהצפיות מתפלגות באופן אחיד בין הדפים באתר. אבל ברור שיש דפים יותר נצפים מאחרים, כלומר שהדפים הכי נצפים ירכזו את רוב הצפיות באתר, ואילו שאר הדפים יקבלו כמות קטנה בהרבה של צפיות.

כאשר מעט דפים מרכזים את רוב הצפיות, זה אומר שרוב הפעילות באתר מתרכזת במעט דפים. לדוגמא, אם יש באתר 200 דפים אבל 90% מהצפיות מתרכזות בחמישה דפים מתוכם אז רוב האתר כמעט לא פעיל. מצב כזה הוא לא כל כך טוב כי האנשים שכתבו בחלקים הלא-נצפים של האתר לא מקבלים התייחסות לדבריהם, ואילו הצופים לא נחשפים לרוב האתר ומשתעממים מאותם הנושאים שעולים שוב ושוב ב-מה חדש. ההיסטוגרמה מאפשרת לראות אם זה אכן המצב:

[<-stats.pl?table=TITLEHIST&format=inline]

כל שורה בהיסטוגרמה מתארת קבוצה של עשרה אחוזים מהצפיות באתר. עמודת כמות הדפים מתארת כמה דפים מרכזים ביחד את עשרת האחוזים האלה מסך כל הצפיות. לדוגמא, אם היו באתר 1000 צפיות בסך הכל, אז כל עשירון כולל 100 צפיות. העשירון העליון (בשורה העליונה) סופר את כמות הדפים הכי נצפים שביחד מרכזים 100 צפיות. העשירון השני (בשורה השניה) סופר את כמות הדפים הכי נצפים שלא נספרו בעשירון העליון ושמרכזים ביחד עוד 100 צפיות. וכן הלאה.

בעמודה כמות מצטברת מופיע בכל שורה הסכום של כל העשירונים שמעליה. לדוגמא, בשורה השלישית מופיע בעמודה זו מספר הדפים הנצפים-ביותר שמרכזים ביחד 30% (בערך שליש) מהצפיות באתר.

היסטוגרמה של התפלגות הכותבים

בקהילה וירטואלית כמו שלנו יש בדרך כלל קבוצה קטנה יחסית של כותבים, וקבוצה גדולה בהרבה של צופים. גם אצלנו יש כאלה שהם צופים -- חלקם אפילו צופים קבועים -- שפשוט לא כותבים באתר. יכול להיות שזה בגלל שאין להם מה להוסיף על הכתוב, או בגלל שהם חוששים מחשיפה, או אולי בגלל שהמחשב שלהם יודע להציג עברית אבל לא לכתוב בה. תהה הסיבה אשר תהה, הצופים האלה הם חלק אינטגרלי מהקהילה שלנו. ולעתים, אחד או אחת מהם עושים את הצעד הנוסף וכותבים משהו. לפעמים זה נגמר בזה, ולפעמים הם ממשיכים אחר כך עוד. ככה הקהילה גדלה.

אותנו מעניינים הצופים הללו, ואנחנו מיד נחזור אליהם בטבלה השלישית בדף זה. אבל לפני זה נבדוק תחילה את ההיסטוגרמה של התפלגות הכותבים באתר:

[<-stats.pl?table=AUTHORNAMEHIST&format=inline]

כל שורה בטבלה מייצגת עשירון של שינויים. שינויים כוללים: הוספה לדף, עריכה של דף, פתיחת דף חדש, וכן הלאה. השורה הראשונה מייצגת את הדפים-הכי-משתנים באתר -- כמות הדפים שמרכזים ביחד 10% מהשינויים באתר. בשורה השניה יש את קבוצת הדפים הבאה מבחינת כמות השינויים בהם -- שוב כמות דפים שמרכזים ביחד עוד 10% מהשינויים באתר. וכן הלאה.

שימו לב שבראש הטבלה יש שדה נגלל שמאפשר לשנות את הנתונים שמציגה הטבלה. אם לדוגמא, אתם מתעניינים ב-עריכה (להבדיל מ-סך השינויים), כלומר אתם מעוניינים לראות את התפלגות הכותבים לפי כמות העריכה שהם עשו, אז פשוט בחרו עריכה מתוך השדה הנגלל, והטבלה תציג את ההתפלגות המתאימה.

שדה אחד אי-אפשר להציג בהיסטוגרמה הזו: צפיות. על אף שהשדה הזה קיים בשתי ההיסטוגרמות האחרות, בהיסטוגרמה של הכותבים הוא לא נכלל. למה? הסיבה היא מדיניות האתר לגבי שמירה על פרטיות: התחייבנו לא להפר את פרטיות המשתמשים באתר על ידי ניתוח דפוסי השימוש שלהם. עכשיו, נתוני הכתיבה והעריכה באתר זמינים לכולם בכל עת, פשוט על ידי עיון ב-מה חדש (אפשר גם לראות נתונים היסטוריים של מה חדש על ידי שימוש באפשרויות השונות הכלולות בו); אבל הדפים שבהם צפו הכותבים השונים הם סיפור שונה לגמרי -- את זה אי-אפשר לגלות בשום אמצעי פתוח. ולכן כל הנתונים הסטטיסטיים לגבי כותבים אינם כוללים נתוני צפיה.

היסטוגרמה של התפלגות הצופים

ככל שהיחס בין כמות הכותבים באתר לכמות הצופים בו קטן יותר, כך האתר הוא פחות "מאוזן". כלומר, יש יותר צופים על כל כותב. בהרבה אתרים מקובל היחס של 1:10 -- על כל כותב יש עשרה צופים. אצלנו הנתונים יותר טובים בדרך כלל:

[<-stats.pl?table=UIDHIST&format=inline]

שימו לב שגם הכותבים מופיעים בין הצופים, לכן הסך הכל כאן תמיד יהיה גדול יותר מהסך הכל בטבלה הקודמת.

זהו, אני מקווה שהבנתם, אבל גם אם לא -- לא נורא. תנסו יום אחד להסביר לי על הילות וצבעים של אנרגיות ותראו מה זה חוסר הבנה. :-)

ראו גם: סטטיסטיקה בצ'יק צ'ק, הסבר על הסטטיסטיקה.
אברם*
הודעות: 1
הצטרפות: 07 דצמבר 2002, 21:39

הסבר על ההיסטוגרמות

שליחה על ידי אברם* »

שאלה:אני למדתי שהיסטוגרמה היא בעצם גרף עמודות שבו בשני הצירים יש משמעות לעובי(ולכן אפשר ממש לחשב את השטח של עמודה) האם זה מדוייק והאם אפשר לראות דוגמא לזה?
רועי_שרון*
הודעות: 1691
הצטרפות: 13 יוני 2001, 18:34
דף אישי: הדף האישי של רועי_שרון*

הסבר על ההיסטוגרמות

שליחה על ידי רועי_שרון* »

כן, גם אני למדתי אותו דבר. ההיסטוגרמות של צ'יק צ'ק עדיין לא מוצגות בצורה גראפית, אבל העקרון דומה. רוחב כל עמודה הוא 10%, והגובה הוא המספר הנבדק. לדוגמא, בהיסטוגרמה של התפלגות הצופים (האחרונה בדף זה) גובה כל עמודה הוא מספר הצופים. כך כשתיבת הבחירה בראש הטבלה אומרת צפיה, האחוזים (כלומר, הציר האופקי, ציר ה-X) נמדדים ביחס לכלל הצפיות שהיו באתר. לכן העמודה הראשונה בגרף (כלומר, השורה הראשונה בטבלה) אומרת את מספר הצופים שבצעו 10% מהצפיות באתר. העמודה השניה (השורה השניה) אומרת את מספר הצופים שבצעו את ה-10% הבאים מהצפיות באתר. וכו'.
שולמית_ש*
הודעות: 147
הצטרפות: 20 מאי 2002, 11:23
דף אישי: הדף האישי של שולמית_ש*

הסבר על ההיסטוגרמות

שליחה על ידי שולמית_ש* »

כמות דפים לפי עשירוני: חדש - מה המשמעות? הרי לא ניתן לספור מהם הדפים שהיו "חדשים" הכי הרבה פעמים, שכן כל דף היה חדש רק פעם אחת. לא כך? או שלא הבנתי...
יונת_שרון*
הודעות: 8089
הצטרפות: 13 יוני 2001, 02:23
דף אישי: הדף האישי של יונת_שרון*

הסבר על ההיסטוגרמות

שליחה על ידי יונת_שרון* »

ואכן ההתפלגות במקרה זה היא אחידה.
שליחת תגובה

חזור אל “כינויים ואנשים באתר”