په ډاټا یا ارقامو کې د عددونو پیژندنه/۴

عزت‌الله ادیب

438

د پدیدو د ښې پيژندې لپاره یوازې ارقام تفصیل او دقت رامنځته کوي.

  • ولې عدد یا ریاضیکي ډاټا مهمه ده؟
  • د ډاټا منځنی یا مرکزي تمایل څه ته ویل کیږي؟
  • د ډاټا خپراوی یا تیتوالی څه شی دی؟
  • ډاټا د ګراف په شکل کې څنګه پیژندل کیږي؟
  • کوم عام ګرافونه ډير کارول کیږي؟

که د کمي تحقیق له دوربین ورته وګورو نو ویلی شو چې ډاټا یانې عددونه او ارقام، خو اطلاعات د خلکو یا شیانو مجموعي یا ګډ تعریف یا تشریح ته ویل کیږي. نوموړی تعریف یا تشریح کیدای شي د عکس، سند، ضبط شوي یا ثبت شوي سند، ویډیویي او یا هم په غږیزه بڼه اوسي، خو ارقام د خلکو او شیانو په اړه د نویو پدیدو په پیژندلو کې خاص ځای لري، نو ځکه پرې پوهیدل اړین او لازمي دي.

ټکنالوژي، له کمپیوټر، انټرنټ، د حساب ماشین بیا تر مبایل ټول د ارقامو او کوډونو په مرسته چلیږي، چې دا ټول وسایل د خلکو او شیانو مربوط د ډيرې مهمې او نادرې ډاټا په راټولولو کې خورا مهم رول لوبوي. کله چې تاسو فیسبوک یا هم بله ټولنیزه پاڼه پرانیزی نو ستاسو د هر پوسټ، تبصرې، لایک او …. په اړه د ارقامو او کوډونو په زور اطلاعات ریکارډ کیږي. له همدې ځایه د هر انسان د شخصیت او فکر په اړه په اتومات ډول ټول مالومات د دې شبکو د مسولینو ډیټابیس ته لیږل کیږي. او دې شیانو د خلکو او ان ادارو په اړه د ارقامو راټولولو کار خورا اسان کړی دی.

همدا ډول، په یوه سیمه یا هیواد کې د ارقامو او ټکنالوژي پر مټ داسې څیړنه او تحلیل ترسره کیدای شي تر څو مالومه کړي چې د یو مشخص هیواد، سیمې، یا ادارې او یا هم ژبې خلک په ټولنیزو شبکو کې د کومو موضوعاتو په اړه ډير بحث او تبصرې کوي، کوم موضوعات ډير څیړل کیږي، او خلک کوم موضوعات ډير خوښوي.

خو ارقام هم، لکه نور هر ډول اطلاعات او ډاټا، کیدای شي لوړ او ټیټ یا ضعیف کیفیت ولري، یا کیدای شي په سمه توګه او یا هم په ډيره ناوړه توګه وکارول شي. که موږ هر څومره ډيرې ډاټا یا ارقامو ته لاسرسی هم ولرو، خو تر څو نوموړي ارقام یا ډاټا ونه پیژنو، او د کارولو هنر یې ونلرو، نو هیڅکله کولی نشو چې سمه ګټه دې ترې واخیستلی شو.

د سروې یا تحقیق او تحلیل په برخه کې به تاسو له ډيرو اصطلاحاتو سره مخ شی، د مثال په ډول عاید، قومیت، د نفوس اندازه، او کله کله به ورته د متغیر یا عامل (د متغیر پيژندنې په اړه بیله مقاله نشروو) نوم ورکول شوی وي، یا به کله دا انفرادي شیان یا خلک دمشاهدې/ملاحظې او یا د کېس (ګر) په نومونو یادول کیږي، نو لازمه دا ده چې هر ډول اصطلاحات سم وپيژندل شي.

کله کله دا ډول اصطلاحات یو ډول نه کارول کیږي، نو ځکه لازمه ده چې لومړی دا موارد وپیژنو او لنډ تعریف یې هم ولیکو:

  • کېس (Case): هغه شی، مورد یا شخص دی چې اندازه کیږي، دلته له اندازې هدف څيړل دي، (لکه په افغانستان کې یو بالغ شخص)
  • متغیر یا عامل (Variable): هغه ځانګړتیاوې دي چې څیړل کیږي ( لکه په تیرو ولسمشریزو ټاکنو کې دوی څنګه رایه ورکړه)
  • مشاهدات (Observation): د څیړنو پایله ده (لکه اشرف غني ته یې رایه ورکړه)
  • ارزښت یا قیمت (Values): د پایلو هغه اندازه/فیصدي تشریح کوي چې هرې برخې ته رسیږي (لکه، اشرف غني، عبدالله، یا باطلې رایې)

په نني عصر کې، ډاټا (په خاصه توګه عدد یا ارقام) د ژوند په هره برخه کې د ستونزمنو پدیدو د پیژندلو او یا د نویو پدیدو د موندلو په برخه کې ډيره مرسته کوي، او زموږ کارونه اسانه کوي. که چیرته د یو څو متعددو شیانو په اړه بحث کول وي، نو دا خورا اسانه ده چې له خپل قاموس څخه مختلف خواږه یا ترخه الفاظ راټول او د هغه شي یا شیانو د تشریح لپاره یې وکاروو، خو که چیرته دا شیان یا خلک په درجنو یا څو ملیونه وي، بیا نو یوازې ارقام دي چې پر مټ یې خپل هدف تر لاسه کولی شو. د مثال په ډول، په افغانستان کې د خلکو پر ټولنیز ژوند  او کلتور د کرونا اغیزې، یا هم د اوسني نظام د تعلیم او تحصیل د پالیسي په اړه د خلکو نظریات، او یا هم په افغانستان کې د یو کال په دروان کې ورکړل شویو بډو اندازه مالومول، دا او دې ته ورته د هر څه موندل یوازې د ارقامو پر مټ ممکن دي.

شخصي تجربه: موږ په ۲۰۱۸م او ۲۰۲۰م کال کې حکومتي مسولینو ته د خلکو لخوا د ورکړل شوې بډې اندازه وښوودله، نو حکومت او ځینې ویاندویانو په اساني سره دا ویل چې آیا دې خلکو د بډو لپاره کوم بانکي حساب پرانیستی چې داسې دقیق رقم وړاندې کوي، خو دوی له دې خبر نه وو چې هغه د څيړنو پر مټ هغه تعمیم شوی رقم وي چې د تیروتنې او اعتماد خپله اندازه لري، خو په ټوله کې رقم رد کیدای نشي.

او یا به مو کله چې د تحلیل پرمختللي احصائیوي میتودونه وکارول نو د پالیسي جوړونکو لپاره به په هغه راپورونو پوهیدل یو څه ستونزمن وو، او په دې برخه کې هغوی هیڅ ملامت نه وو، ځکه دوی په ریاضیاتو او احصائیه هومره چې لازمه وه نه پوهیدل او یا یې سر نه پرې خلاصیده، خو موږ تل هڅه کوله چې تحلیل مو ساده او د لوستونکو د پوهې د کچې سره سم وړاندې او تشریح کړو.
کله کله عددونه یا ارقام ډارونکي وي، خصوصآ هغه مهال کله چې څوک ترې لرې پاتې وي، لوستي یې نه وي، او یا عددونه ونه پیژني، نو پوهیدل پرې ستونزمن شي، او په مقابل کې یې عکس العمل را پاریږي چې کله خو ان په اساني سره رد کیږي. خو نن صبا لازمه نده چې د ریاضي یا عددونو په برخه کې لوړې زدکړې یا خاص مهارت ولری بلکه د لږ زدکړو او یو څه ټکنالوژي پر مټ هم کولی شی د خپل ضرورت وړ کار ترې واخلی، خو پرې پوهیدل خورا اړین دي.

اوسط یا منځنی تمایل څه شی دی؟

اوسط یا منځنی تمایل د ارقامو اسانه خلاصه ده، په اساني پرې پوهیدای شو، او هدف یې هم ډير واضح دی، خو له مختلفو نومونو سره یې اشنایي مهمه او لازمي ده. مرکزي تمایل یا اوسط د ډاټا یا ارقامو منځنۍ عدد دی چې ددې ټولې ډاټا منځنۍ نقطه را ښیي. احصائیه چې د تحقیقي ژوند په هره برخه کې ډيره کارول کیږي، یو څه پوهیدل پرې لازمي دي او دلته هڅه شوې چې ځینې نوي او علمي نومونه وپیژنو او په اسانه او ساده ژبه یې تشریح کړو. لکه منځنی تمایل، اوسط او نور.

د اوسط په برخه کې له څو ډوله مقدارونو څخه کار اخیستل کیږي:

اوسط چې ډير خلک یې میین هم بولي: هغه منځني عدد ته ویل کیږي چې د مشاهدو مقدار په دوو برابرو برخو ویشي.  د مثال په ډول، د ټولو مشاهدو عددونه سره جمع کیږي او بیا د مشاهدو پر شمیر تقسیم کیږي. د مثال په ډول، د دعوت میډیا دفتر خپلو لسو کارمندانو ته د میاشتې مختلف معاش ورکوي، د پنځو تنو معاشونه سره جمع کیږي او په دې ګروپ کې د مشاهدو پر شمیر، چې پنځه کسان دي تقسیم کیږي چې حاصل یې اوسط بلل کیږي.
کله د دې اوسط ډاټا د ګروپ یا بنډل په شکل هم ښوودل شوې وي چې د ریاضي یا احصائیې په کتابونو کې یې په اړه زیات تفصیل لیکل شوی دی. همدا ډول، په ځینو حالتونو کې هندسي او هارمونیک اوسط هم کارول کیږي.

دوهم میډیان: د میډيان محاسبه کول هم ستونزمن کار نه دی، بلکه د یوې نمونې ټول اجزا له کوچني څخه تر لوی ترتیب کیږي او د منځ عدد یې میډیان بلل کیږي، یانې هغه عدد چې نیمایي عناصر تر هغه لوی او نیمایي ترې کوچني وي. که د نمونې اجزا مو تاق وي خو ستونزه نشته هماغه یواځینی عدد مو میډیان غوره کیږي، خو که عددونه مو جفت وي، بیا د منځ دوه عددونه انتخاب او د همدې دوو عددونو میین یانې اوسط پیدا کیږي چې د میین حاصل مو میډیان بلل کیږي.

دریم موډ: د نمونې ترمنځ هغه اجزا یا عناصرو ته وایي چې په یوه ډاټا کې ډير تکرار شوي وي، او یا کیدای شي یو یا دوه ځله تکرار شوي وي. او دا هم ممکنه ده چې یوه ډاټا دې هیڅ موډ ونلري. کله چې ډاټا کتل کیږي، نو موډ په ګراف کې په اساني سره تر سترګو کیږي.

په ډاټا کې تیتوالی: تیتوالی چې په عربي کې یې تشتت او په فارسي کې ورته پراګندګي ویل کیږي. تیتوالی په ډاټا کې مرکزیت (اوسط یا میډیان) ته د مشاهداتو د نژدیوالي یا لرېوالی څرګندونه کوي. په ډاټا کې تیتوالی د فاصلې، معیاري انحراف یا تفاوت پر مټ محاسبه او موندل کیږي. د تیتوالي د محسابې پرمهال کیدای شي څیړونکی د هغه عددونو په اړه هم فکر وکړي چې د عادي او نورمال عددونو له ساحې څخه د باندې وي چې په انګلیسي کې ورته اوټ‌لایر Outlier ویل کیږي. اوټ‌لایر هغه عدد دی چې د ډاټا د نورمال عددونو له ساحې څخه د باندې او له نورمال عددونو څخه ډير متفاوت عددونه وي.

د مثال په ډول: په افغانستان کې د یو محصل د هرې ورځ د غرمنۍ مصارف نورمال ۶۰ تر ۸۰ افغانۍ کیږي، خو یوه ورځ دا مصارف ۱۶۰ افغانۍ ښوودل کیږي، نو دا عدد چې د نورمال عددونو له ساحې څخه د باندې دي اوټ‌لایر بلل کیږي، او یا کیدای شي کومه ورځ یوازې ۱۰ افغانۍ مصرف وي. او همدا ډول نور مثالونه یې داسې ښوودای شو، که په افغانستان کې د خلکو د قد په اړه فکر وکړو، نو اکثر خلک یو ډول یا هم اوسط ته نژدې قد لري خو یو کوچنۍ ګروپ بیا ډير لوړ یا ډير ټیټ قد لري، او یا په بل عبارت، د یوې ادارې کارکونکي اوسط ته نژدې معاش تر لاسه کوي خو یو کس یا څو کسان ډير لوړ معاش تر لاسه کوي چې د اوسط معاش څو چنده وي، او یا ځینې کسان تر اوسط څو چنده ټیټ معاش تر لاسه کوي، نو دا عددونه د نورمال ساحې څخه د باندې دي.

د نورمال عددونو له ساحې څخه باندیني عددونه ځانګړې پاملرنه غواړي تر څو څیړونکی په دې پوه شي چې دا عددونه له کومه راغلي دي، یا ولې له نورمال عددونو څخه متفاوت دي او یا کیدای شي د لیکلو یا کمپیوټر ته د ارقامو د داخلولو پر مهال کومه غلطي شوې وي، نو لازمه ده چې خاصه پاملرنه ورته وشي. څیړونکی باید دا عددونو بیا وګوري او په اړه یې فکر وکړي، خو که چیرته دا سم عددونه وي، یانې په لیکلو کې یې غلطي نه وي موجوده نو دوه حالتونه دي، لومړی دا چې دا عددونه د تحلیل له پروسې څخه ایستل کیږي، او دوهم دا چې تحلیل کیږي، خو لازمه دا ده چې باید تحلیل کړای شي.

لکه په تیرو مقالو کې مو چې ولوستل، کله په کیفي ډاټا کې ورته مالومات موجود وي چې د هغه لپاره ځانګړی کوډ جوړیږي، او له نورو متغیراتو سره یې اړیکه څيړل کیږي. او کله خو نوموړی خارجي عدد دومره په زړه پورې وي چې څيړونکی د ډاټا د راټولولو او تحلیل د لومړی مرحلې څخه وروسته دوهم ځل ډاټا راټولوي او تحلیل کوي یې، نو ځکه دا عددونه مهم رول لري.

په ګراف کې د ډاټا پیژندنه

په ګراف کې د ډاټا پېژندنه او یا ډاټا د ګراف په شکل ښوودل، دا دواړه خورا مهم مهارتونه دي چې باید څيړونکی یې ولري او په دې کار یې ښه سر خلاص وي، خو تر دې وړاندې پخپله د ګراف او ډولونو پیژندل یې هم مهم دي، او دا چې کوم ډول ګراف څنګه کارول کیږي یا کوم ډول ډاټا د کوم ګراف په شکل ښوودل کیږي.

هر ډول ګراف په ډاټا کې د ارقامو په تناسب د سایز یا اوږدوالي په شکل ښوودل کیږي، یانې د ګراف لپاره کیدای شي ارقام او یا د ارقامو خلاصه وکارول شي، لکه د اوسط، ربع/چارک یا لسنې او سلنې اندازه. پر ګراف د پوهیدو لپاره لومړی لازمه ده چې عنوان یې وکتل شي او بیا ډاټا ته پام وشي چې د څه په اړه ده، څومره ده او داسې نور.

هر ګراف پر دوو محورونو پروت وي، افقي محور چې دX  محور یې بولي، او عمودي محور چې د Y محور یې بولي. د ګراف عنوان او د هر محور تشریح باید د ګراف په اړه بشپړ مالومات وړاندې کړي، او کله ګرافونه په څنګ کې علامو د تفصیل چوکاټ لري چې د هر رنګ او کوډ په اړه مالومات پکې لیکل شوي وي، دا چوکاټ باید په پوره دقت سره ولوستل شي.

یوه مهمه پوښتنه دا ده چې آیا یو ګراف د یو متغیر ډاټا را ښیي او که د څو مختلفو متغیرونو؟ دا ډیره ښه پوښتنه ده، او ځواب یې هم هومره ستونزمن نه دی ځکه ګراف ډير وخت د یو متغیر ډاټا او ارقام راښیي، او یا کله د یو یا څو متغیرونو د ډاټا تفصیل څرګندوي. عمومآ یو ګراف د یو متغیر څو مرحله‌ایزه ډاټا تشریح کوي، خو تر دې وړاندې د ګرافونو د ډولونو پیژندل مهم دي، ځکه ګراف له لوستونکي سره اړیکه ټینګوي او مهم مالومات وړاندې کوي.

دلته څو ډوله مختلف ګرافونه تشریح کوو:

  • پایه‌ایز یا میله ایز ګراف د متغیر دمختلفو کټګوریو پر اساس دوامداره مالومات ښکاروي:

د پایه‌ایز ګراف جګوالی یا اوږدوالی د متغیر مختلفو برخو د مشاهداتو ارقام یا تناسب او یا هم خلاصه په داسې بڼه تشریح کوي چې په اساني د پوهیدو وړ وي. د مثال په ډول، په افغانستان کې د تیرو ولسمشریزو ټاکنو پایلې د پایه‌ایز چارټ پر مټ ښوودل کیږی چې هره پایه د یو نوماند رایې ښکاره کوي. د پایه‌ایز ګراف په برخه کې ګروپي چارټ هم کارول کیږي چې د دوو متغیرونو ارقام یا خلاصه ښکاره کوي. د مثال په ډول، هر نوماند ته د مختلفو زونونو د خلکو رایې چې دلته ګروپي چارټ کارول کیږي او د مختلفو متغیرونو ډاټا ښکاره کوي. میله‌ایز چارټ کیدای شي افقي یا عمودي شکل ولري، خو مهمه دا ده چې ارقام په سمه توګه څرګند کړي او د ګراف انتخاب باید په ډیر غور سره وشي. که تاسو د ډاټا د تحلیل لپاره د مایکروسافټ ایکسل یا هم له کوم بل مسلکي سافټ‌ویر څخه کار اخلی نو هلته په اساني سره ګراف لیدلی او انتخاب کولی شی، او یا د ډاټا کیفیت ته په کتو سره سافټ‌ویر په اتومات ډول ځینې مناسب ګرافونه وړاندیز کوي چې له هغه ځای څخه یې د یو ساده کلېک په مرسته غوره کولی شی.

  • هستوگرام د یو متغیرټوله هغه ډاټا ښکاره کوي چې هر وخت د تغیر په حالت کې وي:

هستوګرام د یو متغیر ارقام د دوامداره فاصلې پر بڼه ښکاره کوي، یانې هستوګرام هغه مهال کارول کیږي کله چې څيړونکی غواړي د مشاهداتو عددونه د وخت او فاصلې پر اساس وښیي، خو د مشاهداتو تفصیل نه پرې ښوودل کیږي. ځینې خلک په هسټوګرام کې هم، لکه د پایه‌ایز چارټ، د مشاهداتو تفصیل یا فیصدي کاروي چې دا کار سم نه دی او نه هستوګرام ددې هدف لپاره ډيزاین شوی دی. د مثال په ډول، د کورنۍ د مسلسل عاید د ښوودلو لپاره هستوګرام کارول کیږي، خو که د کورنۍ د نارینه او ښځینه د عاید اوسط ښوودل وي، بیا نو پایه‌ایز چارت یا هم له ګرد/پای چارټ څخه کار اخیستل کیږي.

  • د باکس پلاټ ګراف، د یو متغیر د ارقامو خلاصه ښکاره کوي چې هر وخت د تغیر په حالت کې وي:

باکس پلاټ هم لکه د هستوګرام یوازې د یو متغیر په دوامداره توګه تغیرکونکې ډاټا څرګندوي. باکس پلاټ د ټولې ډاټا د فاصلې پر ځای د پورته او ټیټې کچې ربع یا څلورمه برخه (چارک) د باکس په شکل داسې ښيي چې یوه لکیره هم پرې راکښل شوې وي، چې هغه لکیره د ډاټا میډیان څرګندوي. باکس پلاټ هم لکه د پایه‌ایز چارټ پر ډول د ګروپي ډاټا لپاره کارول کیدای شي. لکه په څو هیوادونو کې د کارکونکو د نورمال کاري ساعتونو تفکیک چې د هیوادونو او کاري ساعتونو په تناسب ډيزاین او د مختلفو رنګونو په شکل ښوودل کیږي.   باکس پلاټ ګراف کې له ډاټا بغیر، یوازې د هر باکس ځای ته په کتلو سره په ډير څه پوهیدای شو.

  • د لاین ګراف د وخت د مودې پر اساس د یو یا دوو متغیرونو د ارقامو خلاصه څرګندوي:

د لاین ګراف د وخت په تناسب د یوې موضوع د میلان بڼه په ښه ډول څرګندوي او دا ګراف هم د سکاټرپلاټس په شکل کارول کیږي خو یوازې دومره توپیر لري چې کواردیناتس د لاین په واسطه ښوودل کیږي. په دې ډول ګراف کې هم د یو یا دوو متغیرونو ډاټا د وخت پر اساس ښوودل کیږي. د مثال په ډول، له ۱۹۵۰نه تر ۲۰۲۲ کال پورې د کابل پوهنتون د ماسټري په پروګرام کې د نارینه او ښځینه محصلینو تاریخچه چې څو تنه نارینه او څومره زنانه محصلین ترې فارغ شوي دي، او یا کیدای شي د ماسټري او دوکتورا دواړه محصلین په دې ډول ګراف کې وښوودل شي.

په افغانستان کې ډيری څيړونکي یا زدکړیالان د خپل څیړنیز کار لپاره د مایکروسافټ ایکسل څخه کار اخلي خو ډيری وخت یې ګرافونه ډير ګډوډ حالت لري، دا ځکه چې د کمپیوټر دا پروګرام یې ښه زده کړی نه وي، او یا یې خپله ډاټا سمه نه وي ترتیب کړې او یا خو د ګراف په پیژندلو او کارولو کې ستونزه لري. نو ځکه دا لازمه ده چې د هر ډول پروګرام یا سافټ‌ویر سره بلدتیا ولرو او د خپل کار لپاره یې وکاروو. اوسمهال ډيری ښه مسلکي پروګرامونه شته، لکه ایس پي ایس ایس، آر، پایتون، سټاټا او یا نور، چې د کمي تحلیل لپاره کارول کیږي.

(متغیر څه شی دی؟ متغیر پېژندنه خورا مهمه او په زړه پورې ده، نو په راتلونکې مقاله کې به متغیر وپیژنو!)

 

—————————————————————————————————–

د دعوت رسنیز مرکز ملاتړ وکړئ
له موږ سره د مرستې همدا وخت دی. هره مرسته، که لږه وي یا ډیره، زموږ رسنیز کارونه او هڅې پیاوړی کوي، زموږ راتلونکی ساتي او زموږ د لا ښه خدمت زمینه برابروي. د دعوت رسنیز مرکز سره د لږ تر لږه $/10 ډالر یا په ډیرې مرستې کولو ملاتړ وکړئ. دا ستاسو یوازې یوه دقیقه وخت نیسي. او هم کولی شئ هره میاشت له موږ سره منظمه مرسته وکړئ. مننه

د دعوت بانکي پتهDNB Bank AC # 0530 2294668 :
له ناروې بهر د نړیوالو تادیاتو حساب: NO15 0530 2294 668
د ویپس شمېره Vipps: #557320 :

Support Dawat Media Center

If there were ever a time to join us, it is now. Every contribution, however big or small, powers our journalism and sustains our future. Support the Dawat Media Center from as little as $/€10 – it only takes a minute. If you can, please consider supporting us with a regular amount each month. Thank you
DNB Bank AC # 0530 2294668
Account for international payments: NO15 0530 2294 668
Vipps: #557320

Comments are closed.