نحوه انتخاب تجسم داده مناسب

  • 2021-10-6

تجسم داده ها یکی از اجزای حیاتی تجزیه و تحلیل داده ها هستند زیرا توانایی جمع بندی مقادیر زیادی از داده ها را به طور موثر در قالب گرافیکی دارند. انواع نمودار زیادی در دسترس است که هر کدام نقاط قوت و موارد استفاده خاص خود را دارند. یکی از پیچیده ترین بخش های فرایند تجزیه و تحلیل انتخاب روش صحیح برای نمایش داده های شما با استفاده از یکی از این تجسم ها است.

در این مقاله به وظیفه انتخاب تجسم داده بر اساس نوع وظیفه ای که می خواهید انجام دهید می پردازیم.

نقش های مشترک برای تجسم داده ها عبارتند از:

  • نمایش تغییر در طول زمان
  • نمایش یک ترکیب بخشی به کل
  • بررسی چگونگی توزیع داده ها
  • مقایسه مقادیر بین گروه ها
  • مشاهده روابط بین متغیرها
  • نگاهی به داده های جغرافیایی

انواع متغیرهای شما در حال تجزیه و تحلیل و مخاطبان برای تجسم نیز می تواند تحت تاثیر قرار دهد که نمودار بهترین در هر نقش کار خواهد کرد. بسته به این عوامل می توان از تجسم های خاصی نیز برای اهداف مختلف استفاده کرد.

نمودارهایی برای نشان دادن تغییر در طول زمان

یکی از رایج ترین برنامه ها برای تجسم داده ها دیدن تغییر مقدار برای یک متغیر در طول زمان است. این نمودارها معمولا در محور افقی زمان دارند و از چپ به راست حرکت می کنند و متغیر مقادیر مورد نظر در محور عمودی است. روش های مختلفی برای رمزگذاری این مقادیر وجود دارد:

bar-chart-and-line-chart

    مقدار رمزگذاری شده توسط ارتفاع میله ها از یک خط پایه. مقدار رمزگذاری شده توسط موقعیت های عمودی نقاط متصل به بخش های خط. این مفید است که یک پایه است معنی دار نیست, و یا اگر تعداد میله خواهد بود قریب به اتفاق به طرح.
  • هر مجموعه جعبه و سبیل می تواند نشان دهد که رایج ترین مقادیر داده در کجا قرار دارند.
  • تعدادی از انواع نمودارهای تخصصی برای حوزه مالی مانند نمودار شمعدان یا نمودار کاگی وجود دارد.

نمودارهایی برای نمایش ترکیب بخشی به کل

گاهی, ما نیاز به دانستن نه تنها یک کل, اما اجزای که شامل که کل. در حالی که نمودار های دیگر مانند یک نمودار میله ای استاندارد را می توان مورد استفاده برای مقایسه مقادیر اجزای, نمودار زیر تجزیه بخشی به کل در خط مقدم قرار:

Pie charts and stacked area charts are among the chart types that can be used to show part-to-whole comparisons.

  • نمودار پای و نمودار دونات پسر عموی کل را با یک دایره نشان می دهد که توسط برش ها به قطعات تقسیم می شود.
  • یک نمودار میله ای انباشته با تقسیم هر میله به چند میله فرعی نمودار میله ای را تغییر می دهد و یک ترکیب بخشی به کل را در هر نوار اصلی نشان می دهد.
  • به طور مشابه, یک نمودار منطقه انباشته تغییر نمودار خط با استفاده از سایه زیر خط به تقسیم کل به مقادیر زیر گروه.
  • یک میزبان از دیگر انواع نمودار پیچیده تر نیز توسعه یافته اند برای نشان دادن روابط سلسله مراتبی. اینها شامل طرح و نقشه درختی ماریمکو است.

نمودارهایی برای بررسی نحوه توزیع داده ها

یکی از کاربردهای مهم برای تجسم نشان دادن نحوه توزیع مقادیر نقاط داده است. این امر به ویژه در طول فرایند اکتشاف مفید است, هنگامی که در تلاش برای ایجاد درک درستی از خواص از ویژگی های داده.

Histograms and box plots are among the chart types that can be used to show distributions in data values.

    زمانی استفاده می شوند که یک متغیر کیفی باشد و تعدادی از مقادیر گسسته را بگیرد.
  • هیستوگرام زمانی استفاده می شود که یک متغیر کمی باشد و مقادیر عددی را بگیرد.
  • همچنین می توان از منحنی چگالی به جای هیستوگرام به عنوان تخمین هموار از توزیع اساسی استفاده کرد.
  • یک طرح ویولن توزیع مقدار عددی بین گروه ها را با ترسیم منحنی چگالی برای هر گروه مقایسه می کند.
  • طرح جعبه روش دیگری برای مقایسه توزیع بین گروه ها است اما با خلاصه ای از ارقام به جای شکل توزیع تخمینی.

نمودارهایی برای مقایسه مقادیر بین گروه ها

یکی دیگر از برنامه های بسیار رایج برای تجسم داده ها مقایسه مقادیر بین گروه های مجزا است. این است که اغلب با نقش های دیگر برای تجسم داده ترکیب, مانند نشان دادن تغییر در طول زمان, و یا به دنبال در چگونه داده ها توزیع شده است.

dot-plots-grouped-bar-chats

  • نمودار میله ای مقادیر بین گروه ها را با اختصاص یک نوار به هر گروه مقایسه می کند.
  • نمودار نقطه را می توان به طور مشابه استفاده, به جز با ارزش نشان داده شده توسط موقعیت نقطه به جای طول نوار. این مانند یک نمودار خطی با حذف بخشهای خط است و 'اتصال' بین نقاط متوالی را از بین می برد. همچنین مانند یک نمودار خط, یک طرح نقطه مفید است که از جمله پایه عمودی نمی خواهد معنی دار.
  • از نمودار خطی می توان برای مقایسه مقادیر بین گروه ها در طول زمان با ترسیم یک خط در هر گروه استفاده کرد.
  • نمودار میله ای گروه بندی شده امکان مقایسه داده ها را در دو متغیر گروه بندی مختلف با رسم چندین نوار در هر مکان و نه فقط یک مورد فراهم می کند. و نمودارهای جعبه ای برای مقایسه توزیع داده ها بین گروه ها استفاده می شود.
  • نمودار قیف یک نمودار تخصصی برای نشان دادن چگونگی حرکت مقادیر از طریق یک فرایند مانند ردیابی تعداد بازدیدکنندگان از نمایش یک تبلیغ تا خرید نهایی است.
  • نمودارهای گلوله یکی دیگر از نمودارهای تخصصی برای مقایسه یک مقدار واقعی با یک یا چند معیار است.
  • یک زیرمجموعه از نمودارها از مقایسه مقادیر بین گروه ها برای چندین ویژگی حاصل می شود. نمونه هایی از این نمودارها شامل طرح مختصات موازی (و مورد خاص طرح شیب) و طرح دمبل است.

نمودارهایی برای مشاهده روابط بین متغیرها

وظیفه دیگری که در اکتشاف داده ها نشان داده می شود درک رابطه بین ویژگی های داده است. از انواع نمودار زیر می توان برای ترسیم دو یا چند متغیر در برابر یکدیگر برای مشاهده روندها و الگوهای بین خود استفاده کرد.

Scatter plots and heatmaps are among the chart types that can be used to show distributions in data values.

  • نمودار پراکندگی روش استاندارد نشان دادن رابطه بین دو متغیر است.
  • قطعه پراکنده همچنین می توانید به متغیرهای اضافی با اضافه کردن رنگ گسترش یافته است, شکل, یا اندازه به هر نقطه به عنوان شاخص, همانطور که در یک نمودار حباب .
  • هنگامی که یک متغیر سوم نشان دهنده زمان, نقاط در یک طرح پراکندگی را می توان با بخش های خط متصل, تولید یک طرح پراکندگی متصل .
  • گزینه دیگر برای متغیر سوم زمانی یک نمودار دو محوره مانند ترسیم نمودار خطی و نمودار میله ای با یک محور افقی مشترک است.
  • هنگامی که یک یا هر دو متغیر در حال مقایسه هستند عددی نیست, یک نقشه حرارتی می تواند رابطه بین گروه ها را نشان دهد. نقشه های حرارتی همچنین می توانند برای داده های کاملا عددی مانند هیستوگرام 2 بعدی یا منحنی چگالی 2 بعدی استفاده شوند.

نمودارهایی برای بررسی داده های جغرافیایی

گاهی اوقات داده ها شامل داده های جغرافیایی مانند طول و عرض جغرافیایی یا مناطقی مانند کشور یا ایالت است. در حالی که رسم این داده ها فقط ممکن است گسترش تجسم موجود بر روی یک پس زمینه نقشه (به عنوان مثال رسم نقاط مانند در یک طرح پراکنده در بالای یک نقشه), انواع نمودار دیگر که دامنه نقشه برداری را به حساب وجود دارد. دو مورد از این موارد در زیر برجسته شده است:

بستن افکار

انتخاب نمودار مناسب برای شغل بستگی به نوع متغیرهایی دارد که می خواهید مشاهده کنید و اینکه از چه چیزی می خواهید خارج شوید. موارد فوق فقط یک دستورالعمل کلی است: این امکان وجود دارد که خروج از حالت های استاندارد به شما کمک کند بینش بیشتری کسب کنید. نه تنها انواع مختلف نمودار بلکه نحوه رمزگذاری متغیرها در هر نمودار را نیز تجربه کنید. همچنین خوب است به خاطر داشته باشید که شما محدود به نشان دادن همه چیز فقط در یک طرح نیستید. اغلب بهتر است برای حفظ هر طرح فردی به عنوان ساده و روشن که ممکن است, و به جای استفاده از قطعه های متعدد را به مقایسه, روند نشان می دهد, و نشان دادن روابط بین متغیرهای متعدد.

برای راهنمای مرجع دستی با انواع نمودار های اضافی و اطلاعات بیشتر از زمانی که باید مورد استفاده قرار گیرد, چک کردن کتاب رایگان ما, چگونه به انتخاب تجسم داده ها راست.

  • نویسنده : شهره سلطانی
  • منبع : creation-site-internet-angers.tech
  • بدون دیدگاه

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : ۰
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.