چگونه تجزیه و تحلیل کلان داده اقتصاد ما را تغییر خواهد داد
چگونه تجزیه و تحلیل کلان داده اقتصاد ما را تغییر خواهد داد
در دنیایی سریع و مبتنی بر فناوری که خریداران میتوانند هر چیزی از پیتزا گرفته تا پورشه را بهصورت آنلاین سفارش دهند، در حالی که همزمان حسابهای توییتر، فیسبوک و اینستاگرام خود را با یک بار کشیدن تلفن هوشمند خود بهروزرسانی میکنند، جای تعجب نیست که مجموع دادههای بالقوه مفید در جهان با جهش و محدودیت در حال رشد است.
در واقع، طبق گفته IBM، انسان هر روز 2.5 کوینتیلیون بایت داده تولید می کند. پردازش چنین حجم زیادی از داده ها به دلیل حجم و پیچیدگی فوق العاده دشوار است، بنابراین چیزی را ایجاد می کند که به عنوان "داده های بزرگ" شناخته می شود.
تا سال 2009، تخمین زده شد که کسبوکارها در تمام بخشهای اقتصاد ایالات متحده با 1,000 کارمند یا بیشتر، تقریباً 200 ترابایت داده ذخیرهشده تولید میکنند که به طور بالقوه میتواند مفید باشد.
تجزیه و تحلیل کلان داده برای بهبود رشد در هر بخش
اکنون که دادههای فراوانی در اطراف وجود دارد، کسبوکارها و شرکتها و بخشهای مختلف دیگر میتوانند مجموعههای دادههای مختلف را برای استخراج اطلاعات مفید ترکیب کنند.
وین هنسن، مدیر مرکز فناوری دانشجویی در دانشگاه نیوبرانزویک در سنت جان، دادههای بزرگ را به عنوان "عبارت جالبی توضیح میدهد که اکنون میتوانیم مجموعههای عظیم داده را تجزیه و تحلیل کنیم. اساساً ما دادههای شخصی، اجتماعی بیشتری را جمعآوری میکنیم. ، علمی و غیره، و اکنون قدرت محاسباتی به سرعت هایی دست یافته است که به ما امکان می دهد این داده ها را با دقت بیشتری تجزیه و تحلیل کنیم."
علاقه اصلی فناورانه هانسن در تعامل بین فناوری و فرهنگ است. او قادر است این علاقه را از طریق کلان داده کشف کند. به عنوان مثال، اطلاعات شهرهای هوشمند مانند جرم و جنایت و نرخ مالیات، جمعیت و جمعیت را می توان برای مشاهدات کلی در مورد آن شهر و فرهنگ تجزیه و تحلیل کرد.
کلان داده به روش های مختلفی تولید می شود. از سیگنال های تلفن همراه و رسانه های اجتماعی گرفته تا خرید تراکنش های آنلاین و در فروشگاه ها، داده ها به طور مداوم در اطراف ما ایجاد و تغییر می کنند. سپس این داده ها را می توان برای استفاده در آینده ذخیره کرد.
سه جنبه مهم از کلان داده وجود دارد که آن را در بازارهای مختلف مفید می کند، آنها به عنوان سه v شناخته می شوند. حجم، سرعت و تنوع حجم، اشاره به مقدار داده ای است که ایجاد می شود و می توان از آن استفاده کرد که به ترابایت و پتابایت می رسد. سرعت، به معنای سرعتی است که در آن داده ها قبل از اینکه در یک بخش خاص یا در مقایسه با سایر مجموعه های داده بی ربط شوند، به دست می آیند و پردازش می شوند. و تنوع، به این معنی که هر چه تنوع بیشتر در بین انواع مجموعه دادههای مورد استفاده وجود داشته باشد، نتایج و پیشبینیها بهتر و دقیقتر میشوند.
تجزیه و تحلیل کلان داده پتانسیل بالایی در بازارهای مختلف دارد. از آب و هوا و فناوری گرفته تا تجارت و رسانه های اجتماعی، داده های بزرگ امکان پیشبرد فروش، بهره وری و پیش بینی نتایج آتی محصولات، فروش و خدمات را دارند. امکانات بی پایان هستند.
هانسن می گوید: «فرض این است که با داده های کافی، همه چیز قابل پیش بینی می شود. می توان الگوها را آشکار کرد، روال ها را ایجاد کرد و آمارها را آشکار کرد. با چنین پیشبینیهایی تقریباً در هر بخش، مزیت رقابتی جدیدی به وجود میآید. سپس تجزیه و تحلیل کلان داده به یک جزء کلیدی در موفقیت یا شکست کسب و کار جدید و ایجاد کسب و کارهای جدید تبدیل می شود.
تصور کنید که یک کارمند در شرکتی هستید که برای یک پایگاه مصرف کننده هدف از زنان در اواخر نوجوانی تا اوایل بیست سالگی لباس طراحی می کند. آیا اگر بتوانید به سرعت و به دقت فروش بالقوه کفش های پاشنه بلند پولکی قرمز را پیش بینی کنید، راحت و سودآور نیست؟
اینجاست که تجزیه و تحلیل کلان داده ها وارد می شود. اگر بتوانید به طور موثر از همه آمارهای مرتبط استفاده کنید، مانند تعداد زنانی که کفش های پاشنه بلند پولک قرمز را به صورت آنلاین سفارش داده اند، و چند نفر در مورد آنها توییت کرده اند، یا ویدیوهایی در یوتیوب منتشر کرده اند که به کفش های پاشنه بلند قرمز اشاره می کنند، پس شما می تواند به دقت پیش بینی کند که محصول شما حتی قبل از اینکه وارد قفسه شود چقدر خوب عمل می کند.
توانایی انجام چنین پیشبینیهایی در حال تبدیل شدن به یک تقاضای فزاینده است و بنابراین توسعه تجزیه و تحلیل دادههای بزرگ نیز به همین ترتیب است.
پالس گروه PLC، یک آژانس تحقیقاتی دیجیتال در آسیا، یکی از شرکتهایی است که در حوزه دادههای بزرگ جهش کرده است. پالس قصد دارد در آینده نزدیک در این زمینه رو به رشد سرمایه گذاری های عمده ای انجام دهد. برنامه سرمایه گذاری آنها شامل توسعه یک مرکز جدید تجزیه و تحلیل داده های بزرگ در Cyberjaya است.
چنین مراکزی مسئول گردآوری تمام جریانهای تاریخ مرتبط مشتری و تجزیه و تحلیل آنها به شیوهای سریع و کارآمد به منظور کشف اطلاعات مهم، مانند الگوها و همبستگیهایی هستند که به طور بالقوه میتوانند برای کسب و کار یا اهداف مشتری مفید باشند.
هانسن میگوید: «ما میتوانیم تجزیه و تحلیل کلان دادهها را اعمال کنیم و جملات کلی را بیان کنیم.» این تعمیم ها پتانسیل بهبود هر بخش از جمله تجارت، آموزش، رسانه های اجتماعی و فناوری را دارند.
بسیاری از شرکتها دادههای مورد نیاز برای پیشبینی را دارند، اما توانایی اتصال جیبهای مختلف دادهها و تجزیه آنها را به گونهای ندارند که مفید باشند.
باب چوا، مدیر اجرایی پالس، اعتراف میکند که سرمایهگذاری کلان داده جدید آنها، معروف به پالسیت، میتواند به طور بالقوه تمرکز اصلی آنها باشد. یک حرکت مالی عاقلانه زیرا انتظار میرود بازار کلان داده در پنج سال آینده بیش از 50 میلیارد دلار رشد کند.
در سه سال آینده پالسیت قصد دارد در تجزیه و تحلیل داده های بزرگ پیشرفت کند و 200 شغل سطح بالا برای دانشمندان داده ایجاد کند. هانسن خاطرنشان میکند: «هم جمعآوری و هم تجزیه و تحلیل دادهها به مجموعههای مهارتی تخصصی نیاز دارد، بنابراین فرصتهای جدیدی باز میشود».
برای انجام این مشاغل جدید، کارکنان باید به درستی آموزش ببینند. گروه پالس همچنین قصد دارد یکی از اولین آکادمی های آموزشی برای دانشمندان داده در جهان را راه اندازی کند تا مرکز جدید تجزیه و تحلیل داده خود را همراهی کند و نیاز روزافزون به تحلیلگران داده را برآورده کند.
کلان داده ها می توانند اثرات مثبت دیگری به جز ارائه فرصت های جدید و تجربیات یادگیری بر دنیای آموزش داشته باشند. هانسن بیان میکند که رفتار دانشآموزان را میتوان از طریق دادههای بزرگ تجزیه و تحلیل کرد تا بخش آموزشی را بهبود بخشد. "در نهایت هدف استفاده از چنین داده های جمع آوری شده برای بهبود تجربه دانش آموزان [و] افزایش تعداد نگهداری است."
بین ایجاد مشاغل جدید و فرصتهای تحصیلی و پیشبینیهای بالقوه و رشد کسبوکارها، دادههای بزرگ در کنار هم چیز خوبی به نظر میرسد. با این حال، برخی از معایب و نقص هایی وجود دارد که با تجزیه و تحلیل و استفاده از چنین حجم عظیمی از اطلاعات وجود دارد.
یکی از مشکلاتی که باید به آن پرداخته شود این است که چه اطلاعاتی بازی رایگان است تا شرکتهای مختلف از آنها به عنوان مجموعه دادههای خود استفاده کنند. مسائل مربوط به حریم خصوصی و امنیت باید مورد توجه قرار گیرد. همچنین اینکه چه کسی صاحب چه اطلاعاتی است سؤالی است که باید به آن پاسخ داده شود. هنگامی که داده ها به طور مداوم ارسال و دریافت می شوند، خط بین مالکیت معنوی شخصی و قلمرو عمومی مبهم می شود.
ثانیا همه اطلاعات مفید نیستند، یا بی فایده هستند مگر اینکه به درستی تجزیه و تحلیل شوند. برخی از مجموعه های داده عملاً هیچ معنایی ندارند مگر اینکه با داده های مناسب و مرتبط ترکیب شوند. به این معنی که اگر یک شرکت به تمام داده های مورد نیاز خود و دانش نحوه یافتن و تجزیه و تحلیل صحیح آنها دسترسی نداشته باشد، داده های بزرگ اساساً وقت آنها را تلف می کند.
همچنین داده ها با سرعت نگران کننده ای در حال رشد هستند. 90 درصد از داده های جهان تنها در دو سال گذشته ایجاد شده است و این تعداد به طور پیوسته در حال افزایش است. اگر دادههای مرتبط جدید سریعتر از آنچه ما بتوانیم آنها را تجزیه و تحلیل کنیم ایجاد میشود، آنگاه تجزیه و تحلیل کلان دادهها نامربوط میشود. از این گذشته، نتایج فقط به اندازه اطلاعات مورد استفاده خوب است.