کوانتوم ران

تجزیه و تحلیل کلان داده‌ها چگونه اقتصاد ما را تغییر می‌دهد

اعتبار تصویر:

چگونه تجزیه و تحلیل کلان داده اقتصاد ما را تغییر خواهد داد

نام نویسنده
اوشن لی پیترز
نویسنده توییتر هندل
@Quantumrun

در دنیایی سریع و مبتنی بر فناوری که خریداران می‌توانند هر چیزی از پیتزا گرفته تا پورشه را به‌صورت آنلاین سفارش دهند، در حالی که همزمان حساب‌های توییتر، فیس‌بوک و اینستاگرام خود را با یک بار کشیدن تلفن هوشمند خود به‌روزرسانی می‌کنند، جای تعجب نیست که مجموع داده‌های بالقوه مفید در جهان با جهش و محدودیت در حال رشد است.

در واقع، طبق گفته IBM، انسان هر روز 2.5 کوینتیلیون بایت داده تولید می کند. پردازش چنین حجم زیادی از داده ها به دلیل حجم و پیچیدگی فوق العاده دشوار است، بنابراین چیزی را ایجاد می کند که به عنوان "داده های بزرگ" شناخته می شود.

تا سال 2009، تخمین زده شد که کسب‌وکارها در تمام بخش‌های اقتصاد ایالات متحده با 1,000 کارمند یا بیشتر، تقریباً 200 ترابایت داده ذخیره‌شده تولید می‌کنند که به طور بالقوه می‌تواند مفید باشد.

تجزیه و تحلیل کلان داده برای بهبود رشد در هر بخش

اکنون که داده‌های فراوانی در اطراف وجود دارد، کسب‌وکارها و شرکت‌ها و بخش‌های مختلف دیگر می‌توانند مجموعه‌های داده‌های مختلف را برای استخراج اطلاعات مفید ترکیب کنند.

وین هنسن، مدیر مرکز فناوری دانشجویی در دانشگاه نیوبرانزویک در سنت جان، داده‌های بزرگ را به عنوان "عبارت جالبی توضیح می‌دهد که اکنون می‌توانیم مجموعه‌های عظیم داده را تجزیه و تحلیل کنیم. اساساً ما داده‌های شخصی، اجتماعی بیشتری را جمع‌آوری می‌کنیم. ، علمی و غیره، و اکنون قدرت محاسباتی به سرعت هایی دست یافته است که به ما امکان می دهد این داده ها را با دقت بیشتری تجزیه و تحلیل کنیم."

علاقه اصلی فناورانه هانسن در تعامل بین فناوری و فرهنگ است. او قادر است این علاقه را از طریق کلان داده کشف کند. به عنوان مثال، اطلاعات شهرهای هوشمند مانند جرم و جنایت و نرخ مالیات، جمعیت و جمعیت را می توان برای مشاهدات کلی در مورد آن شهر و فرهنگ تجزیه و تحلیل کرد.

کلان داده به روش های مختلفی تولید می شود. از سیگنال های تلفن همراه و رسانه های اجتماعی گرفته تا خرید تراکنش های آنلاین و در فروشگاه ها، داده ها به طور مداوم در اطراف ما ایجاد و تغییر می کنند. سپس این داده ها را می توان برای استفاده در آینده ذخیره کرد.

سه جنبه مهم از کلان داده وجود دارد که آن را در بازارهای مختلف مفید می کند، آنها به عنوان سه v شناخته می شوند. حجم، سرعت و تنوع حجم، اشاره به مقدار داده ای است که ایجاد می شود و می توان از آن استفاده کرد که به ترابایت و پتابایت می رسد. سرعت، به معنای سرعتی است که در آن داده ها قبل از اینکه در یک بخش خاص یا در مقایسه با سایر مجموعه های داده بی ربط شوند، به دست می آیند و پردازش می شوند. و تنوع، به این معنی که هر چه تنوع بیشتر در بین انواع مجموعه داده‌های مورد استفاده وجود داشته باشد، نتایج و پیش‌بینی‌ها بهتر و دقیق‌تر می‌شوند.

تجزیه و تحلیل کلان داده پتانسیل بالایی در بازارهای مختلف دارد. از آب و هوا و فناوری گرفته تا تجارت و رسانه های اجتماعی، داده های بزرگ امکان پیشبرد فروش، بهره وری و پیش بینی نتایج آتی محصولات، فروش و خدمات را دارند. امکانات بی پایان هستند.

هانسن می گوید: «فرض این است که با داده های کافی، همه چیز قابل پیش بینی می شود. می توان الگوها را آشکار کرد، روال ها را ایجاد کرد و آمارها را آشکار کرد. با چنین پیش‌بینی‌هایی تقریباً در هر بخش، مزیت رقابتی جدیدی به وجود می‌آید. سپس تجزیه و تحلیل کلان داده به یک جزء کلیدی در موفقیت یا شکست کسب و کار جدید و ایجاد کسب و کارهای جدید تبدیل می شود.

تصور کنید که یک کارمند در شرکتی هستید که برای یک پایگاه مصرف کننده هدف از زنان در اواخر نوجوانی تا اوایل بیست سالگی لباس طراحی می کند. آیا اگر بتوانید به سرعت و به دقت فروش بالقوه کفش های پاشنه بلند پولکی قرمز را پیش بینی کنید، راحت و سودآور نیست؟

اینجاست که تجزیه و تحلیل کلان داده ها وارد می شود. اگر بتوانید به طور موثر از همه آمارهای مرتبط استفاده کنید، مانند تعداد زنانی که کفش های پاشنه بلند پولک قرمز را به صورت آنلاین سفارش داده اند، و چند نفر در مورد آنها توییت کرده اند، یا ویدیوهایی در یوتیوب منتشر کرده اند که به کفش های پاشنه بلند قرمز اشاره می کنند، پس شما می تواند به دقت پیش بینی کند که محصول شما حتی قبل از اینکه وارد قفسه شود چقدر خوب عمل می کند.

توانایی انجام چنین پیش‌بینی‌هایی در حال تبدیل شدن به یک تقاضای فزاینده است و بنابراین توسعه تجزیه و تحلیل داده‌های بزرگ نیز به همین ترتیب است.

پالس گروه PLC، یک آژانس تحقیقاتی دیجیتال در آسیا، یکی از شرکت‌هایی است که در حوزه داده‌های بزرگ جهش کرده است. پالس قصد دارد در آینده نزدیک در این زمینه رو به رشد سرمایه گذاری های عمده ای انجام دهد. برنامه سرمایه گذاری آنها شامل توسعه یک مرکز جدید تجزیه و تحلیل داده های بزرگ در Cyberjaya است.

چنین مراکزی مسئول گردآوری تمام جریان‌های تاریخ مرتبط مشتری و تجزیه و تحلیل آن‌ها به شیوه‌ای سریع و کارآمد به منظور کشف اطلاعات مهم، مانند الگوها و همبستگی‌هایی هستند که به طور بالقوه می‌توانند برای کسب و کار یا اهداف مشتری مفید باشند.

هانسن می‌گوید: «ما می‌توانیم تجزیه و تحلیل کلان داده‌ها را اعمال کنیم و جملات کلی را بیان کنیم.» این تعمیم ها پتانسیل بهبود هر بخش از جمله تجارت، آموزش، رسانه های اجتماعی و فناوری را دارند.

بسیاری از شرکت‌ها داده‌های مورد نیاز برای پیش‌بینی را دارند، اما توانایی اتصال جیب‌های مختلف داده‌ها و تجزیه آن‌ها را به گونه‌ای ندارند که مفید باشند.

باب چوا، مدیر اجرایی پالس، اعتراف می‌کند که سرمایه‌گذاری کلان داده جدید آن‌ها، معروف به پالسیت، می‌تواند به طور بالقوه تمرکز اصلی آنها باشد. یک حرکت مالی عاقلانه زیرا انتظار می‌رود بازار کلان داده در پنج سال آینده بیش از 50 میلیارد دلار رشد کند.

در سه سال آینده پالسیت قصد دارد در تجزیه و تحلیل داده های بزرگ پیشرفت کند و 200 شغل سطح بالا برای دانشمندان داده ایجاد کند. هانسن خاطرنشان می‌کند: «هم جمع‌آوری و هم تجزیه و تحلیل داده‌ها به مجموعه‌های مهارتی تخصصی نیاز دارد، بنابراین فرصت‌های جدیدی باز می‌شود».

برای انجام این مشاغل جدید، کارکنان باید به درستی آموزش ببینند. گروه پالس همچنین قصد دارد یکی از اولین آکادمی های آموزشی برای دانشمندان داده در جهان را راه اندازی کند تا مرکز جدید تجزیه و تحلیل داده خود را همراهی کند و نیاز روزافزون به تحلیلگران داده را برآورده کند.

کلان داده ها می توانند اثرات مثبت دیگری به جز ارائه فرصت های جدید و تجربیات یادگیری بر دنیای آموزش داشته باشند. هانسن بیان می‌کند که رفتار دانش‌آموزان را می‌توان از طریق داده‌های بزرگ تجزیه و تحلیل کرد تا بخش آموزشی را بهبود بخشد. "در نهایت هدف استفاده از چنین داده های جمع آوری شده برای بهبود تجربه دانش آموزان [و] افزایش تعداد نگهداری است."

بین ایجاد مشاغل جدید و فرصت‌های تحصیلی و پیش‌بینی‌های بالقوه و رشد کسب‌وکارها، داده‌های بزرگ در کنار هم چیز خوبی به نظر می‌رسد. با این حال، برخی از معایب و نقص هایی وجود دارد که با تجزیه و تحلیل و استفاده از چنین حجم عظیمی از اطلاعات وجود دارد.

یکی از مشکلاتی که باید به آن پرداخته شود این است که چه اطلاعاتی بازی رایگان است تا شرکت‌های مختلف از آنها به عنوان مجموعه داده‌های خود استفاده کنند. مسائل مربوط به حریم خصوصی و امنیت باید مورد توجه قرار گیرد. همچنین اینکه چه کسی صاحب چه اطلاعاتی است سؤالی است که باید به آن پاسخ داده شود. هنگامی که داده ها به طور مداوم ارسال و دریافت می شوند، خط بین مالکیت معنوی شخصی و قلمرو عمومی مبهم می شود.

ثانیا همه اطلاعات مفید نیستند، یا بی فایده هستند مگر اینکه به درستی تجزیه و تحلیل شوند. برخی از مجموعه های داده عملاً هیچ معنایی ندارند مگر اینکه با داده های مناسب و مرتبط ترکیب شوند. به این معنی که اگر یک شرکت به تمام داده های مورد نیاز خود و دانش نحوه یافتن و تجزیه و تحلیل صحیح آنها دسترسی نداشته باشد، داده های بزرگ اساساً وقت آنها را تلف می کند.

همچنین داده ها با سرعت نگران کننده ای در حال رشد هستند. 90 درصد از داده های جهان تنها در دو سال گذشته ایجاد شده است و این تعداد به طور پیوسته در حال افزایش است. اگر داده‌های مرتبط جدید سریع‌تر از آنچه ما بتوانیم آن‌ها را تجزیه و تحلیل کنیم ایجاد می‌شود، آنگاه تجزیه و تحلیل کلان داده‌ها نامربوط می‌شود. از این گذشته، نتایج فقط به اندازه اطلاعات مورد استفاده خوب است.

اضافه کردن به لیست

گزينه ها

پیشرفته