اکونومیک 24
27 بهمن 1400 - 13:19

«علم داده» و «یادگیری ماشین»؛ نسبت این دو مفهوم با هم چیست؟

میزان تولید داده در جهان سال‌به‌سال در حال افزایش است و می‌توان جهان امروز و پیشرفت‌های آن را در گرو داده دانست. با‌وجودآنکه پاسخ بسیاری از سؤالات در دل همین داده‌ها نهفته است، بدون فرآوری و پالایش آنها نمی‌توان به اطلاعات مفید چندانی دست‌یافت. اینجاست که دیتاساینتیست (متخصص علم داده) وارد عمل شده و پیش‌نیازهای لازم را فراهم می‌کند تا سازمان‌ها بتوانند از این داده‌های خام، تحلیل‌های مفید و کاربردی استخراج کنند. وقتی صحبت از داده و تحلیل آن می‌شود، به یاد اصطلاحات زیادی می‌افتیم که گاه‌به‌گاه در فضای اینترنت با آن مواجه شده‌ایم: علم داده، تحلیل داده‌محور، یادگیری ماشین و…اما آیا تمام این عبارات به مفاهیم مشابهی اشاره دارند؟ اگر این‌طور نیست نسبت میان آنها چیست؟ در این مقاله قصد داریم به بیان این موضوع بپردازیم. یادگیری ماشین (machine learning) چیست؟ یادگیری ماشین  یکی از شاخه‌های علوم کامپیوتر است که بر توانمندسازی سیستم‌های کامپیوتری برای حل مسائل و اتخاذ تصمیماتی مستقل از برنامه‌نویس تمرکز دارد. این شاخه از علم در تلاش است تا زمینه‌ای فراهم کند که که این سیستم‌ها از داده‌های موجود، مشاهدات و تجربیات پیشین خود بیاموزند و بتوانند در پاسخ به مسائل و مشکلات مختلف، تصمیمات سنجیده‌ای بگیرند. یادگیری ماشیننحوه تصمیم‌گیری یک سیستم کامپیوتری، به الگوریتمی بستگی دارد که در آن به‌کاررفته است. دانشمندان برای انجام پروژه‌های یادگیری ماشین از روش‌های مختلفی بهره می‌گیرند که هرکدام از الگوریتم متفاوتی استفاده کرده و مزایا و معایب خاص خود را دارند. بااین‌حال در نهایت هدف تمامی این روش‌ها آن است که با شناخت الگوهای موجود در داده‌ها، بتوانند زمینه استخراج اطلاعات کاربردی و یادگیری از آن را برای سیستم‌ها فراهم کنند. علم داده (Data Science) چیست؟ «داده» (Data) مجموعه‌ای از اطلاعاتی است که در قالب الفبا، عدد، تصویر، صوت، ویدئو و…یا فرمت‌های دیگر در دسترس هستند. برای تبدیل این داده‌ها به تحلیل‌های کاربردی، لازم است که آنها را دسته‌بندی، پالایش، پردازش و تحلیل کرد. این دقیقاً همان کاری است که «علم داده» قصد انجام آن را دارد. علم داده یکی از علومی است که با گرد هم آوردن چندین حوزه تخصصی از جمله متدهای آماری، یادگیری ماشین، تحلیل‌های ریاضی و… در صدد استخراج اطلاعات از دل داده‌هاست. به همین دلیل است که یک متخصص داده یا دیتاساینتیست، باید به مجموعه‌ای از مهارت‌های برنامه نویسی، علوم‌کامپیوتر، آمار، ریاضیات و نمایش‌بصری داده‌ها مسلط بوده و همزمان ذهنی خلاق، محقق و تحلیلگر داشته باشد تا بتواند شکافهای علمی موجود را شناسایی کرده و پاسخ مناسبی برای آن بیابد. دیتاساینتیستاین روزها علم داده به یکی از بخش‌های جدایی‌ناپذیر صنایع مختلف تبدیل شده است. استفاده از داده به کسب‌وکارها کمک می‌کند تا بتوانند درک درستی از جایگاه خود در صنعت و نیازهای واقعی مشتری پیدا کنند و بتوانند بهترین پاسخ را برای مسائل موجود ارائه دهند. به‌این‌ترتیب مدیران در تصمیم‌گیری‌ها به‌جای استفاده از شهود و تکیه بر حدس و گمان، می‌توانند به اعداد و تحلیل‌های آماری تکیه کنند و هزینه و ریسک تصمیمات را به حداقل برسانند. تفاوت «علم داده» و «یادگیری ماشین» در چیست؟ اصطلاحات «علم داده» و «یادگیری ماشین» از جمله عبارات محبوب این روزهای دنیای علم و فناوری‌اند و عموماً در کنار یکدیگر به کار می‌روند؛ بااین‌حال باید به‌خاطر داشت که مفهوم این دو مورد با یکدیگر متفاوت است و نباید به‌اشتباه آنها را یکسان پنداشت. در ساده‌ترین توضیح می‌توان یادگیری ماشین را یکی از مفاهیم نهفته در دل علم داده به‌حساب آورد. باوجودآنکه یادگیری ماشین یکی از بخش‌های مهم پژوهش‌های داده‌محور است، اما تمام آن نیست و گستره «علم داده» بسیار بیش از این حرف‌هاست. به عبارتی دیگر، یادگیری ماشین تنها یک آجر از دیوار بزرگ علم داده است. در بیان تفاوت این دو حوزه می‌توان چنین گفت که «علم داده» بر مطالعه داده‌ها و چگونگی استخراج معنی از آنها تمرکز دارد؛ درحالی‌که یادگیری ماشین بر ابزارها و تکنیک‌هایی تمرکز دارند که کمک می‌کنند مدل‌هایی ساخته شوند که می‌توانند با استفاده از داده‌ها، از عملکرد خود بیاموزند و توسعه یابند. یک دانشمند داده (دیتاساینتیست) عموماً پژوهشگری است که می‌کوشد مهارت‌های مختلف خود را در راستای روش‌شناسی آن پژوهش خاص به کار گیرد و از طریق کار با الگوریتم‌ها، مفاهیم نهفته در داده‌های خام را استخراج کند. درحالی‌که کار یک مهندس یادگیری ماشین مدل‌سازی است. این مهندسان می‌کوشند تا با انتخاب مناسب‌ترین الگوریتم‌ها برای هر مسئله و با استفاده از داده‌های موجود، نتایجی مولد ایجاد کنند. تبدیل‌شدن به یک «سازمان داده‌محور» دنیای داده‌ها در عین آنکه ساده به نظر می‌رسد، بسیار پیچیده و تخصصی است و تبدیل‌شدن به یک سازمان داده‌محور مستلزم فراهم‌کردن پیش‌نیازهایی است. اساساً بسیاری از سازمان‌های سنتی، حتی زیرساخت لازم برای جمع‌آوری داده را هم ندارند و در غیبت داده، تحلیل داده‌محوری نیز به دست نخواهد آمد. فراهم‌کردن این زیرساخت‌ها، شناخت مسئله، انتخاب روش، استخراج داده‌ها و تحلیل و دستیابی به نتایجی قابل‌اعتماد، جز با همراهی متخصصان علم داده ممکن نمی‌شود. «سحاب» یکی از شرکت‌های فعال در زمینه ارائه راهکارهای داده‌محور به سازمان‌ها و مراکز مختلف است که کار خود را از سال ۹۳ آغاز کرده و با بهره‌گیری از شماری از بهترین متخصصان این حوزه اقدام به اجرای پروژه‌های فنی و آموزشی داده‌محوری در سازمان‌ها می‌کند. هدف سحاب، کمک به سازمان‌ها در حل مسائل، جمع‌آوری، نگهداری و تحلیل داده است و در کنار این موارد آمادگی دارد تا خدمات مشاوره‌ای و آموزشی لازم برای آشنایی مدیران و کارکنان شرکت با مفاهیم علم داده را نیز ارائه دهد. برای آشنایی بیشتر با خدمات سحاب و یا دریافت مشاوره تخصصی، می‌توانید به وب‌سایت این شرکت به آدرسhttp://www.sahab.ir  مراجعه کنید. http://www.sahab.ir
منبع: فارس
شناسه خبر: 85324

مهمترین اخبار اقتصادی: