دانشمند داده و سازمان داده-محور

۱. علم داده چیزیه که این اواخر خیلی سر زبون‌ها بوده. (شاید بلاک چین تونسته باشه توی این دو سال توجه رو به خودش جلب کنه، اما قبلش نوبت علم داده بود). علم داده رو خودمونی بخوایم تعریف کنیم می‌شه مجموعه علوم و فنونی که ما ازشون استفاده می‌کنیم تا اطلاعات موجود (شاید به ظاهر بی اهمیت) رو تحلیل کنیم و از توش اطلاعات مفیدی به دست بیاریم که به ما توی تصمیم گیری و متعاقبا گسترش و پیشرفت کارمون کمک کنن. 

۲. مثلن یه شرکت خیالی سرویس ایمیل رو تصور کنید که ده میلیون کاربر داره.  این شرکت می‌تونه بیاد و ساعت مراجعه‌ی هرکدوم از کاربرهاش رو یه جا ذخیره کنه.  بعد از یه مدت می‌فهمه  از این ده میلیون نفر، توی هر ساعت حدود نیم میلیون نفر ایمیل‌هاشونو چک کنن. پس اولین چیزی که می‌فهمه اینه که لازم نیست تجهیزاتش جوری باشه که بتونه همیشه جوابگوی ده میلیون نفر باشه، اگر بتونه نیم میلیون رو راه بندازه، کافیه: می‌تونه هزینه‌ها رو بیاره پایین. حالا بعدش میاد و می‌بینه که توی ساعت نه صبح، تعداد کسایی که وارد سایت شدن نسبت به الباقی روز کمی بیشتره. چرا؟ چون احتمالن اول صبحه و می‌خوان قبل از شروع کار ایمیلشونو چک کنن. اینجا می‌فهمه که لازمه برای اون ساعت خاص از روز یه فکری بکنه.
این یه مثال ساده و پیش‌پا افتاده از کاربرد علم داده بود. درعمل البته با مسائل خیلی پیچیده‌تری مواجه خواهیم شد.

داده محور - دی جی پاتیل - کتاب

۳. دی جی پاتیل و هیلاری میسون دوتا  از دیتا ساینتیست(!)های معروف و برجسته‌ی دنیان. توی کتاب مصاحبه با ۲۵ دانشمند داده هم یه مصاحبه ازهرکدومشون بود. این این دو نفر کتابی دارن  به اسم Data-Driven یا همون داده-محور که توش هم خلاصه‌ای از وظایف یک دانشمند داده ارائه می‌ده،‌ هم از علم داده صحبت می‌کنه و هم درمورد فرهنگی حرف می‌زنه که توش تصمیم گیری های روی هوا و حدس و گمان، جای خودشونو می‌دن به تصمیم گیری های مبتنی بر اطلاعات. خوندنش هم می‌تونه برای علاقه‌مند‌های علم داده مفید باشه، کسایی که می‌خوان وارد این فیلد بشن، هم کسایی که صاحب بیزنس یا علاقه‌مند به راه اندازی کسب و کار خودشونن و می‌خوان با علم روز بهترش کنن و همینطور هرکسی که می‌خواد از ساز و کار دنیای امروز یکم بیشتر سر دربیاره.  جالبیش اینه که این کتاب رو انتشارات اورایلی به صورت رایگان منتشر کرده. جالب تر از اون این که خیلی هم کوتاهه و مختصر.

 

مصاحبه با ۲۵ دیتا ساینتیست

۱. علم داده یا همون دیتا ساینس یقینن یکی از شاخه‌های علم توی قرن حاضره. دیتا ساینتیست ها هم یقینن گروهی از متخصصان که برای آدمهای کنجکاو جذابیت زیادی دارن. کتاب Data Science Handbook تشکیل شده از ۲۵ تا مصاحبه. هر کدوم با یکی از چهره‌های برجسته‌ی این فیلد، معروف ترینشون دی‌جی پاتیل. خوندنش یقینن خالی از لطف نیست.

Data science handbook مصاحبه با ۲۵ متخصص علم داده

۲. یک متخصص علم داده‌ (شاید بشه گفت دانشمند داده) توی سه تا چیز باید تخصص داشته باشه: مهندسی کامپیوتر(برنامه نویسیریاضیات (درواقع دقیق‌ترش می‌شه آمار) و همینطور اون حوزه‌ای که قراره توش فعالیت کنه (مثلن فروش یا پزشکی یا … ). یا به‌قول یکی از افراد توی همین کتاب، متخصص علم داده کسیه که بیشتر از هر ریاضی دانی مهارت برنامه‌نویسی داشته باشه، و از هر برنامه نویسی، توی ریاضیات خبره تر باشه.  به عنوان یه کامپیوتری، این فیلد همیشه برام جذابیت داشته و این کتاب هم یکی از چیزایی بود که خیلی بهم کمک کرد توی آشنایی عمیق تر با این فیلد.

۳. مصاحبه‌های  کتاب Data Science Handbook، خیلی متنوعن. توی بعضی‌هاشون مثل مصاحبه‌ی دی‌جی پاتیل (آدم فکر می‌کنه با یه موزیسین مست لایعقل طرفه 🙂 ) بیشتر درمورد اهمیت این حوزه‌ حرف زده می‌شه. توی یه سریاشون، درمورد فواید و دستاورد‌های افراد این فیلد، توی یه سریا هم مسائل فنی بحث می‌شه. حتی چند جا برای افرادی که می‌خوان توی این فیلد خاص فعالیت کنن، راهنمایی هم هست. این که چی باید بدونن و چی باید یاد بگیرن و چه مسیری رو طی کنن. البته نمی‌شه این کتاب رو، کتاب آموزشی حساب کرد. همچنان باید در نظر داشت که با یه سری مصاحبه طرفیم. نکته‌ی خیلی خوب این کتاب هم اینه که کاملن رایگانه.

۴. برنامه‌نویس خوب شدن یکی از چیزاییه  که خیلی برای من مهم بوده و توی این بلاگ هم ازش حرف زیاد زده شده. اگر علاقه دارین به علم داده، یک بعدش که برنامه نویسی هست رو می‌تونین اینجا دنبال کنید. مثلن کتاب 97 چیز که هر برنامه نویس باید بدونهیا معرفی زبان برنامه‌نویسی پایتون می‌تونه براتون جالب باشه. درکل می‌تونین تگ برنامه‌نویس رو دنبال کنید.