دانشمند داده و سازمان داده-محور

۱. علم داده چیزیه که این اواخر خیلی سر زبون‌ها بوده. (شاید بلاک چین تونسته باشه توی این دو سال توجه رو به خودش جلب کنه، اما قبلش نوبت علم داده بود). علم داده رو خودمونی بخوایم تعریف کنیم می‌شه مجموعه علوم و فنونی که ما ازشون استفاده می‌کنیم تا اطلاعات موجود (شاید به ظاهر بی اهمیت) رو تحلیل کنیم و از توش اطلاعات مفیدی به دست بیاریم که به ما توی تصمیم گیری و متعاقبا گسترش و پیشرفت کارمون کمک کنن. 

۲. مثلن یه شرکت خیالی سرویس ایمیل رو تصور کنید که ده میلیون کاربر داره.  این شرکت می‌تونه بیاد و ساعت مراجعه‌ی هرکدوم از کاربرهاش رو یه جا ذخیره کنه.  بعد از یه مدت می‌فهمه  از این ده میلیون نفر، توی هر ساعت حدود نیم میلیون نفر ایمیل‌هاشونو چک کنن. پس اولین چیزی که می‌فهمه اینه که لازم نیست تجهیزاتش جوری باشه که بتونه همیشه جوابگوی ده میلیون نفر باشه، اگر بتونه نیم میلیون رو راه بندازه، کافیه: می‌تونه هزینه‌ها رو بیاره پایین. حالا بعدش میاد و می‌بینه که توی ساعت نه صبح، تعداد کسایی که وارد سایت شدن نسبت به الباقی روز کمی بیشتره. چرا؟ چون احتمالن اول صبحه و می‌خوان قبل از شروع کار ایمیلشونو چک کنن. اینجا می‌فهمه که لازمه برای اون ساعت خاص از روز یه فکری بکنه.
این یه مثال ساده و پیش‌پا افتاده از کاربرد علم داده بود. درعمل البته با مسائل خیلی پیچیده‌تری مواجه خواهیم شد.

داده محور - دی جی پاتیل - کتاب

۳. دی جی پاتیل و هیلاری میسون دوتا  از دیتا ساینتیست(!)های معروف و برجسته‌ی دنیان. توی کتاب مصاحبه با ۲۵ دانشمند داده هم یه مصاحبه ازهرکدومشون بود. این این دو نفر کتابی دارن  به اسم Data-Driven یا همون داده-محور که توش هم خلاصه‌ای از وظایف یک دانشمند داده ارائه می‌ده،‌ هم از علم داده صحبت می‌کنه و هم درمورد فرهنگی حرف می‌زنه که توش تصمیم گیری های روی هوا و حدس و گمان، جای خودشونو می‌دن به تصمیم گیری های مبتنی بر اطلاعات. خوندنش هم می‌تونه برای علاقه‌مند‌های علم داده مفید باشه، کسایی که می‌خوان وارد این فیلد بشن، هم کسایی که صاحب بیزنس یا علاقه‌مند به راه اندازی کسب و کار خودشونن و می‌خوان با علم روز بهترش کنن و همینطور هرکسی که می‌خواد از ساز و کار دنیای امروز یکم بیشتر سر دربیاره.  جالبیش اینه که این کتاب رو انتشارات اورایلی به صورت رایگان منتشر کرده. جالب تر از اون این که خیلی هم کوتاهه و مختصر.

 

بلاک چین چیه و چجوری کار می کنه

۱. بلاک چین که تکنولوژی شماره یک این روزها حساب می‌شه( از لحاظ زیاد بودن حرفایی که درموردش زده می‌شه و کم بودن تعداد متخصصاش) یه مقدار پیچیده‌س در نظر اول. هرچند که خیلی ساختار ساده‌ای داره ولی موقع آشنایی اولیه باهاش، می‌تونه آدم رو گیج کنه یکم. بلاک چین در واقع یه پایگاه داده/دیتا بیس حساب می‌شه. یه پایگاه داده توزیع شده/نامتمرکز و غیرقابل تغییر. این یه مقدار شاید پیچیده به نظر بیاد در اول. یه مثال باحال دیدم یه جا که همون رو اینجا می‌آرم. به نظر من خیلی خوب توضیح داده.

بلاک چین تکنولوژی پشت بیت کوین

بلاک چین

داکیومنت‌ها قبلا به صورت فایل‌های مایکروسافت ورد ذخیره می‌شدن. شما یه فایل می‌ساختین، توش می‌نوشتین و اون رو می‌فرستادین برای یه نفر دیگه. اون آدم هم می‌دید فایل رو، اگر لازم داشت، تغییرش می‌داد و بعد اونو بر می‌گردوند به شما. این جا مشکلی که هست اینه که شما اگر بخواید توی این فایل تغییری ایجاد کنید، باید صبر کنید تا طرف مقابل کارش تموم شه و اون رو به شما برگردونه، وگرنه این وسط مقداری اطلاعات از دست می‌ره. دیتابیس ها هم همینطوری کار می‌کنن.  دو تا درخواست همزمان نمی‌تونن به پایگاه داده دسترسی داشته باشن. (فرض کنید ۱۰۰ هزار تومن پول توی حساب شماست. شما با دو تا تلفن متفاوت اقدام می‌کنید که از این صد هزار تومن استفاده کنید. چی می‌شه؟ پول رو دو بار مصرف کردید. چاره‌؟ اینه که نمی‌ذارن همزمان بیش از یک دسرسی ممکن باشه.)

حالا گوگل داکز رو نگاه کنید. شما می‌تونین آنلاین به اون دسترسی داشته باشید، همزمان با شما، دوست و همکارتون هم بهش دسترسی داشته باشه. این جا دو تا نسخه متفاوت در کار نیست. یه نسخه‌س که در اختیار دو نفر به طور همزمان قرار گرفته. بلاک چین تقریبن اینجوریه.

 

۲. این مثال تا حدودی بلاک چین رو توضیح می‌ده، درواقع عمومی  بودن بلاک چین رو،‌اونم به زبان خیلی خیلی ساده.  توی بلاک چین، همه، هروقت که بخوان می‌تونن به همه چیز دسترسی داشته باشن و تغییر بدن. اما برای این که تغییرات درست و واقعی باشن و توش تقلب انجام نشه،‌یه سری کار دیگه هم انجام می‌شه.
بلاک‌چین چیزیه که برای خود من خیلی جذابیت داشته تا امروز. از بیت کوین چندباری اینجا نوشتم، احتمالن این روال رو ادامه بدم و مطالب مرتبط بهش رو همچنان بنویسم، البته از بعد علمی قضیه بیشتر و نه تجاری.

اتم: ادیتور دوست داشتنی

۱. یه سریا ویژوال استودیو رو می‌پرستن. واقعن هم حق دارن. فکر کن می‌خوای کد بزنی. دو سه تا کاراکتر می‌زنی، بقیه دستور و فانکشن و کلاس و … رو خودش برات می‌اره. فکر کن داری از یه کلاس استفاده می‌کنی ولی یادت نیست اسم اون متدی که میخواستی استفاده کنی چی بود. یه نقطه می‌ذاری،‌ کنترل اسپیس و اجی مجی همه متدهاش لیست میشه برات. خوبه. نیست؟ نیست آقا. نیست!

نرم افزار ویرایشگر اتم

۲. این که IDE به ادم کمک کنه خوبه. ولی به چه قیمتی؟ اتفاقی که واسه دات نتی ها میفته اینه که بدون ویژوال استودیو تقریبن نصف مهارت برنامه نویسی خودتشون رو از دست می‌دن. چرا؟ چون از همون اول بد عادت می‌شن،‌ وابسته می‌شن به ویژوال استودیو. البته این درمورد جاواکار ها و اینتلیجی، اندرویدیا و اندروید استودیو، پایتون و پایچارم و  در کل هر زبون و IDEای صادقه.

۳. اتم رو خیلی دوست دارم. یه ادیتور ساده با کلی ویژگی خوب. اولین خوبیش اینه که – مخصوصن توی پروسه یادگیری- مجبور میکنه برنامه نویس رو که همه چیز رو خودش بنویسه. البته یه سری کمک می کنه ها. ولی خب اینا اسمشون کمکه، نه این که بیاد کل کار رو از رو دوش برنامه نویس برداره.

۴. چیزی که اتم رو دوست داشتنی می‌کنه، پلاگین های خوبیه که داره. این پلاگین ها شاید همون چیزایی رو به اتم اضافه کنن که ویژوال استودیو و امثالش از همون اول دارن. ولی نگته دقیقن همین جاست. برنامه نویس بعد از یه مدت کار کردن و سر و کله زدن با ادیتورش به اینا برمی خوره و وقتی ازشون استفاده می کنه که هم یاد گرفته که بدون اونا کار کنه و هم واقعن نیاز رو درک می کنه. توی این مطلب چند تا پلاگین خوب و کاربردی برای اتم هم معرفی می‌کنم.