مطالب کتاب صفر تا یک، برگرفته از محتوای کلاسی است با عنوان استارتاپ که پیتر ثیل در سال ۲۰۱۲ در دانشگاه استنفورد ارائه میکرد. هدف او از تدریس در این کلاس، کمک به دانشجویانش بود تا نگاه و چشماندازشان از مسیر متعارفی که معمولاً متخصصان آکادمیک و اساتید دانشگاهی ترسیم میکنند، فراتر برود و بتوانند به آیندهای وسیع تر بیندیشند. یکی از پایه ایترین بحثها در این کتاب حول محور رقابت و انحصار میگردد. پیتر ثیل در این کتاب تأکید فوق العادی روی ایجاد انحصار دارد. البته نه انحصار دولتی یا هر انحصار کثیف دیگر. منظور پیتر ثیل در اینجا، انحصاری هست که از تمایز ناشی شود. نویسنده روی این موضوع پافشاری میکند که کپی کردن از یک محصولی که هماکنون وجود دارد مارا وادار به رقابت با شرکتهایی میکند که در حال حاضر میدان دار هستند. هفت سؤال اساسی برای شروع یک کسب و کار که در این کتاب روی آن تأکید شدهاست: آیا میتوانیم تکنولوژی منحصر بفردی برای رسیدن به موفقیت ایجاد کنیم به جای اینکه بخواهیم ذره ذره پیشرفت کنیم؟ آیا زمان مناسبی برای شروع کسب و کارم هست؟ آیا شما کسب و کارتان را با سهم بالا از یک بازار کوچک شروع کردهاید؟ آیا یک تیم خوب برای خودتان جمع کردهاید؟ آیا راهی برای توزیع محصول و رساندن آن به دست مشتری در ذهن دارید؟ آیا بازار شما برای ده سال آینده قابل دفاع است؟ آیا میتوانید سهم خود را در ده سال آینده پیشبینی کنید؟ آیا یک موقعیت منحصر بفرد در اختیار دارید که دیگران از دیدن آن محروم هستند؟
شرح:
این راهنمای قطعی پروژههای یادگیری ماشینی به مشکلاتی که یک دانشمند داده مشتاق یا با تجربه اغلب دارد پاسخ میدهد: آیا در مورد استفاده از چه فناوری برای توسعه ML خود سردرگم هستید؟ آیا باید از GOFAI، ANN/DNN یا Transfer Learning استفاده کنم؟ آیا می توانم برای توسعه مدل به AutoML تکیه کنم؟ اگر مشتری گیگ و ترابایت داده برای توسعه مدلهای تحلیلی به من بدهد چه؟ چگونه مجموعه داده های پویا با فرکانس بالا را مدیریت کنم؟ این کتاب ادغام کل فرآیند علم داده را در یک "برگ تقلب" به پزشک ارائه می دهد.
چالش یک دانشمند داده استخراج اطلاعات معنادار از مجموعه داده های عظیم است که به ایجاد استراتژی های بهتر برای کسب و کارها کمک می کند. بسیاری از الگوریتم های یادگیری ماشین و شبکه های عصبی برای انجام تجزیه و تحلیل بر روی چنین مجموعه داده هایی طراحی شده اند. برای یک دانشمند داده، این یک تصمیم دلهره آور است که از کدام الگوریتم برای یک مجموعه داده معین استفاده کند. اگرچه پاسخ واحدی برای این سوال وجود ندارد، اما یک رویکرد سیستماتیک برای حل مسئله ضروری است. این کتاب الگوریتمهای مختلف ML را به صورت مفهومی توصیف میکند و فرآیندی را در انتخاب مدلهای ML/DL تعریف/بحث میکند. ادغام الگوریتم ها و تکنیک های موجود برای طراحی مدل های کارآمد ML جنبه کلیدی این کتاب است. Thinking Data Science به تمرین دانشمندان داده، دانشگاهیان، محققان و دانشجویانی که میخواهند مدلهای ML را با استفاده از الگوریتمها و معماریهای مناسب بسازند، چه دادهها کوچک یا بزرگ باشند، کمک میکند.
سیستم های طبقه بندی کننده یادگیری: از مبانی تا برنامه های کاربردی
سیستم های طبقه بندی کننده یادگیری یک الگوی یادگیری ماشینی هستند که توسط جان هالند در سال 1976 معرفی شده است. آنها سیستم های مبتنی بر قانون هستند که در آنها یادگیری به عنوان فرآیند سازگاری مداوم با یک محیط ناشناخته از طریق الگوریتم های ژنتیک و یادگیری تفاوت های زمانی دیده می شود.
از همان ابتدا، سیستم های طبقه بندی کننده توجه محققان را در زمینه های مختلف، از طراحی خطوط لوله گاز گرفته تا شخصی، عوامل اینترنتی، و از جمله علوم شناختی، داده کاوی، تجارت اقتصادی عوامل، و روباتیک خودمختار به خود جلب کرده است. در سال 1989 استوارت ویلسون و دیوید گلدبرگ مروری بر دهه اول تحقیقات سیستم طبقه بندی کننده ارائه کرده است برخی از نقاط عطف که مشخصه توسعه اولیه این رشته بودند. در سال 1992 اولین کارگاه بین المللی سیستم های طبقه بندی کننده یادگیری (IWLCS92) در هیوستون تگزاس برگزار شد.
در دهه 1990 شاهد علاقه فزاینده ای به این حوزه بود: بسیاری از برنامه های کاربردی موفق به مسائل دنیای واقعی و همچنین مدل های سیستم طبقه بندی جدید ارائه شد. با هفت سال از اولین کارگاه و بیش از 400 مقاله منتشر شده، زمان آن بود که در سال 1999 دوباره وضعیت طبقه بندی کننده یادگیری را تحقیق و بررسی سیستمی کنیم. به همین منظور دومین کارگاه بین المللی سیستم های طبقه بندی کننده یادگیری (IWLCS99) برگزار شد و ایده این جلد تصور شده است. این کارگاه، در اورلاندو، فلوریدا، 13 ژوئیه 1999 برگزار شد جامعه حیاتی از محققان از بسیاری از مناطق مختلف که مشترک است. علاقه به این پارادایم یادگیری ماشینی برخی از جالب ترین کارها ارائه شده در کارگاه در این جلد آمده است.
کتاب نمای کلی از وضعیت فعلی سیستم های طبقه بندی کننده یادگیری را ارائه می دهد و برخی از امیدوارکننده ترین جهت های تحقیقاتی را برجسته می کند. مقاله اول قسمت اول این سوال اساسی را مطرح می کند: «سیستم طبقه بندی کننده یادگیری چیست؟» پاسخ ها توسط جان هالند، مبتکر سیستم های طبقه بندی کننده، و سایر محققان قدیمی در این زمینه: لاشون بوکر، مارکو کلمبتی، مارکو ارائه شده است. دوریگو، استفانی فارست، دیوید گلدبرگ، ریک ریولو، رابرت ای. اسمیت و استوارت ویلسون. سه مقاله زیر، از دیدگاههای مختلف، تحولات این حوزه را از زمان ویلسون و گلدبرگ در سال 1989 خلاصه میکنند.. بخش دوم شامل مقالاتی در مورد موضوعات پیشرفته مورد علاقه فعلی است، از جمله نمایشهای جایگزین، روشهایی برای ارزیابی سودمندی قوانین، و الحاقات به مدل های سیستم طبقه بندی کننده موجود. بخش سوم به برنامه های امیدوارکننده سیستم های طبقه بندی کننده اختصاص داده شده است مانند: داده کاوی، تجزیه و تحلیل داده های پزشکی، عوامل تجاری اقتصادی، مانور هواپیما، و رباتیک مستقل.