حضور هوش مصنوعی در جوامع امروزی روز به روز در حال فراگیر شدن است. به ویژه هنگامی که شرکتهای بزرگی مانند Netflix، آمازون، فیس بوک، Spotify و بسیاری دیگر به طور مداوم راه حل های مرتبط با هوش مصنوعی و ماشین لرنینگ را مستقر میکنند که هر روز مستقیماً با مصرف کنندگان ارتباط برقرار میکند.
این راه حلهای مرتبط با هوش مصنوعی وقتی به درستی برای مشکلات تجاری به کار گرفته شوند، میتوانند راه حلهای منحصر به فردی را ارائه دهند که با گذشت زمان مقیاس و بهبود یافته و تأثیر قابل توجهی را برای کسب و کار و کاربران ایجاد کند. اما “به درستی” استفاده از راه حل هوش مصنوعی به چه معناست؟ آیا این بدان معناست که راه اشتباه وجود دارد؟ از دیدگاه محصول، پاسخ کوتاه بله است.
مرور کلی: ابتدا، 5 مورد استفاده از علم داده یا یادگیری ماشین در Netflix را بیان میکنیم. سپس برخی از نیازهای تجاری و ملاحظات فنی مورد بحث مدیر محصول را مورد بحث قرار میدهیم. سپس کمی عمیق تر به آنچه که شاید جالب ترین مورد از این 5 مورد استفاده باشد، میپردازیم تا مشخص کنیم مشکل تجاری آن به دنبال حل کدام است.
در اینجا 5 مورد استفاده از هوش مصنوعی در Netflix را به طور مختصر باهم مرور میکنیم.
- شخصی سازی توصیههای فیلم: کاربرانی که فیلم A را تماشا می کنند به احتمال زیاد فیلم B را تماشا میکنند. این شاید شناخته شده ترین ویژگی Netflix باشد. Netflix از سابقه تماشای سایر کاربران با سلیقه مشابه استفاده میکند تا آنچه را که ممکن است بعداً به تماشای آن بیشتر علاقه مند باشید توصیه کند تا درگیر شوید و اشتراک ماهانه خود را برای موارد بیشتر ادامه دهید.
- تولید خودکار و شخصی سازی تصاویر کوچک: آثار هنری با استفاده از هزاران فریم ویدئویی از یک فیلم یا نمایش موجود به عنوان نقطه شروع برای ایجاد تصویر بند انگشتی، Netflix این تصاویر را حاشیه نویسی میکند و سپس هر تصویر را در تلاش برای تشخیص اینکه کدام تصویرها بیشترین احتمال نتیجه را دارند رتبه بندی میکند. در کلیک شما این محاسبات بر اساس چیزی است که دیگران شبیه شما روی آن کلیک کرده اند. یکی از یافته ها میتواند این باشد که کاربرانی که از بازیگران / ژانرهای فیلم خاصی خوششان می آید به احتمال زیاد روی تصاویر کوچک با برخی بازیگران / ویژگی های تصویر کلیک میکنند.
- مکان یابی برای تولید فیلم (پیش تولید):استفاده از داده ها برای تصمیم گیری در مورد مکان و زمان بهترین فیلمبرداری مجموعه فیلم-با توجه به محدودیت های زمان بندی (در دسترس بودن بازیگر/خدمه)، بودجه (محل برگزاری، هزینه پرواز/هتل) و تولید الزامات صحنه (عکسبرداری روز در مقابل شب، احتمال خطرات رویداد آب و هوا در یک مکان). توجه داشته باشید که این بیشتر یک مشکل بهینه سازی علم داده است تا یک مدل یادگیری ماشین که بر اساس داده های گذشته پیش بینی میکند.
- تدوین فیلم (پس از تولید) -استفاده از داده های تاریخی که در آن زمان کنترل های کیفی در گذشته شکست خورده است (زمانی که همزمانی زیرنویس ها با صدا/حرکات در گذشته خاموش بود).برای پیش بینی اینکه چه زمانی بررسی دستی در موارد دیگر مفیدتر است یک فرایند بسیار زمان بر و پر زحمت باشد.
- کیفیت جریان :استفاده از داده های مشاهده گذشته برای پیش بینی استفاده از پهنای باند برای کمک به Netflix برای تصمیم گیری در مورد زمان ذخیره کردن سرورهای منطقه ای برای بارگذاری سریعتر در زمان تقاضای اوج (مورد انتظار).
این 5 مورد کاربرد علم داده یا یادگیری ماشینی فقط در Netflix به تنهایی چنین مقیاس پذیری داشته است که چشم انداز فناوری و تجربه کاربر را برای میلیونها و آینده دیگر برای همیشه تغییر داده است. اتخاذ این راه حلهای مرتبط با هوش مصنوعی تنها با گذشت زمان قوی تر میشود.
اما پیش از این موارد استفاده مانند امروز معمول بود و توسط کاربرانی مانند من و شما مورد استفاده قرار میگرفت، شخص یا گروهی در Netflix این راه حل های هوش مصنوعی را به درستی با یک نیاز تجاری مرتبط میکردند. بدون این پیوند تجاری ، این موارد استفاده به سادگی ایده هایی در آسمان خواهد بود که مانند بسیاری از ایده های عالی در انتهای مطالب عقب افتاده نشسته اند. تنها از طریق موقعیت یابی مناسب و ارتباط با مشکل اصلی کسب و کار Netflix، این ایده ها به واقعیتی که امروز هستند تبدیل شده است.
نیاز تجاری Netflix چیست؟
توجه داشته باشید در هر یک از موارد استفاده ای که در بالا مشخص کردیم، هر یک با نیاز، هدف یا فرضیه خاصی از مشاغل مرتبط است. این امر برای هر مدیر محصول بسیار مهم است زیرا برای جلوگیری از وسوسه علاقه مندان به فناوری که در جزئیات علم داده یا هوش مصنوعی به دلایل فکری بدون شناسایی مشکل و نیاز تجاری شگفت زده می شوند.
در پایان روز، مدیران محصول باید یک مشکل تجاری را به یک راه حل یادگیری ماشین داده به درستی وصل کنند. ما میخواهیم از داشتن راه حلی که به دنبال مشکل است اجتناب کنیم، در غیر این صورت پروژه در شرکت از بین میرود.
مدیران محصول باید مطمئن شوند مشکلی وجود دارد که می توان به کمک هوش مصنوعی و یادگیری ماشین آن را حل کرد. یادگیری ماشین (ML) یک راه حل بالقوه هوش مصنوعی است. اما قبل از تجویز آن راه حل، ابتدا باید مشکل را مشخص کنیم.
نتیجه کسب و کار ما در تلاش برای دستیابی به یادگیری ماشین چیست؟ از آنجا که پارامترهای مدلهای یادگیری ماشین مورد استفاده، دادهها جمع آوری و پردازش میشود. Netflix به کمک یادگیری ماشین برای ارائه شخصی سازی تنها به دلیل فناوری جالب انجام نمیدهد. بلکه ما باید آن را به یک مشکل تجاری مرتبط کنیم. دانشمندان داده در کشف بینش از داده ها متخصص هستند، اما وظیفه مدیر محصول این است که آن را به درستی با نیاز یا مشکل کسب و کار پیوند داده و آن را با اولویتهای رقابتی مقایسه کند.
برای مثال، یک علاقمند به فناوری ممکن است بگوید: آیا نمیتوانید یک قسمت را با استفاده از صدا با Netflix تجزیه و تحلیل کنید و با دادههای وارد شده از واکنشهای هزاران کاربر دیگر به آن قسمت، میتواند به طور کاملاً هوشمند به نظرات شما به صورت دو طرفه رفت و برگشت پاسخ دهد.
گفتگو محور؟
بله، این یک مورد استفاده بسیار عالی خواهد بود که از پردازش زبان طبیعی (NLP) و پلتفرم هوش مصنوعی برای درک توضیحات بعد از قسمت شما در زمینه استفاده میکند. علاوه بر NLP، این مورد استفاده از متن برای بیان شخصیت ها و همچنین تجزیه و تحلیل احساسات هزاران نفر دیگر در مورد آنچه در آن قسمت اتفاق افتاده است، یا احساس آنها در مورد یک شخصیت خاص استفاده میکند. در واقع، این ادغام زیبایی از چندین فناوری پیشرفته در یک مورد استفاده است.
اگر نسخه آزمایشی MVP این نشان داد که کاربرانی که با ویژگی جدید وی مشارکت داشته اند مدت بیشتری باقی مانده اند یا بیشتر باز میگردند یا به رانندگی بیشتر دهان به دهان در مورد Netflix کمک کرده اند، پس میتواند منابع بیشتری را تضمین کند. تصمیم اولیه برای ساخت آن MVP بستگی به تصمیم استراتژیکی دارد که توسط ذینفعان اتخاذ می شود و لزوماً با معیار اولویت بندی نمیشود. این بستگی به استراتژی شرکت دارد.
اما همانطور که سناریوی کاربر فوق العاده است، این چه مشکلی را حل میکند؟ چگونه با مشکل اصلی Netflix در حفظ اشتراک کاربران در هر ماه ارتباط دارد؟ اگر مرتبط است، اما چه شواهدی (از نظر کیفی یا کمی برای حمایت از آن رابطه داریم؟
و اگر این راه حل مشکلی برای آن مشکل است، آیا نسخه ساده تری از این راه حل وجود دارد که بتواند به همان اندازه این مشکل را برطرف کند اما از نظر فنی پیچیده تر نباشد؟ برای مثال، به جای ورودی صدا و خروجی صدا، پیچیدگی فقط ورودی متن و خروجی متن چگونه میتواند بر میزان تلاش و تأثیر بر تعامل کاربر تأثیر بگذارد؟
اگر یک رابط هوش مصنوعی مکالمه بدون قسمت صوتی (فقط متن) به 80٪ از مشارکت کاربر مورد نظر برسد اما فقط 40٪ از تلاش توسعه را نیاز داشته باشد، چه اتفاقی میافتد؟ آیا ارزش دارد چنین راه دیگری را در نظر بگیریم؟
چنین راه حلی در مقایسه با میزان تلاش چه تأثیر تجاری خواهد داشت؟ این نسبت با سایر وظایف رقیب در عقب مانده چگونه مقایسه میشود؟
اینها همه سوالات متمرکز بر محصول هستند که یک PM باید برای همسویی راه حل های فناوری با نیازهای تجاری بپرسد. زیرا در نهایت، این نیاز تجاری است که پارامترهای یک مدل ML را هدایت میکند، نه برعکس. بنابراین اجازه دهید بار دیگر به توصیه های فیلم و آن تصاویر کوچک شخصی نگاه کنیم. اما مشکل یا هدف تجاری چیست؟
توصیه های فیلم: شناسایی مشکل
مشکل این است که Netflix مجموعه عظیمی از محتوا دارد (طبق گفته Netflix بیش از 100 میلیون محصول مختلف) که دائماً در حال تغییر است و مصرف آن میتواند برای کاربر بسیار زیاد باشد. کاربران نمی خواهند در یافتن محتوای مربوط به علایق خود ناامید شوند. بنابراین، بهترین راه این است که به هر کاربر اجازه دهیم این داده ها را به گونه ای مصرف کند که در نهایت وفاداری به اشتراک را به حداکثر برساند.
اهداف محصول عبارتند از:
- افزایش / حفظ بینندگان بر حسب دقیقه مصرف
- افزایش عنوان مورد بررسی، فراوانی ورود مجدد به سیستم
- فراتر رفتن از حداقل آستانه ای که شرکت تعیین می کند ، معیار موفقیت است
- افزایش کلی وفاداری اشتراک ماهانه / کاهش لغو مشترکین
تصویر کوچک شخصی: شناسایی مشکل
این مورد استفاده زیرمجموعه توصیه های فیلم است. با توجه به اینکه توصیه های فیلم به کاربر ارائه میشود، ما در حال حاضر یک مشکل تجاری / کاربری دیگر داریم. چگونه (و چه موقع) آن توصیه فیلم را به بهترین نحو به کاربر ارائه میدهیم تا بینندگان و وفاداری ماهانه مشترکان را به حداکثر برساند؟
خوب، یک راه برای ارائه این توصیه از طریق تصویر کوچک است اما ما چه نوع تصویر کوچک را ارائه میدهیم؟ و چقدر مطمئن هستیم که تغییر تصویر کوچک تصویر بر بینش یا وفاداری مشترکان تأثیر مثبت خواهد گذاشت؟ و آن تصویر کوچک چقدر اهمیت دارد؟ آیا اطلاعاتی برای آن داریم؟
جمع آوری داده ها
میتوانید مطمئن باشید که برخی از افراد متمرکز بر محصول در Netflix-در زمان قبل از 2014-این سوالات را دقیقاً از داخل میپرسیدند. و آن فرد یا گروه با هم کار کردند (احتمالاً با UX و ذینفعان مرتبط) تا مطالعات یا داده های کاربر را در جای دیگری جمع آوری کنند تا ثابت شود که در واقع پیوند قوی بین تصویر کوچک تصویر و بینندگان وجود دارد. این فرضیه آنها بود: اینکه تنظیم محتوای هنری یک تصویر کوچک می تواند پیوند قوی با بینندگان داشته باشد.
در سال 2014 ، Netflix مطالعاتی را انجام داد که نشان میداد این تصویر کوچک چقدر مهم است: نیک نلسون، مدیر جهانی خدمات خلاق Netflix، توضیح داد که این شرکت در اوایل سال 2014 تحقیقی انجام داد که نشان میداد آثار هنری “نه تنها بزرگترین تأثیرگذار” بر تصمیم کاربر در مورد مواردی است که باید تماشا کنند، بلکه بیش از 82 درصد تمرکز آنها را هنگام مرور انجام میدهد.
نلسون مینویسد: “ما همچنین مشاهده کردیم که کاربران با توجه به هر عنوانی که در Netflix به آنها ارائه شده بود، به طور متوسط 1.8 ثانیه صرف کردند.” “ما از تأثیر یک تصویر بر روی یافتن محتوای عالی برای اعضا شگفت زده شدیم و چقدر زمان کمی برای جلب توجه آنها داشتیم.” یک تصویر کوچک و قانع کننده میتواند تفاوت بین مجبور کردن شما برای گذراندن کل آخر هفته در تماشای جدیدترین نسخه های Netflix یا از دست دادن علاقه و یا از دست دادن خدمات رقیبی مانند Hulu یا سرویسهای پخش مشابه OTT مانند ESPN / Disney / HBO Go باشد. بنابراین بر اساس مطالعات ، فرضیه فوق بسیار درست نشان داده شد.
خوب ، تصاویر کوچک مهم هستند. اما دقیقاً چه چیزی را اصلاح میکنیم؟
و چگونه یک مجموعه داده بدون ساختار مانند مجموعه ای از تصاویر کوچک به یک مدل یادگیری ماشین دیجیتال وارد می شود؟ در ادامه به این سوالات پاسخ میدهیم. اول، با توجه به اهمیت تصویر کوچک در تصمیم کاربر برای تماشای فیلم، چگونه Netflix میتواند برای هر کاربر تصویرهای کوچکتر ایجاد کند تا شانس تماشای یک ویدیو توسط کاربر افزایش یابد؟
استفاده از هنر اصلی فیلم به عنوان تنها تصویر کوچک مورد استفاده برای هر فرد به احتمال زیاد بالاترین نرخ کلیک را نخواهد داشت. این تجارت به احتمال زیاد کلیک (و زمان پخش بیننده) را روی میز می گذارد! اگر Netflix یک سامانه سفارشی تصویر کوچک متفاوت برای هر کاربر ایجاد کند که برای افزایش نرخ کلیک بهینه شده باشد، چطور؟ چه چیزهایی در تصویر کوچک تصویر وجود دارد که تحت کنترل Netflix است و میتواند آنها را برای افزایش نرخ کلیک تغییر دهد؟
در صورت وجود، کدام بازیگرها یا شخصیت ها باید روی آن تصویر کوچک باشند؟ چند تا؟ کلیک روی کدام فریم یا پوستر ایجاد شده به صورت خودکار برای کاربر خاصی جذاب تر خواهد بود؟ کدام نورپردازی بهتر کار می کند؟ چه اطلاعاتی در مورد رفتارهای دیگر کلیک کردن کاربران دیگر داریم که میتوانیم از آنها برای کمک به اطلاع رسانی این تصمیم تصویر کوچک در مقیاس استفاده کنیم؟
بنابراین این یک مشکل واقعاً جالب در تصویر کوچک است که میتواند تأثیر بسزایی در احتمال کلیک شخصی بر روی یک ویدیو و تماشای آن داشته باشد.اگر هدف این است که با تماشای تصویر کوچک، حداکثر احتمال تماشا را به حداکثر برسانید – برخی از تصمیمات محصول را باید در نظر گرفت؟
ما در هر یک از موارد استفاده بالا غرق نمیشویم، اما بیایید کمی بیشتر به مورد دوم بپردازیم: یعنی آثار هنری و شخصی سازی تصاویر کوچک. این یک ویژگی شخصی سازی مبتنی بر داده است که در بالای موتور توصیه فیلم قرار دارد
ملاحظات محصول
الگوریتم ها عالی هستند، اما محدودیت هایی نیز دارند. یک مدیر محصول همیشه باید پیش از سناریوهای احتمالی احتمالی که در آنها الگوریتم نتواند بهترین نتایج را ایجاد کند، فکر کند.
- به طور ایده آل هر فیلم باید دارای یک تصویر کوچک شخصی باشد که حداکثر کلیک را داشته باشد. از آنجایی که Netflix اطلاعاتی در مورد رفتار کلیک کردن افراد دیگر با علایق مشابه دارد، فرضیه ای منطقی است که حدس بزنید اگر سایر افراد با علایق مشابه و سابقه تماشا بر روی یک تصویر کوچک از تعداد کلیک بالایی برخوردار بودند، به احتمال زیاد این تصویر کوچک این تصویر است در مورد شخص جدیدی که هنوز این فیلم به او توصیه نشده است.
- تصویر کوچک شخصی شده باید فیلم های دیگری را که همزمان توصیه می شوند در نظر بگیرد. اما این توصیه های تصویری چیست. فرض کنید Netflix دو فیلم مختلف مرد عنکبوتی را به کاربر در کنار هم توصیه میکند و هر دو اسپایدرمن را با ماسک دوربین خاموش نشان میدهند. یکی توبی مگوایر و دیگری اندرو گارفیلد. آیا برای کاربران عجیب نیست که هر دو پرتره مگوایر و گارفیلد را در نقش مرد عنکبوتی با ماسک های خود کنار هم ببینند؟ اگر چنین اتفاقی رخ دهد، چیزی برای پاسخگویی وجود ندارد.
یک تصویر کوچک میتواند به تنهایی خوب عمل کند، اما ممکن است وقتی صفحه ای از ده ها تصویر کوچک ظاهر میشود به اندازه کافی خوب نباشد. اگر همه آنها برای ظاهر یکسان بهینه شده اند، پس به عنوان یک گروه، هر یک ممکن است کمتر قانع کننده به نظر برسند. بنابراین نگاه کردن به هر تصویر کوچک به همراه موارد دیگر مهم خواهد بود. - داده ها عالی هستند، اما مراقب الگوریتم هایی باشید که کار خود را خیلی خوب انجام می دهند و منجر به عواقب ناخواسته و مثبت کاذب میشوند! در آمار، آنها این را خطای نوع اول مینامند که به طور اشتباه (یا نامناسب) تصویر کوچک تصویر را پیشنهاد می کند که نباید پیشنهاد شود.
به مثال زیر از فیلم Like Father، با بازی کریستن بل توجه کنید. با این حال، الگوریتم Netflix (احتمالاً) توصیه های کوچک تصویر کوچک را در مورد حمایت از بازیگران/بازیگران سیاهپوست ارائه میدهد که واقعاً نمایانگر موضوع فیلم نیستند، اما در بین برخی از مخاطبان قومی نرخ کلیک بالاتری را تجربه کرده اند.
بنابراین یک تجربه بیش از حد بهینه سازی شده با پردازش گفتار شخصی میتواند یک تجربه کاربر یکنواخت ایجاد کند که در برخی موارد میتواند برای کاربر گمراه کننده باشد. ما می خواهیم ترکیبی سالم از افراد آشنا با موارد غیر منتظره را ارائه دهیم اما محتواها را نیز به درستی به کاربر نمایش دهیم تا آنها به اشتباه گمراه نشوند.
در اینجا یک مثال دیگر وجود دارد: بر اساس احتمال بالا کلیک از طریق نرخ (CTRS)، Netflix بکشد به پایان رسید تا ارائه ریز عکسها به کاربران است که همسان قومیت کاربر حتی زمانی که که (معمولا) حمایت از بازیگر screentime بسیار کمی در آن فیلم بود. البته، این الگوریتم به احتمال زیاد در طول زمان تنظیم میشود، اما درس اینجا این است که هنگام استفاده از داده ها زیاده روی نکنید و برای متعادل کردن آن از عقل سلیم استفاده کنید.
به عنوان مثال، ما نمیخواهیم کاربران را به اشتباه گمراه کنیم یا به آنها اطلاع دهیم که به دلیل نژادشان با آنها متفاوت رفتار میشود. سرانجام، الگوریتم باید تصاویر کوچک تصویر کاربر را که قبلاً در ارتباط با این فیلم دیده بود، در نظر بگیرد و هدف آن ارائه تجربه کاربری ثابت و بدون گیجی باشد.
ما میخواهیم در هر بار که فیلم به کاربر نمایش داده میشود، از دیدن تصاویر کوچک آن توسط کاربر جلوگیری کنیم. این امر نه تنها کاربر را گیج میکند، بلکه باعث میشود که مدیر محصول نتواند به یک کلیک نسبت دهد که در صورت تغییر مداوم کدام تصویر منجر به نرخ کلیک بیشتر (CTR) می شود؟ نیاز PM به اینکه بتواند هر نتیجه جدید را به درستی به یک تغییر خاص نسبت دهد. بنابراین حفظ نسبت داده های ثابت مهم است.
بنابراین اینها مواردی است که مدیر محصول هنگام طراحی سناریوهای بزرگ و موارد شدید استفاده از داده ها میتواند منجر به آن شود. صحبت از داده ها شد، اما Netflix به طور خاص از چه چیزی استفاده می کند؟ این 2 قسمت دارد:
- Netflix از چه داده هایی برای ایجاد این تصاویر کوچک / آثار هنری استفاده می کند؟
- Netflix از چه داده هایی این تصاویر کوچک سفارشی را برای افراد مناسب هدف می گیرد؟
برای سوال اول
- یک قسمت 1 ساعته Stranger Things دارای 86000 فریم ویدئویی ثابت است
- به این فریم های ویدئویی می توان هریک به صورت جداگانه ویژگی های خاصی را اختصاص داد که بعداً برای فیلتر کردن برترین نامزدهای کوچک از طریق مجموعه ای از ابزارها و الگوریتم ها به نام تجزیه و تحلیل بصری زیبایی (AVA) استفاده می شود. این برای پیدا کردن بهترین تصویر کوچک سفارشی از هر فریم ثابت ویدیو طراحی شده است
- نتفلیکس حاشیه نویسی – Netflix متا داده هایی برای هر فریم ایجاد می کند که شامل روشنایی، چهره، رنگ پوست، احتمال برهنگی، سطح تار شدن حرکت، تقارن
- رتبه بندی تصاویر Netflix – Netflix از متا داده های بالا برای انتخاب تصاویر خاص با بالاترین کیفیت استفاده می کند (نور خوب ، بدون تار شدن حرکت ، احتمالاً شامل برخی از عکس های شخصیت های اصلی از زاویه مناسب ، حاوی محتوای مارک دار غیر مجاز و غیره) ) و قابل کلیک کردن
در مورد سوال دوم مبنی بر اینکه Netflix از چه داده هایی برای شناسایی افرادی که این تصویرهای کوچک سفارشی را هدف قرار می دهند استفاده میکند، در نظر بگیرید که Netflix آهنگ ها را دنبال میکند:
- فیلم تماشا شده، دقیقه از هر نمایش تماشا شده
- درصد تکمیل برای هر فیلم یا سریال
- رای موافق، کدام فیلم ها مورد علاقه بودند و غیره
- ٪ از کل محتوای تماشا که به هر نمایش خاص منتسب است (و بنابراین میزان قرابت کاربر با یک نمایش خاص یا اعضای بازیگر مرتبط)
- هر گونه روند فصلی یا هفتگی مربوط به سطح تعامل کاربر و غیره
جالب است بدانید، در اواسط سال 2018 ، Netflix پذیرش نظرات کاربران را به عنوان یک نقطه داده، که قبلاً فقط در وب سایت آنها درخواست کرده بود ، متوقف کرد. اما چرا؟ از آنجا که این “ویژگی” در واقع بینندگان را کاهش میدهد، زیرا نظرات منفی کاربران را از امتحان ویدئو منصرف میکند. این فقط یک نمونه دیگر از این است که چگونه نیازهای یک کسب و کار بر نیاز کاربران عادی غلبه میکند! بنابراین Netflix یک تن اطلاعات در مورد هر یک از مشتریان خود دارد. از فیلم های مشاهده شده تا تصاویر کلیک شده. آنها با این همه داده چه می کنند؟
چگونه Netflix از داده ها برای ایجاد علایق مشخصات کاربر استفاده میکند. آنها از آن برای جمع آوری نمای 360 از هر کاربر و نمایه ریاضی هر کاربر با توجه به صدها، احتمالاً هزاران ویژگی مختلف استفاده میکنند. آنها این کار را به منظور گروه بندی افراد با علایق مشابه انجام می دهند تا بتوانند از داده های یک کاربر برای پیش بینی رفتار احتمالی سایر کاربران مشابه استفاده کنند.
این گروه بندی از نمایه های کاربر مشابه چگونه کار می کند و چگونه مدیر محصول داده ها را درک میکند؟
با گذراندن ریاضیات پیچیده و الگوریتم های مرتبط با ماتریسها، بردارها و تجزیه و تحلیل ویژگی های n-بعدی، ساده ترین راه را برای درک نحوه عملکرد این دستگاه از طریق نمایش فضایی سه بعدی از 10+ بعد پیدا کردم.
در اینجا اسکرین شاتی است که هنگام استفاده از TensorBoard Google در پایگاه داده اعداد دست نویس mNIST گرفتم. این یک طرح فانتزی به نام طرح t-SNE است-در واقع یک نمایش سه بعدی از ابعاد بسیار بیشتر از 3 است. در این مورد، ما 10 بعد (یک عدد برای هر رقم از 1 تا 10) را بر روی مختصات سه بعدی مانند کره نشان می دهیم. موقعیت هر رقم دست نویس در این نمایش فضایی را می توان با یک بردار توصیف کرد-مجموعه ای از اعداد شبیه مختصات در همه ابعاد ویژگی.
به همین ترتیب، در مورد کاربران Netflix ، موقعیت هر نمایه کاربر در نمودار بالا را میتوان با مقادیر عددی توصیف کرد که هریک نمایانگر یک بعد شخصی از علاقه آن کاربر است – از جمله ژانر فیلم ، بازیگران/بازیگران مورد علاقه، موضوع فیلم و غیره.
گروه های علاقمندی که با یکدیگر مرتبط هستند به هم نزدیکتر ظاهر می شوند و می توانند پیش بینی کننده خوبی باشند که کاربر چه چیزی را دوست خواهد داشت، با توجه به اینکه کاربر چیز دیگری را در این نزدیکی دوست دارد.اینگونه است که Netflix یا در واقع هر شرکتی که از مدلهای یادگیری ماشین استفاده میکند، بین داده های ظاهراً بدون ساختار و تبدیل این داده ها به اعداد رابطه ایجاد می کند. این اعداد به خودی خود چندان منطقی نیستند، اما در کنار هم هستند.
اما هنگامی که Netflix هر تصویر کوچک را حاشیه نویسی می کند و به هر یک فوق داده هایی را برای توضیح آنچه در آن تصویر کوچک است اختصاص میدهد. اکنون ما نمایش عددی آن داده های بدون ساختار را داریم. آن نمایش عددی را به صورت بردارها در یک کره سه بعدی مانند بالا ترسیم کنید و اکنون Netflix شروع به ایجاد روابط بین نقاط داده میکند.
Netflix سپس نقاط داده ای را پیدا می کند که نسبتاً به یکدیگر نزدیک هستند و از آنها برای پیش بینی رفتارهای بعدی در کلیک استفاده می کند. اگر پیش بینی ها بد یا خوب شوند، موقعیت ریاضی این ویژگی ها را بر این اساس تنظیم می کنند تا زمانی که مدل بهتر و بهتر شود. بنابراین Netflix اینگونه است که داده های بدون ساختار را به نمایش های ریاضی تبدیل میکند. از فاصله رابطه ای بین نقاط داده به عنوان مبنایی برای ایجاد و بهبود توصیه های کوچک تصویر استفاده میکند.
Netflix از این همه داده چه آموخت؟
اکنون که می دانیم چگونه Netflix در مدل یادگیری ماشین تصاویر را به اعداد تبدیل می کند ، Netflix از همه پردازش داده ها و آزمایشات که سالها انجام داده است چه اطلاعاتی بدست آورده است؟ علاوه بر یادگیری میلیونها تصویر کوچک که کاربران را در طول زمان به مشترکان وفادار تبدیل کرده است، در اینجا چند نکته دیگر وجود دارد که Netflix در مورد تصاویر کوچک به کار میبرد:
- نمای نزدیک چهره های احساسی را بیان کنید
- به جای قهرمانان به افراد شرور نشان دهید
- بیش از سه کاراکتر نشان ندهید
در نتیجه گیری: Netflix هوش مصنوعی را در راه درست به کار گرفت. بیایید از رویکرد آنها درس بگیریم. Netflix یک کار خارق العاده در بکارگیری هوش مصنوعی، علم داده و یادگیری ماشینی به روش صحیح انجام داده است. با استفاده از رویکردی مبتنی بر محصول که ابتدا بر نیازهای تجاری تمرکز میکند، سپس راه حل هوش مصنوعی بعد، و نه برعکس.
وقتی از هوش مصنوعی به درستی استفاده شود می تواند معجزه کند
ما دیدیم که راه حل های هوش مصنوعی چقدر میتواند در شخصی سازی تجربه به نفع Netflix از نظر اشتراک و کاربران از نظر رضایت کلی موثر باشد.ما همچنین محدودیت های الگوریتم هایی را مشاهده کرده ایم که “زیاده روی می کنند” و نمونه های خاصی را مورد بحث قرار داده ایم که در آنها الگوریتم Netflix تصاویر کوچک گمراه کننده ای را برای افراد رنگی ارائه کرده است ، زیرا الگوریتم برای کلیک ها بهینه شده است و به طور موثر کاربران را “فریب” می دهد تا طعمه کلیک کنند. این حتی زمانی اتفاق می افتد که تصویر کوچک آن ویدیو را به طور دقیق نشان نمی دهد.
هیچ الگوریتمی در محاسبه تمام تفاوت های ظریف یک تجربه انسانی کامل نخواهد بود. در واقع، الگوریتمهایی که برای بهره گیری از معیارها طراحی شده اند، دقیقاً همان کار را انجام میدهند. بنابراین وظیفه مدیر محصول این است که با طراحی یا سایر اعضای تیم کار کند تا راهی برای رفع این نقایص در الگوریتم ها پیدا کند.در ادامه، ادغام هوش مصنوعی در جامعه و همچنین در فضای سازمانی شرکتی همچنان رواج بیشتری پیدا خواهد کرد.
ممکن است فناوران تمایل داشته باشند که راه حل های هوش مصنوعی موجود را تجویز کنند، اما واقعاً موثر ترین روش برای پذیرش هوش مصنوعی همان روشی است که Netflix انجام داد.