Представьте себе 299 млн человек, которые получают персонализированный плейлист из 30 песен. Каждый понедельник. А теперь представьте, что 167 млн человек получают персональные рекомендации о том, какой фильм или сериал им посмотреть, при этом даже обложки фильмом и сериалов адаптированы специально для них. Это непосильная задача, которую никто не может выполнить в одиночку, даже для одного пользователя, не говоря уже о сотнях миллионов по всему миру. Вот где рекомендательные алгоритмы приходят на помощь.
Кому нужны рекомендации?
Каждая компания на планете стремится получить как можно больше. В случае таких компаний, Netflix и Spotify, это достигается путем привлечения, но также и удержания как можно большего числа пользователей. Говоря «как можно больше пользователей», мы говорим о действительно большом количестве – буквально сотнях миллионов, из разных культур, с чрезвычайно разными вкусами и представлениями. Задача алгоритмов и их разработчиков в каждой такой компании огромна, потому что они должны показывать подходящий контент, чтобы удержать каждого отдельного пользователя. Только так у каждого из них появится мотивация продолжать платить и пользоваться услугами.
Одна из главных «проблем» этих сервисов – их огромное преимущество. Они дают доступ к очень большой библиотеке контента – миллионам песен или тысячам фильмов и сериалов, среди которых, безусловно, каждый найдет что-то интересное для себя. Здесь на помощь приходит система рекомендации контента, которая, с одной стороны, облегчает пользователям задачу, не показывая им то, чего они, вероятно, не хотят видеть. С другой стороны, она предлагает им то, чему они должны быть искренне рады – трогательную мелодию или необычную историю. А что касается успешности рекомендаций…
Spotify может визуализировать ваш музыкальный вкус в виде топографической карты с пиками, низинами и отдельными островами.
Более 80% сериалов, которые смотрят пользователи Netflix, происходят из системы рекомендаций платформы. В музыкальном мире, всего через 9 месяцев после его запуска, плейлист «Открытия недели» (Discover Weekly) от Spotify, который курируется алгоритмом и является уникальным для каждого пользователя, прослушали более 40 млн человек. Это лишь два из многих примеров того, насколько важны рекомендации для потоковых сервисов. А тот факт, что рекомендации даются алгоритмами, делает сами алгоритмы столь же ключевыми в бизнесе этих компаний. Но как они работают?
Трехногий стул Netflix
Одно из самых больших достижений Netflix – это рекомендация контента, который пользователи обычно не принимают во внимание. Например, каждый восьмой человек, который смотрит сериалы Marvel в Netflix, никогда не видел ничего связанного или основанного на комиксах. Комбинируя машинное обучение (machine learning) и алгоритмы, компания изучает предубеждения потребителей и рекомендует им то, что они обычно не смотрят, но все же отвечает их предпочтениям.
Компания описывает эту систему как трехногий стул. Первая ножка стула – это пользователи и, в частности, каждый отдельный профиль (у каждого подписчика может быть до пяти профилей) и его привычки. Платформа учитывает как то, что пользователи смотрят в данный момент, так и ранее просмотренный контент, который просматривался год назад или недавно, а также в какое время суток он было просмотрен. Затем эти данные объединяются со второй ножкой стула – подробным тегом для каждого фильма или сериала. Теги создаются людьми, которые внимательно смотрят каждый эпизод или фильм, и содержат неожиданные подробности о них. Какое у них настроение, какие эмоции они вызывают, есть ли самостоятельный главный герой, коррумпированное правительство, происходит ли действие в космосе. Часть из них видно на главной странице с такими названиями, как Gritty drama или TV Dramedies, но большинство из них скрыто от пользователей.
Затем данные об использовании сервиса и теги переходят к третьей ножке стула – алгоритмам. С ними Netflix понимает, что важно для аккаунта в данный момент. Что важнее? Вчерашний фильм или тот сериал, который вы смотрели год назад? Неужели 10 минут сериала сегодня имеют больший вес, чем просмотр двух сезонов за раз месяц назад? Все эти данные приводят к созданию «сообществ по вкусам», в которые входят профили со всего мира.
Ключевой момент в том, что зрители попадают в разные сообщества – фактор, который влияет на то, что отображается на главном экране сервиса. Важная деталь: у Netflix нет причин рекомендовать определенный контент больше, чем другой. Создателям контента выплачивается фиксированная плата, поэтому не имеет значения, смотрят ли фильм или сериал 1 или 100 миллионов человек – расходы для Netflix такие же. Вот почему компания ограничивается рекомендациями, которые просто удерживают пользователей в сервисе.
В ритме алгоритма
Одно из существенных различий между Netflix и Spotify, помимо самого контента, – это конкуренция сервисов. В то время как Netflix, HBO, Amazon Prime и т.д. сражаются друг с другом за счет сочетания иностранного и оригинального контента, Spotify, Tidal и Apple Music лишены этой роскоши. За редким исключением, все музыкальные сервисы предлагают практически идентичный контент, и выбор одного из них основан на всем остальном, но главным образом на кураторстве музыки.
В нашей беспокойной повседневной жизни поиск новой музыки – это занятие, для которого у нас редко бывает необходимое время. Однако радость от открытия новой хорошей песни остается сильной. Вот на что рассчитывает Spotify в своих рекомендациях, особенно с Discover Weekly.
Даже продвинутые алгоритмы Spotify и Netflix опираются на некоторые ключевые элементы человеческого вмешательства.
В отличие от Apple Music, где рекомендации делают музыкальные редакторы, Spotify использует алгоритмы. Как и Netflix, Spotify создает вкусовой профиль для всех пользователей, беря за основу то, что они слушают. Благодаря этому профилю платформа дает рейтинг близости к исполнителям, который основан на алгоритме, определяющем важность исполнителя для слушателя. Алгоритм также учитывает жанры, которые вы слушаете, чтобы определить, в каких из них вы, скорее всего, захотите услышать что-то новое.
Что еще более интересно, если мы примем музыкальный вкус каждого за континент с вершинами, которые представляют нашу любимую и наиболее прослушиваемую музыку, и долинами из песен и исполнителей, которые нам нравятся, тогда у нас будет целый океан песен и жанров, которые нам не нравятся. Но есть также острова музыки, которые мы слушаем, но не любим. Это, например, детские песни, которые ребенок слушает из вашего профиля, или те три песни ABBA, которыми вы предаете свое рокерское отношение. Алгоритм достаточно умен и знает, что не стоит учитывать эту музыку.
Однако суть работы алгоритма заключается в поиске других пользователей, у которых есть плейлисты с вашими любимыми музыкантами и песнями. Из этих плейлистов ваших музыкальных родственных душ он берет песни, которые вы не слушали, фильтрует их по вашему вкусовому профилю и добавляет в рекомендации, которые вы видите каждый понедельник в Discover Weekly. Ваше поведение с Discover Weekly влияет на ваш вкусовой профиль, и любая понравившаяся, пропущенная или добавленная песня в список воспроизведения является сигналом того, что вам нравится, а что нет.
Люди вокруг алгоритмов
Подобно тому, как Spotify и Netflix не исчерпывают потоковые сервисы на рынке, описанные здесь подходы не исчерпывают роль и работу алгоритмов даже в этих двух компаниях. Netflix использует интеллектуальные системы для тестирования новых функций, в том числе различных обложек одних и тех же фильмов, ежегодно охватывая сотни тысяч пользователей. У Spotify есть системы анализа естественного языка, которые роются в популярных блогах в поисках новой сенсационной музыки, которая становится частью плейлистов Fresh Finds. Система анализа звука определяет качество совершенно новой музыки, которой нет в чьем-либо блоге или плейлисте.
Примечательно, что эти ключевые алгоритмы сильно зависят от людей. И речь идет не об инженерах и программистах, разрабатывающих алгоритмы, а о миллионах пользователей Spotify, которые добавляют треки в плейлисты, и десятках сотрудников и фрилансеров, которые тегируют контент Netflix. Без этой метафорической ножки стула алгоритмы были бы абсолютно неспособны принять правильное решение для отдельного пользователя.