Чтение онлайн

на главную - закладки

Жанры

Dolgin.indb

Маматов Алексей Сергеевич

Шрифт:

EachMovie работает с базой из 4000 пользователей и 1600 товаров»172.

Дорогостоящие вычисления целесообразно выполнять только в офф-

лайне, но традиционная поклиентсткая корпоративная фильтрация в

таком режиме практически не функционирует, а делать все вычисле-

ния в режиме реального времени трудно. Это возможно только если

количество измерений невелико, что уменьшает качество рекоменда-

ций. В противном случае обслуживание рекомендательной системы

оказывается

неоправданно затратным.

Еще одна проблема, характерная для коллаборативной фильтра-

ции – это рекомендации чего-то принципиально иного. Многие дей-

ствующие системы дают сбой на этом месте173. Например, если при ра-

боте с Amazon.com. указать, что у вас в библиотеке есть «Макбет» Шек-

спира, то в ответ последует поток «услужливых» подсказок других пьес

Шекспира174. Так же банальны и советы в сфере музыки. В рамках кон-

тентных систем идет поиск товаров, связанных общими характеристи-

ками (того же автора, актера, режиссера) либо имеющих те же ключе-

вые слова. Пообъектная коллаборативная фильтрация тоже базируется

на сходстве товаров. Поэтому клиенту, купившему DVD с фильмом

«Крестный отец», компьютер выдаст список других криминальных

драм, фильмов с Марлоном Брандо и картин, снятых Ф. Копполой. Ре-

комендации часто будут либо слишком общими (все DVD того же жан-

ра), либо чрезмерно зауженными (все книги того же автора), в то время

как человек надеется на помощь в нахождении новых, стоящих вни-

мания продуктов. Пытаясь решить эту проблему, некоторые системы, например Daily-Learner, отклоняют объекты на основании слишком

большого сходства с тем, что уже известно клиенту175.

Субъект-субъектная версия коллаборативной фильтрации лишена

этого недостатка. Клиент может запросить набор произведений, высо-

172 Linden G., Smith B., York J. Amazon.com Recommendations. Item-to-Item Collaborative Filtering // IEEE Internet Computing, February 2003.

173 Terveen L., Hill W. Beyond Recommender Systems…

174 Там же.

175 Billsus D., Pazzani M. User Modeling for Adaptive News Access // User Modeling and User-Adapted Interaction,Vol. 10, № 2–3, 2000. P. 147–180.

Й. Жанг и др. предложили пять правил избыточности, чтобы определить, содер-

жит ли продукт, отвечающий профилю потребителя, какую-либо новую для него

информацию (cм.: Zhang Y., Callan J., Minka T. Novelty and Redundancy Detection in Adaptive Filtering // Proc. 25th Ann. Intl ACM SIGIR Conf., 2002. P. 81–88).

189

ЧАСТЬ 2. УХУДШАЮЩИЙ ОТБОР В ИНДУСТРИЯХ КУЛЬТУРЫ

ко оцененных его кругом

рекомендателей, и обнаружить что-то совер-

шенно новое.

Сотрудники Amazon сообщают, что справились с рядом недочетов

пообъектной коллаборативной фильтрации, разработав собственную

оригинальную схему (хотя, как показывает опыт с Шекспиром, с внед-

рением ноу-хау еще не все гладко)176. Ими разработан алгоритм колла-

боративной фильтрации для работы с громадными базами данных (что

актуально для Amazon.com177), способный выдавать качественные, по

мнению авторов, рекомендации в режиме реального времени. Смысл в

том, что система соотносит каждый из приобретенных пользователем

товаров с близкими товарами, купленными другими клиентами, и фор-

мирует рекомендательный список178.

Создав (в оффлайновом режиме) таблицу сходных товаров, про-

грамма находит среди них те, что перекликаются с покупками и оцен-

ками конкретного пользователя. Затем ему подсказывают самые по-

пулярные из продуктов, сходных с теми, что он еще не покупал или

близких к уже купленным. (При этом, какие именно ему нужны реко-

мендации, никто не спрашивает!) Вычисление занимает мало времени, поскольку основная работа делается в режиме оффлайн, и в этом сек-

рет масштабируемости пообъектной схемы. На выходе предлагаются

только в большой степени сходные и, как уверяют авторы, желанные

товары, хотя не ясно, откуда при высоком сходстве возьмутся рекомен-

дации нового, оригинального произведения искусства.

2.7.4. Гибридные методы производства рекомендаций

Эти методы представляют собой комбинацию коллаборативного

и контентного подходов и позволяют избежать ограничений, свойс-

твенных каждой из систем в отдельности179. Преимущества гибридной

схемы180 видны из простого примера. Предположим, один пользователь

176 Linden G., Smith B., York J. Amazon.com Recommendations…

177 У Amazon.com десятки миллионов клиентов и несколько миллионов товаров.

178 Для вычисления сходства между двумя товарами применяется тот же метод, что

и в традиционной поклиентской коллаборативной фильтрации, с той лишь раз-

ницей, что вектор соответствует товару, а не пользователю, а его размерность

равна числу пользователей, приобретших данный товар.

179 Wei Y. Z., Moreau L., Jennings N. R. A market-based approach to recommender systems

// ACM Transactions on Information Systems, Vol. 23, № 3, April 2005. P. 227–266.

180 Дополнительную информацию про гибридные рекомендательные системы см. в

Поделиться:
Популярные книги

Титан империи

Артемов Александр Александрович
1. Титан Империи
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Титан империи

Ваше Сиятельство 11

Моури Эрли
11. Ваше Сиятельство
Фантастика:
технофэнтези
аниме
фэнтези
5.00
рейтинг книги
Ваше Сиятельство 11

Сердце Дракона. Том 8

Клеванский Кирилл Сергеевич
8. Сердце дракона
Фантастика:
фэнтези
героическая фантастика
боевая фантастика
7.53
рейтинг книги
Сердце Дракона. Том 8

Хозяйка поместья, или отвергнутая жена дракона

Рэйн Мона
2. Дом для дракона
Фантастика:
фэнтези
5.00
рейтинг книги
Хозяйка поместья, или отвергнутая жена дракона

Вернуть невесту. Ловушка для попаданки 2

Ардова Алиса
2. Вернуть невесту
Любовные романы:
любовно-фантастические романы
7.88
рейтинг книги
Вернуть невесту. Ловушка для попаданки 2

Идеальный мир для Лекаря 3

Сапфир Олег
3. Лекарь
Фантастика:
фэнтези
юмористическое фэнтези
аниме
5.00
рейтинг книги
Идеальный мир для Лекаря 3

Правильный попаданец

Дашко Дмитрий Николаевич
1. Мент
Фантастика:
альтернативная история
5.75
рейтинг книги
Правильный попаданец

Барин-Шабарин 2

Гуров Валерий Александрович
2. Барин-Шабарин
Фантастика:
попаданцы
альтернативная история
фэнтези
5.00
рейтинг книги
Барин-Шабарин 2

Развод с генералом драконов

Солт Елена
Фантастика:
фэнтези
5.00
рейтинг книги
Развод с генералом драконов

Не грози Дубровскому!

Панарин Антон
1. РОС: Не грози Дубровскому!
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Не грози Дубровскому!

Инквизитор Тьмы 4

Шмаков Алексей Семенович
4. Инквизитор Тьмы
Фантастика:
попаданцы
альтернативная история
аниме
5.00
рейтинг книги
Инквизитор Тьмы 4

Пятьдесят оттенков серого

Джеймс Эрика Леонард
1. Пятьдесят оттенков
Проза:
современная проза
8.28
рейтинг книги
Пятьдесят оттенков серого

Кротовский, сколько можно?

Парсиев Дмитрий
5. РОС: Изнанка Империи
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Кротовский, сколько можно?

Завод-3: назад в СССР

Гуров Валерий Александрович
3. Завод
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Завод-3: назад в СССР