Dolgin.indb
Шрифт:
одну проблему рекомендательных систем – назойливость (большин-
ство этих сервисов предполагают пользовательскую активность). Для
точного расчета необходимы оценки большого количества ранее оп-
робованных продуктов. Эти сведения стараются извлечь косвенными
методами167. Например, анализируют время, ушедшее на чтение ста-
тьи. Но косвенные данные неточны и не заменяют полностью прямых
оценок пользователя. Поэтому проблема снижения навязчивости ре-
комендательных
164 Вообще говоря, сближение родственных по духу людей и формирование сооб-
ществ по интересам может оказаться главной ценностью коллаборативной тех-
нологии, радикально и позитивно меняющей мир.
165 Этика содействия организации обществ по интересам разбирается, в част-
ности, Тервином и Хиллом на примере системы PHOAKS. Главный приоритет
здесь – соблюдение невмешательства в частную жизнь (Terveen L., Hill W. Beyond Recommender Systems: Helping People Help Each Other // Carroll J. (ed.) HCI in the New Millennium. Addison-Wesley, 2001).
166 Подробнее см.: Rashid A. M., Albert I., Cosley D., Lam S. K., McNee S. M., Konstan J. A., Riedl J. Getting to Know You: Learning New User Preferences in Recommender Systems
// Proc. Intl Conf. Intelligent User Interfaces, 2002; Yu K., Schwaighofer A., Tresp V., Xu X., Kriegel H.-P. Probabilistic Memory-Based Collaborative Filtering // IEEE
Transactions on Knowledge and Data Engineering, Vol. 16, № 1, Jan. 2004. P. 56–69.
167 См.: Caglayan A., Snorrason M., Jacoby J., Mazzu J., Jones R., Kumar K. Learn Sesame
— A Learning Agent Engine // Applied Artifi cial Intelligence, Vol. 11, 1997. P. 393–412; Konstan J. A., Miller B. N., Maltz D., Herlocker J. L., Gordon L. R., Riedl J. GroupLens: Applying Collaborative Filtering to Usenet News // Comm. ACM, Vol. 40, № 3, 1997.
P. 77–87; Middleton S. E., Shadbolt N. R., de Roure D. C. Ontological User Profi ling in Recommender Systems // ACM Trans. Information Systems, Vol. 22, № 1, 2004. P. 54–88; Oard D. W., Kim J. Implicit Feedback for Recommender Systems // Proc. Recommender Systems. Papers from 1998 Workshop, Technical Report WS-98-08, 1998.
187
ЧАСТЬ 2. УХУДШАЮЩИЙ ОТБОР В ИНДУСТРИЯХ КУЛЬТУРЫ
стоит довольно остро. MovieLens, например, первым делом просит но-
вичков проставить оценки двум десяткам фильмов168.
Те же сложности возникают и с новым товаром: его невозможно
рекомендовать до тех пор, пока он не наберет достаточного количества
оценок169.
Есть и еще одна препона – так называемая разреженность оценок.
Спрос на рекомендации обычно превышает наличие оценок в системе.
Люди предпочитают не давать оценки, а получать их, не вкладываться
в формирование
ти, проблема «первого оценщика» и вообще «холодного старта». Как
побудить человека к этому действию, ведь поначалу взамен он не при-
обретает ничего и может подождать, пока эти хлопоты возьмет на себя
кто-то другой?170 Хотя если судить по высочайшей спонтанной актив-
ности веблоггеров, не стоит переоценивать трудности. И все же так или
иначе критическая масса пользователей необходима. Например, в ре-
комендательных системах по кино часть фильмов оценивается лишь
малым числом зрителей, поэтому эти ленты будут рекомендоваться
редко, даже если им поставили высокие баллы. В общем, если в базе
данных число «экспертов» относительно мало по сравнению с количес-
твом объектов, прогнозы будут неточны. Проблему можно частично
купировать, если включить в профиль пользователя дополнительную
информацию, к примеру, учитывать социально-демографические дан-
ные (это так называемая демографическая фильтрация). Так, рекомен-
дательные системы для ресторанов предлагается пополнять сведения-
ми о возрасте, месте проживания, образовании и работе171.
Часть проблем коллаборативной фильтрации носит сугубо техни-
ческий характер и связана со сложностями вычислений при работе с
большими базами данных. Как указывают разработчики конкурирую-
щих друг с другом систем, «почти все современные алгоритмы колла-
168 Такой запрос требует от пользователя некоторого количества усилий. В то же время
каждая дополнительная оценка увеличивает точность анализа и в этом смысле вы-
годна клиенту. Поэтому перед разработчиками стоит проблема минимизации необ-
ходимого числа оцениваемых единиц, чтобы человек ради получения эффективно-
го результата был готов потратить некоторое время на первоначальные оценки.
169 Good N., Schafer J. B., Konstan J., Borchers A., Sarwar B., Herlocker J., Riedl J. Combining Collaborative Filtering with Personal Agents for Better Recommendations // Proc. of AAAI’99, July 1999.
170 Avery C., Resnick P., Zeckhauser R. Th
e Market for Evaluations // American Economic Review, Vol. 89(3), 1999. P. 564–584.
171 Pazzani M. A Framework for Collaborative, Content-Based, and Demographic Filtering
// Artifi cial Intelligence Review, December 1999. P. 393–408.
188
ГЛАВА 2.7. ОБЗОР РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ
боративной фильтрации были разработаны на небольших базах дан-
ных. Например, MovieLens работает с 35000 клиентов и 3000 товаров, а