Машина факторизации внимания с обзором
Том 13 научных отчетов, номер статьи: 13454 (2023) Цитировать эту статью
278 Доступов
1 Альтметрика
Подробности о метриках
В рекомендательных системах отзывы пользователей об товарах содержат богатую семантическую информацию, которая может выражать предпочтения пользователей и особенности товара. Однако существующие методы рекомендаций на основе обзоров либо используют статическую векторную модель слов, либо не могут эффективно извлекать функции длинной последовательности в обзорах, что приводит к ограничению возможностей выражения пользовательских функций. Кроме того, игнорируется влияние различных или бесполезных взаимодействий между пользователями и элементами на эффективность рекомендаций. Поэтому мы предлагаем машину факторизации внимания с взаимодействием пользователя и элемента для получения рекомендаций на основе отзывов (AFMRUI), которая сначала использует RoBERTa для получения функции внедрения каждого отзыва пользователя/элемента и объединяет двунаправленные закрытые повторяющиеся блоки с сетью внимания, чтобы выделить больше полезная информация как в отзывах пользователей, так и в обзорах товаров. Затем мы применяем AFM для изучения взаимодействия функций пользователя и элемента, чтобы определить важность различных взаимодействий между функциями пользователя и элемента и, кроме того, получить более точный прогноз рейтинга, чтобы продвигать рекомендации. Наконец, мы провели оценку производительности на пяти реальных наборах данных. Экспериментальные результаты на пяти наборах данных показали, что предлагаемый AFMRUI превосходит современные методы, основанные на обзорах, в отношении двух часто используемых показателей оценки.
В условиях быстрого развития интернет-индустрии и технологий больших данных рекомендательные системы играют все более важную роль в социальных сетях1, академическом образовании2, электронной коммерции3 и так далее. В настоящее время рекомендательные системы стали неотъемлемой частью повседневной жизни, например, покупки в Интернете4, рекомендации по следующим достопримечательностям5, рекомендации по музыке6 и просмотр видео7. Согласно историческим данным о поведении пользователей, рекомендательные системы могут прогнозировать оценки пользователей товаров и выполнять персональные рекомендации, чтобы помочь пользователям быстро находить интересующие их товары и повышать удовлетворенность пользователей. Таким образом, чтобы обеспечить более качественные услуги персонализированных рекомендаций, проблема точного прогнозирования оценок пользователей по элементам для повышения эффективности рекомендаций становится сложной проблемой.
Для решения вышеуказанной проблемы исследователи предложили различные методы прогнозирования рейтинга элементов, среди которых метод прогнозирования рейтинга8, основанный на совместной фильтрации (CF), является одним из наиболее широко используемых методов. Большинство методов CF основаны на матричной факторизации9,10, изучении скрытых особенностей пользователей и элементов матричных моделей для рекомендаций. Учитывая, что рейтинги пользователей для элементов отражают их поведение при взаимодействии и явные характеристики, Чжан и др.11 получили характеристики пользователей и элементов на основе информации о рейтинге пользователей и элементов на основе глубокой матричной факторизации. Однако с быстрым ростом количества пользователей и товаров возникает все больше и больше проблем, таких как разреженность рейтинговых данных. К сожалению, информация, извлекаемая из рейтинговых данных, ограничена, что ограничивает эффективность рекомендаций.
По сравнению с рейтинговыми данными, информация отзывов содержит богатую семантику, которая может не только отражать удовлетворенность пользователей качеством и функциональностью товара, но и косвенно выражать предпочтения пользователей и характеристики товара12. Таким образом, прогнозирование рейтинга элементов на основе обзоров привлекло широкое внимание таких исследователей, как ConvMF13, DeepCoNN14, D-Attn15, NARRE16 и DAML17 и т. д. Эти методы могут облегчить проблему разреженности, вызванную рейтинговыми данными с помощью обзорной информации, и, таким образом, получить относительно точные рейтинги прогнозов для рекомендаций. Однако есть два основных ограничения:
Возможности выражения функций пользователя/предмета недостаточны. В приведенном выше исследовании D-Attn15, DAML17 и т. д. используют статически закодированные векторы слов, такие как word2vec или Glove, что приводит к разреженному представлению функций, недостаточной семантике и полисемии, что влияет на способность модели извлекать функции пользователя и элемента. Более того, такие модели, как ConvMF13, DeepCoNN14 и NARRE16, используют сверточные нейронные сети (CNN) для извлечения характеристик пользователей и элементов из обзоров, которые не могут эффективно извлекать текстовые функции с длинными последовательностями в обзорах и, следовательно, не могут точно выражать функции пользователя или элемента, ограничивая производительность модели.