Я предположил, что решению моей задачи может помочь machine learning. Передо мной страшный и могучий R. Библиотека arules - то, что мне нужно.
Насколько я понял, читанув слегка описание, библиотека служит для поиска закономерностей в транзакциях, выводит association rules. Пишу стандартный многоцитируемый сэмпл:
Насколько я понял, читанув слегка описание, библиотека служит для поиска закономерностей в транзакциях, выводит association rules. Пишу стандартный многоцитируемый сэмпл:
library(arules)
txn = read.transactions(
file="basketData.txt",
format="basket",
sep=" ");
basket_rules <- apriori(
txn,
parameter = list(sup = 0.5, conf = 0.9,target=”rules”))
Транзакций-то у меня было всего на 37 килобайт и в них различных предметов упоминалось всего-то 36. Прога работала несколько минут, съела 1.6 Г памяти, выдала статус "writing..." и грохнулась. Может быть, Windows7 не совсем то, что в таких случаях удобно использовать. Но я же честно погуглил. И вот багтрекер проекта arules совсем чист. А на форуме упоминаются похожие проблемы и не с Windows.
Есть ли другие пакеты для таких задач?
Комментариев нет:
Отправить комментарий