Пока BigData и InMemory очень плохо совместимы.
BigData - это распределенные слабоструктурированные данные.InMemory - это поколоночные СУБД с сжатием данных.
В общем, я сейчас данными проектами и занимаюсь: в Хадупе собирается инфа, через Hive происходит выборка и упорядочивание основных данных + аналитических срезов в датамарт, которые как раз и затягиваются в InMemory DB (Qlikview). Все работает шустро и в пямяти, но вот если нужна ссылка на исходный документ (проводку, строчку лога от оборудования, подробную информацию по поведению клиента) - тогда уже имейте терпение, запрос идет к BigData. А там уже дело в релевантности (насколько точно хотим получить результат) и в том, насколько данные внутри хорошо структурированы.
С Уважением,
Георгий
|