1. Большие
данные
в
Ecommerce
Как
превратить
цифры
в
деньги
Роман
Зыков,
Retail
Rocket
2. Давайте
знакомиться!
Роман
Зыков
Retail
Rocket,
сооснователь,
директор
по
аналитике
Более
10
лет
занимаюсь
построением
систем
Business
Intelligence
и
рекомендательных
сервисов
для
крупнейших
сайтов
Рунета.
В
2004
году
закончил
Московский
Физико-‐Технический
Институт
(МФТИ).
Личный
блог
по
аналитике
—
KPIs.ru.
Компании:
Ozon.ru,
Wikimart.ru
и
Ostrovok.ru.
3. Что
такое
Retail
Rocket?
+
Товарные
рекомендации
для
сайта
+
Система
real-‐Dme
персонализации
сайта
и
email
+
Система
триггерных
рассылок
Платформа
персонализации
интернет-‐магазина
+
90
миллионов
уникальных
пользователей
в
месяц
+
Аналитический
кластер
из
70
серверов
+
360
тысяч
внешних
запросов
в
минуту
+
6GB
сырых
данных
для
анализа…
В
час!
В
цифрах:
4. Соревнования
по
анализу
данных
Пора
начать
заниматься
своими
данными!
Kaggle.com:
•
O`o
group
—
классификация
товаров
(маркетинг).
•
Walmart
—
предсказание
продаж
товаров
при
экстремальных
погодных
условиях
(прогнозирование
закупок).
•
Неизвестно
—
предсказание
лояльности
пользователя
(350
млн.
записей).
•
Expedia
—
сортировка
отелей
для
пользователей.
•
Неизвестно
—
предсказание
онлайн
продаж
в
зависимости
от
рекламных
кампаний.
*
Неизвестно
—
компания
пожелала
остаться
неизвестной
**
Kaggle.com
—
соревнования
специалистов
по
машинному
обучению
6. Andreas
Weigend
Работал
главным
аналитиком
Amazon.com.
Преподает
в
ведущих
университетах
США
и
Китая
(включая
Stanford).
«People
are
way
more
predictable
than
they
think
they
are!»
7. Время
принятия
решения
24
часа
для
персональных
рекомендаций
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
(25%-‐75%]
(25%-‐75%]
(25%-‐75%]
(25%-‐75%]
(25%-‐75%]
(25%-‐75%]
(25%-‐75%]
(25%-‐75%]
1294
5990
6191,5
18990
2930
3850
2135
4745
228
968
855
3990
1030
1369
429
1296
Books
DIY
Electronics
Furniture
&
Household
Health&beauty
Kids
Mul•Category
Sports
Less
1
hour
More
1
hour
less
3
hours
More
3
hours
less
12
hours
More
12
hour
less
1
day
More
1
day
less
2
days
More
2
days
less
4
days
More
4
days
8. Главная
страница
Главная
страница
потребность
сформирована
Навигация!
10. Главная
страница
Главная
страница
1.
Бестселлеры
/
Самые
популярные
–
Просто:
покупки.
–
Сложно:
просмотры/
корзины/
покупки,
дисконтирование,
долгосрочные
интересы,
персонализация,
профилирование.
потребность
сформирована
потребность
не
сформирована
Навигация
Акции
+
рекомендации
11. Главная
страница
Главная
страница
1.
Бестселлеры
/
Самые
популярные
–
Просто:
покупки.
–
Сложно:
просмотры/
корзины/
покупки,
дисконтирование,
долгосрочные
интересы,
персонализация,
профилирование.
2.
Персональные
рекомендации
–
Краткосрочные
интересы
3.
Новинки
–
Просто:
сортировка
по
дате
добавления
товара
в
базу
–
Сложно:
профилирование,
долгосрочные
интересы.
потребность
сформирована
потребность
не
сформирована
Навигация
Акции
+
рекомендации
12. Кейс:
Персонализация
главной
Главная
страница
для
нового
пользователя
Та
же
страница
для
интересовавшегося
телевизорами
+
Кейс
персонализации
главной
страницы
Dostavka.ru:
рост
продаж
на
8,5%
+
Подробное
описание
кейса:
hyp://bit.ly/retail-‐rocket-‐dostavka
13. Механизм
предсказания
следующей
покупки
Andreas
Weigend:
Next
up
is
something
he
calls
"zero-‐click
shopping"
—
meaning
that
you'll
buy
stuff
automa•cally,
without
going
online
to
shop
for
it.
14. Механизм
предсказания
следующей
покупки
1
3
2
4
5
6
7
8
1.
Анализ
последовательностей
покупок
2.
Выявление
значимых
цепочек
3.
После
того,
как
человек
совершает
покупку,
появляется
вероятность
покупки
в
следующем
«звене»
цепочки
потребления
15. 1
3
2
4
5
6
7
8
t1
t2
t3
t4
t5
Механизм
предсказания
следующей
покупки
+
В
жизни
каждая
покупка
является
звеном
сразу
нескольких
цепочек
потребления
+
Разные
цепочки
потребления
по-‐разному
распределяются
во
времени
16. Средства
для
купания
детей
Бутылочки
и
соски
Посуда
для
малышей
Нагрудники
и
слюнявчики
18
дней
Пустышки
29
дней
24
дня
28
дней
Реальный
пример
цепочек
потребления
17. Кейс:
триггерные
рассылки
в
Hoff.ru
• Следующая
вероятная
покупка
(«Next
Best
Offer»).
CR
~7%.
+
Подробное
описание
кейса:
hyp://bit.ly/case-‐hoff-‐triggers
18. Сколько
стоит
в
рублях?
Data
scien•st
Менеджер
продукта
Мин
=
200
000
*
1.5
Опт
=
270
000
*
1.5
Hadoop
Мин
(3)
=
15
000
Опт
(6)
=
30
000
Итого
мин.
стоимость
запуска:
(350
000
+
15
000)
*
6
месяцев
=
2
190
000
р.
Оптимальная
стоимость
=
Мин
+
(70
000
*
1.5
+
15
000)
*
6
=
2
910
000
р.
21. Определение
Персонализированное
(price
discrimina}on):
•
Геолокация
(расстояние
до
ближайшего
магазина,
средний
доход
на
местности)
—
Staples.com.
•
Тип
браузера
и
ОС.
•
История
транзакций
(платежеспособность
пользователя).
•
Источник
перехода
(чувствительность
к
цене).
Неперсонализированное:
•
Анализ
цен
конкурентов.
•
Бестселлеры
—
длинный
хвост,
Ozon.ru.
•
…….
Факт:
Amazon
изменяет
цены
в
среднем
каждые
10
минут.