| 
			
			 | 
		#1 | 
| 
			
			 Участник 
		
			
	 | 
	
	
	
		
		
			
			 
			
			Не без гордости рассказываю про наш новый сервис прогнозирования. За разработку и продвижение отвечает Костя Доброток - бывший Аксаптоид  
		
		
		
		
		
		
			![]() В отличие от большинства релизов, где мы связаны NDA с клиентами, готовы ответить на вопросы сообщества (по существу). ГК «КОРУС Консалтинг» разработала облачный сервис KORUS | Forecast, позволяющий FMCG-ритейлерам и дистрибуторам прогнозировать спрос на товары на новом уровне. Сервис развернут на платформе Microsoft Azure и сочетает современные технологические решения и многолетний опыт системного интегратора в автоматизации предприятий различных секторов экономики. KORUS | Forecast – это облачный сервис прогнозирования высокой точности, созданный с применением уникальных методов очистки (pre-processing) и преобразования данных. Сервис автоматически производит прогноз спроса для каждого товара и/или магазина сети на каждый день, на выбранный горизонт в будущем, без ограничений по объёму данных и производительности и учитывает, как внутренние данные ритейлера и дистрибутора (используются все исторические данные вплоть до чека), так и внешние, такие, например, как конкурентное окружение. Сервис работает с сырыми данными ритейлера/дистрибутора, что позволяет практически полностью снять нагрузку по преобразованию данных на стороне заказчика. Все вычисления и преобразования выполняются в специально спроектированном хранилище сырых данных в облаке экспертами «КОРУС Консалтинг». Пресс-релиз: https://korusconsulting.ru/press-cen...tribution.html 
				__________________ 
		
		
		
		
	Ivanhoe as is..  | 
| 
	
 | 
|
| За это сообщение автора поблагодарили: mazzy (50). | |
| 
			
			 | 
		#2 | 
| 
			
			 MCTS 
		
			
	 | 
	
	
	
		
		
		
		 
			
			Хотелось бы узнать детальный алгоритм прогнозирования. Это самое интересное )
		 
		
		
		
		
		
		
			
				__________________ 
		
		
		
		
	I could tell you, but then I would have to bill you.  | 
| 
	
 | 
| 
			
			 | 
		#3 | 
| 
			
			 Участник 
		
			
	 | 
	
	
	
		
		
		
		 
			
			Я пока собираю вопросы, чтобы Костю не дергать лишний раз.  
		
		
		
		
		
		
			Из того что я знаю, мы используем самообучающиеся модели, конкретный алгоритм может быть любой из десятка классических, реализованных в R Server. Основное преимущество над "старыми" монструозными продуктами, что в облаке можно очень быстро строить разные модели на огромной выборке данных, быстро их сравнивать и выбирать наилучшую. 
				__________________ 
		
		
		
		
	Ivanhoe as is..  | 
| 
	
 | 
| 
			
			 | 
		#4 | 
| 
			
			 Модератор 
		
			
	 | 
	
	
	
		
		
		
		 
			
			Он должен быть различным для разных групп товаров. Ну, или один и от же, но с разными параметрами. Причем "группы товаров" здесь - самое интересное. 
		
		
		
		
		
		
		
	Дело в том, что нельзя вести прогнозирование на уровне SKU. Для вас 1 кг сахарного песка от ООО "Манечка" и ООО "Танечка" - это одно и то же. А для системы - два абсолютно разных товара. Следовательно, товары необходимо объединить в группы со схожими потребительскими свойствами: "Сахар", фасовка "1кг", "Песок", "средний ценовой диапазон". При этом: * Потребление рафинированного сахара летом будет снижаться (его берут для офисов, летом снижает деловая активность - снижается потребление рафинада) * В июле-сентябре вырастает потребление сахарного песка, причем популярностью пользуется фасовка в 2-5-10 кг. (народ варит варенье / компоты) * Вместо упаковки 2 кг народ готов взять 2х1кг, если разница несущественна * Вместо рафинада, возможно, потребитель готов купить сахарный песок. Но не готов вместо песка купить рафинад. Особенно в сезон. * Не везде потребитель готов переплачивать или покупать дорогой сахарный песок, например, тростниковый. Однако, если его включить в матрицу в правильных магазинах, он займет категорию AY, а то и AX. Хотя обычно - это больше BY (конкуренция не дает ему стать A, хотя спрос на него стабилен). Хотя при этом он будет отъедать долю у рафинада (каннибализация), но маржа покроет это с лихвой. Кроме сезонности, каннибализации и совместно потребляемых товаров (желатин в сезон, например, или крышки для консервирования), важно учесть погоду (теплее лето - лучше урожай - больше потребление), курс на нефть / доллар / экономическую ситуацию в стране (чем хуже ситуация, тем больше людей занимаются приусадебным хозяйством, тем выше потребление сахарного песка в сезон), ситуацию на рынке (требования / сертификация / урожай / кол-во производителей), и другие факторы. Например, рост цен на водку ведет к увеличению самогоноварения и росту спроса на сахар. И это-только сахар песок. Для других категорий, кроме сезонности, надо еще учитывать календарь - постоянные (Новый год, Рождество, 14 и 23 февраля, 8 марта) и плавающие праздники (пост, ураза байрам, курбан байрам, последняя пятница июля и т.п.), а также прочие день строителя и день нефтяника. Когда занимался прогнозированием (datamining), это самая большая проблема была - не получишь ты нормальные прогнозные модели, не приведя в порядок категорийный менеджмент. Хотя DM может помочь выявить SKU со схожими потребительскими свойствами, но это лишь помочь в наведении порядка. И только потом можно прогноз строить в разрезе категорий со схожими потребительскими свойствами. Тогда уже, внутри группы, КМ (категорийный менеджер может играться матрицей, добавляя / удаляя товары и работая с поставщиками). Ну и постоянная обратная связь и подстройка, разумеется. Динамическое изменение буфера, маркетинговые акции и из отслеживание... И, кстати, исторические данные не всегда являются хорошим подспорьем. Достаточно глянуть на прогнозы, построенные по 2007, 2008 и 2009 годам. ![]() С Уважением, Георгий  | 
| 
	
 | 
|
| За это сообщение автора поблагодарили: gl00mie (1), trud (5), apanko (4), skuull (5), AlGol (2), AvrDen (1). | |
| 
			
			 | 
		#5 | 
| 
			
			 Участник 
		
			
	 | 
	
	
	
		
		
		
		 
			
			А в чем сакральный смысл вести такой сложный затратный по деньгам (это сколько сотрудников-экспертов, айтишников, экономистов надо привлечь) прогноз? Сейчас вроде не средние века. Не надо на два года планировать склад до следующего корабля. Всегда есть на бирже/оптовых складах нужный товар. Да и в России склады дешевые. Ну будет +/- 10 тонн. Почему просто не плясать от заказов от магазинов? Не только с сахаром. Со всеми продуктами.
		 
		
		
		
		
		
		
		
	 | 
| 
	
 | 
| 
			
			 | 
		#6 | 
| 
			
			 Модератор 
		
			
	 | 
	
	
	
		
		
		
		 
			
			В том-то все и дело. Это на западе удавятся за 0,5%, а тем более за 3% - а именно такой прирост дает точно прогнозирование, когда уже все остальное оптимизировано. А в России - да ну, +/- 15% - норм. "Лучше с губернатором познакомь, больше толку будет". Так и живем по "среднему скользящему". Самые продвинутые ARIMA пользуются и считаю себя супер-продвинутыми. 
		
		
		
		
		
		
		
	Цитата: 
	
Цитата: 
	
![]() С Уважением, Георгий  | 
| 
	
 | 
| 
			
			 | 
		#7 | 
| 
			
			 Участник 
		
			
	 | 
	
	
	
		
		
		
		 
			
			Мы работаем на всех уровнях: SKU и полное дерево категорий. Именно за счет хорошей программно-аппаратной платформы можно быстро посчитать все варианты и выбирать наиболее подходящий. В том числе сезонность, промо и т.п. И под каждого клиента делается своя модель с учетом чистоты данных - у кого-то просто учет истории и сезона дает прирост в 20-50%, а у кого-то столько хороших и разных данных, что прирост в пару процентов на миллиардных оборотах дает конкретный бизнес-результат. 
		
		
		
		
		
		
			И да, чтобы эти данные можно было не только в прогноз превращать (и скармливать ERP системам на вход планирования), разработан блок отчетности на PowerBI. 
				__________________ 
		
		
		
		
	Ivanhoe as is..  | 
| 
	
 | 
| 
			
			 | 
		#8 | 
| 
			
			 Участник 
		
			
	 | 
	
	
	
		
		
		
		 
			
			Кстати, статья Кости по теме: http://www.globalcio.ru/workshops/1887/
		 
		
		
		
		
		
		
			
				__________________ 
		
		
		
		
	Ivanhoe as is..  | 
| 
	
 | 
| 
			
			 | 
		#9 | 
| 
			
			 Участник 
		
			
	 | 
	
	
	
		
		
		
		 Цитата: 
	
		
			Сообщение от Ivanhoe
			 
 
			Кстати, статья Кости по теме: http://www.globalcio.ru/workshops/1887/ 
		
	 | 
| 
	
 | 
| 
			
			 | 
		#10 | 
| 
			
			 Участник 
		
			
	 | 
	
	
	
		
		
		
		 
			
			Прогнозы нужны. Но если производитель табуреток (сахара в вашем случае) начнет считать прогноз на табуретки по размеру задницы в популяции, по кол-ву барных стоек в районе, по урожаю бамбуковых в Южной Африке - ни к чему хорошему это не приведет.
		 
		
		
		
		
		
		
		
	 | 
| 
	
 | 
| 
			
			 | 
		#11 | 
| 
			
			 Участник 
		
			
	 | 
	
	
	
		
		
		
		 
			
			Строить прогноз на "больших данных" это как рулить баржей с углем с помощью весла. Работы много а выхлопа 0,5%
		 
		
		
		
		
		
		
		
	 | 
| 
	
 | 
| 
			
			 | 
		#12 | 
| 
			
			 Участник 
		
			
	 | 
	
	
	
		
		
		
		 
			
			Тут биткоин за сутки на 4 тыс $ вырос. Хотя уже эксперты ему год падение предрекают. Бигдата миф. Попытка IT-пираний еще немного откусить от крупных китов бизнеса
		 
		
		
		
		
		
		
		
	 | 
| 
	
 | 
| 
			
			 | 
		#13 | 
| 
			
			 Модератор 
		
			
	 | 
	
	
	
		
		
		
		 Цитата: 
	
![]() Видимо, Вы не совсем понимаете, что такое "Большие Данные". Это очень даже не миф. Но мало кто понимает, что это и зачем это надо. Как раз недавно на конференции в Сколково рассказывал, именно про это был доклад. И, кстати, продажи и чеки - это отнюдь не "BigData" С Уважением, Георгий  | 
| 
	
 | 
| 
			
			 | 
		#14 | 
| 
			
			 Аманд 
		
			
	 | 
	
	
	
		
		
		
		 
			
			Это как секс в 12 лет...
		 
		
		
		
		
		
		
			
		
		
		
		
	 | 
| 
	
 | 
|
| За это сообщение автора поблагодарили: mazzy (2). | |
| 
			
			 | 
		#15 | 
| 
			
			 Участник 
		
			
	 | 
	
	|
| 
	
 | 
|
| За это сообщение автора поблагодарили: mazzy (2). | |
| 
			
			 | 
		#16 | 
| 
			
			 Участник 
		
			
	 | 
	
	|
| 
	
 | 
| 
			
			 | 
		#17 | 
| 
			
			 Модератор 
		
			
	 | 
	
	
	
		
		
		
		 
			
			Ладно. Давайте для начала разберемся что такое "BigData" и откуда она взялась. 
		
		
		
		
		
		
		
	Big Data - это не просто "много данных". Это, в первую очередь, слабоструктурированные и распределенные данные. В этом их основное отличие. Откуда она пошла? Из поисковых систем - первый релиз сделали специалисты Yahoo, потом эту инициативу подхватили Google, поддержав тот самый Hadoop. Вот уже где много слабоструктурированной (тексты, форумы, музыка, видео и т.д.) и, тем более, распределенной информации. И, да - хранение, обработка, индексирование и быстрый поиск - очень важная для них задача. Является ли миллиард чеков "Большими Данными"? Нет. А сто миллиардов, даже если они побиты по 10 базам? Тоже нет. Потому что выдача запроса от non-sql поисковой системы - это выборка с определенной релевантностью. Т.е. если вы в реляционнку подадите запрос "Дай-ка, мне дорогая, чек №1000000" (Select * from bills where bills.billid == "1000000") - вы получите 1 чек с номером 1000000. И если вы ее попросите "А теперь дай-ка, мне дорогая, чеки с суммой покупки более 10 000 000" (Select * from bills where bills.amount >= "10000000") - вы получите все чеки с суммой покупки более 10 млн. А вот если вы первый запрос пошлете в Non-SQL, результат может Вас сильно удивить, так как кроме чека с номером 1 000 000 у вас будет "Как получить 1 000 000 подписчиков на Youtube", "Как украсть миллион", "1000000 рецептов борща" и еще какой-нибудь "How to earn you first million". Да, а чека, кстати, там может и не быть. Или быть далеко не первым в выдаче. Конечно, чем лучше профилированны и протегированны данные, тем релевантнее будет выборка. А задач много. И не только в соцсетях и телекоме. Но и вполне себе в ритейле. С Уважением, Георгий  | 
| 
	
 | 
|
| За это сообщение автора поблагодарили: mazzy (2). | |
| 
			
			 | 
		#18 | 
| 
			
			 Участник 
		
			
	 | 
	
	|
| 
	
 | 
| 
			
			 | 
		#19 | 
| 
			
			 Модератор 
		
			
	 | 
	
	
	
		
		
		
		 
			
			Так. Бизнес есть разный. Есть "что купили / что выросло, то и продаем". Тут можно вести речь только о прогнозировании сбыта и стоимости продукции. Гораздо интереснее задача, когда мы можем что-то разное производить из более-менее одинакового сырья, но ограничены, например, производственными мощностями (и финансами, как обычно). Например, на тех же самых производственных линиях можно производить молоко, кефир, сыр, творог, йогурт. Основное сырье одно - молоко, а вот выход разный. Вот тут уже важно, что и когда производить, когда спрос и так стабильный, когда планируется какая-либо маркетинговая компания и ожидается повышенный спрос на тут или иную продукцию. Вот, например, как я говорил - в первые недели поста спрос на молочную продукцию снижается, значит, это время можно отвести под производство сыров, у которых срок годности больше, и его можно складировать. 
		
		
		
		
		
		
		
	С Уважением, Георгий.  | 
| 
	
 | 
| 
			
			 | 
		#20 | 
| 
			
			 Участник 
		
			
	 | 
	
	
	
		
		
		
		 
			
			Причем тут бигдата и как этот прогноз учитывает действия конкурентов. Коих сотни
		 
		
		
		
		
		
		
		
	 | 
| 
	
 | 
| Теги | 
| big data | 
| 
	
	 | 
	
		
		
  |