Нужно
Для анализа больших данных использовать Knime. Задания нужно выполнить именно в ней.
Задание:
1. Скачать два набора данных из раздела "Торговля" (https://data.mos.ru/)
2. Объединить два набора в один и сгруппировать по названию (или владельцу, или по административном округам, или по адресам).
3. Рассчитать внутри группы суммарное значение и долю (%) по количеству объектов каждого типа.
4. Построить круговую диаграмму по долям каждой категории в общем количестве для пункта 3.
5. Получить общий список разделов (District) без повторов.
6. Выполнить анализ данных в виде сводной таблицы (Pivot Table) в разрезе типов, территории, назначения и т.д.
7. Построить облако тегов для признака "специализация"
8. В объединенной таблице сделать цветовую маркировку по признаку "Административный округ".
9. Вычислить количество и процент регистраций на конкретную дату.
10. Отсортировать результат п.9 по убыванию процента.
Полученный сценарий нужно экспортировать и прислать на почту.