Мне необходим файл, содержащий 3 колонки: Тип (велосипед/сноуборд/горные лыжи), Марка (Burton, Trek и тд) Модель (Clash, Mint 3.0 и тд)
Все марки и модели можно взять отсюда:
- http://www.katushkin.ru/encyclopedia/ts/bikes/ (велосипеды)
- http://www.katushkin.ru/encyclopedia/ts/snowboard/ (сноуборды)
- http://www.katushkin.ru/encyclopedia/ts/ski/т (лыжи)
открывая каждую марку там будет список моделей (не путать с небольшим списком модельных рядов (например, Avalanche это модельный ряд, а Avalanche 1.0, Avalanche 2.0, Avalanche 3.0 это конкретные модели, которые мне и нужны). Можно использовать и другие источники, но более качественной базы, чем эта я не встречал, а судить о качестве работ я буду именно по этой базе)
Как делал я.
1. Выбирал марку и раскрывал весь список моделей
2. Копировал в блокнот, чтобы снять форматирование
3. Переносил в эксель, сжимал пробелы и удалял дубликаты
4. Через Найти и заменить удалял псевдо модификации (на конце они содержат: boy, girl, lady, men, women, disc, mech, hydr)
5. Сортировал по алфавиту, чтобы удалить псевдо модели (7300, 7300 Euro, 7300 WSD, 7300 WSD Euro это все 7300 модель. Иными словами если список состоит из нескольких похожих моделей, но отличающихся по модификации (это буквы или слова типа Euro, Team, Expert и тд), то оставляем только один вариант. На этом этапе могут возникнуть трудности, если вы не лютый велосипедист, поэтому в соседней колонке оставляйте оригинальный список этого этапа, а в параллельном списке работайте с моделями. Что я имею ввиду: Avalanche 1.0, Avalanche 1.0 Disk, Avalanche 1.0 -V, Avalanche 2.0 Team, Avalanche 3.0 Expert, Avalanche 3.0 Team Pro, Avalanche 3.0 Lady, в итоге должен быть таким:
Avalanche 1.0 ( повторяется только Avalanche 1.0, это истинная модель)
Avalanche 2.0 (единственная в своем роде, но соседние позиции показывают, что team pro это модификация, а не модель)
Avalanche 3.0 (повторяется только Avalanche 3.0, это истинная модель)
Для примера видео (https://youtu.be/Dk5Mu3LSUo8), как это делал я. Если вы умеете парсить, то первая половина для вас проще! Добавлять в основную таблицу не надо, тк мне предстоит все проверить перед формированием основной таблицы.
Каждый файл содержит 1 вид транспорта и так называется велосипеды (209 марок)/сноуборды(97 марок)/горные лыжи(33 марки), каждый лист содержит модели одной марки. Пример файла в приватной информации. Также сможем созвониться и чатиться для уточнения деталей.