Импорт товаров из XML
Доброго времени суток уважаемые разработчики. Предо мной встала крайне интересная задачка, которую каким то образом до меня решили, но у меня в голове просто не укладывается как…
Я скидал простенький магазин, который хочу набить товарами. И вот тут встало самое интересное… Есть достаточно много партнерских программ, которые предоставляют для скачивания xml файлики. Эти партнерки берут оригинальные выгрузки из магазинов, приводят их к структурному виду, раскладывают товары по категориям и дают для скачки объединенный xml файл, со всех магазинов. Этот файл постоянно обновляется, хоть раз в неделю выкачивай… Но там очень мало товаров. 60-70к товаров. А из одного только магазина порядка 300к товаров может быть.
По тому есть ряд задачек, за решение которых я не представляю с какой стороны подойти…
Каждый магазин имеет свою структуру категорий, вида
<categories>
<category id="2">Default Category</category>
<category id="15" parentId="555">Женская обувь</category>
<category id="17" parentId="555">Мужская обувь</category>
<category id="19" parentId="2">Аксессуары</category>
Никаких уникальных идентификаторов нету, как в выгрузке 1С. <Группа>
<Ид>dc487549-e3d9-11e2-b724-08606e6eaaa3</Ид>
<Наименование>iPad mini</Наименование>
</Группа>
Хотя даже имея такие идентификаторы сложно будет прицепиться… И товары не имеют ничего опознавательного, кроме названия товара, который может вполне совпасть.
Все идентификаторы начинаются от 1 до бесконечности, соответственно из другого магазина товары разложатся не в те категории.
<offer available="true" bid="1" cbid="1" group_id="350161" type="vendor.model" id="120983">
<categoryId>61</categoryId>
<currencyId>RUB</currencyId>
<delivery>true</delivery>
<description>Кеды Converse / Конверс мужские. Цвет: синий. Материал: текстиль. Сезон: Весна-лето 2014. С бесплатной доставкой и примеркой на Lamoda.</description>
<model>Converse CO011AUHU961</model>
<param name="Цвет">синий</param>
<param name="Коллекция">Весна-лето 2014</param>
<param name="Внешний материал">текстиль</param>
<param name="Сезонность">Демисезон, Лето</param>
<param name="Высота голенища">12.00</param>
<param name="Материал подошвы">резина</param>
<param name="Страна-изготовитель">ПОЛЬША</param>
<param name="Размер" unit="EUR">44</param>
<param name="Пол">Мужской</param>
<param name="Возраст">Взрослый</param>
<picture>http://pn.lmcdn.ru/img600x866/C/O/CO011AUHU961_1.jpg</picture>
<picture>http://pn.lmcdn.ru/img600x866/C/O/CO011AUHU961_2.jpg</picture>
<picture>http://pn.lmcdn.ru/img600x866/C/O/CO011AUHU961_3.jpg</picture>
<picture>http://pn.lmcdn.ru/img600x866/C/O/CO011AUHU961_4.jpg</picture>
<picture>http://pn.lmcdn.ru/img600x866/C/O/CO011AUHU961_5.jpg</picture>
<picture>http://pn.lmcdn.ru/img600x866/C/O/CO011AUHU961_6.jpg</picture>
<picture>http://pn.lmcdn.ru/img600x866/C/O/CO011AUHU961_7.jpg</picture>
<price>2890.00</price>
<typePrefix>Кеды</typePrefix>
<vendor>Converse</vendor>
<vendorCode>M9622</vendorCode>
<url>https://ad.admitad.com/goto/3f2779c2d4659f8989a04e8640d77b/?ulp=http%3A%2F%2Fwww.lamoda.ru%2Fp%2FCO011AUHU961%2F</url>
<modified_time>1391457432.52</modified_time>
<name>Кеды Converse</name>
</offer>
И из всего этого следуют такие головные боли как:1. Как собрать товары со всех магазинов в 1 сайт, с сохранением категорий. В общей сложности товаров будет более 1 000 000
2. Как эти все товары обновлять регулярно, хотя бы 2 раза в месяц
3. Как быть с колоссально огромным обьемом трафика… На каждом товаре от 2 до 7 фоток достаточно большого разрешения. По 500 кб примерно… И того на 1 товар пусть в среднем будет 3мб, и тог 3ТБ
Хотя есть фотки и по 100кб…
Как с этим всем быть… Один скрипт будет выполняться только недели 3 наверно, если не вылетит…
shoptracker.ru/catalog/vse-dlya-zhenshchin
А вот эти ребята как то сделали это. Есть у кого то мысли как справиться с этими задачками?
За ранее спасибо за возможные наводки на решения проблем.