Импорт товаров из XML


Доброго времени суток уважаемые разработчики. Предо мной встала крайне интересная задачка, которую каким то образом до меня решили, но у меня в голове просто не укладывается как…
Я скидал простенький магазин, который хочу набить товарами. И вот тут встало самое интересное… Есть достаточно много партнерских программ, которые предоставляют для скачивания xml файлики. Эти партнерки берут оригинальные выгрузки из магазинов, приводят их к структурному виду, раскладывают товары по категориям и дают для скачки объединенный xml файл, со всех магазинов. Этот файл постоянно обновляется, хоть раз в неделю выкачивай… Но там очень мало товаров. 60-70к товаров. А из одного только магазина порядка 300к товаров может быть.

По тому есть ряд задачек, за решение которых я не представляю с какой стороны подойти…

Каждый магазин имеет свою структуру категорий, вида

<categories>
<category id="2">Default Category</category>
<category id="15" parentId="555">Женская обувь</category>
<category id="17" parentId="555">Мужская обувь</category>
<category id="19" parentId="2">Аксессуары</category>
Никаких уникальных идентификаторов нету, как в выгрузке 1С.
<Группа>
	<Ид>dc487549-e3d9-11e2-b724-08606e6eaaa3</Ид>
	<Наименование>iPad mini</Наименование>
</Группа>
Хотя даже имея такие идентификаторы сложно будет прицепиться…
И товары не имеют ничего опознавательного, кроме названия товара, который может вполне совпасть.
Все идентификаторы начинаются от 1 до бесконечности, соответственно из другого магазина товары разложатся не в те категории.
<offer available="true" bid="1" cbid="1" group_id="350161" type="vendor.model" id="120983">
	<categoryId>61</categoryId>
	<currencyId>RUB</currencyId>
	<delivery>true</delivery>
	<description>Кеды Converse / Конверс мужские. Цвет: синий. Материал: текстиль. Сезон: Весна-лето 2014. С бесплатной доставкой и примеркой на Lamoda.</description>
	<model>Converse CO011AUHU961</model>
	<param name="Цвет">синий</param>
	<param name="Коллекция">Весна-лето 2014</param>
	<param name="Внешний материал">текстиль</param>
	<param name="Сезонность">Демисезон, Лето</param>
	<param name="Высота голенища">12.00</param>
	<param name="Материал подошвы">резина</param>
	<param name="Страна-изготовитель">ПОЛЬША</param>
	<param name="Размер" unit="EUR">44</param>
	<param name="Пол">Мужской</param>
	<param name="Возраст">Взрослый</param>
	<picture>http://pn.lmcdn.ru/img600x866/C/O/CO011AUHU961_1.jpg</picture>
	<picture>http://pn.lmcdn.ru/img600x866/C/O/CO011AUHU961_2.jpg</picture>
	<picture>http://pn.lmcdn.ru/img600x866/C/O/CO011AUHU961_3.jpg</picture>
	<picture>http://pn.lmcdn.ru/img600x866/C/O/CO011AUHU961_4.jpg</picture>
	<picture>http://pn.lmcdn.ru/img600x866/C/O/CO011AUHU961_5.jpg</picture>
	<picture>http://pn.lmcdn.ru/img600x866/C/O/CO011AUHU961_6.jpg</picture>
	<picture>http://pn.lmcdn.ru/img600x866/C/O/CO011AUHU961_7.jpg</picture>
	<price>2890.00</price>
	<typePrefix>Кеды</typePrefix>
	<vendor>Converse</vendor>
	<vendorCode>M9622</vendorCode>
	<url>https://ad.admitad.com/goto/3f2779c2d4659f8989a04e8640d77b/?ulp=http%3A%2F%2Fwww.lamoda.ru%2Fp%2FCO011AUHU961%2F</url>
	<modified_time>1391457432.52</modified_time>
	<name>Кеды Converse</name>
</offer>
И из всего этого следуют такие головные боли как:

1. Как собрать товары со всех магазинов в 1 сайт, с сохранением категорий. В общей сложности товаров будет более 1 000 000
2. Как эти все товары обновлять регулярно, хотя бы 2 раза в месяц
3. Как быть с колоссально огромным обьемом трафика… На каждом товаре от 2 до 7 фоток достаточно большого разрешения. По 500 кб примерно… И того на 1 товар пусть в среднем будет 3мб, и тог 3ТБ
Хотя есть фотки и по 100кб…

Как с этим всем быть… Один скрипт будет выполняться только недели 3 наверно, если не вылетит…
shoptracker.ru/catalog/vse-dlya-zhenshchin
А вот эти ребята как то сделали это. Есть у кого то мысли как справиться с этими задачками?
За ранее спасибо за возможные наводки на решения проблем.
Николай
20 февраля 2014, 21:10
modx.pro
2 305
0

Комментарии: 0

Авторизуйтесь или зарегистрируйтесь, чтобы оставлять комментарии.
0