новое событие
Информационный поток
Задания вакансии материалы разработки сообщения форума
alex
Приватное сообщение

ут 11. Нужны парсеры картинок и html описаний со страниц поставщиков

31 |  0
18 сентября 2023 в 14:42:35 (1 год 9 недель 3 дня 6 часов назад)
8100
Текст задания
Есть регистр сведений: цены поставщиков. В этом регистре есть номенеклатура поставщика и номенклатура 1с, которая к ней привязана, кроме этого есть идентификатор номенклатуры поставщика. Нужно по этому идентификатору парсить и загружать картинку и описание для номенклатуры справочника, если этих данных еще нет. Описание загружается в виде файла html формате и привязывается к карточке товара. Эти данные используются на сайте после обмена.
Пример Идентификатор номенклатуры поставщика 1466432
адрес урл товара для парсинга описания будет иметь вид:
http://www.netlab.ru/descr.asp?id=466432 (первый символ в идентификаторе удаляется!)- отсюда парсим описание. Надо понять как определить, что это именно та таблица, которая нужна. Обычно она начинается со строки Основные характеристики и заканчивается Сайт производителя. Но это легко проверить поизучав исходный код. Из таблицы нужно удалить все теги цветов bgcolor.
Картинки:
На странице ищем код c адресом картинки <img src="/ISAPI/TestISAPI.dll?238248&0" это и есть урл картинки. Урл будет иметь вид
http://www.netlab.ru/ISAPI/TestISAPI.dll?238248&0
но его надо немного подкорректировать, заменив &0 на &178551- такую замену надо делать для всех картинок
Итоговый урл
http://www.netlab.ru/ISAPI/TestISAPI.dll?238248&178551 формат jpg. далее сохраняем картинку в карточке товара в виде Артикул.jpg
Вот и все. Основные моменты-парсинг должен проходить только для того элемента, которого в карточке товара еще нет. и выполняться по регл заданию. 2 задания- одно по описанию, другое по картинкам.
В самой обработке должен быть ручной режим с разными отборами номенклатуры, стандартные формы отбора+ по дате создания номенклатуры, нажимаем кнопку загрузить описание или загрузить картинку. Происходит парсинг.
работа по тимвьюверу, anydesk или rdp. Выслать базу крайне проблемно
0
Отклики (10)