Доработка обработки снятия данных с сайтов.

Выполнено

55 | 1

5 июня 2021 в 13:04:48 (5 лет 6 недель 4 дня 17 часов назад)

41900

10.11.2013 11:44:39

Текст задания

Есть обработка для снятия данных с сайтов за авторством Якова Когана.
Основная идея: вычитываются таблицы, а уже внутри их ячеек идут маленькие деревья DOM-объектов. Применяются только механика 1С, в отличие от первоначального парсера, поэтому всё быстрее.
Недостаток: это не рабочая модель, т.к. тут нет механизма сохранения настроек чтения, а есть лишь само чтение и раскладка.
Но, ориентируясь на полные пути, свойства-атрибуты и прочее, можно уже делать локальные настройки схем чтения и интерпретации.
Требуется доработать, чтобы её мог использовать человек, особо в среде хтмл не ориентирующийся.
Также, потребуется структурирование вычитанных данных, добавление новых свойств, внесение в список номеклатуры.

HTML_PL_Tables.epf (16 кб)

предыдущие ()все

Выбранные исполнители

Усцелемов Олег
Миасс(Россия)
- 2 дня
- + 2- 0
- 600
- 1
- 4
- 5001
Сделка №3795 от 11.11.2013

Завершена (03.12.2013)

Отклики

Aleks 6.3

10 ноября 2013 в 12:06:07

5 дней
- + 0- 0
- 0
- 4636
Была аналогичная проблема. Пришлось дорабатывать программу. Обращались к знакомым «умельцам», но со временем споткнулись о те же проблемы, что и были в начале. Два или три раза переустанавливали, потом всё-таки хватило ума поискать в сети специалистов. Сейчас пользуемся – вопросов больше не возникает. Обращались на сайт http://www.1c-biz.ru.

≡ Список Ваших задач