ЗАПРОС
предназначен для составления структуры и параметров запроса парсинга на сайт-донор.
Параметры запроса
URL начальной страницы Задается ссылка на начальную страницу, с которой будет начинаться парсинг.
+SubUrl Кнопка добавляет новый структурный элемент запроса, в котором с помощью регулярного выражения описывается ссылка(ссылки), которая будет искаться на странице, переданной от "родителя". Другими словами, если мы создаем SubURL начальной страницы, то описанная в SubURL ссылка будет искаться на начальной странице.
+REGEXP Регулярное выражение для выборки данных. В поле name указывается название данных, в поле REGEXP - регулярное выражение.
Точка сохранения Параметр означает, что в данном месте все собранные данные передадуться на сохранение. В структуре запроса может быть несколько точек сохранения.
Повторный поиск URL При включении данного параметра поиск URL будет проводиться заново на каждой последующей странице. Функция полезна для листания страниц сайта.
Множить Записывает найденные данные во все последующие выборки, результат в которых будет нулевое значение. Данная функция полезна, если, например, название категории на сайте-доноре отображается только на одной странице, а сохранять данное название необходимо для каждой записи данных.
ОбщийПрименяется в основном с параметром Множить и позволяет сохранять данные во всех следующих выборках. В последующих выборках параметр можно запретить установкой REGEXP с неустановленным параметром
Дополнительные параметры REGEXP - сгруппировать в REGEXP. Все найденные данные на странице по регулярному выражению будут склеены в одну строку.
- сгруппировать в URL. Все найденные данные на всех страницах в пределах текущего URL, будут сгруппированы в одну строку.
- выбрать первый в REGEXP. Из подмножества найденных на странице данных по рег. выражению, выбран будет только первый.
- выбрать первый в URL. Из подмножества найденных на всех страницах данных в пределах текущего URL, выбран будет только первый.
Тип - текст. Данные сохраняются, как обычный текст.
- ссылка. Данные сохраняются в ввиде ссылки. Если ссылка относительная, то она автоматически преобразовывается в абсолютную.
- фото. По переданной ссылке сохраняется фото.
+SubREGEXP Создается REGEXP-предок, в котором поиск будет производится по данным, переданным от REGEXP-родителя.
ТестСлужит для тестирования параметров запроса. Тестирование проходит в сокращенном режиме, при котором с каждой точки сохранения отрабатывается не больше 5 пунктов данных и не больше 2-х переходов по страницам.
Авторизация (только в Standart и Professional версиях)
Имя параметраВ поле вводится название в input-е поля (name)
ЗначениеВ поле вводится передаваемое значение (value), то есть логин/пароль
Авторизация должна быть доступна со ссылки начальной страницы. С помощью кнопки "Тест" можно протестировать удачное прохождение авторизации. При этом в новом окне откроется начальная страница, полученная от сайта-донора после передачи ему параметров авторизации.
Дополнительно (только в Standart и Professional версиях)
Делать задержки в запросахПараметр предназначен для задания паузы между загрузками страниц с сайта-донора. Применяется при наличии на сайте защиты от ботов.
Использовать proxy-сервера Параметр заставляет парсер работать по указанным в файле proxy.txt proxy-серверам. Как и предыдущий параметр, применяется для обхода защиты сайта от ботов.

СОХРАНЕНИЕ
предназначен для задания параметров и пути сохранения данных. Представлено два вида сохранения: в MySQL и в файл (для версий Standart и выше).
MySQL (подключение)
СерверИмя сервера с базой, чаще всего localhost
Имя базыИмя подключаемой базы
ЛогинИмя учетной записи, которой подключаемся к базе
ПарольПароль учетной записи
ПодключитьсяИспользуется во-первых для проверки возможности подключения, а во-вторых для подгрузки в Параметры сохранения информации о таблицах, существующих в базе.
MySQL (Параметры сохранения)
ИмяОтображаются названия данных, которые были указаны в разделе Запрос
ТаблицаНазвание таблицы, в которую будут записываться данные. Перечень таблиц появляется после подключения к базе.
ПолеПоле в таблице для записи данных.
КодировкаЗадается кодировка сохранения текстовых данных в базу, есть возможность сохранения в форматах WINDOWS-1251, UTF-8, KOI8-R.
ДополнительноДля текстовых данных есть возможность проверки дубликатов в базе по полю, для фото - выбор места сохранения (база либо в файл) и путь к папке, куда сохранять файлы
+Доп. параметрДобавляет поле для сохранения дополнительной информации в базу.
MySQL (дополнительно)
Действие при нахождении дубликатовЕсть возможность игнорировать дубликат и продолжить парсинг, досохранять все данные, найденные в текущей точке останова, и прекратить выполнение программы и остановиться сразу после нахождения первого дубликата в базе.
Постобработка (только в Standart и Professional версиях)
Преобразовать регистр буквПозволяет перевести все буквы в верхний или нижний регистр.
Удалить тэгиУдаляет из текста все HTML и PHP тэги.
+Добавить заменуДобавляет параметр замены части текста. Есть вариант прямой замены, а также по регулярному выражению.
В файл (параметры сохранения), только для Standart и Professional версии
Формат файлаПредставлен в двух вариантах: Excel (xls) и текстовый (txt).
Путь к файлуПуть сохранения файла. При указании названия файла, файл будет сохранен под указанным именем, при указании только папки, в данную папку будет сохранен файл с именем текущей даты, формата дд-мм-гггг_чч.мм.сс
Путь сохранения фотографий:При наличии в сохраняемых данных фотографий, они сохраняются в указанную папку.
При сохранении текстовых данных в формате Excel каждый сохраняемый пакет данных (при достижении точки сохранения) помещается на отдельную страницу. Такой режим сохранения связан с возможностью составления запроса, при котором сохраняемые данные могут быть с разными названиями и типами. При сохранении данных в txt формате данные пишутся в один файл, разделенные в строке символом табуляции.

ЗАПУСК
При переходе в этот раздел автоматически запускается на выполнение парсер по всем заданным ранее параметрам. В ходе выполнения отображается таблица с результатами работы программы.