Парсер Google: Портфолио фрилансера Константин Иванов 07.01.2009, работа №1 - FL.RU
Константин Иванов
Стоимость указана, чтобы вам было проще оценить примерные расходы на решение вашей задачи. Окончательную цену фрилансер сможет сообщить в личной беседе после уточнения деталей.
Похожая работа будет стоить
102 usd

Примерный срок выполнения

20 часов

К списку работ
Константин Иванов
Константин Иванов

Парсер Google

image
формирует страниц на основе поиска гугла: keyphrase site:domain. на входе список кейфраз. на выходе - набор хтмл страниц в каталоге или локально, как вам удобнее. урл страницы - кейфраза (транслит, если фраза по-русски). выделения em гугла заменяет на strong. убрать строку метадаты, опция сохранить линки. 20 результатов на страницу. вверху страницы - кейфраза в h1. также формируется карту с урлами страниц и кейфразами в анкоре. страницы перелинкованы между собой в пределах одного кейворда и между кейвордами учитывает существование ограничения на предельное время работы скриптов на сервере. если список кейфраз прогоняется повторно, предыдущие файлы затираются. опция подстановки урл в линки. например, при парсинге site:domain.org заменять линки на domain.com (domain.org/xxx.htm -> domain1.com/xxx.htm) опция nofollow в линки остановка скрипта и продолжение с заданного места, индикация работы. предусмотреть обрывы - скрипт должен продолжать с места остановки. задаем глубину парсинга: N страниц по M результатов по каждой кейфразе.