moblov : Написание граббера на php23 Мая 2013
Грабберами в народе называют серверные скрипты, предназначенные для получения данных с различных серверов и встраивания их в свои страницы. В инете есть куча примеров RSS-грабберов, извлекающих тексты с новостных лент, но мне лично нужен не какой-то RSS, которым я ни разу в жизни не пользовался, а полноценный скрипт, который легко настроить для извлечения любой нужной мне информации с любой из доступных в сети страниц. Так что эта небольшая статья - как раз пример написания граббера на языке PHP. Задача состоит, собственно, из 3 этапов. 1. Получение данных с нужного нам URL Для этого в PHP существует несколько возможностей: Стандартная функция fopen, служащая для открытия файла Применять ее не очень удобно, так как нельзя контролировать время соединения, получать ответы ошибок сервера и т.д. Кроме того, она может быть запрещена на хостинге через http. Тем не менее, вот пример откуда-то. Здесь мы парсим выдачу популярного сайта bash.org: