Pull data from external web site

  |   by kadriad   |   Blogi, php  |  No Comments

Seoses eelneva postitusega rss-teemal:

http://www.adaptorconsulting.com/?p=999&lang=ee

tuli ülesandes takistusi nendel lehtedel, kus ametlikult rss-voogu ei leidnud.

Peale otsimist selgus, et minu poolt otsitav mõiste on screen-scraping.

Siit leidsingi sellise toreda php klassi:

http://www.troywolf.com/articles/php/class_http/

Kasutamine on äärmiselt lihtne – lehel on ka enamik variante üles loetletud.

Muidugi peab meeles pidama, et soovitatav on kasutada cache ning kammitavat lehte mitte liiga tihti tülitada.

Katsetasin skripti mitme lehega – osad töötasid ilusasti, osad aga sisu ei näidanud.