I need a script that can take a RSS feed from wordpress or blogger, fetch the blog pages and scrape the title, date, content from each post entry (<div>) from the rss feed. Only the text is needed, the html tags and scripts should be filtered out or replaced with user defined tag.
Proof a correct function will be a test on 7 random wordpress blogs and 3 blogger blogs. The correct results should return a page with posts title dates content similar to google reader.
Provider should have some experience with scraping webpages, spidering, or very good with regular expressions. Language used should be PHP. I will consider perl or python if there are peformance advantage and intergration hooks into php is provided. Also please design code to improve performance whenever possible.
Follow up work possible
ID e Projektit: 218598
Rreth projektit
2 propozime
Projekt në distancë
Aktive 16 yrs ago
Po kërkoni të fitoni para?
Përfitimet e ofertës për Freelancer
Vendosni buxhetin dhe afatin tuaj
Paguhuni për punën tuaj
Përshkruani propozimin tuaj
Është falas të regjistrohesh dhe të bësh oferta për punë
I can help you and can complete in few hours.
I have experience for scrapers ([login to view URL], [login to view URL], [login to view URL], [login to view URL], [login to view URL], [login to view URL] and other)
$60 USD në 0 ditë
5,0 (17 përshtypje)
0,0
0,0
2 profesionistët e pavarur ofrojnë mesatarisht $118 USD oferta për këtë punë