2016년 2월 18일 목요일

[nodejs] cheerio 페이지안의 이미지 다 다운받기


var client = require('cheerio-httpcli');
var request = require('request');
var fs = require('fs');
var URL = require('url');

var savedir = __dirname + "/dl_img";

if (!fs.existsSync(savedir)) {
        fs.mkdirSync(savedir);
}

var url = "http://myurl";

client.fetch(url, {}, function(err, $, res) {
        if (err) { console.log("error"); return; }
        $("img").each(function(idx) {
                var src = $(this).attr('src');
                src = URL.resolve(url, src);
                var fname = URL.parse(src).pathname;
                fname = savedir + "/" + fname.replace(/[^a-zA-Z0-9\.]+/g, '_');

                request(src).pipe(fs.createWriteStream(fname));
        }); 
});

댓글 없음:

댓글 쓰기