2016년 2월 17일 수요일

[nodejs] cheerio-httpcli 사용하여 크롤링하기

cheerio-httpcli 모듈을 사용할 때의 장점은
jquery 식으로 DOM 파싱이 가능하다는 점이다.


var client = require('cheerio-httpcli');
var request = require('request');

client.fetch("http://naver.com", {}, function(err, $, res) {
        $("a").each(function(idx) {
                var text = $(this).text();
                console.log(text);
        });
});

$(this).attr('href') 를 하면 href 속성을 얻어올 수 있다.
$(this).html()

댓글 없음:

댓글 쓰기