logo

[r-crawling] 한글이 깨지는 경우 사례분석: DC인사이드

library(httr)
library(rvest)
res = GET('http://gall.dcinside.com/board/lists/?id=toy')

raw = content(res, 'raw')
library(stringi)
dc.content = stri_encode(raw, 'UTF8')
dc.lines = stri_split_lines(dc.content)[[1]]
dc.html = paste0(dc.lines[-(499:537)], collapse = ' ')

h = html(dc.html)
titles = html_text(html_nodes(h, '.t_subject'))

repair_encoding(titles)  ##  윈도의 경우
Previous
한글이 깨지는 경우