C# HtmlAgilityPack을 이용한 웹크롤러(Web-Crawler), 웹페이지 HTML 파싱하기



C# HtmlAgilityPack을 이용한 웹크롤러(Web-Crawler), 웹페이지 HTML 파싱하기

C# HtmlAgilityPack을 이용한 웹크롤러(Web-Crawler), 웹페이지 HTML 파싱하기

C# HtmlAgilityPack을 이용한 웹크롤러(Web-Crawler), 웹페이지 HTML 파싱하기 실습 동영상 입니다.

강의자료 http://ojc.asia/bbs/board.php?bo_table=LecCsharpNet&wr_id=57

HtmlAgility, WebClient를 이용한 웹크롤러 만들기(Web-Crawler)

HtmlAgilityPack은 NET Framework의 코드 만으로 HTML 문서를 파싱하고 분석할 수 있는 도구로 닷넷 프로젝트에서 사용하려면 NuGet 패키지 관리에서 간단히 설치해서 사용하면 된다.

System.Xml 네임스페이스에서 제공하는 XPATH를 지원하고 HTML 문서탐색을 편하게 해주고 HTML을 다운받거나 또는 HMLT을 파싱하는 방법등을 이용할 수 있다.

HTML 노드를 탐색하기 위해서는 XPath문법을 알아야 한다. 단일노드(SelectSingleNode) 및 여러노드(SelectNode) 탐색이 가능하며 여러노드(SelectNode)를 탐색한 경우 foreach문의 반복문에서 나머지 처리를 하면 된다.