PYTHON

[빅데이터 분석] 2021.12.29 HTML, 블로그 내용 크롤링

죠으니 2021. 12. 29. 22:46

저녁으로 치킨을 먹었당 ㅎㅎㅎ

오늘 스케일링도 하고 바쁜듯 바쁘지 않은 하루,,ㅇㅁㅇ

오늘은 HTML이랑 블로그 내용 크롤링 하는 것을 배웠다. 

크롤링 어렵지는 않은데 계속 오류가 떠서 슬프다ㅠㅠ

내일 계속 실행을 해봐야겠다 ㅠㅅㅠ

 

 

<a> 태그의 href 속성을 이용하여 하이퍼링크(다른 HTML 페이지의 연결 고리) 작성

-다른 웹 사이트의 웹 페이지 연결

<a href=“http://www.naver.com>네이버</a>

<a href=“http://www.siter.com/login.html>사이트 로그인</a>

-같은 웹 사이트에 있는 웹 페이지 연결

<a href=“picturepage.html”>클릭하면 사진 페이지로 이동합니다.</a>

-이미지 하이퍼링크 만들기

<a href=“http://www.naver.com>

  <img src=“naver.png” alt=“네이버사이트>

</a>

 

<CSS를 활용한 웹 페이지>

<style> 태그는 <head> 태그 내에서만 사용

 

▶오른쪽 여백, 왼쪽 여백

  margin-left : 30px;

  margin-right : 30px;

 

셀렉터(selector)

HTML 태그의 모양을 꾸밀 스타일 시트를 선택하는 기능

) 웹 페이지의 모든 <h3> 태그에 color:brown 스타일을 적용

        하는 셀렉터 h3를 만든 사례

 

태그 이름 셀렉터

- 태그 이름이 셀렉터로 사용되는 유형

- 셀렉터와 같은 이름의 모든 태그의 css3 스타일 시트 적용

ex) h3, li { color : brown; }

 

점(.)으로 시작하는 이름의 셀렉터

- HTML 태그의 class 속성으로만 지정 가능(class 이름은 .으로 씀)

ex) .warning {  color : red;  }

 

▶#으로 시작하는 이름의 셀렉터

- HTML 태그의 id 속성으로만 지정 가능

ex) #list { background : mistyrose; }

 

자식 셀렉터(child selector)

- 부모 자식 관계인셀렉터를 ‘>’ 기호로 조합

) div > strong { color : dodgerblue; }

<div>의 직계 자식인 <strong>에 적용되는 스타일 시트

 

전체 셀렉터(universal selector)

- 와일드 문자(*)를 사용하여 모든 태그에 적용시키는 셀렉터

) * { color : green; }

 웹 페이지의 모든 태그에 적용. 텍스트 색을 green으로 칠함

 

속성 셀렉터

- HTML 태그의 특정 속성(attribute)에 대해 값이 일치하는 태그에만 스타일을 적용하는 셀렉터

) input[type=text] { color : red; }

    type 속성값이 “text”<input> 태그에 적용

    <input type=“text”>

 

<블로그 내용 크롤링 하기>