반응형
뷰티풀스프_ beautifulsoup
-
데이터 사이언스: 파이썬 Beautiful Soup 모듈 이용해서 파싱(Parsing)하기!데이터 사이언스 2020. 8. 4. 03:54
파싱(Parsing)이란? 파싱은 문자의 구조를 분석해서 원하는 정보를 얻어내는 것입니다. 쉽게 말해서 웹 파싱이라하면 웹에서 필요한 정보를 찾아 가져오는 것을 의미하죠. 예를 들어, 네이버의 실시간 검색어에 대한 정보가 필요하다면 이를 파싱해서 가져올 수도 있습니다. 스크래핑과 크롤링 같은것? 같습니다. 정확하게는 잘모르겠네요ㅋㅋㅋ 파이썬에서 파싱을 하기 위한 대략적인 절차는 다음과 같습니다. 먼저 내가 파싱하고자 하는 웹사이트의 주소에 요청(request)을 보냅니다. 응답이 내가 정해놓은 변수에 저장되었다면 html 코드를 Beautiful soup타입을 바꾸어 준 후, select() 메소드를 이용해서 원하는 태그를 가져옵니다. (웹사이트 아무곳에서 마우스 우측 버튼을 누르신 후 검사(N)를 누르..