Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 코딩테스트
- 넘파이
- 넘파이 배열
- c++
- Machine Learning
- java
- 차원축소
- lambda
- 기계학습
- python
- 머신러닝
- 파이썬
- 코테
- 코딩테스트실력진단
- numpy 기초
- 데이터 마이닝
- 디자인 패턴
- 넘파이 기초
- NumPy
- 데이터 분석
- 자바
- 합성곱 신경망
- 클러스터링
- OOP
- 코드트리
- Design Pattern
- ack
- 네트워크 기초
- cpp
- cpp class
Archives
- Today
- Total
목록웹 스크레이핑 (1)
준비하는 대학생
[자연어 처리] 웹 스크레이핑 기초 - 1
웹 스크레이핑과 웹 크롤링 웹에서 데이터를 수집하는 방법에는 크게 웹 스크레이핑과 웹 크롤링이 있습니다. 이 두 용어는 종종 혼용되어 사용되지만, 명확한 차이점이 있습니다. 웹 스크레이핑은 특정 웹사이트에서 원하는 정보를 직접 추출하는 것을 의미합니다. 예를 들어, 영화 리뷰, 뉴스 기사, SNS 데이터 등을 수집할 때 사용합니다. 반면, 웹 크롤링은 웹 스크레이핑보다 넓은 범위의 데이터를 시스템적으로 수집하는 것을 말합니다. 이는 주로 검색 엔진에서 사용되며, 연결 구조를 파악하고 인덱싱 하는 데 사용됩니다. 다양한 데이터 수집 방법 RSS 피드: 웹 사이트의 업데이트를 XML 형식으로 제공합니다. OCR: 이미지나 PDF 내의 문자를 인식합니다. 개인화된 데이터: 사용자 동의 하에 개인화된 텍스트 데..
Programming/NLP
2023. 9. 14. 10:35