일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- c++
- lambda
- 코드트리
- 넘파이
- OOP
- Machine Learning
- 합성곱 신경망
- cpp class
- NumPy
- 파이썬
- 차원축소
- ack
- 클러스터링
- 머신러닝
- 디자인 패턴
- 넘파이 배열
- 기계학습
- 넘파이 기초
- 코딩테스트실력진단
- java
- 네트워크 기초
- 데이터 마이닝
- Design Pattern
- 자바
- cpp
- 데이터 분석
- 코딩테스트
- numpy 기초
- 코테
- python
- Today
- Total
목록데이터 분석 (4)
준비하는 대학생
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/EAiDO/btr4tN3BEF2/WSm15bvYhsRFkLTf10QbVK/img.png)
K-means 알고리즘 K-means 알고리즘은 가장 간단하면서도 널리 사용되는 클러스터링 알고리즘 중 하나입니다. 이 알고리즘은 데이터를 K개의 클러스터로 나누는 방법으로 동작합니다. K-means 알고리즘의 동작 과정은 다음과 같습니다. K개의 클러스터 중심점(centroid)을 임의로 선택합니다. 각 데이터 포인트들을 가장 가까운 클러스터 중심점에 할당합니다. 할당된 데이터 포인트들의 평균값을 계산하여 새로운 클러스터 중심점을 업데이트합니다. 2-3단계를 반복합니다. 클러스터 할당이 변하지 않거나, 미리 정한 반복 횟수에 도달하면 알고리즘이 종료됩니다. K-means 알고리즘의 단점 중 하나는, 초기 클러스터 중심점의 위치가 무작위로 결정되기 때문에, 다른 결과를 도출할 수 있다는 것입니다. 따라서..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/blVQLH/btr4uIHqpqb/bCTnGXtP9bMYuQsDpbkFz1/img.png)
1. K-means 클러스터링이란? K-means 클러스터링은 군집분석의 한 방법으로, 데이터를 비슷한 특징을 가진 그룹으로 나누는 기법입니다. K-means 클러스터링은 각 데이터 포인트와 그룹의 중심 간의 거리를 측정하여 가장 가까운 그룹에 할당하는 방식으로 동작합니다. 이를 반복하여 그룹의 중심을 업데이트하고, 그룹 간의 거리를 줄여나가며 클러스터를 형성합니다. K-means 클러스터링은 비계층적인 방식으로 동작하며, 클러스터의 개수를 미리 지정해주어야 합니다. 클러스터의 개수는 사용자가 정해주어야 하며, 적절한 클러스터 개수를 선택하는 것이 중요합니다. 2. K-means 클러스터링 예시 K-means 클러스터링 예시를 보겠습니다. 먼저, 필요한 라이브러리들을 import합니다. import nu..
1. 슬라이싱 기본 개념 파이썬에서 슬라이싱은 리스트, 튜플, 문자열 등의 시퀀스 자료형에서 연속된 범위의 데이터를 추출하는 기능을 제공합니다. 슬라이싱은 다음과 같은 형식으로 사용합니다. sequence[start:stop:step] 여기서 start는 시작 인덱스, stop은 종료 인덱스, step은 간격을 나타냅니다. start와 stop은 생략 가능하며, 생략 시 기본적으로 start는 0, stop은 시퀀스의 길이로 설정됩니다. step은 생략 가능하며, 생략 시 기본적으로 1로 설정됩니다. 2. NumPy 확장 슬라이싱 NumPy에서는 기본 슬라이싱 기능을 확장하여 다차원 배열에서도 적용할 수 있습니다. 각 축(axis)에 대해 슬라이싱을 적용하여 다양한 형태의 데이터를 추출할 수 있습니다. ..
zeros() NumPy에서 zeros() 함수는 모든 요소가 0인 배열을 생성하는 함수이다. 함수의 구문은 다음과 같다. numpy.zeros(shape, dtype=float, order='C') shape: 생성할 배열의 모양(shape)을 지정한다. 정수(int) 또는 정수들로 이루어진 튜플(tuple)로 지정한다. - 예를 들어, (3, 4)는 3행 4열의 2차원 배열을 의미한다. dtype: 생성할 배열의 자료형(data type)을 지정한다. (기본값: float) order: 생성할 배열의 메모리 저장 순서(order)를 지정한다. (기본값: 'C', 'C' or 'F' 로 지정한다.) 'C': C-style 메모리 저장 순서. 배열의 마지막 차원을 가장 먼저 변경 'F': Fortran-..