'데이터 분석' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/02 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

Tags more

Archives

Today

Total

관리 메뉴

목록데이터 분석 (4)

준비하는 대학생

[기계학습] k-means 클러스터링 - 최적의 k값 탐색

K-means 알고리즘 K-means 알고리즘은 가장 간단하면서도 널리 사용되는 클러스터링 알고리즘 중 하나입니다. 이 알고리즘은 데이터를 K개의 클러스터로 나누는 방법으로 동작합니다. K-means 알고리즘의 동작 과정은 다음과 같습니다. K개의 클러스터 중심점(centroid)을 임의로 선택합니다. 각 데이터 포인트들을 가장 가까운 클러스터 중심점에 할당합니다. 할당된 데이터 포인트들의 평균값을 계산하여 새로운 클러스터 중심점을 업데이트합니다. 2-3단계를 반복합니다. 클러스터 할당이 변하지 않거나, 미리 정한 반복 횟수에 도달하면 알고리즘이 종료됩니다. K-means 알고리즘의 단점 중 하나는, 초기 클러스터 중심점의 위치가 무작위로 결정되기 때문에, 다른 결과를 도출할 수 있다는 것입니다. 따라서..

Programming/Machine learning 2023. 3. 17. 17:14

[기계학습] 군집분석 - 비계층적 클러스터링(k-means)

1. K-means 클러스터링이란? K-means 클러스터링은 군집분석의 한 방법으로, 데이터를 비슷한 특징을 가진 그룹으로 나누는 기법입니다. K-means 클러스터링은 각 데이터 포인트와 그룹의 중심 간의 거리를 측정하여 가장 가까운 그룹에 할당하는 방식으로 동작합니다. 이를 반복하여 그룹의 중심을 업데이트하고, 그룹 간의 거리를 줄여나가며 클러스터를 형성합니다. K-means 클러스터링은 비계층적인 방식으로 동작하며, 클러스터의 개수를 미리 지정해주어야 합니다. 클러스터의 개수는 사용자가 정해주어야 하며, 적절한 클러스터 개수를 선택하는 것이 중요합니다. 2. K-means 클러스터링 예시 K-means 클러스터링 예시를 보겠습니다. 먼저, 필요한 라이브러리들을 import합니다. import nu..

Programming/Machine learning 2023. 3. 17. 16:50

[NumPy] 확장 슬라이싱

1. 슬라이싱 기본 개념 파이썬에서 슬라이싱은 리스트, 튜플, 문자열 등의 시퀀스 자료형에서 연속된 범위의 데이터를 추출하는 기능을 제공합니다. 슬라이싱은 다음과 같은 형식으로 사용합니다. sequence[start:stop:step] 여기서 start는 시작 인덱스, stop은 종료 인덱스, step은 간격을 나타냅니다. start와 stop은 생략 가능하며, 생략 시 기본적으로 start는 0, stop은 시퀀스의 길이로 설정됩니다. step은 생략 가능하며, 생략 시 기본적으로 1로 설정됩니다. 2. NumPy 확장 슬라이싱 NumPy에서는 기본 슬라이싱 기능을 확장하여 다차원 배열에서도 적용할 수 있습니다. 각 축(axis)에 대해 슬라이싱을 적용하여 다양한 형태의 데이터를 추출할 수 있습니다. ..

Programming/Machine learning 2023. 3. 15. 16:52

[python] Numpy 기초 공부(zeros, ones, full)

zeros() NumPy에서 zeros() 함수는 모든 요소가 0인 배열을 생성하는 함수이다. 함수의 구문은 다음과 같다. numpy.zeros(shape, dtype=float, order='C') shape: 생성할 배열의 모양(shape)을 지정한다. 정수(int) 또는 정수들로 이루어진 튜플(tuple)로 지정한다. - 예를 들어, (3, 4)는 3행 4열의 2차원 배열을 의미한다. dtype: 생성할 배열의 자료형(data type)을 지정한다. (기본값: float) order: 생성할 배열의 메모리 저장 순서(order)를 지정한다. (기본값: 'C', 'C' or 'F' 로 지정한다.) 'C': C-style 메모리 저장 순서. 배열의 마지막 차원을 가장 먼저 변경 'F': Fortran-..

Programming/Machine learning 2023. 3. 8. 17:13

이전 Prev 1 Next 다음

목록데이터 분석 (4)

준비하는 대학생

티스토리툴바