일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Design Pattern
- Machine Learning
- 코테
- 코딩테스트
- numpy 기초
- c++
- 클러스터링
- 넘파이
- cpp class
- OOP
- 데이터 마이닝
- 넘파이 기초
- 코드트리
- 코딩테스트실력진단
- NumPy
- 자바
- 머신러닝
- java
- 기계학습
- 네트워크 기초
- ack
- cpp
- 합성곱 신경망
- 파이썬
- 넘파이 배열
- 차원축소
- python
- 디자인 패턴
- 데이터 분석
- lambda
- Today
- Total
목록전체 글 (69)
준비하는 대학생
DataFrame에서 데이터 선택하기 DataFrame에서 데이터를 선택하는 방법은 다양합니다. 예를 들어, [] 연산자를 사용하여 열(column)을 선택할 수 있으며, loc 메소드와 iloc 메소드를 사용하여 행(row)과 열(column)을 선택할 수 있습니다. # DataFrame에서 데이터 선택하기 import pandas as pd data = {'Name': ['John', 'Kim', 'Emma', 'Andrew'], 'Age': [28, 25, 27, 31], 'Country': ['USA', 'Korea', 'UK', 'Australia']} df = pd.DataFrame(data, index=['one', 'two', 'three', 'four']) print(df['Name'])..
Pandas Series Series는 1차원 데이터 배열을 나타내는 객체입니다. Series는 인덱스(index)와 값(value)으로 구성되어 있으며, 각 값은 인덱스에 해당하는 레이블(label)로 접근할 수 있습니다. Series 생성하기 Series 객체는 다양한 방법으로 생성할 수 있습니다. 예를 들어, pd.Series() 함수를 사용하여 리스트(list), 튜플(tuple), 딕셔너리(dictionary), Numpy 배열 등에서 Series 객체를 생성할 수 있습니다. import pandas as pd import numpy as np # 리스트에서 Series 생성하기 data_list = [1, 2, 3, 4, 5] s1 = pd.Series(data_list) # 튜플에서 Seri..

hist 함수 hist 함수는 Matplotlib에서 가장 기본적인 히스토그램 그래프를 그리는 함수입니다. 히스토그램은 데이터의 분포를 그래프로 나타낸 것으로, 데이터가 어떤 범위에 속하는지를 빈도 수로 표현합니다. hist 함수는 다음과 같은 파라미터를 사용할 수 있습니다. x: 히스토그램을 그릴 데이터 bins: 히스토그램을 그릴 때 구간(bin)의 개수 range: 히스토그램을 그릴 데이터의 범위 density: 히스토그램의 y축 값을 빈도 수 대신 확률 밀도로 표시할지 여부 cumulative: 누적 히스토그램을 그릴지 여부 color: 히스토그램의 색상 alpha: 히스토그램의 투명도(0~1) edgecolor: 히스토그램 막대기의 테두리 색상 linewidth: 히스토그램 막대기의 테두리 선의..

K-means 알고리즘 K-means 알고리즘은 가장 간단하면서도 널리 사용되는 클러스터링 알고리즘 중 하나입니다. 이 알고리즘은 데이터를 K개의 클러스터로 나누는 방법으로 동작합니다. K-means 알고리즘의 동작 과정은 다음과 같습니다. K개의 클러스터 중심점(centroid)을 임의로 선택합니다. 각 데이터 포인트들을 가장 가까운 클러스터 중심점에 할당합니다. 할당된 데이터 포인트들의 평균값을 계산하여 새로운 클러스터 중심점을 업데이트합니다. 2-3단계를 반복합니다. 클러스터 할당이 변하지 않거나, 미리 정한 반복 횟수에 도달하면 알고리즘이 종료됩니다. K-means 알고리즘의 단점 중 하나는, 초기 클러스터 중심점의 위치가 무작위로 결정되기 때문에, 다른 결과를 도출할 수 있다는 것입니다. 따라서..

1. K-means 클러스터링이란? K-means 클러스터링은 군집분석의 한 방법으로, 데이터를 비슷한 특징을 가진 그룹으로 나누는 기법입니다. K-means 클러스터링은 각 데이터 포인트와 그룹의 중심 간의 거리를 측정하여 가장 가까운 그룹에 할당하는 방식으로 동작합니다. 이를 반복하여 그룹의 중심을 업데이트하고, 그룹 간의 거리를 줄여나가며 클러스터를 형성합니다. K-means 클러스터링은 비계층적인 방식으로 동작하며, 클러스터의 개수를 미리 지정해주어야 합니다. 클러스터의 개수는 사용자가 정해주어야 하며, 적절한 클러스터 개수를 선택하는 것이 중요합니다. 2. K-means 클러스터링 예시 K-means 클러스터링 예시를 보겠습니다. 먼저, 필요한 라이브러리들을 import합니다. import nu..

1. 군집분석이란? 군집분석은 데이터를 비슷한 특징을 가진 그룹으로 나누는 기법으로, 데이터 분석 및 기계학습 분야에서 많이 활용됩니다. 군집분석을 통해 비슷한 특성을 가진 데이터끼리 그룹으로 묶어서 특성을 파악하고, 그룹 간의 차이점을 분석하여 새로운 인사이트를 얻을 수 있습니다. 2. 계층적 클러스터링이란? 계층적 클러스터링은 군집분석의 한 방법으로, 데이터를 계층적으로 묶어가며 클러스터를 형성하는 방법입니다. 데이터 포인트들을 가장 가까운 클러스터로 묶어나가며, 클러스터 간의 거리를 계산하여 계층적으로 클러스터를 형성합니다. 이렇게 계층적으로 클러스터를 형성하면, 데이터의 유사도를 시각화하기 쉽고, 데이터를 보다 잘 이해할 수 있게 됩니다. 계층적 클러스터링은 두 가지 방법으로 나눌 수 있습니다. ..
1. 난수 생성의 기본: random.rand()와 random.randn() NumPy의 random 모듈에서 가장 기본적인 난수 생성 함수는 random.rand()와 random.randn()입니다. 1.1. random.rand() random.rand() 함수는 0과 1 사이의 균일 분포(uniform distribution)를 따르는 난수를 생성합니다. 인자로는 원하는 배열의 크기를 지정합니다. 예시 import numpy as np # 0과 1 사이의 난수 생성 rand_num = np.random.rand(3, 3) print(rand_num) 결과 [[0.42656567, 0.707024 , 0.93653248], [0.1935818 , 0.56052649, 0.59793347], [0...
1. 슬라이싱 기본 개념 파이썬에서 슬라이싱은 리스트, 튜플, 문자열 등의 시퀀스 자료형에서 연속된 범위의 데이터를 추출하는 기능을 제공합니다. 슬라이싱은 다음과 같은 형식으로 사용합니다. sequence[start:stop:step] 여기서 start는 시작 인덱스, stop은 종료 인덱스, step은 간격을 나타냅니다. start와 stop은 생략 가능하며, 생략 시 기본적으로 start는 0, stop은 시퀀스의 길이로 설정됩니다. step은 생략 가능하며, 생략 시 기본적으로 1로 설정됩니다. 2. NumPy 확장 슬라이싱 NumPy에서는 기본 슬라이싱 기능을 확장하여 다차원 배열에서도 적용할 수 있습니다. 각 축(axis)에 대해 슬라이싱을 적용하여 다양한 형태의 데이터를 추출할 수 있습니다. ..