준비하는 대학생

[NumPy] unique 함수 본문

Programming/Machine learning

[NumPy] unique 함수

Bangii 2023. 3. 14. 19:31

넘파이 배열에서의 중복 제거

 넘파이 배열에서 중복된 값을 제거하기 위해서는 unique() 함수를 사용합니다. 이 함수는 넘파이 배열에서 중복된 값들을 제거한 배열을 반환해줍니다. 예를 들어, 다음과 같이 중복된 값이 있는 1차원 배열이 있다고 가정해봅시다.

import numpy as np

arr = np.array([1, 2, 3, 2, 1, 4, 5, 4, 6, 5])

unique_arr = np.unique(arr)

print(unique_arr) # [1 2 3 4 5 6]

위의 코드에서는 중복된 값이 포함된 1차원 배열을 생성하고 있습니다.
unique() 함수를 이용하여 중복된 값을 제거하고, 그 결과로 새로운 배열 unique_arr을 생성할 수 있습니다.

unique() 함수는 디폴트로 오름차순으로 정렬된 결과를 반환합니다. 만약 내림차순으로 정렬된 결과를 원한다면, unique() 함수의 reserve 인자를 활용해 다음과 같이 호출해야 합니다.

unique_arr = np.unique(arr, reverse=True)

print(unique_arr) # [6 5 4 3 2 1]

 

unique() 함수의 return_counts 파라미터

unique() 함수는 넘파이 배열에서 중복된 값을 제거하고, 중복되지 않은 값들로 이루어진 새로운 배열을 반환합니다. 이때 return_counts 파라미터를 True로 지정하면, 중복되지 않은 값들이 각각 몇 번씩 등장하는지의 빈도를 함께 반환해줍니다. 예를 들어, 다음과 같은 범주형 데이터가 있다고 가정해봅시다.

import numpy as np

data = np.array(['male', 'female', 'female', 'male', 'male', 'female'])

unique_data, counts = np.unique(data, return_counts=True)

print(unique_data) # ['female' 'male']
print(counts) # [3 3]

위의 코드에서는 성별이라는 범주형 데이터가 포함된 배열을 생성하고 있습니다. 이때 unique() 함수를 이용하여 유일한 성별 값들과 각 값의 빈도를 추출할 수 있습니다. return_counts 파라미터를 True로 지정하여 각 성별 값의 빈도를 함께 반환하고 있습니다. 실행 결과는 다음과 같습니다.

['female' 'male']
[3 3]

결론

넘파이의 unique() 함수는 중복된 값을 제거하고, 중복되지 않은 값을 추출할 때 사용됩니다. 이때 return_counts 파라미터를 True로 지정하면 각 값의 빈도를 함께 추출할 수 있습니다. 이러한 기능을 이용하여 넘파이 배열에서 범주형 데이터의 유일한 값과 각 값의 빈도를 추출하는 것이 가능합니다.

 

'Programming > Machine learning' 카테고리의 다른 글

[NumPy] 확장 슬라이싱  (0) 2023.03.15
[NumPy] sort 정렬  (0) 2023.03.15
[NumPy] 인덱싱  (2) 2023.03.13
[NumPy] reshape 함수  (0) 2023.03.13
[python] Numpy 기초 공부(zeros, ones, full)  (0) 2023.03.08
Comments