본문 바로가기

파이썬

파이썬 데이터 구조 - 집합(Set) 이해하기

반응형

파이썬의 집합(Set) 데이터 구조에 대해 쉽고 재미있게 알아보겠습니다. 집합의 기본 개념부터 다양한 연산과 실용적인 예제까지, 이해하기 쉽게 단계별로 설명합니다.

파이썬 집합(Set) 소개

파이썬에서 집합(Set)은 중복되지 않는 요소들의 모임을 나타내는 데이터 구조입니다. 수학의 집합 개념을 바탕으로 하며, 주로 데이터의 고유성을 유지하거나 집합 간의 연산을 수행할 때 유용하게 사용됩니다.

집합의 특징

  • 중복된 요소를 허용하지 않습니다.
  • 순서가 없기 때문에 인덱싱이 불가능합니다.
  • 변경 가능(mutable)하며, 요소의 추가와 제거가 가능합니다.

집합과 리스트의 비교

집합(Set)과 리스트(List)는 모두 여러 요소를 저장할 수 있는 자료형이지만, 몇 가지 중요한 차이점이 있습니다.

  • 중복: 리스트는 중복된 요소를 허용하지만, 집합은 중복을 허용하지 않습니다.
  • 순서: 리스트는 요소의 순서가 유지되지만, 집합은 순서가 없습니다.
  • 연산: 집합은 합집합, 교집합, 차집합 등의 집합 연산을 효율적으로 지원합니다.

집합(Set) 생성과 기본 사용법

집합 생성하기

파이썬에서 집합을 생성하는 방법은 간단합니다. 중괄호({})나 set() 함수를 사용하여 집합을 만들 수 있습니다.

# 중괄호를 사용한 집합 생성
fruits = {"apple", "banana", "cherry"}

# set() 함수를 사용한 집합 생성
numbers = set([1, 2, 3, 4, 5])

집합의 요소 추가 및 제거

집합에 요소를 추가하거나 제거하는 방법은 매우 직관적입니다.

# 요소 추가
fruits.add("orange")

# 여러 요소 추가
fruits.update(["mango", "grape"])

# 요소 제거
fruits.remove("banana")

# 요소 제거 (존재 여부 확인 없이)
fruits.discard("cherry")

집합의 기본 메서드

  • add(elem): 집합에 단일 요소를 추가합니다.
  • update(iterable): 집합에 여러 요소를 추가합니다.
  • remove(elem): 집합에서 특정 요소를 제거합니다. 요소가 없으면 KeyError가 발생합니다.
  • discard(elem): 집합에서 특정 요소를 제거합니다. 요소가 없어도 에러가 발생하지 않습니다.
  • clear(): 집합의 모든 요소를 제거합니다.

집합의 주요 연산

합집합 (Union)

두 집합의 모든 요소를 포함하는 집합을 만듭니다.

set1 = {1, 2, 3}
set2 = {3, 4, 5}

union_set = set1.union(set2)
# 또는
union_set = set1 | set2

print(union_set)  # 출력: {1, 2, 3, 4, 5}

교집합 (Intersection)

두 집합에 공통으로 포함된 요소들로 구성된 집합을 만듭니다.

intersection_set = set1.intersection(set2)
# 또는
intersection_set = set1 & set2

print(intersection_set)  # 출력: {3}

차집합 (Difference)

첫 번째 집합에는 있지만 두 번째 집합에는 없는 요소들로 구성된 집합을 만듭니다.

difference_set = set1.difference(set2)
# 또는
difference_set = set1 - set2

print(difference_set)  # 출력: {1, 2}

대칭차집합 (Symmetric Difference)

두 집합 중 하나에만 존재하는 요소들로 구성된 집합을 만듭니다.

sym_diff_set = set1.symmetric_difference(set2)
# 또는
sym_diff_set = set1 ^ set2

print(sym_diff_set)  # 출력: {1, 2, 4, 5}

집합(Set)을 활용한 실용 예제

중복 데이터 제거

리스트나 다른 반복 가능한 자료형에서 중복된 데이터를 쉽게 제거할 수 있습니다.

numbers = [1, 2, 2, 3, 4, 4, 5]
unique_numbers = set(numbers)
print(unique_numbers)  # 출력: {1, 2, 3, 4, 5}

집합을 이용한 회원 관리

웹사이트나 애플리케이션에서 회원의 권한을 관리할 때 집합을 활용할 수 있습니다.

admins = {"alice", "bob", "charlie"}
users = {"alice", "bob", "charlie", "david", "eve"}

regular_users = users - admins
print(regular_users)  # 출력: {'david', 'eve'}

데이터 분석에서의 활용

데이터 분석 시 집합 연산을 통해 데이터의 중복 제거나 교집합 분석 등을 수행할 수 있습니다.

dataset1 = {"apple", "banana", "cherry", "date"}
dataset2 = {"banana", "cherry", "fig", "grape"}

common_items = dataset1 & dataset2
print(common_items)  # 출력: {'banana', 'cherry'}

집합을 사용할 때 알아두면 좋은 팁

집합의 불변 버전: frozenset

집합의 불변(immutable) 버전인 frozenset을 사용하면 요소를 변경할 수 없는 집합을 만들 수 있습니다.

immutable_set = frozenset([1, 2, 3])
print(immutable_set)  # 출력: frozenset({1, 2, 3}))

# immutable_set.add(4)  # AttributeError 발생

집합의 효율적인 멤버십 테스트

집합은 리스트에 비해 멤버십 테스트(특정 요소가 집합에 있는지 확인)가 훨씬 빠릅니다.

import time

my_set = set(range(1000000))
my_list = list(range(1000000))

# 집합에서의 멤버십 테스트
start = time.time()
500000 in my_set
end = time.time()
print(f"Set lookup time: {end - start} seconds")

# 리스트에서의 멤버십 테스트
start = time.time()
500000 in my_list
end = time.time()
print(f"List lookup time: {end - start} seconds")

집합을 문자열로 변환하기

집합의 요소를 문자열로 쉽게 변환할 수 있습니다.

fruits = {"apple", "banana", "cherry"}
fruits_str = ", ".join(fruits)
print(fruits_str)  # 출력 예: "banana, apple, cherry"

마무리하며

파이썬의 집합(Set)은 데이터의 고유성을 유지하고 다양한 집합 연산을 효율적으로 수행할 수 있는 강력한 데이터 구조입니다. 위 내용을 통해 집합(Set)을 쉽게 이해하고 활용할 수 있도록 기본 개념부터 실용적인 예제까지 살펴보았습니다. 집합(Set)을 잘 활용하여 더욱 효율적인 파이썬 코드를 작성해보세요!

반응형