Processor

【Pandas】 데이터 오브젝트 : Series와 DataFrame

작성자 임베디드코리아 작성일26-04-16 00:02 조회86회 댓글0건
【 Pandas : Series와 DataFrame 】
데이터 오브젝트는 데이터를 담고있는 그릇으로  데이터 오브젝트의 종류는 2가지로 나뉘게 되는데 Series와 DataFrame 2가지가 존재한다.
◆ series는 1차원 배열로 값의 위치를 기억하는 정보인 인덱스를 포함하고있다. 
    - 인덱스는 기본값으로 0부터 시작해서 1씩 증가하는 정수 인덱스가 사용된다.
◆ DataFrame은 2차원의 배열로 데이터를 담고 있다.

[ 1 ] Series (시리즈)
    - 시리즈는 1차원 배열과 유사한 객체이다.
    - 리스트와 비슷하지만, 각 데이터에 대응하는 인덱스(Index)를 사용자가 직접 지정할 수 있다는 차이점이 있다.

    ◎ 특징: 한 가지 데이터 타입만 담을 수 있습니다 (예: 정수만, 혹은 문자열만).
    ◎ 구성: 값(Value) + 인덱스(Index).

---<예시>------------------------------------------
import pandas as pd

# 예시: 간단한 시리즈 생성
s = pd.Series([10, 20, 30], index=['가', '나', '다'])
------------------------------------------------------
# 결과:
# 가    10
# 나    20
# 다    30

[ 2 ] DataFrame (데이터프레임)
      - 데이터프레임은 2차원 테이블 형태의 자료구조 이다.
      - 흔히 사용하는 엑셀(Excel) 스프레드시트나 SQL 테이블과 매우 흡사하다.

    ◎ 특징: 여러 개의 시리즈가 모여서 구성됩니다. 즉, 각 열(Column)은 서로 다른 데이터 타입을 가질 수 있다.
    ◎ 구성: 행 인덱스(Row Index) + 열 이름(Column Name) + 데이터 값(Value).

  구분              설명
-------------------------------------------------
Index         행의 이름 (세로 방향의 위치)
Columns      열의 이름 (가로 방향의 위치)
Values        실제 데이터 값
-------------------------------------------------


[ 3 ] 주요 차이점 요약

비교항목            Series                              DataFrame
--------------------------------------------------------------------------------------
차원              1차원 (Linear)                    2차원 (Tabular)
구성 요소        데이터 + 인덱스                데이터 + 행 인덱스 + 열 이름
비유              엑셀의 한 줄(열 또는 행)      엑셀 시트 전체
--------------------------------------------------------------------------------------