파이썬 DataFrame

ALL

Python pandas 결측값(NaN) 일괄 변경 fillna 사용법

pandas DataFrame또는Series에 결측값NaN을 임의의 값으로 변경하는 방법을 알아보겠습니다. 결측값NaN을 다른 값으로 변경하기 위해서fillna함수를 사용합니다. fillna함수를 사용해DataFrame의 결측값NaN을 다른 값으로 일괄 변경하는 방법을 보겠습니다. DataFrame에NaN을 만들기 위해csv를 불러왔습니다. DataFrame에는 아래처럼 결측값NaN이 존재합니다. import pandas as pd df = pd.read_csv('data/tmp/sample.csv') print(df) # name...
ALL

Python 여러개 DataFrame 인덱스 기준 합치기 merge 사용 방법

여러개DataFrame을 결합하기 위해서pandas.merge()또는pandas.DataFrame의 merge() 메서드를 사용합니다. merge를 사용해DataFrame를 결합하는 경우 열의 컬럼명을 지정하거나인덱스를 기준으로 결합할 수 있습니다. 이번에는인덱스를 기준으로DataFrame을 결합하는 방법을 알아보겠습니다. DataFrame 컬럼명을 지정해 결합하는 방법은 아래를 참조해주세요. pandas.merge()함수또는pandas.DataFrame의 merge() 메서드에 인덱스를 지정해 결합하는 기본적인 내용을 먼저 보겠습...
ALL

Python 여러개 DataFrame 열 컬럼명 합치기 merge 사용 방법

DataFrame에 날짜나 이름 등 공통의 컬럼명을 가진 여러 개의DataFrame을 공통 컬럼명의 값을 가지고 합치는 방법을 알아보겠습니다.여러개DataFrame에서 공통의 컬럼명으로 합치기 위해서는pandas.merge()함수또는 pandas.DataFrame의 merge()메서드를 사용합니다.merge()를 사용해 지정한 열의 컬럼명을 기준으로 결합하는 방법을 보겠습니다. 키 열을 지정: on, left_on, right_on 결합 방법을 지정: how inner_join: how='inner' left_join: how='l...
ALL

Python DataFrame 결측값 제거 dropna 사용 방법

만약 조건과 일치하지 않은NaN행을 출력하고 싶지 않은 경우에는dropna()를 사용해 출력하지 않도록 할 수 있습니다.우선dropna()를 사용하지 않고where()만을 사용한 결과를 확인해보겠습니다. where() 기본적인 사용 방법은 아래를 참조해주세요. import pandas as pd import numpy as np df = pd.DataFrame({'A': , 'B': , 'C': }) # DataFrame 샘플 데이터 # A B C # 0 -20 1 a # 1 -10 2 b # 2 0 3 b # 3 10 4 b # ...
ALL

Python Dataframe 조건 검색 where 사용 방법

Dataframe에 저장한 데이터중 특정 값만 출력하고 싶은 경우가 있습니다. 이러한 경우에는where()사용해 조건과 일치하는 데이터 행만 출력할 수 있습니다. where where은Dataframe원하는 컬럼에 조건을 설정해 해당하는 데이터행의 값만 출력합니다. 샘플을 보겠습니다. import pandas as pd import numpy as np df = pd.DataFrame({'A': , 'B': , 'C': }) # DataFrame 샘플 데이터 # A B C # 0 -20 1 a # 1 -10 2 b # 2 0 3 b...
ALL

Pandas DataFrame 공백(NaN) 행만 추출 방법

DataFrame을 사용할때NaN(Null) 인 데이터만 추출하고 싶은 경우가 있습니다. isnull 함수를 사용해서 DataFrame에 NaN(Null)이 존재하는 행만 추출하는 여러 가지 예제를 보도록 하겠습니다. 테스트 데이터 준비 먼저 예제를 실행할 수 있는 테스트용 데이터를 만들겠습니다. random 함수를 사용해 랜덤으로 생성된 숫자를 DataFrame에 추가하겠습니다. 열은 ABCDE로 지정하겠습니다. 그리고 마지막 줄에서iloc로Null을 설정해두겠습니다. import pandas as pd import numpy a...