파이썬

ALL

Python DataFrame 인덱스 변경 제거 reset_index

판다스DataFrame에 인덱스를 지정해 사용할 수 있습니다. 기본값인 0부터 시작하는 행번호 인덱스를 사용할 수도 있고, 컬럼명을 인덱스로 지정할 수도 있습니다. 행번호 인덱스가 컬럼명을 지정해 인덱스를 사용하는 경우 인덱스를 제거하는 방법을 알아보겠습니다. 샘플 데이터를 준비하겠습니다. import pandas as pd df = pd.DataFrame({'name': , 'age': , 'state': , 'point': } ) # 인덱스를 name로 지정 df.set_index('name', inplace=True) prin...
ALL

Python DataFrame 컬럼명 인덱스로 설정하기 set_index

set_index() 메서드를 사용해DataFrame에 설정된 컬럼명(열)을 인덱스로 사용할 수 있습니다. 인덱스에 이름을 지정해두면loc, at으로 요소를 선택하는 경우에 편리하게 사용할 수 있습니다. 예제를 실행해 보면서set_index()메서드 사용방법을 알아보겠습니다. 샘플 데이터를 준비하겠습니다. import pandas as pd df = pd.DataFrame({'name': , 'age': , 'state': , 'point': } ) print(df) # name age state point # 0 Alice 24 ...
ALL

Python DataFrame Series 결합 concat 사용 방법

파이썬pandas.DataFrame또는pandas.Series를 결합하는 방법을 알아보겠습니다. 여러개DataFrame또는Series를 결합하기 위해서는pandas.concat()을 사용합니다. 샘플 데이터를 만들어 예제를 보면서 사용 방법을 알아보겠습니다. 샘플 데이터 import pandas as pd df1 = pd.DataFrame({'A': , 'B': , 'C': }, index=) print(df1) # A B C # ONE A1 B1 C1 # TWO A2 B2 C2 # THREE A3 B3 C3 df2 = pd.Dat...
ALL

Python DataFrame 문자열 치환 정규 표현식 사용 방법

DataFrame에 저장된 값을 치환하기 위해서replace를 사용합니다. replace를 사용해 문자열을 치환하는 경우 검색 문자열과 완전히 일치하는 문자만 치환이 됩니다. 일부분 일치하는 문자열은 변환되지 않습니다. 문자열 일부만 치환하고 싶은 경우는regex=True를 설정해정규 표현식으로 문자열 치환을 원하는 부분만 할 수 있습니다. 정규 표현식을 사용하지 않고 문자열을 치환한 결과를 먼저 보겠습니다. import pandas as pd df = pd.DataFrame({'name': , 'age': , 'state': , ...
ALL

Python DataFrame 문자열 치환 replace

판다스DataFrame, Series에 저장한 값을 치환하고 싶은 경우replace를 사용합니다. 기본적인 사용방법은 문자열을 변경할 때 사용하는replace와 같습니다. 하지만 문자열에서 사용하는 경우와DataFrame처럼 값이 여러개 저장되어 있는 리스트 형태에서 사용하는 것은 조금 차이가 있습니다. DataFrame에서 문자열을 치환하는replace를 어떻게 사용하고 어떤 결과가 나오는지 예제를 보면서 확인해보겠습니다. 문자열 치환 먼저 샘플 데이터를 준비하겠습니다. import pandas as pd df = pd.DataF...
ALL

Python DataFrame 순위 지정 rank() 함수

판다스DataFrame에 저장한 데이터 값을 판단해 순위를 지정하기 위해 rank() 함수를 사용합니다. DataFrame에 저장한 값을 정렬하기 위해서는sort_values()를 사용합니다. rank()는 정렬은 하지 않고 순위를 지정할 수 있습니다. 샘플 데이터를 만들어rank()사용 방법을 알아보겠습니다. import pandas as pd df = pd.DataFrame({'col1': , 'col2': , 'col3': }, index=) print(df) 결과 col1 col2 col3 a 50 0.3 h b 80 NaN...
ALL

Python DataFrame NaN 문자열 결합 na_rep

DataFrame에 저장된 문자열을 결합하기 위해str.cat()또는+연산자를 사용합니다. 문자열을 결합할 때 NaN 값이 있는 경우에는 문자열이 결합되지 않고 NaN으로 표시됩니다. na_rep를 사용해 NaN 대신에 다른 문자를 지정해 문자를 결합할 수 있습니다. 먼저 샘플 데이터를 준비하겠습니다. import pandas as pd import numpy as np df = pd.DataFrame({'name': , 'age': , 'state': , 'point': , 'col_NaN': }) print(df) 결과 name...
ALL

Python 판다스 DataFrame 여러행 문자열 결합 하기

DataFrame에 저장한 데이터를 저장한 경우에는 여러개 행이 존재하는 경우가 대부분입니다. 여러개 데이터가 있는 경우 모든 행에 문자열을 연결하는 방법을 알아보겠습니다. 또는DataFrame에 저장되어 문자열들을 컬럼명을 이용해 연결하는 방법을 알아보겠습니다. 먼저 샘플 데이터를 준비하겠습니다. import pandas as pd df = pd.DataFrame({'name': , 'age': , 'state': , 'point': }) print(df) # name age state point # 0 Alice 24 NY 64...
ALL

Python 판다스 DataFrame for 문 반복 처리

pandas DataFrame에 저장된 데이터를 for 문으로 처리하는 경우 단순히 for 문으로 돌리면 열 이름이 출력되기만 합니다. 반복 처리를 하기 위해서는 메서드를 사용해 열 또는 행 단위로 값을 취득해야 합니다. 예제를 보면서 DataFrame에서 반복 처리를 하며 값을 취득하는 방법을 보겠습니다. 먼저 샘플 데이터를 준비하겠습니다. import pandas as pd df = pd.DataFrame({'age': , 'state': , 'point': },                   index=) print(df) ...