ALL

Python 판다스 엑셀 파일 행, 열 원하는 부분만 읽어 오기

파이썬으로 엑셀 파일에 있는 데이터를read_excel()를 사용해 취득해올 수 있습니다. 특별히 설정을 하지 않으면 지정한 엑셀 파일에 있는 시트 내용을 모두 취득해옵니다. 만약 취득하고 싶지 않은 열 또는 행이 있다면skiprows또는skiprows,usecols를 사용해 원하는 데이터만 취득할 수 있습니다. read_excel()를 사용해 원하는 엑셀에서 일부분만 취득하는 방법을 보겠습니다. read_excel()자세한 사용 방법은 아래를 참조해 주세요. 샘플 데이터를 준비하겠습니다. 엑셀에는 아래와 같은 데이터를 입력했습니다...
ALL

Python 판다스 엑셀 파일 저장 to_excel

파이썬에서 DataFrame으로 작성한 데이터를엑셀파일(xlsx, xls)로 저장하는 방법을 알아보겠습니다. 엑셀 파일로 데이터를 저장하기 위해서는to_excel()메서드를 사용합니다. to_excel()사용 방법을 예제를 통해 알아보겠습니다. xlwt, openpyxl 설치 to_excel()를 사용하면 내부에서는 xlwt, openpyxl 라이브러리를 사용합니다. 만약 라이브러리 설치가 되지않았다면엑셀 파일을 저장할 때 에러가 발생합니다. import openpyxl ModuleNotFoundError: No module nam...
ALL

Python 판다스 엑셀 파일 읽기 열기 read_excel

파이썬 판다스로엑셀(xlsx, xls)파일을 열어 데이터를DataFrame형태로 취득하는 방법을 알아보겠습니다. 엑셀 파일을 읽어오기 위해서는pandas.read_excel()함수를 사용합니다. 데이터를 읽어올 엑셀 파일을 준비하겠습니다. 엑셀 파일에는sheet1과sheet22개 시트가 있습니다. shee1 시트에는 다음과 같은 값이 들어있습니다. A B C one 11 12 13 two 21 22 23 three 31 32 33 shee2 시트에는 다음과 같은 값이 들어있습니다. AA BB CC ONE 11 12 13 TWO 21...
ALL

Python DataFrame 인덱스 변경 제거 reset_index

판다스DataFrame에 인덱스를 지정해 사용할 수 있습니다. 기본값인 0부터 시작하는 행번호 인덱스를 사용할 수도 있고, 컬럼명을 인덱스로 지정할 수도 있습니다. 행번호 인덱스가 컬럼명을 지정해 인덱스를 사용하는 경우 인덱스를 제거하는 방법을 알아보겠습니다. 샘플 데이터를 준비하겠습니다. import pandas as pd df = pd.DataFrame({'name': , 'age': , 'state': , 'point': } ) # 인덱스를 name로 지정 df.set_index('name', inplace=True) prin...
ALL

Python DataFrame 컬럼명 인덱스로 설정하기 set_index

set_index() 메서드를 사용해DataFrame에 설정된 컬럼명(열)을 인덱스로 사용할 수 있습니다. 인덱스에 이름을 지정해두면loc, at으로 요소를 선택하는 경우에 편리하게 사용할 수 있습니다. 예제를 실행해 보면서set_index()메서드 사용방법을 알아보겠습니다. 샘플 데이터를 준비하겠습니다. import pandas as pd df = pd.DataFrame({'name': , 'age': , 'state': , 'point': } ) print(df) # name age state point # 0 Alice 24 ...
ALL

Python DataFrame Series 결합 concat 사용 방법

파이썬pandas.DataFrame또는pandas.Series를 결합하는 방법을 알아보겠습니다. 여러개DataFrame또는Series를 결합하기 위해서는pandas.concat()을 사용합니다. 샘플 데이터를 만들어 예제를 보면서 사용 방법을 알아보겠습니다. 샘플 데이터 import pandas as pd df1 = pd.DataFrame({'A': , 'B': , 'C': }, index=) print(df1) # A B C # ONE A1 B1 C1 # TWO A2 B2 C2 # THREE A3 B3 C3 df2 = pd.Dat...
ALL

Python DataFrame 문자열 치환 정규 표현식 사용 방법

DataFrame에 저장된 값을 치환하기 위해서replace를 사용합니다. replace를 사용해 문자열을 치환하는 경우 검색 문자열과 완전히 일치하는 문자만 치환이 됩니다. 일부분 일치하는 문자열은 변환되지 않습니다. 문자열 일부만 치환하고 싶은 경우는regex=True를 설정해정규 표현식으로 문자열 치환을 원하는 부분만 할 수 있습니다. 정규 표현식을 사용하지 않고 문자열을 치환한 결과를 먼저 보겠습니다. import pandas as pd df = pd.DataFrame({'name': , 'age': , 'state': , ...
ALL

Python DataFrame 문자열 치환 replace

판다스DataFrame, Series에 저장한 값을 치환하고 싶은 경우replace를 사용합니다. 기본적인 사용방법은 문자열을 변경할 때 사용하는replace와 같습니다. 하지만 문자열에서 사용하는 경우와DataFrame처럼 값이 여러개 저장되어 있는 리스트 형태에서 사용하는 것은 조금 차이가 있습니다. DataFrame에서 문자열을 치환하는replace를 어떻게 사용하고 어떤 결과가 나오는지 예제를 보면서 확인해보겠습니다. 문자열 치환 먼저 샘플 데이터를 준비하겠습니다. import pandas as pd df = pd.DataF...
ALL

Python DataFrame 순위 지정 rank() 함수

판다스DataFrame에 저장한 데이터 값을 판단해 순위를 지정하기 위해 rank() 함수를 사용합니다. DataFrame에 저장한 값을 정렬하기 위해서는sort_values()를 사용합니다. rank()는 정렬은 하지 않고 순위를 지정할 수 있습니다. 샘플 데이터를 만들어rank()사용 방법을 알아보겠습니다. import pandas as pd df = pd.DataFrame({'col1': , 'col2': , 'col3': }, index=) print(df) 결과 col1 col2 col3 a 50 0.3 h b 80 NaN...