ALL

Python DataFrame NaN 문자열 결합 na_rep

DataFrame에 저장된 문자열을 결합하기 위해str.cat()또는+연산자를 사용합니다. 문자열을 결합할 때 NaN 값이 있는 경우에는 문자열이 결합되지 않고 NaN으로 표시됩니다. na_rep를 사용해 NaN 대신에 다른 문자를 지정해 문자를 결합할 수 있습니다. 먼저 샘플 데이터를 준비하겠습니다. import pandas as pd import numpy as np df = pd.DataFrame({'name': , 'age': , 'state': , 'point': , 'col_NaN': }) print(df) 결과 name...
ALL

Python 판다스 DataFrame 여러행 문자열 결합 하기

DataFrame에 저장한 데이터를 저장한 경우에는 여러개 행이 존재하는 경우가 대부분입니다. 여러개 데이터가 있는 경우 모든 행에 문자열을 연결하는 방법을 알아보겠습니다. 또는DataFrame에 저장되어 문자열들을 컬럼명을 이용해 연결하는 방법을 알아보겠습니다. 먼저 샘플 데이터를 준비하겠습니다. import pandas as pd df = pd.DataFrame({'name': , 'age': , 'state': , 'point': }) print(df) # name age state point # 0 Alice 24 NY 64...
ALL

Python 판다스 DataFrame for 문 반복 처리

pandas DataFrame에 저장된 데이터를 for 문으로 처리하는 경우 단순히 for 문으로 돌리면 열 이름이 출력되기만 합니다. 반복 처리를 하기 위해서는 메서드를 사용해 열 또는 행 단위로 값을 취득해야 합니다. 예제를 보면서 DataFrame에서 반복 처리를 하며 값을 취득하는 방법을 보겠습니다. 먼저 샘플 데이터를 준비하겠습니다. import pandas as pd df = pd.DataFrame({'age': , 'state': , 'point': },                   index=) print(df) ...
ALL

Python 판다스 DataFrame AND, OR, NOT 여러개 사용 방법

pandas에서 AND, OR, NOT을 사용해 여러 조건을 가지고 행을 추출하는 방법을 보겠습니다. 소스를 작성할 때는AND, OR, NOT을&, |, ~로 작성합니다. 조건식and&or|not~ DataFrame테스트 데이터를 준비하겠습니다. import pandas as pd df = pd.read_csv('C:/Users/Administrator/Desktop/python/csv/pandas_sample_data.csv') print(df) #       name  age state  point # 0    Alice   2...
ALL

Python 로또 당첨번호 크롤링 분석 하기

파이썬으로 크롤링 한 데이터를 분석해보는 예제를 보겠습니다. 예제 내용은 로또 번호를 크롤링 해 1등 당첨 번호가 가장 많이 나온 숫자를 분석하겠습니다. 로또 번호 크롤링은 API를 제공하고 있기 때문에 간단하게 데이터를 수집할 수 있습니다. 본론으로 들어가 로또 번호를 취득해 가장 많이 나온 1등 번호를 알아보겠습니다. import requests from tqdm import tqdm import json import matplotlib.pyplot as plt from collections import Counter impor...
ALL

Python 로또 예상 번호 추출 하기 예제

파이썬random을 사용해서 랜덤으로 번호를 추출할 수 있습니다. 랜덤으로 번호를 추출하기 때문에 로또 번호를 추출하는 프로그램을 간단하게 만들 수 있습니다. 로직 또한 간단하며 어렵지 않습니다. import random numbers = luckey_numbers = random.sample(numbers, 6) luckey_numbers.sort() print(luckey_numbers) 결과 6개 번호가 랜덤으로 출력되었습니다. 변수numbers에는 1부터 45까지 숫자를 저장해놓습니다. random함수로 범위를 지정해 숫자를...
ALL

Python 터틀 별 그리기 예제

프로그램 연습을 할 때 많이 하는 로직이 별 그리기입니다. 별을 그리기 위해 터틀 그래픽을 사용해보겠습니다. 터틀 그래픽은 거북이가 나와 그림을 그려줍니다. 터틀 그래픽을 사용해서 그림으로 출력하는 방법을 보겠습니다. 초심자 또는 어린이들에게 프로그램을 학습할 때 흥미를 가지게 할 수 있습니다. 거북이를 사용해 별 그림을 그려보겠습니다. import turtle turtle.color('red', 'yellow') turtle.begin_fill() for _ in range(5):     turtle.forward(100)    ...
ALL

Python 크롤링 한글 깨짐 pandas encoding 설정

파이썬 판다스로 웹사이트에서 크롤링을 하는 경우가 많습니다. 복잡한 로직을 만들지 않아도 간편하게 크롤링을 할 수 있기 때문입니다. 하지만 취득한 데이터가 한글인 경우 글자가 깨지는 경우가 있습니다. import pandas as pd url = ' dfs = pd.read_html(url) print(dfs)   결과 크롤링 한 데이터를 출력해보면 한글이 깨져서 나옵니다. 한글이 깨지는 것을 해결하기 위해서는 크롤링 할 때encoding을euc-kr로 설정해야 합니다.   인코딩 설정은read_html()안에 지정합니다. impo...
ALL

Python 크롤링 데이터 csv 파일 저장

파이썬 판다스로 크롤링을 사용해 웹 사이트 정보를 취득할 수 있습니다. 이번에는 취득한 정보를 csv 파일로 저장하는 예제를 보겠습니다. 크롤링과 csv 파일을 출력은 판다스를 사용하겠습니다. 먼저 데이터를 취득하겠습니다. import pandas as pd url = ' dfs = pd.read_html(url,match='순위',encoding='euc-kr') # print(dfs].dropna(how="all")) dfsNan = dfs.dropna(how="all") print(dfsNan) 결과 데이터는 문제없이 취득되었...