Python 크롤링 데이터 csv 파일 저장

파이썬 판다스로 크롤링을 사용해 웹 사이트 정보를 취득할 수 있습니다.

이번에는 취득한 정보를 csv 파일로 저장하는 예제를 보겠습니다.

크롤링과 csv 파일을 출력은 판다스를 사용하겠습니다.

먼저 데이터를 취득하겠습니다.

import pandas as pd

url = 'https://finance.naver.com/sise/lastsearch2.nhn'
dfs = pd.read_html(url,match='순위',encoding='euc-kr')

# print(dfs[0][['순위', '종목명','현재가']].dropna(how="all"))

dfsNan = dfs[0].dropna(how="all")
print(dfsNan)

 

결과

데이터는 문제없이 취득되었습니다.

크롤링에 대한 자세한 설명은 아래를 참조해 주세요.

 

취득한 데이터를 csv 파일로 저장하기 위해 to_csv() 사용하겠습니다.

import pandas as pd

url = 'https://finance.naver.com/sise/lastsearch2.nhn'
dfs = pd.read_html(url,match='순위',encoding='euc-kr')

# print(dfs[0][['순위', '종목명','현재가']].dropna(how="all"))

dfsNan = dfs[0].dropna(how="all")

dfsNan.to_csv('C:/Users/Administrator/Desktop/python/csv/pandas_sample.csv')

 

실행하면 지정한 폴더에 csv 파일이 생성됩니다.

생성된 파일을 확인해보겠습니다.

 

csv 파일에는 크롤링 한 데이터가 출력되었습니다.

특별히 구분을 정해주지 않아도 콤마(,)로 항목별이 구분되어 출력됩니다.

댓글