Match

ALL

Python pandas 웹 사이트 크롤링 예제

파이썬 판다스를 사용해 웹 페이지에 내용을 크롤링 하는 방법을 보겠습니다.크롤링취득한 데이터는 DataFrame에 저장해 가공을 하거나 csv 파일로 저장을 할 수 있습니다.본론으로 들어가 크롤링은 read_html()을 사용해 취득하도록 하겠습니다.크롤링 할 때 필요한 라이브러리도 미리 설치해두겠습니다.lxml, html5lib, beautifulsoup4라이브러리를 설치합니다.$ pip install lxml html5lib beautifulsoup4파이참을 사용하는 경우에는 파이참에서 설치해도 됩니다.웹 크롤링 예제는 네이버 ...
ALL

Python 정규 표현식으로 추출 방법

파이썬 정규 표현식 사용방법과 예제입니다.초기 설정정규 표현식을 사용하기 위해서는 라이브러리를 설정해야 합니다.import re정규 표현식을 사용하는 방법으로 2가지가 있습니다.첫 번째는 검색할 패턴을 컴파일해두는 방법입니다.이 방법은 같은 문자를 여러 번 검색하는 경우에 사용하는 방법으로, 매번 검색 패턴을 지정하지 않아도 되기 때문에 검색 속도가 빠릅니다.compilepattern = r"ca"text = "caabsacasca"repatter = re.compile(pattern)matchOB = repatter.match(t...