외부 데이터 호출: 금융감독원, 한국은행 등 외부 기관 API(웹)에서 최신 환율, 금리, 주가 정보 수집
복잡한 데이터 처리: 통계 분석 및 머신러닝 수행
파일 처리: 엑셀, 파워포인트 등 오피스 파일 연동
자동화: 반복 작업 수행 및 데이터 시각화
활용 예시: 여러 SQL 질의 결과를 조합하여 그래프로 시각화하고, 이를 파워포인트 보고서로 작성하여 관계자들에게 이메일로 자동 발송
데이터베이스 접속 (Oracle)
라이브러리 설치: Oracle DB 접근을 위한 oracledb 라이브러리 설치 (!는 쉘 명령어 실행)
!pip install oracledb
접속 설정 및 연결:
import oracledb
un = "c##user"# 사용자 이름
pw = '1234'# 비밀번호
cs = "localhost:1521/xe"# 접속 문자열 (서버:포트/서비스이름)# 접속 객체 생성
connection = oracledb.connect(user=un, password=pw, dsn=cs)
Pandas 활용
Pandas란?: Python에서 표(Table) 형태의 데이터를 다루는 라이브러리
SQL 결과 변환: SQL 실행 결과를 읽어서 Pandas의 데이터프레임(표) 형태로 변환
import pandas as pd
company = pd.read_sql("SELECT COMPANY_NM, CEO_NM FROM TB_COMPANY_MASTER", con=connection)
엑셀 파일 처리:
저장하기: to_excel 함수 사용. index=False는 왼쪽의 행 번호를 생략한다는 의미