사내 자동화 · 데이터 · 인프라
수기 회계 업무를 RPA · OCR · 크롤링으로 자동화하고, 회사 데이터를 BigQuery로 통합 · 운영.
ERP 본개발에 앞서, 흩어진 수작업과 레거시 회계 시스템(더존·홈택스·위하고)을 연동·자동화하고 회사 데이터를 클라우드로 옮기는 일을 단독으로 맡았습니다. 결제·금융 인프라를 직접 조사하고, GCP(BigQuery·Cloud Run·VM) 위에 데이터·자동화 기반을 세웠습니다.
주요 구현 · 성과
- 01 회계 업무 RPA 자동화 — 더존(Douzone) 카드매출 입력, 국세청 홈택스 전자세금계산서 합계표·현금영수증 매출 다운로드, 위하고 마이그레이션을 무인 자동화
- 02 은행·카드 매출 데이터 크롤링 + VM 무인 운영 — 농협·기업은행 계좌/카드 매출을 undetected-chromedriver로 수집(승인된 계정 범위 내 보안 입력 제약 대응 적용), 15분 주기 실행 루프(연속 실패 시 백오프)를 Windows 작업 스케줄러·서비스로 등록해 VM에서 무인 운영
- 03 위하고 통장·카드매출(SPC·머니온) 크롤러를 Cloud Run Jobs + Scheduler 자동 수집 파이프라인으로 배포·구성 — 중복 제거 누적 적재로 BigQuery raw_data 적재
- 04 Upstage OCR로 실측·견적 자동 인식 — 인식률 테스트 후 ERP 판매견적에 적용, 서버 배포
- 05 결제·금융 인프라 직접 조사·도입 검토 — 팝빌/바로빌, 사이다페이·토스페이, PG vs VAN 수수료, 여신금융협회 API 정책까지 분석
- 06 BigQuery 데이터 이관 + 보안 설계 — 서비스계정·IAM 권한·정책태그 승격, 스케줄 서비스 구성, "빠른조회서비스" 클라우드 마이그레이션
- 07 흩어진 고객 데이터를 정리해 CRM의 토대를 마련 — 유입·계약 고객을 수기로 다우오피스웍스에 입력하던 탓에 이름·키값이 어긋나고 중복이 많던 약 2만 6천 건을 BigQuery에서 정제하고, 이를 CRM 7개 관계형 테이블로 분해 적재하는 룰 기반 매핑 엔진(Python)을 만들었습니다 — 4단계 우선순위 진행상태 판정·enum 12종 정규화·user·partner FK 매칭. 이 정제된 데이터가 신규 CRM의 출발점이 되었습니다
- 08 매입검수 자동화 파이프라인 운영·고도화 — 거래명세서 OCR → 별칭 매칭 → BigQuery 적재 → 세금계산서 대사(6단계, 거래처 약 60개)를 인수·운영하며 멱등 적재(MERGE)·FAIL 재매칭 보정·Apps Script 검수 웹앱으로 고도화
- 09 민감정보 부서간 격리(Secret Manager) 보안 설계 — 은행계좌 비밀번호 등 100개 이상을 사람에게 노출 없이 런타임 주입(DEV 더미/PROD 실값·실행/열람 권한 분리)하는 구조를 설계·도입
- 10 근태 출퇴근 시스템 구축(POC) — 세종·논산 공장 대상 회의·설계, 기초데이터 정리
- 11 Notion · Playwright · Context7 등 MCP 도구를 개발 프로세스에 도입