엑셀 데이터를 AI로 노션 자동화했다가 실패한 이유: 자산관리 대시보드 실험 복기
엑셀 자산 데이터를 AI로 분석해 노션 대시보드를 자동화했다가 데이터 오염으로 폐기한 사례를 통해, 자산관리 자동화의 한계와 데이터 설계의 중요성을 복기합니다.
🎬 프롤로그: “부기야, 내 자산 현황 좀 정리해줄래?”
모든 비극은 선한 의도에서 시작됩니다.
나에게는 부기(Bookie)라는 AI 비서가 있습니다. 텔레그램을 통해 항상 곁에 있고, 파일을 분석하고, API를 호출하고, 블로그 포스팅까지 대신 써주는, 말하자면 디지털 집사 같은 존재입니다.
어느 날, 문득 이런 생각이 들었습니다.
“내 개인 자산 현황이 엑셀 파일 하나에 다 정리되어 있는데, 이걸 AI한테 분석시켜서 노션에 대시보드로 자동 생성하면 꽤 멋지지 않을까?”
솔직히 말하면, 기술적으로 가능한 것과 해야 하는 것 사이의 경계를 간과한 순간이었습니다. 하지만 그때의 나는 자동화의 장밋빛 미래에 취해 있었습니다.
🔧 전개: 엑셀 → 노션 대시보드, 자동화의 꿈
Step 1. 엑셀 파싱
부기에게 엑셀 파일을 건넸습니다. 부기는 openpyxl을 활용해 시트 구조를 분석하고, 각 행의 데이터를 파싱하기 시작했습니다.
1
2
3
4
📊 분석 결과:
- 시트 수: N개
- 총 행 수: XX행
- 자산 항목 추출 완료
여기까지는 순조로웠습니다. 엑셀의 각 행에서 자산명, 금액, 카테고리 등을 추출하고, 이를 구조화된 데이터로 변환하는 과정은 AI가 가장 잘하는 영역이기도 합니다.
Step 2. 노션 API를 활용한 대시보드 자동 생성
파싱된 데이터를 기반으로 노션(Notion) 데이터베이스를 자동 생성했습니다. 노션 API를 통해:
- 📁 데이터베이스 스키마 설계 — 자산명, 카테고리, 금액, 메모 등의 속성(Property) 정의
- 📝 페이지 자동 생성 — 각 자산 항목을 개별 페이지로 등록
- 📊 뷰 구성 — 카테고리별 그룹핑, 금액 기준 정렬
노션에 자산 대시보드가 뚝딱 만들어지는 것을 보며, “역시 자동화란 이런 거지!” 하고 감탄했습니다.
…라고 좋아했던 것도 잠시.
🚨 위기: “이게 왜 자산이지?” — 데이터 오염의 늪
노션 대시보드를 열어본 순간, 뭔가 이상했습니다.
분명 자산 항목만 들어가야 할 데이터베이스에 엉뚱한 데이터들이 섞여 있었습니다. 연도 정보(2024, 2025), 소계 행, 빈 행까지 — 엑셀 내의 서식용 데이터와 메타 정보가 자산으로 오인된 것입니다.
1
2
3
4
❌ 오염된 데이터 예시:
- "2024" → 자산명으로 등록됨
- "소계" → 자산 항목으로 인식됨
- 빈 행 → 금액 0원짜리 유령 자산 생성
원인은 명확했습니다. 엑셀 파일은 사람이 보기 위해 설계된 문서였지, 기계가 파싱하기 위한 정형 데이터가 아니었습니다.
인간이 읽을 때는 “아, 이건 연도 구분선이구나” 하고 자연스럽게 넘기지만, AI는 그런 맥락(Context)을 이해하지 못합니다. 모든 행을 동등한 데이터로 취급한 것입니다.
이것은 AI의 한계라기보다는, 입력 데이터의 설계 문제였습니다.
💡 Garbage In, Garbage Out. — 쓰레기가 들어가면 쓰레기가 나온다. 데이터 엔지니어링의 가장 오래된 격언이 이렇게 생생하게 증명되는 순간이었습니다.
⚡ 절정과 결말: “다 지워. 지금 당장.”
여기서 중요한 장면이 등장합니다.
오염된 대시보드를 확인한 나는 즉각적으로 폐기를 결정했습니다.
데이터를 고쳐볼까? 필터를 추가할까? 예외 처리 로직을 넣을까? — 이런 고민을 할 수도 있었지만, 그러지 않았습니다.
“방향이 잘못되었으면, 수정이 아니라 폐기다.”
부기에게 지시했습니다.
1
"노션에 생성된 자산 대시보드, 관련 데이터베이스 전부 삭제해줘."
부기는 신속하게 노션 API를 통해 생성했던 모든 페이지와 데이터베이스를 롤백(삭제)했습니다. 만든 것도 AI, 치운 것도 AI. 깔끔했습니다.
전체 과정을 정리하면:
| 단계 | 소요 시간 | 결과 |
|---|---|---|
| 엑셀 파싱 | ~5분 | ✅ 완료 |
| 노션 대시보드 생성 | ~10분 | ✅ 완료 |
| 데이터 오염 발견 | ~2분 | 🚨 문제 인식 |
| 폐기 결정 | ~10초 | ⚡ 즉각 결정 |
| 롤백(삭제) | ~3분 | 🧹 완료 |
총 약 20분. 실험하고, 실패를 확인하고, 폐기하기까지 20분.
이것이 바로 Lean한 의사결정입니다.
📚 교훈: 이 “실패”에서 배운 것들
1. 완벽한 자동화보다 중요한 것은 정확한 데이터 설계
자동화 도구가 아무리 강력해도, 입력 데이터의 품질이 보장되지 않으면 결과물은 신뢰할 수 없습니다.
엑셀은 인간의 가독성을 위해 설계된 도구입니다. 병합된 셀, 서식용 빈 행, 소계 행, 연도 구분, 이 모든 것이 사람에게는 시각적 단서이지만, 기계에게는 노이즈(Noise)입니다.
만약 처음부터 기계 친화적인 데이터 구조(정규화된 CSV, 데이터베이스 테이블 등)로 자산을 관리했다면 결과는 달랐을 것입니다.
🎯 Lesson Learned: 자동화를 꿈꾸기 전에, 먼저 데이터가 자동화될 준비가 되어 있는지 확인하라.
2. Fail Fast — 빠르게 실패하고, 빠르게 배워라
이번 경험에서 가장 잘한 것은 실패를 인지한 즉시 폐기를 결정한 것입니다.
소프트웨어 개발에서 자주 인용되는 Fail Fast 원칙은 단순히 “빨리 실패하라”는 뜻이 아닙니다. “잘못된 방향임을 인지했을 때, 매몰 비용(Sunk Cost)에 연연하지 말고 즉시 방향을 전환하라”는 뜻입니다.
오염된 대시보드를 고치려고 시간을 쏟았다면? 예외 처리 로직을 추가하고, 필터를 만들고, 데이터를 수작업으로 정제했다면? — 그것은 잘못된 기초 위에 건물을 올리는 것과 같습니다.
3. AI는 도구다 — 판단은 사람의 몫
부기는 훌륭한 실행자입니다. 시키면 해내고, 빠르고, 정확하며, 불평하지 않습니다.
하지만 “이 방향이 맞는가?”라는 판단은 여전히 인간의 영역입니다. AI에게 자산 관리를 맡긴 것 자체가 문제가 아니라, 맡기기 전에 데이터의 상태를 검증하지 않은 것이 문제였습니다.
🤖 AI는 좋은 병사이지만, 좋은 장군은 아닙니다. 전략적 판단과 방향 설정은 결국 사람이 해야 합니다.
4. Lean한 기술 의사결정의 힘
전체 사이클을 돌아보면, 이것은 사실 완벽한 Lean 사이클이었습니다:
- Build — 최소한의 리소스로 빠르게 프로토타입을 만들었습니다 (엑셀 파싱 → 노션 대시보드)
- Measure — 결과물을 즉시 확인하고 문제를 발견했습니다 (데이터 오염)
- Learn — 근본 원인을 파악하고 교훈을 도출했습니다 (데이터 설계의 중요성)
그리고 Pivot — 잘못된 방향을 즉시 폐기하고 원점으로 돌아왔습니다.
20분 만에 한 바퀴를 돌았습니다. 실패했지만, 비용은 최소화되었고, 배움은 최대화되었습니다.
🔮 에필로그: 다음 시도를 위하여
이번 경험이 “실패”인가? 나는 그렇게 생각하지 않습니다.
20분의 실험으로 “엑셀 기반의 자산 데이터를 그대로 자동화하면 안 됩니다”라는 확실한 교훈을 얻었습니다. 이 교훈을 얻기 위해 며칠을 삽질했다면 그것이 진짜 실패였을 것입니다.
다음에 자산 대시보드를 만든다면, 이렇게 접근할 것입니다:
- 데이터 정규화부터 — 엑셀의 “인간 친화적” 구조를 “기계 친화적” 구조로 재설계
- 스키마 정의 선행 — 어떤 데이터가 자산이고, 어떤 데이터가 메타 정보인지 명확히 구분
- 검증 단계 추가 — 파싱 결과를 대시보드에 반영하기 전, 데이터 품질 검증 레이어 도입
그때까지 부기는 또 다른 일들을 묵묵히 해낼 것이고, 나는 또 다른 실험을 기획할 것입니다.
실패를 두려워하지 말자. 다만, 빠르게 실패하자. ⚡
이 포스팅은 실제로 AI 비서(부기)와의 협업 과정에서 일어난 실화를 기반으로 작성되었습니다. 참고로, 이 포스팅의 초안도 부기가 작성했습니다. 아이러니하죠? 😄
이 포스팅이 가치 있었나요?
여러분의 평가는 콘텐츠의 품질을 결정하는
가장 핵심적인 데이터가 됩니다.
실시간 익명 데이터로 수집되어 블로그 운영에 반영됩니다.