discussion — #016 自动抓温哥华地产局数据(自动化方法 × 房产数据场景)

工作底稿。index.md 等深挖到「材料够了」再写。

选题来源

  • inbox.md 第 2 条种子:「房产数据拿到以后能够对人们有什么帮助,温哥华两个地产局每月都会发布统计数据」。
  • 定位:这是一篇 laoxia.ca 长博客(pillar),不是小红书内容。房产数据只是「自动化方法」的业务场景载体

strategy 对齐(LAOXIA_BRAND_STRATEGY.md)

  • 人设宪法 #3「与业务场景深度挂钩」:技术必须依附实际业务场景——本篇 = 自动化方法 × 温哥华房产数据。✅
  • 卖铲子 / BYOK:不做楼市预测、不给买卖建议(也守财经红线);只展示「我怎么用代码把公开数据自动抓下来、清洗、看懂」这套铲子
  • 文章结构(必须按这个):真实痛点场景 → 老夏降维哲思 → 极客解题(工作流/代码展示)→ 降维打击的商业思考。
  • Pillar-to-Micro:长博客是地基;之后切成小红书(切面 A 情绪/痛点、B 极客硬核、C 哲思)。

value 验证调研(2026-06-18,研究小号/限速)——结论:🟢 绿(适合做 pillar 长博客)

YouTube(yt-dlp,免登录)

  • 「温哥华楼市数据」本身:播放几百~几千,被地产经纪月报霸占,高播放=唱衰标题党(违红线/voice)。→ 当"楼市内容"判=黄。
  • 换"自动化方法"镜头:「自动抓网页/数据」30万/29万/7.5万/3.3万;「AI/自动化办公提效」12万;一人公司全自动化几万。→ 自动化方法=强需求赛道,且打法正是卖铲子结构。

小红书(xhs CLI,小号「小红薯5657B4EE」)

  • 「AI/自动化 提效」:「4个能替你上班的AI神器」1.7万赞/3.4万藏 → 大需求。
  • 「程序员 自动化 生活」:情感/生活反差类高(后端程序员真实一天 570赞、接私活还房贷 271评、老公写代码自动化打游戏 126赞);纯教程低(Codex 36赞)。
  • 「温哥华房产数据」:全是个位数赞(5/3/6/2/10)→ 🔴 小红书是死的。 「程序员AI量化」4赞(死+撞红线)。

关键洞察

  • 平台分裂:房产数据这个场景,YouTube/长博客能活(自动抓数据方法演示),小红书死
  • 所以:pillar 长博客 = 自动化方法(自动抓地产局数据),完全成立;
  • 切片到小红书时别叫"房产数据报告"(没人看)→ 走切面 A 情绪(每月几十页报告看到吐 vs 脚本3分钟搞定的爽感)/ B 硬核(代码截图)/ C 哲思,把"自动化方法"的爽感和反差拎出来。

待深挖(进 laoxia-writing-workflow Step2 拷问时榨干)

  • 真实痛点场景:老夏自己为什么要每月看这俩地产局数据?(自家买卖房?纯好奇?帮谁?)——痛点要具体、第一人称、有真实动机。⚠️ 守红线:不导向"该不该抄底"。
  • 极客解题:具体怎么抓?(两个地产局 = REBGV 大温 + FVREB 菲沙河谷?月报是 PDF 还是网页?抓取 + 解析 + 清洗 + 看懂的工作流)——要能展示「极简优雅解决实际问题」的代码片段。
  • 降维哲思:从"自动抓一份月报"能拔到什么普适的点?(如:公开数据其实人人能拿,差的是把它自动变成"能看懂的东西"的那一步)
  • 商业思考:这套"自动抓公开报表"的铲子,还能给哪些被手工折磨的行业用?(BYOK)

红线 & voice 自检(写正文时)

  • 不预测楼市、不给买卖建议、不荐盘;财经只做一般性信息(带免责)。
  • Spider-Man voice:讲我自己怎么折腾的,不说教;大白话+生活比喻;主角是"自动化方法/铲子",不是"楼市判断"。

系列 / 配图 / 分发(draft 阶段先记)

  • 可能开一个「自动化方法」系列(本篇 + 未来其它场景),待定。
  • 配图:走「Claude 出 ChatGPT prompt → 老夏 ChatGPT 出图」流程(见 CLAUDE.md「Cover + inline images」)。
  • 视频:若做 YouTube 长视频,走 laoxia-youtube-script→storyboard→video→upload 四步;Shorts 切条走 laoxia-youtube-short。