- 一、核心前提与调研结论
1.1 核心前提梳理
技术路径:完全依赖火山引擎/阿里云百炼的三方API,不自主训练AI模型(识图、文本生成均通过API实现);
功能边界:放弃AR/3D,仅保留“2D户型图/家居照片上传→AI识别→奇门八卦图文建议→摆件推荐”的核心流程;
目标用户:风水爱好者,核心需求是“低门槛获取专业奇门八卦布局建议”;
商业模式:免费体验(基础分析)+ 会员增值(精细规划、免广告);
核心优势:轻量化开发(快速上线)、低技术门槛(无需算法能力)、聚焦奇门八卦垂直领域(差异化)。
1.2 三方API适配性调研结论
通过调研火山引擎、阿里云百炼的核心API能力,两者均能满足核心需求,具体适配性如下表:
| 核心需求 | 火山引擎(豆包大模型) | 阿里云百炼(通义千问) | 适配性结论 |
|---|---|---|---|
| 户型图/家居照片识别 | 支持视觉大模型(多模态),可识别图像中的墙体、门窗、家具位置,支持API调用 | 通义千问VL模型支持单图/多图识别,可提取空间结构、物体位置,提供Python SDK,接入成本低 | 均适配,阿里云有现成家居识别案例,火山引擎视觉模型经字节内部验证,稳定性强 |
| 奇门八卦知识库挂载 | 提供“知识库”插件,支持PDF、DOCX、MD等多种格式导入,自动解析、切片、向量化,可直接关联大模型生成回答 | 通过Dify平台支持知识库接入,优先推荐MD格式(支持表格/列表),支持结构化数据检索 | 均适配,火山引擎支持飞书文档导入(方便协作整理),阿里云支持CSV表格(适合摆件清单结构化) |
| 图文建议生成 | 豆包大模型中文理解能力强,支持自定义prompt,可生成结构化图文回复,提供SDK和零代码接入两种方式 | 通义千问系列模型支持按prompt生成精准回复,输入/输出Token定价清晰,90天内有免费额度(各100万Token) | 均适配,阿里云免费额度可覆盖初期开发/运营成本,火山引擎零代码接入适合技术能力弱的团队 |
| 开发/运维成本 | 提供7×24小时人工客服,架构师1V1定制方案,按量计费,无初期订阅费 | API调用按Token计费(输入0.0008元/千Token,输出0.002元/千Token),支持AI网关统一管理,运维简单 | 阿里云成本更透明(初期免费),火山引擎服务更全面(适合后续扩容) |
核心建议:初期优先选择阿里云百炼(免费额度覆盖初期需求,接入文档完善,家居识别有现成代码示例);若后续需要强化知识库协作或大流量支撑,可迁移至火山引擎。
- 二、功能模块规划(API套壳版)
功能模块聚焦“低门槛操作+核心价值输出”,共分为5大核心模块,全流程无需用户手动输入复杂信息,仅需“上传图片→等待结果”两步操作:
2.1 核心功能模块拆解
| 模块名称 | 核心功能 | 依赖API | 用户体验要点 |
|---|---|---|---|
| 1. 图片上传模块 | 支持手机拍照/相册上传(户型图、家居照片);自动裁剪图片(去除无关背景);提示上传规范(如“正对户型拍摄”“光线充足”) | 无(前端原生功能) | 操作极简,上传后显示“处理中”动画,降低等待焦虑 |
| 2. AI识别模块 | 户型图识别:提取朝向、墙体结构、房间数量、缺角位置;家居照片识别:识别沙发、床、书桌等关键家具位置,判断是否正对门窗/墙角 | 阿里云百炼·通义千问VL(多模态识别API)/ 火山引擎·视觉大模型API | 识别时间≤3秒,失败时提示“重新上传清晰图片”,并给出示例图 |
| 3. 奇门八卦分析模块 | 将识别结果(朝向、户型结构、家具位置)与奇门知识库匹配;定位吉位(财位、文昌位)、煞位(穿堂煞、横梁煞);生成阵法布局逻辑 | 阿里云百炼·知识库挂载+文本生成API / 火山引擎·知识库插件+豆包大模型API | 分析逻辑不外露,直接输出“结论+建议”,避免专业术语堆砌 |
| 4. 结果展示模块 | 免费版:基础吉凶方位标注(图文结合,用不同颜色标注吉/煞位)、1-2条核心建议;会员版:完整阵法布局方案、精准摆件清单(含摆放位置/禁忌)、文字解读(通俗版+专业版可选) | 无(前端渲染) | 结果页面简洁,重点信息加粗;支持保存/分享报告;点击摆件可查看详情(如“貔貅:五行属金,适合摆放于财位”) |
| 5. 商业变现模块 | 免费版:每日限3次上传,含开屏/信息流广告;会员版:9.9元/月、68元/年,享无限上传、免广告、精细规划、自定义需求(如“儿童房文昌位布局”);摆件导流:会员报告嵌入合规摆件购买链接(赚取佣金) | 无(接入第三方广告平台/电商联盟) | 会员开通按钮突出但不强制;广告不遮挡核心内容;导流链接标注“广告”“仅供参考” |
2.2 辅助功能模块(必备)
个人中心:查看上传历史、会员状态、收藏报告;
帮助中心:上传规范、常见问题(如“为什么识别失败?”“奇门八卦布局的依据是什么?”);
合规声明:所有建议标注“仅供传统文化研究与娱乐参考,不代表实际效果”,避免绝对化表述。
- 三、核心实现方案(API套壳全流程)
3.1 技术架构(极简版)
采用“前端+API网关+三方服务”的轻量化架构,无需自建复杂后端,降低开发/运维成本:
前端层:原生APP(iOS/Android)或跨平台开发(如Uni-app),负责用户交互(上传图片、展示结果);
API网关层:使用阿里云AI网关(统一管理API调用、控制流量),避免直接暴露API Key,提升安全性;
核心服务层:调用阿里云百炼/火山引擎的API(图像识别、文本生成),挂载奇门八卦知识库;
数据存储层:使用云数据库(如阿里云RDS),存储用户信息、上传记录、会员状态(无需存储大量图片,仅保留识别结果)。
3.2 关键API对接流程(以阿里云百炼为例)
全流程按“图片上传→识别→分析→生成结果”四步走,核心API调用逻辑清晰,无需复杂编码:
步骤1:图片预处理与上传
前端将用户上传的图片转成Base64格式(阿里云VL模型要求的输入格式);
通过前端代码验证图片清晰度/格式(如JPG/PNG),不合格则提示用户重新上传。
步骤2:调用通义千问VL模型识别图像
API选型:使用阿里云百炼“qwen-vl-plus”模型(多模态识别,适合空间结构提取);
调用参数:传入Base64格式图片+自定义prompt(如“识别这张户型图的朝向、房间数量、缺角位置,输出结构化JSON”);
返回结果:解析API返回的JSON数据,提取核心信息(如“朝向:坐北朝南;缺角:东南角;房间数量:3室1厅”)。
步骤3:关联奇门八卦知识库生成建议
知识库准备:将奇门八卦核心知识整理为MD格式(推荐),通过阿里云Dify平台导入知识库(支持表格、列表,便于结构化检索);
API调用:将图像识别结果作为输入,结合知识库生成prompt(如“已知户型坐北朝南,东南角缺角,基于奇门八卦理论,给出趋吉避凶的阵法布局和摆件建议,输出通俗图文”);
返回结果:API返回结构化文本(分“吉位标注”“阵法建议”“摆件清单”三部分)。
步骤4:前端渲染结果
将API返回的文本结果转化为用户易懂的图文页面(如用红色标注煞位、绿色标注吉位);
根据用户身份(免费/会员)展示对应内容(会员额外显示精细解读和摆件详情)。
3.3 奇门八卦知识库构建方案(核心竞争力)
知识库是APP的核心,无需你深入研究奇门八卦,按“收集→整理→导入→优化”四步即可完成,全程可外包给风水爱好者/内容编辑:
1. 知识库核心内容(必须收集)
基础理论:奇门九宫与家居区域对应关系(如“坎宫→北方→卧室;离宫→南方→客厅”);
煞位识别:常见家居煞位(穿堂煞、横梁煞、缺角煞)的判断标准及化解逻辑;
摆件清单:50-100种主流风水摆件(貔貅、五帝钱、文昌塔等)的五行属性、适用方位、禁忌(整理为CSV表格,便于导入知识库)。
2. 知识库格式要求(适配API平台)
优先格式:Markdown(.md),支持标题、列表、表格,API平台解析效率最高;
避免格式:扫描版PDF、PPT(无法有效提取文本,需先转成文字版);
整理技巧:每个知识点附近添加关键词(如“缺角煞→东南角缺角→化解摆件:麒麟”),提升API检索精准度。
3. 导入与优化流程
导入:通过阿里云Dify平台/火山引擎知识库插件上传整理好的文档,平台自动完成切片、向量化;
测试:上传多张不同户型图,验证API返回的建议是否符合知识库逻辑(如“东南角缺角”是否准确推荐“麒麟摆件”);
优化:根据测试结果补充知识库内容(如新增“小户型奇门布局”“租房风水注意事项”),调整prompt关键词。
- 四、开发成本与周期测算
因采用API套壳模式,无需算法工程师,开发成本和周期大幅降低,适合初创阶段快速验证需求:
4.1 团队配置(3-4人即可落地)
| 角色 | 人数 | 核心职责 | 月薪范围(元) |
|---|---|---|---|
| 全栈开发工程师 | 1-2 | 前端APP开发、API对接、云数据库配置 | 15000-30000 |
| 内容编辑(懂基础风水) | 1 | 整理奇门八卦知识库、编写prompt、审核API返回结果 | 8000-15000 |
| UI设计师 | 1(可外包) | 设计APP界面(上传页、结果页) | 5000-10000(按项目收费) |
4.2 成本明细(总预算10-25万元)
| 成本类型 | 明细 | 预估金额(万元) |
|---|---|---|
| 开发人力成本 | 全栈+内容编辑,按2个月开发周期计算 | 6-12 |
| 设计/外包成本 | UI设计、知识库整理外包(若自己无法整理) | 1-3 |
| API调用成本 | 阿里云百炼90天免费额度(覆盖初期),后续按用量计费(月活1万以内≈0.5-1万/月) | 0-2(初期免费) |
| 服务器/云服务成本 | 云数据库、AI网关、APP上架费用(iOS/Android) | 1-3 |
| 备用金 | 应对开发延期、API调整等突发情况 | 2-5 |
4.3 开发周期(2-3个月快速上线)
第1-2周:需求梳理、UI设计、知识库初步整理;
第3-6周:前端开发、API对接(图像识别+文本生成)、知识库导入与测试;
第7-8周:功能测试、bug修复、合规声明添加、APP上架准备;
第9周:正式上线MVP版本(核心功能+免费版),收集用户反馈。
五、风险防控与合规要点
5.1 技术风险
风险:API调用失败、识别准确率低;
应对:设置API重试机制;添加人工审核通道(用户对结果有异议可提交反馈);优化prompt关键词提升识别精准度。
5.2 合规风险(核心重点)
内容合规:所有建议必须标注“仅供娱乐参考,不构成任何决策依据”,避免“必发财”“保平安”等绝对化表述;
数据合规:用户上传的图片/个人信息需加密存储,遵守《个人信息保护法》,不随意收集生辰八字等敏感信息;
API使用合规:严格遵守火山引擎/阿里云的服务协议,不滥用API(如批量调用、篡改返回结果)。
5.3 商业风险
风险:用户付费意愿低、广告收入不足;
应对:初期免费版功能足够吸引用户(如基础吉凶分析),会员版定价亲民(68元/年低于同类竞品);精准投放风水爱好者社群,降低获客成本。
- 六、分阶段实施计划
阶段1:MVP版本(2-3个月,核心目标:验证需求)
核心功能:户型图上传→AI识别→基础奇门八卦分析→免费版图文报告;
知识库:完成核心内容(九宫对应关系+30种常见摆件);
目标:上线后获取1000-5000名种子用户,验证“上传图片→获取建议”的核心流程是否顺畅。
阶段2:功能完善(1-2个月,核心目标:提升付费转化)
新增功能:家居照片识别、会员体系上线、摆件导流功能;
优化:提升识别准确率、丰富知识库(新增租房/小户型专项建议);
目标:付费转化率达到5%以上,月活用户突破1万。
阶段3:规模化运营(3-6个月,核心目标:盈利增长)
运营:投放风水爱好者社群、与风水博主合作推广;
变现:拓展广告合作、深化电商导流(与合规风水摆件商家签约);
目标:月活突破5万,实现盈亏平衡。
- 七、核心建议总结
技术选型:初期优先阿里云百炼,利用免费额度降低成本,API对接文档完善,开发门槛最低;
核心优先级:先落地“户型图识别+基础建议”的MVP版本,再逐步添加家居照片识别、会员功能,避免初期功能过于复杂;
知识库建设:这是差异化核心,建议外包给懂风水的内容编辑,按“结构化格式”整理(MD/CSV),确保API能精准检索;
合规第一:全程标注“娱乐参考”,不承诺效果,避免触碰监管红线。