很多公司的费控之所以“永远堆着”,不是财务不努力,而是报销材料形态五花八门、政策条款复杂、票据合规风险高、系统之间又割裂:一笔报销从收单到入账,要经历“看票—查验真—核对标准—算额度—找项目—找审批—退单补件—再看一遍”的循环。
openclaw(也叫龙虾)的落地方式是把报销审核拆成一条可编排的流水线:OCR/结构化抽取 → 发票验真与关键校验 → 费用政策匹配 → 规则引擎判定 → 异常分流与回退人工 → 结果入账/对接费控与 ERP → 审计留痕与看板。机器先把 80% 规则明确的单据“清分并给出判断依据”,财务只需要处理 20% 的异常与例外,这就是“日清日结”能成立的前提。
自动化不是“全自动通过”,而是“自动化分流”
很多人对报销自动化有个误解,认为自动化就是所有单据都能自动通过。其实不然,真正的自动化是“自动化分流”。在龙虾里,每笔报销单据最终会落到三个结果之一:自动通过、预警拦截、例外回退。
- 自动通过:就是规则命中清晰、证据齐全、风险低的单据,机器直接放行;
- 预警拦截:是那些命中红线或高风险的单据,直接卡住并提示原因;
- 例外回退:则是信息不全或置信度不足的单据,机器会自动追问补齐,仍不足则转人工处理。
这种分工变化,才是真正的提效关键。机器负责“找、比、算、写清楚依据”,人则负责“判断例外与业务合理性”。这样一来,财务人员就能从繁琐的逐单核对中解放出来,集中精力处理那些真正需要人工干预的单据。
拆解“发票/报销审核”的10步流程
为了让报销自动化更落地,我们把“发票/报销审核”拆成了10步,这10步可以直接当作龙虾的流程编排清单。不同费用类型只需要替换“政策/规则/阈值”,整体框架不变。
第一步:收单与材料完整性检查
这一步是为了减少退单往返。龙虾会先识别单据类型,清点附件是否齐全,关键信息是否缺失。
- 识别单据类型:增值税专票/普票、电子发票、机打票、行程单、酒店水单、对公付款附件等。
- 附件清点:是否缺少行程单、出差审批、会议签到、合同/订单、验收单等必备材料。
- 关键信息追问:缺项目号、成本中心或事由不清,会先追问再进入后续校验。
第二步:OCR与版面还原
拍照票据最容易出错,税号识别错一个字,后面所有校验都白做。
- 电子发票优先走结构化 XML/版式文件解析;
- 图片/扫描件走 OCR,并保留“字段 → 原图坐标”的映射,方便审计与复核;
第三步:结构化抽取
这一步是把“看一眼找信息”变成秒级操作。
- 发票通用:发票代码/号码、开票日期、购方名称/税号、销方名称/税号、金额/税额/价税合计、税率、备注区
- 差旅:出发地/目的地、航班/车次、入住日期、晚数、单价、乘机人/入住人
- 对公:收款方账户、开户行、合同号/订单号、付款用途
第四步:发票验真/验重
先把最硬的风险拦住。
- 验真:对接发票查验能力(按你们所在地区的合规方式接入;很多企业是走费控/税务服务商接口)
- 验重:同一发票代码+号码+金额+日期的重复报销;跨系统重复(员工报销 + 对公报账)也要挡住
第五步:抬头/税号/税率/金额一致性校验
这一步是清掉常见的“低级错”。
- 购方名称与公司抬头是否一致(允许别名/分公司要走白名单)
- 税号格式与位数校验
- 税率合理性(例如住宿 6%、餐饮 6%/9%等按你们政策配置)
- 价税合计、税额计算是否一致(含四舍五入规则)
第六步:费用类型识别与政策匹配
- 先用规则/轻量模型根据发票品名、备注、事由、供应商名称做粗分;
- 再用大模型结合上下文(申请单、审批单、行程)判定费用类型与适用政策;结果决定后续走哪套规则引擎与阈值。
第七步:政策规则引擎判定
规则引擎适合做“确定性判断”,例如:
- 差旅标准:城市等级、住宿上限、餐补标准、交通工具等级
- 额度与项目:费用是否超项目预算、是否允许计入该成本中心
- 合规红线:无审批先报销、无发票报销、超期报销、超标准且无例外审批
第八步:异常分流与回退
把异常拆成两类:可自动追问补齐和必须人工判断。
- 可自动追问补齐:缺审批号、缺项目号、缺出差行程、缺会议名单
- 必须人工判断:确实超标但业务合理、票据模糊无法识别、涉及高风险费用
第九步:审计留痕与可追溯
- 原始票据与字段定位(哪一行识别出了税号)
- 验真结果(时间、接口返回、状态)
- 规则命中清单(命中哪条政策、阈值是多少)
- 计算过程(超标金额怎么得出)
- 例外审批记录(谁批准、理由、附件)
第十步:对接费控/共享平台/ERP
最后一步是把“结果”变成“入账动作”。
- 费控系统:回写审核结果、退单原因、补件清单
- 共享平台:工单状态流转、分派、SLA
- ERP/总账:凭证分录、税码、供应商主数据、付款计划
配置工具:龙虾落地的“积木”
要让龙虾落地,你需要配置哪些工具呢?这里按“能稳定上线”为目标给出建议。
1.OCR / 版式解析
- 电子发票:走版式文件/结构化解析(准确率高、成本低)
- 扫描/拍照:OCR + 版面还原(必须保留证据定位)
2.发票验真能力
- 复用你们现有费控/税务服务商的查验接口
- 自建对接合规查验通道(适合大体量、强合规团队)
- 对低风险票据做抽样查验 + 风控策略(不是所有票都要同强度)
3.政策知识库(强治理)+ 运营知识库(弱治理)
- 政策知识库(强治理,必须版本化):差旅标准、费用报销制度、税务口径、附件要求、例外审批规则
- 存储建议:结构化(表/配置)+ 文本(制度原文),每次更新带版本号与生效日期
- 运营知识库(弱治理,可快速补充):常见退单原因、口径解释话术、员工常问问题
- 存储建议:向量检索(RAG)即可,用于“解释与答疑”,不用于硬判定
- bge-m3(多语、长文本表现稳)
- 或者你们云上常用 embedding(多语也行)
4.规则引擎(决定稳定性)
- 城市等级 → 住宿上限
- 餐补按天计算、按出差天数自动推导
- 发票抬头不一致 → 预警/拦截(白名单例外)
- 报销超期(例如开票后 90 天)→ 自动退单
- 同日同人同供应商多张餐费 → 触发风控抽检
5.大模型选择(建议“分工 + 路由”,而不是一个模型包打天下)
- 费用类型识别/意图理解:成本较低、稳定的通用模型(例如同系列小型号,或企业自建的 Qwen2.5 / DeepSeek)
- 复杂场景解释与话术生成:推理更强的模型(如 GPT-4.1 / Claude 3.5 Sonnet / Gemini 1.5 Pro 这类)
- 文档长上下文(把申请单+行程+发票一起看):选长文本稳定的模型
- 敏感信息(身份证号、银行卡、医疗等):优先走本地/私有化模型或脱敏后再走云
- 高风险费用(招待/退款/对外赞助):强制“引用来源 + 人审确认”
案例分享:从“堆积如山”到“日清日结”
下面用三个具体案例,讲讲龙虾是怎么让报销从堆积如山走向日清日结的。
案例1:差旅报销(住宿超标,但有例外审批)
员工 A 去上海出差 2 天游,提交:酒店电子发票 2 张、打车票 3 张、出差申请单 1 份。
公司差旅政策(示例):
- 上海住宿上限 600 元/晚;
- 超标必须提前例外审批;
龙虾处理步骤(关键点)
1)抽取:识别到酒店发票单价 780 元/晚,入住 1 晚;
2)政策匹配:费用类型=差旅-住宿;城市=上海;岗位等级=P6;
3)规则判定:超标 180 元;
4)证据与计算:写明“政策上限 600;实际 780;超标=180”;
5)例外校验:自动在附件里找到“例外审批单(审批号:EX-2026-0312)”,审批理由“展会周房价上涨”;
6)结果:例外通过,但打上“超标例外”标签进入抽检池;
最终输出(意见摘要示例)
- 结论:通过(例外)
- 依据:差旅政策 V2026.02 第 3.1 条(上海住宿上限 600/晚);例外审批 EX-2026-0312;
- 风险提示:建议抽检 5% 同类例外单据;
你看,机器不是死板地一刀切,它能理解“例外”,并给出清晰的判断依据。
案例2:客户招待餐费(高风险费用,必须引用与话术规范)
销售 B 报销餐费 2,380 元,备注“客户沟通”,无客户名单、无招待审批。
公司政策(示例):
- 单次招待 > 1,500 必须提前审批
- 必须提供客户信息与参会人员名单
龙虾处理步骤(关键点):
1)费用类型识别:通过发票品名/供应商/事由判定“招待餐费(高风险)”;
2)红线规则命中:金额>1,500 且缺招待审批 → 直接拦截;
3)自动追问补齐:生成补件清单;
- 招待审批单号
- 客户公司名称、参与人员名单;;
- 招待事由与业务关联(可引用 CRM 机会号);
4)规范话术:给员工的退单理由用统一模板,避免“主观评价”引发扯皮;
5)留痕:记录命中政策条款与金额阈值;
最终输出(退单原因示例)
- 结论:退单补件;
- 原因:命中《费用报销制度》V2026.01 第 5.2 条:单次招待>1,500 需提前审批;当前缺少审批与客户信息;
- 需要补充:审批单号、客户信息、人员名单、业务关联;
财务不用再花时间去电话里和销售“掰扯”为什么退单,机器已经把理由和补件要求说得清清楚楚,避免了人情扯皮。
案例3:对公付款+专票抵扣(票面信息正确,但供应商主体不在主数据)
采购提交对公报账:供应商 C 的增值税专票 + 合同 + 验收单;发票抬头正确、验真通过,但供应商税号在 ERP 中不存在。
龙虾处理步骤(关键点)
1)验真通过:发票状态正常
2)主数据校验失败:供应商税号未匹配到 ERP 供应商主数据
3)异常分流:转“主数据补齐”队列,而不是退回员工
4)自动生成主数据申请草稿:
- 供应商名称、税号、开户地址(从发票抽取)
- 合同号、业务部门、付款用途(从附件抽取)
5)留痕:把“主数据缺失”作为异常原因进入看板统计
最终输出(共享中心内部处理建议)
- 结论:挂起(主数据补齐)
- 原因:ERP 供应商主数据缺失
- 建议动作:创建/补齐供应商主数据后自动续跑后续制证流程
你看,机器甚至能帮你把善后工作做掉一半,而不是把问题原封不动地踢回来。
知识库自进化:让系统越跑越准
报销自动化的难点不是规则本身,而是规则边界永远在变:政策更新、业务形态变化、地方税务口径变化、供应商票据变化。
龙虾比较有效的一种运营方式是做“闭环回流”:
1)把每笔异常的原因结构化(不是一句“资料不全”)
2)把人工处理结论回流为样本(通过/退单/例外及原因)
3)定期把高频异常做成“规则/知识条目”升级
4)用看板盯指标,按收益排序迭代
建议重点回流的素材:
- 高频退单原因 Top 20(对应可优化的表单校验/自动追问)
- 高频例外原因 Top 10(能否固化为“可控例外”或新增审批类型)
- OCR 低质量票据样式(补充识别模板或引导员工上传版式文件)
上线时最常踩的6个坑及避坑指南
1)只做 OCR,不做政策版本化:制度变了系统还是按旧口径判
- 解决:政策库强治理,更新必须带版本号、生效日期、变更摘要
2)把红线交给大模型:模型偶尔“心软”就会漏拦
- 解决:红线规则进规则引擎;大模型只负责解释与追问
3)异常原因写不清:员工不知道怎么补件,来回扯皮
- 解决:退单原因模板化 + 最小补齐清单
4)缺少证据链:内审/税审追问时拿不出依据
- 解决:字段定位、验真回执、规则命中与计算过程全部留存
5)跨系统重复报销挡不住:费控、对公、项目报销各自为政
- 解决:做统一的“验重指纹”(发票字段 + 金额 + 日期 + 员工/供应商维度)
6)一上来就想“全自动入账”:改造太大、风险太高
- 解决:先做“自动分流 + 回写 + 审计留痕”,再逐步自动制证/入账
盯紧这些指标,让“日清日结”成为现实
建议至少有这 8 个指标:
- 日清率:当天收单当天结案的比例;
- 自动通过率:机器直接放行的比例(越高越省人);
- 异常率:进入异常队列的比例(越低越稳定);
- 退单率:退回员工补件的比例(越低体验越好);
- 复核率:抽检/复核占比(用于平衡风险);
- 命中率:政策/规则命中准确性(与人工结论对比);
- 平均处理时长:从收单到结案的平均时间;
- 风险命中统计:招待、超标、疑似重复、抬头不符等分布;
当你把OCR抽取、验真验重、政策规则、异常回退、审计留痕、系统对接这些积木,通过龙虾编排成一条稳定流水线之后,共享中心的工作会发生两个明显变化:人不再被“逐单核对”拖死,而是集中精力处理少量异常与例外;系统不只是“处理”,还能沉淀哪些条款最常命中、哪些环节最常退单、政策该怎么优化。
从堆积如山到日清日结,不是靠加人加班,而是靠“机器先清分+人工管例外+每笔有依据”的工程化落地。希望这篇文章能给你带来一些启发和帮助,让你的财务共享中心也能实现报销自动化,走向日清日结的新时代!

