openclaw（龙虾）：财务共享中心“发票/报销自动化”，从堆积如山到日清日结

很多公司的费控之所以“永远堆着”，不是财务不努力，而是报销材料形态五花八门、政策条款复杂、票据合规风险高、系统之间又割裂：一笔报销从收单到入账，要经历“看票—查验真—核对标准—算额度—找项目—找审批—退单补件—再看一遍”的循环。

openclaw（也叫龙虾）的落地方式是把报销审核拆成一条可编排的流水线：OCR/结构化抽取 → 发票验真与关键校验 → 费用政策匹配 → 规则引擎判定 → 异常分流与回退人工 → 结果入账/对接费控与 ERP → 审计留痕与看板。机器先把 80% 规则明确的单据“清分并给出判断依据”，财务只需要处理 20% 的异常与例外，这就是“日清日结”能成立的前提。

自动化不是“全自动通过”，而是“自动化分流”

很多人对报销自动化有个误解，认为自动化就是所有单据都能自动通过。其实不然，真正的自动化是“自动化分流”。在龙虾里，每笔报销单据最终会落到三个结果之一：自动通过、预警拦截、例外回退。

- 自动通过：就是规则命中清晰、证据齐全、风险低的单据，机器直接放行；

- 预警拦截：是那些命中红线或高风险的单据，直接卡住并提示原因；

- 例外回退：则是信息不全或置信度不足的单据，机器会自动追问补齐，仍不足则转人工处理。

这种分工变化，才是真正的提效关键。机器负责“找、比、算、写清楚依据”，人则负责“判断例外与业务合理性”。这样一来，财务人员就能从繁琐的逐单核对中解放出来，集中精力处理那些真正需要人工干预的单据。

拆解“发票/报销审核”的10步流程

为了让报销自动化更落地，我们把“发票/报销审核”拆成了10步，这10步可以直接当作龙虾的流程编排清单。不同费用类型只需要替换“政策/规则/阈值”，整体框架不变。

第一步：收单与材料完整性检查

这一步是为了减少退单往返。龙虾会先识别单据类型，清点附件是否齐全，关键信息是否缺失。

识别单据类型：增值税专票/普票、电子发票、机打票、行程单、酒店水单、对公付款附件等。
附件清点：是否缺少行程单、出差审批、会议签到、合同/订单、验收单等必备材料。
关键信息追问：缺项目号、成本中心或事由不清，会先追问再进入后续校验。

第二步：OCR与版面还原

拍照票据最容易出错，税号识别错一个字，后面所有校验都白做。

建议策略：

电子发票优先走结构化 XML/版式文件解析；
图片/扫描件走 OCR，并保留“字段 → 原图坐标”的映射，方便审计与复核；

第三步：结构化抽取

这一步是把“看一眼找信息”变成秒级操作。

抽取字段按票据类型分层：

发票通用：发票代码/号码、开票日期、购方名称/税号、销方名称/税号、金额/税额/价税合计、税率、备注区
差旅：出发地/目的地、航班/车次、入住日期、晚数、单价、乘机人/入住人
对公：收款方账户、开户行、合同号/订单号、付款用途

第四步：发票验真/验重

先把最硬的风险拦住。

两类动作：

验真：对接发票查验能力（按你们所在地区的合规方式接入；很多企业是走费控/税务服务商接口）
验重：同一发票代码+号码+金额+日期的重复报销；跨系统重复（员工报销 + 对公报账）也要挡住

第五步：抬头/税号/税率/金额一致性校验

这一步是清掉常见的“低级错”。

典型校验：

购方名称与公司抬头是否一致（允许别名/分公司要走白名单）
税号格式与位数校验
税率合理性（例如住宿 6%、餐饮 6%/9%等按你们政策配置）
价税合计、税额计算是否一致（含四舍五入规则）

第六步：费用类型识别与政策匹配

同一张发票，可能出现在不同场景：差旅餐费、客户招待、内部团建，政策上限完全不同。

龙虾的做法是“分类 + 路由”：

先用规则/轻量模型根据发票品名、备注、事由、供应商名称做粗分；
再用大模型结合上下文（申请单、审批单、行程）判定费用类型与适用政策；结果决定后续走哪套规则引擎与阈值。

第七步：政策规则引擎判定

规则引擎适合做“确定性判断”，例如：

差旅标准：城市等级、住宿上限、餐补标准、交通工具等级
额度与项目：费用是否超项目预算、是否允许计入该成本中心
合规红线：无审批先报销、无发票报销、超期报销、超标准且无例外审批

龙虾输出的不只是“通过/不通过”，还要把“命中哪条政策、怎么计算出来的”写出来，便于审计。

第八步：异常分流与回退

把异常拆成两类：可自动追问补齐和必须人工判断。

可自动追问补齐：缺审批号、缺项目号、缺出差行程、缺会议名单
必须人工判断：确实超标但业务合理、票据模糊无法识别、涉及高风险费用

回退时给出“最小补齐清单”，避免员工来回补一堆无关材料。

第九步：审计留痕与可追溯

每笔单据建议至少留这些证据：

原始票据与字段定位（哪一行识别出了税号）
验真结果（时间、接口返回、状态）
规则命中清单（命中哪条政策、阈值是多少）
计算过程（超标金额怎么得出）
例外审批记录（谁批准、理由、附件）

第十步：对接费控/共享平台/ERP

最后一步是把“结果”变成“入账动作”。

常见对接点：

费控系统：回写审核结果、退单原因、补件清单
共享平台：工单状态流转、分派、SLA
ERP/总账：凭证分录、税码、供应商主数据、付款计划

建议先做“回写 + 结构化输出”，再逐步做自动制证/自动入账，降低一次性改造风险。

配置工具：龙虾落地的“积木”

要让龙虾落地，你需要配置哪些工具呢？这里按“能稳定上线”为目标给出建议。

1.OCR / 版式解析

建议优先级：

电子发票：走版式文件/结构化解析（准确率高、成本低）
扫描/拍照：OCR + 版面还原（必须保留证据定位）

可选工具：

- OCR：PaddleOCR（中文场景常用）、各类云 OCR（接入快但要考虑成本与合规）

- 关键点：不要只拿到“文本”，一定要拿到“字段坐标”，否则审计与复核会很痛苦。

2.发票验真能力

实现方式通常有三种：

复用你们现有费控/税务服务商的查验接口
自建对接合规查验通道（适合大体量、强合规团队）
对低风险票据做抽样查验 + 风控策略（不是所有票都要同强度）

关键点：把“查验结果”写进留痕记录，后面内审/税审问起来能拿得出证据。

3.政策知识库（强治理）+ 运营知识库（弱治理）

报销自动化最怕“政策更新了，但系统不知道”，所以建议分两层：

政策知识库（强治理，必须版本化）：差旅标准、费用报销制度、税务口径、附件要求、例外审批规则
存储建议：结构化（表/配置）+ 文本（制度原文），每次更新带版本号与生效日期
运营知识库（弱治理，可快速补充）：常见退单原因、口径解释话术、员工常问问题
存储建议：向量检索（RAG）即可，用于“解释与答疑”，不用于硬判定

向量库可选：Qdrant / Milvus / pgvector（三选一即可，团队熟哪个用哪个）。

Embedding 模型建议（中文为主）：

bge-m3（多语、长文本表现稳）
或者你们云上常用 embedding（多语也行）

4.规则引擎（决定稳定性）

强烈建议：红线与硬性政策用规则引擎，不要交给大模型“自由发挥”。

可配置的规则例子：

城市等级 → 住宿上限
餐补按天计算、按出差天数自动推导
发票抬头不一致 → 预警/拦截（白名单例外）
报销超期（例如开票后 90 天）→ 自动退单
同日同人同供应商多张餐费 → 触发风控抽检

5.大模型选择（建议“分工 + 路由”，而不是一个模型包打天下）

报销场景里，大模型最适合做三件事：分类、解释、补齐追问；不适合做红线裁决。

推荐的组合思路（按可用性选，不强依赖某一家）：

费用类型识别/意图理解：成本较低、稳定的通用模型（例如同系列小型号，或企业自建的 Qwen2.5 / DeepSeek）
复杂场景解释与话术生成：推理更强的模型（如 GPT-4.1 / Claude 3.5 Sonnet / Gemini 1.5 Pro 这类）
文档长上下文（把申请单+行程+发票一起看）：选长文本稳定的模型

路由建议：

敏感信息（身份证号、银行卡、医疗等）：优先走本地/私有化模型或脱敏后再走云
高风险费用（招待/退款/对外赞助）：强制“引用来源 + 人审确认”

案例分享：从“堆积如山”到“日清日结”

下面用三个具体案例，讲讲龙虾是怎么让报销从堆积如山走向日清日结的。

案例1：差旅报销（住宿超标，但有例外审批）

员工 A 去上海出差 2 天游，提交：酒店电子发票 2 张、打车票 3 张、出差申请单 1 份。

公司差旅政策（示例）：

- 上海住宿上限 600 元/晚；

- 超标必须提前例外审批；

龙虾处理步骤（关键点）

1）抽取：识别到酒店发票单价 780 元/晚，入住 1 晚；

2）政策匹配：费用类型=差旅-住宿；城市=上海；岗位等级=P6；

3）规则判定：超标 180 元；

4）证据与计算：写明“政策上限 600；实际 780；超标=180”；

5）例外校验：自动在附件里找到“例外审批单（审批号：EX-2026-0312）”，审批理由“展会周房价上涨”；

6）结果：例外通过，但打上“超标例外”标签进入抽检池；

最终输出（意见摘要示例）

- 结论：通过（例外）

- 依据：差旅政策 V2026.02 第 3.1 条（上海住宿上限 600/晚）；例外审批 EX-2026-0312；

- 风险提示：建议抽检 5% 同类例外单据；

你看，机器不是死板地一刀切，它能理解“例外”，并给出清晰的判断依据。

案例2：客户招待餐费（高风险费用，必须引用与话术规范）

销售 B 报销餐费 2,380 元，备注“客户沟通”，无客户名单、无招待审批。

公司政策（示例）：

- 单次招待 > 1,500 必须提前审批

- 必须提供客户信息与参会人员名单

龙虾处理步骤（关键点）：

1）费用类型识别：通过发票品名/供应商/事由判定“招待餐费（高风险）”；

2）红线规则命中：金额>1,500 且缺招待审批 → 直接拦截；

3）自动追问补齐：生成补件清单；

- 招待审批单号

- 客户公司名称、参与人员名单；；

- 招待事由与业务关联（可引用 CRM 机会号）；

4）规范话术：给员工的退单理由用统一模板，避免“主观评价”引发扯皮；

5）留痕：记录命中政策条款与金额阈值；

最终输出（退单原因示例）

- 结论：退单补件；

- 原因：命中《费用报销制度》V2026.01 第 5.2 条：单次招待>1,500 需提前审批；当前缺少审批与客户信息；

- 需要补充：审批单号、客户信息、人员名单、业务关联；

财务不用再花时间去电话里和销售“掰扯”为什么退单，机器已经把理由和补件要求说得清清楚楚，避免了人情扯皮。

案例3：对公付款+专票抵扣（票面信息正确，但供应商主体不在主数据）

采购提交对公报账：供应商 C 的增值税专票 + 合同 + 验收单；发票抬头正确、验真通过，但供应商税号在 ERP 中不存在。

龙虾处理步骤（关键点）

1）验真通过：发票状态正常

2）主数据校验失败：供应商税号未匹配到 ERP 供应商主数据

3）异常分流：转“主数据补齐”队列，而不是退回员工

4）自动生成主数据申请草稿：

- 供应商名称、税号、开户地址（从发票抽取）

- 合同号、业务部门、付款用途（从附件抽取）

5）留痕：把“主数据缺失”作为异常原因进入看板统计

最终输出（共享中心内部处理建议）

- 结论：挂起（主数据补齐）

- 原因：ERP 供应商主数据缺失

- 建议动作：创建/补齐供应商主数据后自动续跑后续制证流程

你看，机器甚至能帮你把善后工作做掉一半，而不是把问题原封不动地踢回来。

知识库自进化：让系统越跑越准

报销自动化的难点不是规则本身，而是规则边界永远在变：政策更新、业务形态变化、地方税务口径变化、供应商票据变化。

龙虾比较有效的一种运营方式是做“闭环回流”：

1）把每笔异常的原因结构化（不是一句“资料不全”）

2）把人工处理结论回流为样本（通过/退单/例外及原因）

3）定期把高频异常做成“规则/知识条目”升级

4）用看板盯指标，按收益排序迭代

建议重点回流的素材：

- 高频退单原因 Top 20（对应可优化的表单校验/自动追问）

- 高频例外原因 Top 10（能否固化为“可控例外”或新增审批类型）

- OCR 低质量票据样式（补充识别模板或引导员工上传版式文件）

上线时最常踩的6个坑及避坑指南

1）只做 OCR，不做政策版本化：制度变了系统还是按旧口径判

- 解决：政策库强治理，更新必须带版本号、生效日期、变更摘要

2）把红线交给大模型：模型偶尔“心软”就会漏拦

- 解决：红线规则进规则引擎；大模型只负责解释与追问

3）异常原因写不清：员工不知道怎么补件，来回扯皮

- 解决：退单原因模板化 + 最小补齐清单

4）缺少证据链：内审/税审追问时拿不出依据

- 解决：字段定位、验真回执、规则命中与计算过程全部留存

5）跨系统重复报销挡不住：费控、对公、项目报销各自为政

- 解决：做统一的“验重指纹”（发票字段 + 金额 + 日期 + 员工/供应商维度）

6）一上来就想“全自动入账”：改造太大、风险太高

- 解决：先做“自动分流 + 回写 + 审计留痕”，再逐步自动制证/入账

盯紧这些指标，让“日清日结”成为现实

建议至少有这 8 个指标：

- 日清率：当天收单当天结案的比例；

- 自动通过率：机器直接放行的比例（越高越省人）；

- 异常率：进入异常队列的比例（越低越稳定）；

- 退单率：退回员工补件的比例（越低体验越好）；

- 复核率：抽检/复核占比（用于平衡风险）；

- 命中率：政策/规则命中准确性（与人工结论对比）；

- 平均处理时长：从收单到结案的平均时间；

- 风险命中统计：招待、超标、疑似重复、抬头不符等分布；

当你把OCR抽取、验真验重、政策规则、异常回退、审计留痕、系统对接这些积木，通过龙虾编排成一条稳定流水线之后，共享中心的工作会发生两个明显变化：人不再被“逐单核对”拖死，而是集中精力处理少量异常与例外；系统不只是“处理”，还能沉淀哪些条款最常命中、哪些环节最常退单、政策该怎么优化。

从堆积如山到日清日结，不是靠加人加班，而是靠“机器先清分+人工管例外+每笔有依据”的工程化落地。希望这篇文章能给你带来一些启发和帮助，让你的财务共享中心也能实现报销自动化，走向日清日结的新时代！