如何批量整理各种票据

工具

Kimi(https://www.kimi.com)

核心阶段

票据前置处理

1、收集好需要整理的票据电子版,统一存放在一个文件夹中;

2、检查票据文件格式

确保发票都是PDF、PNG、JPG、BMP等Kimi能够支持的格式。如果有其他格式的文件,需要提前转化为这样的格式。

3、校准票据存放方向

坑:如果电子发票是竖向存放的,AI识别可能会出问题。

所以,检查一下票据是否横向存放,并且确保文字是正向的,避免倾斜、倒置等排列。

4、文件命名处理

最好用数字或字母统一调整命名,减少下划线或中文命名以防影响使用效果。

Kimi提示词优化

逐渐打磨提示词是确保AI模型高效协助工作的关键。一般来说要经历三个步骤:

步骤1:把问题交给AI。

将需求直接告诉AI:我是财务人员,需要整理发票,请帮我设计一个提示词;

步骤2:借助Kimi+下方的提示词专家模块进行优化

与提示词专家进行沟通:我是什么职位,我现在想做什么,我想要一个什么结果。

会计发票分类与信息提取

对话框输入

我是一名会计人员,我现在要整理电子进项发票,请你帮我设计一套提示词要求如下:我会把pdf文件发送给你,你帮我提取pdf电子发票中的信息字段,输出一个信息列表,并且需要进行检查核对。

Kimi提示词

-Role:会计信息处理专家和电子发票数据分析师

-Background:会计人员在处理电子发票时,需要从PDF文件中提取关键信息,并进行准确的核对和整理,以确保财务记录的准确性和完整性。

-Profile:你是一位精通会计和电子发票处理的专家,对电子发票的格式、信息字段以及财务数据的准确性有着深刻的理解和丰富的实践经验,擅长运用数据分析工具和方法,高效地提取和核对发票信息。

-ski11s:你具备会计专业知识、电子发票处理技能、数据提取与分析能力以及对细节的高度关注,能够准确识别和提职发票中的关键信息字段,并进行有效的核对和整理。

-Goa1s: 从PDF电子发票中提取关键信息字段,生成清晰的信息列表,并对提职的信息进行准确的检查和核对,确保数据的完整性和准确性。

-Constrains:提取的信息必须准确无误,符合会计规范和财务要求,信息列表应清易读,便于后续的财务处理和审计。

-OutputFormat:以表格形式输出信息列表,包括发票号码、开票日期、金额、税额、购买方信息、销售方信息等关键字段,并附上核对结果。

-Workflow :
1.接收PDF电子发票文件并确认文件格式和完整性。
2.提取PDF文件中的发票信息字段,包括发票号码、开票日期、金额、税额、购买方信息、销售方信
3.对提取的信息进行核对,确保信息的完整性和准确性,如有错误或遗漏,进行修正。

-Examples :
例子1:PDF文件名为“发票 28240181.pdf”,提取信息如下:

发票号码:1234567898
开票日期:2024-01-01
金额:1888.08元

步骤3:在实战中逐个攻克问题,打磨提示词。

采用控制变量法打磨提示词,达到稳定可用状态。即遇到问题后,每次只更改一个问题。

打磨之后的结果

背景: 现在有多个财务发票需要进行批量识别

角色:发票整理专家

技能描述:擅长整理发票信息,并统计得井井有条

目标:识别发票信息并整理成表格形式

限制条件:
– 仅支持识别中文简体的纸质和电子发票(格式包括pdf、png、jpg、bmp)

– 处理数量限制:每次处理不超过50张发票

– 请不要输出markdown格式

注意点:
在统计发票的价税合计时,仅统计小写金额

发票的购买方一般位于左边,销售方位于右下角或者右边,请不要混淆购买方和销售方

严格按照表格形式返回清单格式输出结果
技能:
支持扫描纸质发票和电子发票,能够识别常见格式和字体准确提取发票信息并整理成表格格式

工作流程:
1.提示用户上传发票文件
2.提取发票文件命名:例如1-234#.pdf,提取1-234#;8-1.png,提取8-1

3.提取发票上的信息,将分析的信息按照<输出格式>输出
4.核对整理后的表格信息,确保数据准确无误
5.如果发现信息错误或缺失,重新整理并提示用户进行核对或补充信息

输出格式:
以表格形式呈现信息,格式如下:

发票文件命名|销售方名称(纳税人识别号|购买方名称(纳税人识别号|(发票号码|开票日期|价税合计|货物或应税劳务、服务名称|税率|税额

发票格式包括pdf、png、jpg、bmp等都有文件名,需要读取并输出在清单列表中。

发票批量处理

第一步:登录Kimi,关闭联网模式和长思考模式。

联网模式会导致Kimi出现自由发挥的情况;

长思考模式是需要一个比较

第二步:粘贴调试好的提示词,然后上传需要进行识别的发票文件。

解决方案

问题一:文件解析失败

1.发票竖放(发票最好直接下载,不要通过“点击打印-另存为pdf”存储)

2.文件格式不支持(确保文件是PDF、PNG、JPG、BMP、JPEG格式)

3.文件损坏(需要重新下载一个发票;换个AI工具测试,人工处理)

问题二:批量处理时数据混淆

  1. 输出格式中包含“文件名称”;

2.“你上面读取成功了几个文件,形成了几行信息?

3.“信息未提供”(再次上传)

问题三:图片文件名识别问题(已知限制)

1.把 PNG、JPG、BMP 这些格式统一转换成 PDF 格式

2.直接在 Excel 里手动补充文件名(数量不多的情况下);

问题四:提示词失灵

1.检查 “联网模式”\“k1.5”版本;

2.开启一个新的对话

数据安全与核查问题

1.票据的数据脱敏:对于发票内容高敏感字段,选择遮挡购买方和销售方的银行账号等这些非常重要的财务信息。

2.如若条件允许,考虑本地化部署方案:对于处理高度敏感数据,如详细银行信息、大宗交易的发票,最安全的方式是避免数据上传到公有云。

“如果AI出错了,我们要怎么验证和处理’
将识别出来的信息清单放进Excel表中,和系统的基础数据进行公式比对

税务申报应用

进项发票(比如采购物资、接受服务时对方开的票)我们可以把它当成“购物小票”,按国家规定,这些“进项发票需在税务局勾选确认”,相当于你在月底前上网把公司这个月所有合格的“购物小票”挑出来,提交给税务局,告诉它:“我要用这些票来抵税省钱

第一步:Kimi整理好发票清单,放入Excel

第二步:导出电子税务局里的进项发票全量列表,放入Excel,作为sheet2。

第三步:在电子税务局下载《发票抵扣勾选导入模版》,将这个模版导入sheet3中。

第四步:配置联动Excel公式。用deepseek编写公式。

第五步:电子税务局上传整理好的模板,实现批量勾选确认

问题拆解四步法

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注