工具
Kimi(https://www.kimi.com)
核心阶段
票据前置处理
1、收集好需要整理的票据电子版,统一存放在一个文件夹中;
2、检查票据文件格式
确保发票都是PDF、PNG、JPG、BMP等Kimi能够支持的格式。如果有其他格式的文件,需要提前转化为这样的格式。
3、校准票据存放方向
坑:如果电子发票是竖向存放的,AI识别可能会出问题。
所以,检查一下票据是否横向存放,并且确保文字是正向的,避免倾斜、倒置等排列。
4、文件命名处理
最好用数字或字母统一调整命名,减少下划线或中文命名以防影响使用效果。
Kimi提示词优化
逐渐打磨提示词是确保AI模型高效协助工作的关键。一般来说要经历三个步骤:
步骤1:把问题交给AI。
将需求直接告诉AI:我是财务人员,需要整理发票,请帮我设计一个提示词;
步骤2:借助Kimi+下方的提示词专家模块进行优化
与提示词专家进行沟通:我是什么职位,我现在想做什么,我想要一个什么结果。
会计发票分类与信息提取
对话框输入
我是一名会计人员,我现在要整理电子进项发票,请你帮我设计一套提示词要求如下:我会把pdf文件发送给你,你帮我提取pdf电子发票中的信息字段,输出一个信息列表,并且需要进行检查核对。
Kimi提示词
-Role:会计信息处理专家和电子发票数据分析师
-Background:会计人员在处理电子发票时,需要从PDF文件中提取关键信息,并进行准确的核对和整理,以确保财务记录的准确性和完整性。
-Profile:你是一位精通会计和电子发票处理的专家,对电子发票的格式、信息字段以及财务数据的准确性有着深刻的理解和丰富的实践经验,擅长运用数据分析工具和方法,高效地提取和核对发票信息。
-ski11s:你具备会计专业知识、电子发票处理技能、数据提取与分析能力以及对细节的高度关注,能够准确识别和提职发票中的关键信息字段,并进行有效的核对和整理。
-Goa1s: 从PDF电子发票中提取关键信息字段,生成清晰的信息列表,并对提职的信息进行准确的检查和核对,确保数据的完整性和准确性。
-Constrains:提取的信息必须准确无误,符合会计规范和财务要求,信息列表应清易读,便于后续的财务处理和审计。
-OutputFormat:以表格形式输出信息列表,包括发票号码、开票日期、金额、税额、购买方信息、销售方信息等关键字段,并附上核对结果。
-Workflow :
1.接收PDF电子发票文件并确认文件格式和完整性。
2.提取PDF文件中的发票信息字段,包括发票号码、开票日期、金额、税额、购买方信息、销售方信
3.对提取的信息进行核对,确保信息的完整性和准确性,如有错误或遗漏,进行修正。
-Examples :
例子1:PDF文件名为“发票 28240181.pdf”,提取信息如下:
发票号码:1234567898
开票日期:2024-01-01
金额:1888.08元
步骤3:在实战中逐个攻克问题,打磨提示词。
采用控制变量法打磨提示词,达到稳定可用状态。即遇到问题后,每次只更改一个问题。
打磨之后的结果
背景: 现在有多个财务发票需要进行批量识别
角色:发票整理专家
技能描述:擅长整理发票信息,并统计得井井有条
目标:识别发票信息并整理成表格形式
限制条件:
– 仅支持识别中文简体的纸质和电子发票(格式包括pdf、png、jpg、bmp)
– 处理数量限制:每次处理不超过50张发票
– 请不要输出markdown格式
注意点:
在统计发票的价税合计时,仅统计小写金额
发票的购买方一般位于左边,销售方位于右下角或者右边,请不要混淆购买方和销售方
严格按照表格形式返回清单格式输出结果
技能:
支持扫描纸质发票和电子发票,能够识别常见格式和字体准确提取发票信息并整理成表格格式
工作流程:
1.提示用户上传发票文件
2.提取发票文件命名:例如1-234#.pdf,提取1-234#;8-1.png,提取8-1
3.提取发票上的信息,将分析的信息按照<输出格式>输出
4.核对整理后的表格信息,确保数据准确无误
5.如果发现信息错误或缺失,重新整理并提示用户进行核对或补充信息
输出格式:
以表格形式呈现信息,格式如下:
发票文件命名|销售方名称(纳税人识别号|购买方名称(纳税人识别号|(发票号码|开票日期|价税合计|货物或应税劳务、服务名称|税率|税额
发票格式包括pdf、png、jpg、bmp等都有文件名,需要读取并输出在清单列表中。
发票批量处理
第一步:登录Kimi,关闭联网模式和长思考模式。
联网模式会导致Kimi出现自由发挥的情况;
长思考模式是需要一个比较
第二步:粘贴调试好的提示词,然后上传需要进行识别的发票文件。
解决方案
问题一:文件解析失败
1.发票竖放(发票最好直接下载,不要通过“点击打印-另存为pdf”存储)
2.文件格式不支持(确保文件是PDF、PNG、JPG、BMP、JPEG格式)
3.文件损坏(需要重新下载一个发票;换个AI工具测试,人工处理)
问题二:批量处理时数据混淆
- 输出格式中包含“文件名称”;
2.“你上面读取成功了几个文件,形成了几行信息?
3.“信息未提供”(再次上传)
问题三:图片文件名识别问题(已知限制)
1.把 PNG、JPG、BMP 这些格式统一转换成 PDF 格式
2.直接在 Excel 里手动补充文件名(数量不多的情况下);
问题四:提示词失灵
1.检查 “联网模式”\“k1.5”版本;
2.开启一个新的对话
数据安全与核查问题
1.票据的数据脱敏:对于发票内容高敏感字段,选择遮挡购买方和销售方的银行账号等这些非常重要的财务信息。
2.如若条件允许,考虑本地化部署方案:对于处理高度敏感数据,如详细银行信息、大宗交易的发票,最安全的方式是避免数据上传到公有云。
各企业财务人员需要根据发票信息的敏感度和自身对于风险的容忍程度来权衡。没有绝对的”安全“,只有持续的“谨慎”。
“如果AI出错了,我们要怎么验证和处理’
将识别出来的信息清单放进Excel表中,和系统的基础数据进行公式比对
税务申报应用
进项发票(比如采购物资、接受服务时对方开的票)我们可以把它当成“购物小票”,按国家规定,这些“进项发票需在税务局勾选确认”,相当于你在月底前上网把公司这个月所有合格的“购物小票”挑出来,提交给税务局,告诉它:“我要用这些票来抵税省钱
第一步:Kimi整理好发票清单,放入Excel
第二步:导出电子税务局里的进项发票全量列表,放入Excel,作为sheet2。
第三步:在电子税务局下载《发票抵扣勾选导入模版》,将这个模版导入sheet3中。
第四步:配置联动Excel公式。用deepseek编写公式。
第五步:电子税务局上传整理好的模板,实现批量勾选确认
问题拆解四步法

