目次
前回の記事(電子帳簿保存法①)で、電子取引データの保存には「取引年月日・金額・取引先名」で検索できるファイル名が必要とお伝えしました。毎月届く請求書を一枚ずつ手作業でリネームするとなると、それ自体が相当な手間です。電子取引の対応を特に意識していない場合でも、社内でファイル名の付け方がバラバラで困っている、という話はよく耳にします。今回は、そのファイル名を自動で整える方法について整理します。
「AIに聞けばいい」は、少し違う
最初に一点だけ。「ChatGPTやGeminiに請求書を見せて、ファイル名を考えてもらえばいい」という発想は、一見合理的に思えますが、実務では少しズレがあります。
経理の現場で必要なのは、1件ずつ会話することではありません。フォルダに溜まったPDFを、決まったルールで、まとめて処理することです。AIは効率よく動く仕組みの相談として使うのがいいでしょう。
★情報管理の観点から
顧客の社名・金額・振込先が含まれる請求書データを、セキュリティの設定も確認せずにクラウドのAIサービスへ渡すのは、情報管理や法務の観点から慎重に判断すべきことです。
ファイル名の自動化の仕組みは、どう動くか
OCR(文字認識技術)とプログラムを組み合わせることで、PDFの中身を読み取り、ファイル名を自動で変更することが可能です。具体的には次のような流れで処理が動きます。
【処理の流れ】
フォルダにPDFが入る → 中身を読み取る(OCR) → 日付・取引先・金額を抽出 → ルールに沿ってリネーム
| 処理前 | 処理後 |
|---|---|
| ダウンロード (1).pdf | 20240115_110000_株式会社〇〇_請求書.pdf |
| ダウンロード (2).pdf | 20240120_55000_△△商事_請求書.pdf |
| ダウンロード (3).pdf | 20240201_330000_□□工業_請求書.pdf |
電子帳簿保存法で求められる検索性(取引年月日・金額・取引先で探せる状態)を意識した形です。月に何十枚・何百枚と処理している会社であれば、積み重なる効果は小さくありません。
ひとつ、知っておいてほしいこと
OCRの精度は、PDFの種類によって大きく変わります。
- 会計ソフトやシステムから直接出力されたPDFは、もともと文字情報を含んでいることが多く、比較的扱いやすい傾向があります。
- 紙をスキャンしたPDFやFAX由来のPDFは、OCRが必要になり、画像の鮮明さによって精度が左右されます。
取引先から請求書を受け取る際、「PDFデータで送ってもらう」「システムからダウンロードする」という運用に統一できると、自動化の精度が上がります。これは自動化を導入するかどうかに関わらず、電子帳簿保存法の対応としても理にかなった方向です。
具体的な方法
Pythonによるローカル処理
現時点でもっともオーソドックスな選択肢です。自社のPC内で処理が完結するため、データを外部に送らずに済む設計にしやすい。端末管理やバックアップ体制など、運用の設計は別途必要ですが、情報管理の統制という観点では扱いやすい方法です。
Google Apps Script(GAS)
Google Workspaceを使っている会社であれば検討に値します。ブラウザだけで動き、インストール不要で導入できる点が利点です。ただGoogleのクラウド環境を使う前提になるため、ローカル完結ではありません。扱うデータの機密性やGoogle Workspaceの設定を踏まえて判断が必要です。
Windowsの標準機能
ファイルを選択してF2キーを押すだけで連番付きの一括リネームはできます。ただしPDFの中身を読み取ることはできないため、日付や取引先名は自動で入りません。用途は限定的です。
どの方法が自社に合うかは、使っているシステムの環境、扱うPDFの種類、社内の情報管理ポリシー、そして月あたりの処理件数によって変わります。
AIの設定について
ChatGPTやGeminiを業務で活用したい会社も増えてきているのではないでしょうか。ただ利用する前に最低限の設定確認をお勧めします。
- ChatGPTの一般向けプランでは、設定から「すべての人のためにモデルを改善する」をオフにすることで、会話内容が学習に使われるリスクを下げられます。法人向けのEnterpriseやAPI利用であれば、OpenAIの方針として入力データは原則として学習に使用されません。
- Geminiは個人アカウントでアクティビティ設定をオフにできますが、Googleの案内ではオフにしていても最大72時間はデータが保持される場合があるとされています。「設定をオフにしたから安心」とは言い切れない点は覚えておいていただければと思います。
★社内ルールとしての整備が先決
いずれにしても、顧客の情報が含まれるデータをどう扱うかは、ツールの設定だけでなく、社内のルールとして決めておくことが先決です。
何が難しいところなのか
自動化の仕組み自体は、技術的にはそれほど複雑ではありません。難しいのは、現場に合わせる部分です。
- 取引先ごとにレイアウトが異なる請求書から、正確に情報を抽出するための調整
- 読み取りが失敗したときの確認フロー
- セキュリティ・情報漏洩リスクへの対応
- 社内承認・現場のフローの確認
これらを「動くだけ」でなく「実務で使える」レベルに仕上げるには、経理業務の流れを知っている人間が設計に関わる必要があります。
【この記事のポイント】
- ファイル名の自動整備はOCR+プログラムで実現できる
- 会計ソフト出力PDFは精度が高く、スキャンPDFは精度が変わる
- PythonによるローカルPC処理が情報管理の観点では扱いやすい
- AIツール(ChatGPT等)は設定確認と社内ルール整備がセットで必要
- 「動く」から「実務で使える」に仕上げるには経理業務の理解が鍵
経理代行のことは、お気軽にご相談ください。
お問い合わせはこちら