AIドキュメントサービス「空海」

紙やPDFを高速かつ高精度にデジタル化し、
AIが理解・整理まで自動で行います。

空海が選ばれる3つの理由

  1. かんたん – ドラッグ&ドロップするだけで取込み完了
  2. すばやい – 最短30秒でAIが理解しJSON化
  3. つよい – テンプレート方式で新しい帳票にも即対応

機能ハイライト

  • 高精度OCR – かすれた文字も、手書き文字も、逃さない。
  • AI理解&整理 – 読む、考える、まとめる――全部AIにおまかせ。
  • REST API – あなたの基幹システムと、即シンクロ。
  • 同期・非同期処理 – 1枚でも1万枚でも、スピードは同じ。
  • カスタムJSON – 欲しい項目だけ、思いのまま。

システム概要

本プロジェクトは、請求書などのPDFから⽂字情報を抽出し、整理されたJSONデータとして出⼒する仕組みです。Google Cloud VisionによるOCRとOpenAIのChat APIを組み合わせることで、書類の内容を⾃動的に構造化します。Webブラウザ上では編集可能なレポート画⾯も提供しています。

使⽤技術

  1. Python 3 / FastAPI – サーバーアプリケーション[^1]
  2. Google Cloud Vision API – PDF画像から⽂字を取得[^2]
  3. OpenAI API – 取得した⽂字を解析して請求書データを⽣成[^2]
  4. pdf2image / OpenCV / PyMuPDF – PDFを画像へ変換し、OCR⽤に加⼯[^2]
  5. Jinja2 – HTMLテンプレートとしてレポートを⽣成[^3]
  6. JavaScript – 画像上のハイライトや拡⼤縮⼩などブラウザ側の操作[^4]

システム構成図

データフロー

  • 1.PDFアップロード
    1. /uploadエンドポイントで受け付けます。PDFはstorage/{timestamp}ディレクトリに保存されます[^5]。
  • 2.OCR処理
    1. process_fileがPDFを画像化(300dpi)し、Vision APIで⽂字と位置情報を取得します[^6][^7]。
  • .AI解析
    1. OCR結果をプロンプトと共にOpenAIに送り、請求書JSONを⽣成します[^8][^9]。
    2. OCRの結果には座標情報を持つJSON形式と、単なるプレーンテキスト形式の2種類があります。
    3. スキーマへのマッピング処理はOpenAIに委ねています。
    4. プレーンテキスト形式の場合、後続プログラムで決め打ち処理を⾏えます。
  • 4.結果保存
    1. ⽣成されたJSONとOCR結果、ページ画像を同じディレクトリに保存します[^10]。
  • 5.レポート表⽰
    1. /report/{id}でHTMLレポートを表⽰。編集フォームとOCR画像を並べて表⽰します[^11] [^12]。
  • 6. API利⽤
    1. /v1/invoices:analyzeではPDFを送信するとJSONが即時返ります[^13]。
      ⾮同期版/v1/invoices:analyzeAsyncも⽤意されています[^14].

よくある質問

Q. セキュリティは大丈夫?
A. 通信はすべてTLS1.3で暗号化。データは日本リージョン内で保管できます。
Q. 手書きの伝票も読める?
A. Google Cloud Visionのハイエンドモデルを利用し、手書きでも高精度です。
Q. ワークフローに合わせて項目を変えたい。
A. 管理画面でJSONスキーマをGUI編集、すぐ反映できます。

CONTACT

導入のご相談はお気軽に!

空海へのお問い合わせ
TOP