Web受発注システム

FAX注文も自動化へ!Google Cloud Document AIで受発注システムにOCR機能を導入してみた

FAX注文も自動化へ!Google Cloud Document AIで受発注システムにOCR機能を導入してみた

まだまだ現役「中小企業の受発注現場と”紙/FAX”問題」

※本記事はこのメディアでメインで扱っている Magento 以外の内容も含まれています。

中小企業の担当者の方々で、受発注業務の処理で、こんなお悩みはありませんか?

「いまだに電話・FAX での注文が多く、手作業入力に追われている」

実際、企業間取引(BtoB)では FAX やメール添付の注文書、電話注文などアナログな手段が依然 8 割近くを占めているとの調査もあります。

こうした紙や画像の情報をシステムに取り込むには、担当者が内容を視認してキーボードで基幹システムやERPへ手入力。。。
非効率極まりなく、入力ミスも頻発しがちです。
Web-EDI や受発注システムを導入して取引先にも使ってもらえれば理想的ですが、取引先すべてが対応できるとは限りません。デジタルデバイトの方は非常に多いです。。。

零細企業の中にはシステム導入が色々な意味で難しく、全取引先を完全にデジタル化するのは困難なのが現状です。
結果、「一部の取引先だけ FAX 注文が残ってしまう」というケースも多く、どうしても残る紙の注文書をいかに効率よく処理するかが課題として取り残されます。

解決策候補:AI-OCR サービスの活用

そこで注目されているのが、紙の帳票をデータ化する AI-OCR(光学文字認識)技術です。

AI-OCR なら FAX や手書き帳票から文字情報を自動抽出でき、入力作業を大幅に省力化できます。
近年はクラウド型 AI-OCR サービスも増え、手書き・活字・FAX などあらゆる書類を高精度にデータ化できる製品が提供されています。

  • 例:AI inside 社「DX Suite」
    手書き伝票や FAX 画像まで読み取り可能で、読み取り範囲の指定や読取後のデータ加工にも対応。
  • 例:LINE WORKS 社「PaperOn」(旧 LINE CLOVA OCR)
    注文書・納品書・日報などフォーマットの異なる帳票から必要な項目を高精度に抽出し、確認や手修正の手間を大幅に減らせると謳われています。さらに最近は生成 AI との連携で文書内の項目特定精度も向上しつつあるようです。

これら SaaS 型 AI-OCR を使えば自社でアルゴリズムの構築は不要です。

しかし一方で、

  • 「月額料金やページ課金などコストが気になる」→固定費増加。
  • 「自社システムとの細かな連携やカスタマイズを柔軟に行いたい」→仕様に合わせる必要がある。

上記の理由から、自前で OCR 機能を開発・組み込みたいケースもあります。

そのケースを満たしてくれるサービスはクラウド上で強力な OCR エンジンが APIとして提供されています。
その代表格が Google Cloud の「Document AI」です。

Google Cloud Document AI とは?

Google Cloud Document AI(旧称: Cloud Vision OCR のドキュメント特化版)は、
Google が提供するクラウド OCR/ドキュメント解析サービスです。

単なる文字認識にとどまらず、非構造化な書類から名前・住所・電話番号・日付・金額など任意の情報を抽出できる高度な AI で、日本語にも対応しています。

Document AI には主に二つの機能を有しています。

  • テキスト抽出(デジタル化)
    ・従来の OCR 同様、画像/PDF から文字を読み取りテキスト化。
    ・手書き文字の認識精度も非常に高く、活字であれば 100%近い精度という報告も。
    ・まずこのステップで、紙の注文書から注文日や社名、品名や数量といった文字の羅列を丸ごと取得。
  • 情報抽出(構造化)
    ・読み取ったテキストをさらに解析し、フォーム内の項目名と値のペアを抽出(キー・バリュー抽出)する機能。
    ・例として注文書であれば、「発注日:2025 年 5 月 1 日」「発注元企業:○○商事」「品番:ABC123」…。といった具合に、自動で項目ごとにデータを振り分け。
    ・Document AI には「フォームパーサー(Form Parser)」という事前学習モデルがあり、一般的な帳票から項目を見つけ出して JSON 形式で返す。

さらに Document AI では、もし独自レイアウトの帳票でうまく項目抽出できない場合に備え、カスタムモデルのトレーニングも可能です。

自社の注文書サンプルを学習させて独自の抽出ルールを覚えさせる「CustomExtractor」機能により、取引先ごとにフォーマットが異なる伝票/帳票でも対応できます。

このように AI に学習させることで、これまで正規表現の手作業調整に苦労してい
たようなケースも自動化でき、面倒なパターン修正作業から解放されます。

実験してみた。「Document AI+クラウド受発注システムのスクラッチ開発」

MaruwebVietnam のエンジニアにもこの Document AI を用いて受発注システムに OCR 機能を組み込む実験を行ってみました。

SaaS の OCR サービス(LINE AiOCR や DX Suite など)は使わず、Google Cloud 上にスクラッチで OCR 仕組みを構築した事例です。

以下、その流れです。

構築ステップ概要

  1. Google Cloud 設定:
    • a. Google Cloud 上にプロジェクトを作成し、Document AI API を有効化します。
    • b. サービスアカウントを作成して必要な権限(Document AI で PDF を読み取る権限)を付与し、Document AI 上で「プロセッサ(Processor)」を作成します。
      ※プロセッサとは処理器のことで、「インボイス(請求書)パーサー」「注文書パーサー」など用途に合わせたテンプレートモデルを選択可能です。今回は注文書に近いフォームということでフォームパーサー系のモデルを選びました(ここで必要に応じフィールドマッピングのトレーニングも実施できます)。
    • c. 準備が整ったら、Cloud Functions 上に小さなプログラム(Python スクリプト)をデプロイ(アップロード)し、Document AI を呼び出すAPI を実装します。
  2. 処理フロー:
    • a. 上記 Cloud Function に対して、フロントの受発注システム(今回の実験では社内システム想定)から PDF 注文書データとリクエストを送信します。
    • b. 関数側で Document AI の API に PDF を渡し、返ってきた解析結果(JSON 形式のテキストと項目データ)をそのまま呼び出し元に返却する仕組みです。
    • c. 後段では、この JSON データを元に基幹システムの受注登録処理を自動で行います。例えば当社が取り扱う Magento などの EC システムやOracle NetSuite、Odoo などの ERP をお使いであれば、その API 経由で注文データを登録することも可能です(※今回は検証のため JSON出力の確認に留めました)。
Google Cloud Platform

実験結果:OCR 抽出データの検証

では、実際にとある注文書 PDF を使った OCR 結果の一部を見てみましょう。

まず、フォームパーサーによる項目抽出を行わない「生の OCR テキスト」は以下
のようになります。

2025 年 5 月 1 日 10 時 18 分
株式会社サンプル商事
03-1234-5678
NO. 9876
テスト用 製品注文書
■申請者
氏名 株式会社サンプル商事 関東営業部 佐藤
TEL 03-1234-5678
住所 〒100-0001 東京都サンプル区サンプル町 1-2-3
■施工業者
氏名 株式会社テスト工業
TEL 03-9876-5432
住所 〒101-0002 東京都テスト区テスト町 4-5-6
■物件情報
工事名 サンプル邸 改修工事
住所 〒102-0003 東京都実験区検証町 7-8-9
施工完了日:2025 年 4 月 28 日
■仕様
用途 一般用途
方式 テスト方式 A
製品名 サンプル商品 X
使用量 123
実験結果 2.5
■実験結果付近の状況(該当項目に○)
1. 実験結果①
2. 実験結果②
3. 実験結果③

上記のように、書類全体の文字起こし自体は問題なくできています。
ただ、生のテキストだけでは項目ごとに意味付けされていないため、このままでは最悪コピペ作業が発生して人的リソースを減らすなどの目的が半減してしまいます。
そこでフォームパーサーを用いた項目抽出の結果を確認すると、例えば以下のような JSON 構造が得られました。

{
“issuer_name”: “株式会社サンプル商事”,
“issuer_department”: “関東営業部”,
“issuer_contact_person”: “佐藤”,
“issuer_phone”: “03-1234-5678”,
“issuer_address”: “東京都サンプル区サンプル町 1-2-3”,
“order_date”: “2025-05-01”,
“order_id”: “9876”,
“product_name”: “サンプル商品 X”,
“work_name”: “サンプル邸 改修工事”,
“result_value”: “2.5”,
“result_environment”: [
“実験結果①”,
“実験結果②”
]
}
OCR 抽出

ご覧頂いたように、注文申請書に記載された発注元(issuer)の会社名・部署・担当者・電話・住所、発注日注文番号、仕入先企業名と電話番号など、主要な項目が自動抽出されています。JSON 形式なのでシステム連携でいかようにもできます。

しかし、よく見ると一部課題も確認できました。上記では「No.9876」という番号が order_id(注文 ID)として抽出されていますが、本来この書類での「9876」は注文書の受付番号であり、注文 ID ではありません。つまりフィールドの誤認識が起きているわけです。

今回は事前にカスタム学習をさせていない汎用モデルのまま試したため、AI が文脈上それらしい項目名を推測してしまったようです。
ただ、このような場合でも、Document AIカスタムエクストラクタで追加学習を行えばモデルの精度向上が期待できます。
実際、Google の検証では 10 件程度のサンプルでファインチューニングするだけで様々なレイアウトへの対応力が向上したとの報告もあります。

我々の注文書フォーマットに合わせて AI にフィールド定義を学習させれば、より
正確に項目仕分けできるでしょう。

まとめ:OCR 活用で「紙の受発注」をデジタル化

今回の実験を通じて、自社システムに AI-OCR 機能を組み込むことはハードルが高くないことが分かりました。
Google Cloud Document AI の OCR 精度は極めて高く、日本語書類でも手書き含め安
定した文字起こし・項目抽出が可能です。

またクラウド上の関数(サーバーレス)と組み合わせることで、既存の受発注システムや ERP とシームレスに連携する OCR ワークフローを比較的短期間で開発できました。
SaaS 型の AI-OCR を利用する場合と比べて、自社のニーズに合わせた柔軟なカスタマイズや他クラウドサービスとの統合がしやすい点も利点となります。

Google Cloud Document AI

FAX 含む紙の注文書を自動でデータ化しシステム登録まで行えれば、担当者が FAXやメールを見ながら手入力する手間は大幅に削減でき、AI-OCR とワークフロー自動化を導入した企業では、受注処理時間が約 50%短縮し、入力ミスは 90%以上削減された例も報告されています。
人手不足に悩む中小企業にとって、これは大きな生産性向上と言えるでしょう。

受発注業務のDX化

弊社は、こうした受発注業務の DX 化を支援するシステム開発を行っています。
要件に応じて信頼性の高い Magento 等の EC プラットフォームを活用した BtoB 受発注システム構築も可能ですし、必要に応じてスクラッチ開発や他ソリューションのご提案もいたします。

FAX 注文への対応に代表されるように、「紙が混在するからデジタル化なんて無理」と諦める必要はもうありません。
OCR とシステム開発の力で、貴社の受発注フローから属人的な手入力作業を一掃しませんか? 私たちがお手伝いします!

【参考】
※1 ※20 ※21 BtoB EC・Web 受発注システム |Solution|株式会社マルウェブ
https://www.maruweb.co.jp/ja/solution/btob/
※2 ※3 ※5 OCR で EC に受注データを導入する 4 つの方法
https://ebisumart.com/blog/ocr-ec/
※6 ※18 ※19 中小企業向け AI-OCR7選比較!選び方と導入メリットも解説 | IT トレ
ンド
https://it-trend.jp/ai_ocr/article/813-4911
※7 LINE WORKS PaperOn | 世界最高水準の AI-OCR で書類をデータ化
https://line-works.com/paperon/
※8 ※9 ※10 ※12 ※13 ※14 ※15 ※16 Google Cloud (GCP)Document AI を使ったデータ抽出の最適化 – GMO インターネットグループ グループ研究開発本部
https://recruit.group.gmo/engineer/jisedai/blog/optimization_data_extract_documentai/
※17 ※24 株式会社トーモク様の受注業務効率化事例|AI 導入で 50%の時間短縮を
実現
https://www.feer-design.com/articles/ai50-097821
※22 ※23 調達向け Document AI | Google Cloud
https://cloud.google.com/solutions/procurement-doc-ai?hl=ja

弊社ではMagentoを利用した多機能ECサイトの構築・越境EC/中国越境ECの開発をして企業様をサポートしています。 ご興味ある方は是非問い合わせください。

ABOUT ME
otsuka
Design & html cording division所属です。

※注意

本ブログの投稿内容に関するお問い合わせをして頂いてもご返信できませんので、何卒ご了承ください。