※本記事はこのメディアでメインで扱っている Magento 以外の内容も含まれています。
中小企業の担当者の方々で、受発注業務の処理で、こんなお悩みはありませんか?
「いまだに電話・FAX での注文が多く、手作業入力に追われている」
実際、企業間取引(BtoB)では FAX やメール添付の注文書、電話注文などアナログな手段が依然 8 割近くを占めているとの調査もあります※2。
こうした紙や画像の情報をシステムに取り込むには、担当者が内容を視認してキーボードで基幹システムやERPへ手入力。。。
非効率極まりなく、入力ミスも頻発しがちです※3。
Web-EDI や受発注システムを導入して取引先にも使ってもらえれば理想的ですが、取引先すべてが対応できるとは限りません。デジタルデバイトの方は非常に多いです。。。
零細企業の中にはシステム導入が色々な意味で難しく、全取引先を完全にデジタル化するのは困難なのが現状です※4。
結果、「一部の取引先だけ FAX 注文が残ってしまう」というケースも多く、どうしても残る紙の注文書をいかに効率よく処理するかが課題として取り残されます。
そこで注目されているのが、紙の帳票をデータ化する AI-OCR(光学文字認識)技術です。
AI-OCR なら FAX や手書き帳票から文字情報を自動抽出でき、入力作業を大幅に省力化できます※5。
近年はクラウド型 AI-OCR サービスも増え、手書き・活字・FAX などあらゆる書類を高精度にデータ化できる製品が提供されています。※6 ※7
これら SaaS 型 AI-OCR を使えば自社でアルゴリズムの構築は不要です。
しかし一方で、
上記の理由から、自前で OCR 機能を開発・組み込みたいケースもあります。
そのケースを満たしてくれるサービスはクラウド上で強力な OCR エンジンが APIとして提供されています。
その代表格が Google Cloud の「Document AI」です。
Google Cloud Document AI(旧称: Cloud Vision OCR のドキュメント特化版)は、
Google が提供するクラウド OCR/ドキュメント解析サービスです※8。
単なる文字認識にとどまらず、非構造化な書類から名前・住所・電話番号・日付・金額など任意の情報を抽出できる高度な AI で、日本語にも対応しています※8。
Document AI には主に二つの機能を有しています※9。
さらに Document AI では、もし独自レイアウトの帳票でうまく項目抽出できない場合に備え、カスタムモデルのトレーニングも可能です※13。
自社の注文書サンプルを学習させて独自の抽出ルールを覚えさせる「CustomExtractor」機能により、取引先ごとにフォーマットが異なる伝票/帳票でも対応できます※13。
このように AI に学習させることで、これまで正規表現の手作業調整に苦労してい
たようなケースも自動化でき、面倒なパターン修正作業から解放されます※14。
MaruwebVietnam のエンジニアにもこの Document AI を用いて受発注システムに OCR 機能を組み込む実験を行ってみました。
SaaS の OCR サービス(LINE AiOCR や DX Suite など)は使わず、Google Cloud 上にスクラッチで OCR 仕組みを構築した事例です。
以下、その流れです。
では、実際にとある注文書 PDF を使った OCR 結果の一部を見てみましょう。
まず、フォームパーサーによる項目抽出を行わない「生の OCR テキスト」は以下
のようになります。
2025 年 5 月 1 日 10 時 18 分
株式会社サンプル商事
03-1234-5678
NO. 9876
テスト用 製品注文書
■申請者
氏名 株式会社サンプル商事 関東営業部 佐藤
TEL 03-1234-5678
住所 〒100-0001 東京都サンプル区サンプル町 1-2-3
■施工業者
氏名 株式会社テスト工業
TEL 03-9876-5432
住所 〒101-0002 東京都テスト区テスト町 4-5-6
■物件情報
工事名 サンプル邸 改修工事
住所 〒102-0003 東京都実験区検証町 7-8-9
施工完了日:2025 年 4 月 28 日
■仕様
用途 一般用途
方式 テスト方式 A
製品名 サンプル商品 X
使用量 123
実験結果 2.5
■実験結果付近の状況(該当項目に○)
1. 実験結果①
2. 実験結果②
3. 実験結果③
上記のように、書類全体の文字起こし自体は問題なくできています。
ただ、生のテキストだけでは項目ごとに意味付けされていないため、このままでは最悪コピペ作業が発生して人的リソースを減らすなどの目的が半減してしまいます。
そこでフォームパーサーを用いた項目抽出の結果を確認すると、例えば以下のような JSON 構造が得られました。
ご覧頂いたように、注文申請書に記載された発注元(issuer)の会社名・部署・担当者・電話・住所、発注日や注文番号、仕入先企業名と電話番号など、主要な項目が自動抽出されています。JSON 形式なのでシステム連携でいかようにもできます。
しかし、よく見ると一部課題も確認できました。上記では「No.9876」という番号が order_id(注文 ID)として抽出されていますが、本来この書類での「9876」は注文書の受付番号であり、注文 ID ではありません。つまりフィールドの誤認識が起きているわけです。
今回は事前にカスタム学習をさせていない汎用モデルのまま試したため、AI が文脈上それらしい項目名を推測してしまったようです※14。
ただ、このような場合でも、Document AI のカスタムエクストラクタで追加学習を行えばモデルの精度向上が期待できます※14。
実際、Google の検証では 10 件程度のサンプルでファインチューニングするだけで様々なレイアウトへの対応力が向上したとの報告もあります※15 ※16。
我々の注文書フォーマットに合わせて AI にフィールド定義を学習させれば、より
正確に項目仕分けできるでしょう。
今回の実験を通じて、自社システムに AI-OCR 機能を組み込むことはハードルが高くないことが分かりました。
Google Cloud Document AI の OCR 精度は極めて高く、日本語書類でも手書き含め安
定した文字起こし・項目抽出が可能です※8 ※11。
またクラウド上の関数(サーバーレス)と組み合わせることで、既存の受発注システムや ERP とシームレスに連携する OCR ワークフローを比較的短期間で開発できました。
SaaS 型の AI-OCR を利用する場合と比べて、自社のニーズに合わせた柔軟なカスタマイズや他クラウドサービスとの統合がしやすい点も利点となります。
FAX 含む紙の注文書を自動でデータ化しシステム登録まで行えれば、担当者が FAXやメールを見ながら手入力する手間は大幅に削減でき、AI-OCR とワークフロー自動化を導入した企業では、受注処理時間が約 50%短縮し、入力ミスは 90%以上削減された例も報告されています※17。
人手不足に悩む中小企業にとって、これは大きな生産性向上と言えるでしょう※18 ※19。
弊社は、こうした受発注業務の DX 化を支援するシステム開発を行っています。
要件に応じて信頼性の高い Magento 等の EC プラットフォームを活用した BtoB 受発注システム構築も可能ですし、必要に応じてスクラッチ開発や他ソリューションのご提案もいたします※20。
FAX 注文への対応に代表されるように、「紙が混在するからデジタル化なんて無理」と諦める必要はもうありません。
OCR とシステム開発の力で、貴社の受発注フローから属人的な手入力作業を一掃しませんか? 私たちがお手伝いします!
【参考】
– Maruweb 公式サイト: BtoB EC・Web 受発注システム(サービス紹介)※20 ※21
– Google Cloud 公式: 調達向け Document AI(ドキュメントデータの自動抽出ソリュ
ーション)※22 ※23
– 事例: 株式会社トーモク 「受注業務効率化事例」(AI-OCR 導入で 50%時間短縮)※24 ※17
– 技術ブログ: GMO インターネットグループ 「Document AI を使ったデータ抽出の
最適化」※8 ※14 (Document AI の機能・精度検証)
※1 ※20 ※21 BtoB EC・Web 受発注システム |Solution|株式会社マルウェブ
https://www.maruweb.co.jp/ja/solution/btob/
※2 ※3 ※5 OCR で EC に受注データを導入する 4 つの方法
https://ebisumart.com/blog/ocr-ec/
※4 ※11 12.Ai-OCR と組合せた受発注システム – 株式会社アンソネット
https://test.anthnet.co.jp/service/ju-hachu/gyomu-sys-ai-ocr/
※6 ※18 ※19 中小企業向け AI-OCR7選比較!選び方と導入メリットも解説 | IT トレ
ンド
https://it-trend.jp/ai_ocr/article/813-4911
※7 LINE WORKS PaperOn | 世界最高水準の AI-OCR で書類をデータ化
https://line-works.com/paperon/
※8 ※9 ※10 ※12 ※13 ※14 ※15 ※16 Google Cloud (GCP)Document AI を使ったデータ抽出の最適化 – GMO インターネットグループ グループ研究開発本部
https://recruit.group.gmo/engineer/jisedai/blog/optimization_data_extract_documentai/
※17 ※24 株式会社トーモク様の受注業務効率化事例|AI 導入で 50%の時間短縮を
実現
https://www.feer-design.com/articles/ai50-097821
※22 ※23 調達向け Document AI | Google Cloud
https://cloud.google.com/solutions/procurement-doc-ai?hl=ja