
既存のAI-OCRに、
こんな不満は
ありませんか?
テンプレ作成に時間を取られ、更新に追われ続ける
新しいフォーマットが届くたびにテンプレート設定が必要
取引先が増えるほど管理コストが膨らみ、IT部門への依頼も止まらない
フォーマットが少し変わるだけで処理が止まる
帳票レイアウトの微細な変更で再設定が発生し、業務がストップ
「またか」のたびに現場とシステム担当の双方が消耗する
手書き・押印・かすれで精度が落ち、結局、目視修正が絶えない
手書き文字・訂正印・傾き・かすれがあると読み取りが崩れ、
自動化したはずの工程に人が張り付く状況が続く
OCR後の確認・修正が最大のボトルネック
読み取り後のデータ検証・修正に最も工数がかかるという逆転現象
精度が上がらないかぎり、後工程の人手は減らせない
フォーマット の
垣根を超える。
LLMからVLMへ
進化を取り込む“多層生成OCR”
複数のLLM、VLMを活用して高精度を実現
取引先ごとの違いにも対応します
ファイルをアップするだけで
必要項目を自動抽出
帳票登録もテンプレ設計も不要で
様々なフォーマットをデータ化します
使うほど精度はアップデート
業務効率を劇的に向上させる次世代OCRです
認識率 99 %の
壁を超える。
「単一モデル依存」
からの脱却
複数の生成モデルを組み合わせる“多層生成アーキテクチャ”を採用
ハルシネーションを抑え、信頼性の向上、検証工数の削減を実現します
4 Core Technologies
Layout Awareness
読み順の崩れを防ぐ、視覚的理解
VLMが視覚的情報を直接解釈し、読み順の崩れを防ぐ
- VLM連携により、罫線・余白・印影などの視覚的構造を理解し、読み飛ばしや位置誤認を防止します
- 画像の回転、表のセル結合、複雑な多段組レイアウトを正規化して構造を理解します
- 90度回転した帳票や、80%に縮小された画像であっても正確な読み取りが可能です
Semantic Driven
意味と文脈で特定
絶対座標に依存せず意味情報と文脈から特定
- 事前のテンプレート定義は不要(ゼロコンフィグ)
- 人間のように意味を読み取るため、フォーマットのズレに影響されません
- 要約・分類・データ構造化までをワンストップで実行
Multi-layered Recognition
専用モデルの連携で統合判断
軽量な専用モデルを組み合わせることで統合判断
- 軽量な専用モデルを組み合わせることで統合判断。ハルシネーションを大幅に抑制
Two-step Verification
AIと検証ルールの二段構え
AIの自己採点とルールに則った検証の二段構え
Step 1(AI自己採点)
確信度スコアによる自動振分。閾値(例:98%)未満は自動的に「要確認」フラグを付与
Step 2(ルール検証)
合計金額の整合性、日付の妥当性、マスタ照合など、アプリケーション側での厳格なルール検証
読取精度
以下のような場合でも読み取ることが可能です
複数行



Sample
001
枠からはみ出し



2024年8月15日
くせ字


商品サンプル1
訂正印



USD 3,000
多言語



Hello World
你好,世界
チェックボックス



1
1という値を取得
ご利用シーン
契約書の内容理解と構造化
契約書から内容を読み取り、必要部分をAlが選んで出力
・課題:定型フォーマットがない「文章」。弁護士からの 開示請求など、文面から目的を理解する必要がある
・解決:LLMが文章の中身を読み解き、「請求の目的」 「期限」「対象者」などのキー情報を抽出。構造化データへ変換
(TONHATC)
| 所 在 | 地番 | 地目 | 地積(㎡) | 持 分 | |
|---|---|---|---|---|---|
| 土地 | 1. 山田テスト太郎 | 29番5 | 宅地 | 694.44 | 全部 |
| 2. 同上 | 29番3 | 宅地 | 22.18 | 全部 | |
| 3. | 畠 | ||||
| 合計(2筆) | 716.62㎡ | ||||
氏名
非定型帳票の文脈理解
英語の帳票もLLMが読み取りデータ構造化
・課題:国や企業ごとにフォーマットが無限に存在し、従来の座標定義では対応不可能
・解決:AIが文書の種類(インボイスかB/Lか)を自動 判別し、必要な項目(スキーマ)だけを的確に抽出
123, EXAMPLE STREET, SAMPLE CITY
TEL: 000-000-0000
XYZ BUILDING, SAMPLE CITY
| Shipping Mark | Description | Quantity | Unit Price | Amount |
|---|---|---|---|---|
| KYOCERA CIRCUIT KOS CASE NO. MADE IN SAMPLE |
ELECTRODEPOSITED SAMPLE FOIL | |||
| COPPER PURITY : 99.9PCT UP 18GZ STANDARD SHEET TYPE |
(30 CASES) | |||
| SAMPLE-12 850MM X 500MM | 180,000 SHT | ¥65.00 / SHT | ¥14,254,500.00 | |
| TOTAL | 180,000 SHT | ¥14,254,500.00 |
配送伝票の高精度読み取り
複数枚の伝票を一括でデータ構造化
・課題:バーコード・手書き・チェック項目が混在する伝票の読み取りが困難
・解決:複数枚の伝票を一括処理し、届先・依頼主・品名・送り状番号を自動抽出
東京都渋谷区テスト町三丁目25-3
サンプルマンション 502号室
神奈川県ダミー市サンプル区四丁目5-6
東京都渋谷区テスト町三丁目25-3
サンプルマンション 302号室
神奈川県ダミー市サンプル区四丁目5-6
手書き・チェックボックスの認識
手書き文字とチェック状態をLLMが正確に判定
・課題:手書き文字やチェックボックスのON/OFF判定は従来OCRでは誤読が多発
・解決:LLMが文脈から手書き文字を正確に読み取り、チェック状態も確実に判定
(届出届出届)
下記の口座に給与・賞与振込を依頼します。
地積測量図の読み取り
測量図から必要項目をAIが自動抽出
・課題:図面と文字情報が混在する測量図は、従来OCRでは項目の特定が困難
・解決:LLMが図面の構造を理解し、地番・地積・申請人など必要情報を正確に抽出
健康診断結果表の読み取り
検査項目・数値・判定をAIが一括で構造化
・課題:健診機関ごとにレイアウトが異なり、多数の検査項目と数値を手入力するのは工数が大きい
・解決:LLMが帳票レイアウトを理解し、検査値・基準値・判定コードを正確に抽出してデータベースへ連携
| 検査項目 | 測定値 | 基準値 | 単位 | 判定 |
|---|---|---|---|---|
| 身体計測 | ||||
| 身長 | 171.2 | — | cm | — |
| 体重 | 76.4 | — | kg | — |
| BMI | 26.1 | 18.5〜24.9 | — | C |
| 血圧 | ||||
| 収縮期 | 138 | < 130 | mmHg | C |
| 拡張期 | 88 | < 85 | mmHg | C |
| 血液検査 | ||||
| 空腹時血糖 | 105 | 70〜99 | mg/dL | C |
| HbA1c | 5.8 | < 5.6 | % | B |
| 中性脂肪 | 178 | 50〜149 | mg/dL | C |
| HDL-C | 52 | > 40 | mg/dL | A |
| LDL-C | 118 | < 120 | mg/dL | A |
| γ-GTP | 68 | 13〜64 | U/L | C |
| ALT | 29 | 10〜42 | U/L | A |
| 尿検査 / その他 | ||||
| 尿糖 | (−) | (−) | — | A |
| 尿蛋白 | (±) | (−) | — | C |
| 胸部X線 | 異常なし | — | A | |
| 心電図 | 洞性頻脈 | — | C | |
逸脱が認められます。生活習慣の改善と
定期的な再検査をお勧めします。
導入事例
実際に導入いただいた企業様の活用事例をご紹介します
導入フロー
お申し込みから本稼働まで、LLM OCRを安心して導入いただけます
お聞かせください
精度を一緒に確認
設定・定義
精度を検証
精度向上
最短2週間で運用開始
よくあるご質問
PDF、JPG、JPEG、PNG、TIF、TIFF に対応しています
はい、反転・傾き・逆さまの画像でも対応可能です
人が見て判断できるものは高精度で読み取り可能です
AIモデルの再学習には利用されません(オプトアウト)。セキュアな環境にて設計しております
ご希望に合わせて、精度向上に向けフィードバックデータを活用したチューニングも可能です
はい、API連携も可能です
オンプレ環境での提供も可能です。ご希望のGPUに合わせてモデルを提供いたします
最短で2週間での導入が可能です
価格
安心のメールサポート
WEB会議による
個別サポート付き