崩し字解読支援サービス

サービス内容

このサービスは、KuroNetくずし字認識サービス(AI OCR)のご利用の前提となる、IIIFマニフェストURLを発行することができるサービスです。当社がKuroNetくずし字認識サービス(AI OCR)を使用してテキスト化を行うこともできます。

お手持ちの画像ファイル(jpgやpng等。※)を当社サイトにアップロードすることでIIIFマニフェストのURLを発行することができます。

※pdfの場合、エラーが生じることがあります。他のファイル形式については、動作確認しておりませんので、事前にお問い合わせください。

ご利用料金

ご利用者様自身がアップロード&IIIFマニフェストURL発行作業を行う場合

ご利用者様ご自身で当社サイトに画像ファイルをアップロードし、IIIFマニフェストURL発行作業を行うプランです。

ご利用期間 価格
30日間 5000円
180日間 25000円
1年間 48000円

当社がアップロード&IIIFマニフェストURL発行作業を行う場合

当社に画像ファイルを送付いただき、当社がIIIFマニフェストURL発行作業を行い、発行されたURLをご利用者様にお送りします。発行から30日以内に解読作業を完了してください。30日を経過しますと、画像ファイル自体を削除しますので、URLを使用できなくなります。

ご利用期間 価格
30日間 50000円
180日間 250000円
1年間 480000円

当社がアップロード&IIIFマニフェストURL発行作業&テキスト化までを行う場合

KuroNetくずし字認識サービス(AI OCR)でのテキスト化作業までを当社が行い、テキストを納品いたします。この場合、誤認識や読み飛ばしなどの可能性がありますが、目視確認・修正作業・解読作業はいたしませんので、納品後にご自身で画像等と対照して目視確認なさってください。

ご利用期間 価格
30日間 10000円
180日間 500000円
1年間 960000円

お申し込み

お申し込みはこちらのフォームへ

ご利用上の注意

  • 画像ファイルはお手元に必ずバックアップを残してください。サーバーの負担軽減のため、所定の日数が経過した場合、サーバー上のファイルは断りなく削除されますので、お早めに作業を終了してください。現在の削除期限はアイテムを追加した日付から30日です。
  • このサービスの対象となるのは、基本的には100年以上前の崩し字が記載された古文書・古記録です。人物や風景を写した写真や活字で書かれた文章は対象外です。
  • 公序良俗に反する画像をアップロードしないでください。公序良俗に違反するご利用があった場合は、直ちに利用資格を喪失するものとします。その場合、返金はいたしませんが、画像を削除した上で刑事告発いたします。また、そのようなファイルがアップロードされているのを発見した場合は、直ちに当社にお知らせください。
  • ご利用期限が経過した場合、アカウントを抹消いたします。ご利用期限を延長する場合は、ご利用期限到来前にお申し出・お支払いください。
  • 同時に100MB以上のファイルをご利用にならないでください。サーバーが逼迫してしまいます。KuroNetくずし字認識サービス(AI OCR)では結局一枚一枚作業することになるのですから、一気にアップロードするのではなく、数枚ずつにとどめてください。なお、ご利用者数が増大した場合は、サーバーを増強いたしますので、その際改めてこの制限について検討いたします。

ご利用方法

後日、説明用画像を追加します。

以下では、ご自身でなさる場合のOmeka及びKuroNetくずし字認識サービス(AI OCR)の使用方法について解説します。

下準備

当サイトに搭載されているOmeka Classicというツールを使用して、画像ファイルからIIIFマニフェストURLを作成します。

1.Omekaユーザー登録(購入時のみ)

購入時のみ、ユーザー登録が必要です。ご購入時に下記事項をお知らせください。まず、当社が登録作業を行います。

申請の際は、
①ユーザー名(半角英数字30文字以下。 空白は使用できません。ログインに使用します)
②表示名(他の利用者等から見える可能性があります)
③メールアドレス
をお知らせください。

(2)当社が登録作業を行うと、上記メールアドレスに「家族史編纂センター リポジトリでアカウントを有効にする」というメールが届きます。記載されているURLをクリックしてパスワードを登録してください。

(3)以上でユーザー登録は完了です。

2.Omekaでの画像登録・IIIFマニフェストURL発行

(1)Omekaページを開きます。

(2)左ツールバーの「アイテム」を押し、「アイテムを追加」を押す

(3)「ファイル」タブを開いてファイルを指定する。

なお、ファイルはpngやjpg、pdfなどに対応していますが、pdfの場合はエラーが発生するかもしれません。

「Dublin Core」タブにタイトル等の入力欄があり、空欄でも使用できますが、ご自身の区別のために入力しても構いません。

(4)「公開」にチェックする。

※「公開」にしないと、KuroNetくずし字認識サービス(AI OCR)が読み取れません。

(5)コレクションでご自分の名前を選ぶ。

(6)左ツールバーの「アイテム」を押し、アイテムの一覧の中から目的のアイテムを見つけて、当該アイテムの画像又はタイトルをクリックする。

(7)「公開ページを見る」をクリックする。

(8)「出力フォーマット」の下に表示された画像の左下のシェアマークを押し、「iiif」マークを押す。

(9)ページが開かれるので、URL欄にあるIIIFマニフェストURL(URL欄内の「https://family-history.kinoshita.or.jp/omeka/iiif/★/manifest?manifest=」の後の部分「https://family-history.kinoshita.or.jp/omeka/iiif/★/manifest」)をコピーする。

アイテムによってIIIFマニフェストURLは異なります。

3.作業後

作業が終了した場合は、アイテムを削除してください。

サーバーの負担軽減のため、アイテムを追加した日付から30日(※)を超えた場合はWEB管理者が断りなくアイテムを削除します。

※ 暫定的に30日としますが、利用状況を見て日数を変更することがあります。

KuroNetくずし字認識サービス(AI OCR)

下記2つのページが公式の説明です。

KuroNetくずし字認識サービス | ROIS-DS人文学オープンデータ共同利用センター
KuroNet Text Editor | ROIS-DS人文学オープンデータ共同利用センター(CODH)

1.認識まで

(1)こちらのページからGoogleアカウント等を使用してKuroNetくずし字認識サービスにログインします。サインアップ(登録)作業は特にありません。

(2)KuroNetくずし字認識ビューアを起動してください。
(3)KuroNetくずし字認識ビューア上にIIIFマニフェストURLを貼り付けてください。
(4)目的の画像が表示されるので、右上の■を押して、文字読み取りをさせたい部分を水色の四角で囲ってください(マウスでドラッグします)。
(5)水色の四角の中をクリックすると「KuroNetくずし字認識サービス https://~」という吹き出しがでますので、「KuroNetくずし字認識サービス」をクリックしてください。
(6)ダッシュボード画面が表示されます。目的の画像を見つけて、「予約:実行」を押します。(すぐ下に「処理:完了」とありますが、気にしないでください。これは処理完了日時欄であって、実行後に右に処理完了日時が表示されるものです)
(7)処理が完了すると、「成功:閲覧」と表示されるので、これをクリックしてください。認識結果が画像上に表示されます。

2.認識結果の取得

ア 自動テキスト化の場合

(1)ダッシュボード画面で、目的の画像右の「処理:実行」を押します。

(2)ダッシュボード画面又は読み順自動推定外面で「テキスト化:実行」又は「テキスト化を実行する」を押します。

(3)テキストが表示されるので、ドラッグしてコピーします。

イ 手動テキスト化の場合
(1)「エディタ:準備」を押します。
(2)画像上に文字の認識結果が表示されていますので、読ませたい順に文字をドラッグしていきます。改行する場合はドラッグをやめます。指定し終わったら、右上のノートマーク(キュレーションリスト)を押し、「上書き更新」を押します。詳しくはこちらをご覧ください
(3)ダッシュボード画面に戻り、「テキスト化:実行」を押してください。

3.認識結果テキストの目視確認

以上の作業を経て得られた認識結果テキストも、それだけでは誤認識や飛ばしなどの問題が含まれている可能性がそれなりにありますので、必ず目視確認なさってください。