リサーチプロジェクト
研究報告会レポート

第8回ユーザー・コミュニティとオープン・メディア研究報告会レポート「みんなで参加する古文書解読」

#いまマーケティングができること

第8回 ユーザー・コミュニティとオープン・メディア研究報告会(オンライン) > 研究会の詳細はこちら
テーマ:みんなで参加する古文書解読
報告者:橋本 雄太(国立歴史民俗博物館 助教)
日 程:2022年2月2日(水)19:00-20:30
場 所:Zoomによるオンライン開催

 
【報告会レポート】
 ネット集合知はユーザー共創の成果であり、『みんなで翻刻』は中央管理された集団知性(collective intelligence)を使って問題解決のアウトプットを生み出すユニークなプラットフォームである。『みんなで翻刻』とは歴史災害資料を専門家ではなく一般ユーザーが参加して翻刻、つまり史料に書かれた文字を現代の活字に起こすプロジェクトであり、2017年のWEBサイトから正式にリリースされてスタートした。京都大学古地震研究会が開発と運営を行う。当初の翻刻対象は東大地震研図書室に所蔵の災害史料コレクション「石本文庫」であり、このなかからデジタル公開されている史料114点(画像数3,193枚)の全文翻刻が5カ月弱で完了した。
 

 
 さて、古文書の翻刻は国文学や歴史学の固有知識を有するきわめて専門的な作業であり、くずし字の一般的な識字率は0.01%ともいわれる。専門知識をもたない一般ユーザーが作業に参加するには識字技術を代替するシステムが欠かせない。そこで教育サービスの分野で一般ユーザーが参加して相互に多言語を翻訳する教育サービス、「Duolingo」「lang-8」からヒントを得て、一般ユーザーが古文書の相互に翻刻するシステムを基本設計した。大阪大学文学研究科を中心に開発された、くずし字学習支援アプリ「KuLA」を使い、アプリで基礎を学習し、『みんなで翻刻』で発展学習を行うフローを設計したのである。
 

 

 
 2019年3月までの成果は次のとおりである。参加登録ユーザー数5,346名、ユーザーが入力した入力総文字数624万文字、翻刻が完了した画像数は公開8,925枚のうち、8,810枚(98%)、翻刻が完了した東大地震研所蔵の和古文書数が508点のうち全499点を達成した。完了したデジタルデータは、クリエイティブコモ、ンズ(CC)ライセンス(CC BY-SA)で社会に公開される。プラットフォームは2019年7月から新バーションに移行し、資料対象の拡大やデジタルアーカイブの国際標準規格IIIFに対応したほか、くずし字認識に凸版印刷とCODH(人文学オープンデータ共同利用センター)が開発したAI技術を採用して認識と変換技術を向上させた。また翻刻対象も災害史料以外に文化や医療、仏典など範囲を拡大して進行中である。新バーション移行後の翻刻完了史料数は対象2,209点のうち1,264点に上り、現在も1日当たり2万字のペースの翻刻で進行している。
 

 
 このプラットフォームがユーザー・コミュニティとして成果を上げているユニークな仕組みは、ユーザー間の「相互添削システム」である。ユーザーが翻刻した文と単語はプラットフォームのタイムラインに投稿して公開され、他のユーザーからの添削希望を求めることができる。あるユーザーが翻刻した内容を他の不特定の登録ユーザーが添削して互いにフィードバックする。1枚の画像当たり平均2.7人のユーザーが5回編集を行っていた。この相互添削システムは、当研究会でこれまで研究してきたボカロ音楽・動画の二次・三次の創作連鎖と似ている。ボカロコンテンツの創作連鎖とそのネットワークがコミュニティの拡大と活性化に貢献したように、『みんなで翻刻』でも、ユーザー間の相互添削の連鎖がコミュニティを活性化し、その成果を高めるものと考えられる。
 また、一般ユーザーのネット集合知は専門家の専門知に対して、その成果のクオリティは劣るのか。サンプリングされた翻刻文10万文字を中世史の研究者2名に精度を依頼して検証したところ、100文字当たり平均1.5文字のエラーが見つかり、翻刻精度は98.5%であった。学術出版のレベルには及ばないものの、内容の理解と災害史料として利用価値は十分にあることが確認された。
 
 最後に、ユーザーの参加分布は次のとおりである。参加登録ユーザー5千人のうち、翻刻に参加しているのは450名であり、ユーザーの77%は入力文字数10字未満であった。アクティブなユーザーの中でも、上位10名のコアユーザーが全体文字数の62%、30名で90%を翻刻するという偏りが見られた。ユーザーの年齢分布は18歳~34歳で5割を占めるが、活動している時間(サイトの平均滞在時間)でみると、65歳以上が31分と最も長く、年齢が上がるほど活動時間が長くなる傾向がある。アンケート調査によれば、この非営利なコミュニティに参加するユーザーの動機として「作業が楽しい」「他のユーザーとの協働が楽しい」「学術への貢献」が上がっていた。
 
 『みんなで翻刻』のプラットフォームは非営利のコミュニティであるため、参加ユーザーの動機づけをどのように促進するかが課題であり、翻刻成果を全国の地域や自治体の災害対策にどのように生かしていくかである。現在は翻刻文書の地理的な位置情報や日時情報を紐づけするプラットフォーム『みんなでマークアップ』が運営され、集合知成果の社会的な活用も始まっている。
 
 2021年度もご参加いただき、ありがとうございました。2022年度も引き続き、「ネット集合知」をテーマに研究報告会を企画してまいりますので、どうぞよろしくお願いします。
 
(文責:片野 浩一)

 
Join us

会員情報変更や、領収書発行などが可能。

入会についての詳細はこちらから。

member