受験生サイト受験生サイト
入試情報入試情報
資料請求資料請求
アクセスアクセス

【研究成果】ディープ・ニューラル・ネットワーク手法を活用した帝国議会のデータベース構築

2022.07.27

ディープ・ニューラル・ネットワーク手法を活用した帝国議会のデータベース構築

1.発表者:

野中尚人 学習院大学・法学部・教授
野中尚輝  

2.ポイント:

  • Deep Neural NetworkならびにOCR※の手法を用いることで、帝国議会時代の審議記録をテキスト化
  • 政治学とデータ・サイエンスの融合的な研究

3.概要:

  • 帝国議会時代の審議記録は、これまで画像データの状態であったため、OCRの技術、Deep Neural Networkの手法を用いて、それらをテキスト化しました。
  • 学習院大学東洋文化研究所からの研究資金(帝国議会の制度遺産と韓国・台湾比較から見た日本の国 会 2019-2020年度)ならびに科研費(挑戦的研究(開拓)-自然言語処理技術を用いた日英仏議会テキスト解析による国会の特質・変則性の解明-20K20509)からの支援を得ました。また、学習院大学グランドデザイン 2039「国際学術誌論文掲載補助事業」より掲載費を助成しています。
 日本の国会は、かなり長い歴史を持っていて、その結果、他国には見られないような様々な特質・変則性を持っています。そして、そうした現在の国会の特質を理解するためには、歴史的な経緯を理解することが不可欠です。そのためには、帝国議会時代のデータをコンピュータでの解析に用いられるよう、議事録の画像情報をテキスト化することが重要な前提となります。このペーパーでは、OCRによって画像情報を読み取った後、Deep Neural Networkの手法を用いることで精度の高いテキスト化を実現し、審議記録のテキスト化を進めました。今後は、対象時期を拡張するとともに、本会議だけでなく予算委員会にも適用することで、より充実したデータベースを構築し、国会研究の基礎データとして整備することが期待できます。
(※は用語解説参照)
4.用語解説:
用語 説明
ディープニューラルネットワーク(DNNDeep Neural Network 深層学習)

十分なデータ量があれば、人間の力なしに機械が自動的にデータから特徴を抽出する学習手法

OCR

光学文字認識の手法で、活字、手書きテキストの画像を文字コードの列に変換する

5.発表雑誌:

著者 : Naoto Nonaka,Naoki Nonaka
論文 :

Construction of Japanese Imperial Diet Database using Deep Neural Network
ディープ・ニューラル・ネットワーク手法を活用した帝国議会のデータベース構築

雑誌名 :

Journal of Information Processing, Vol.30, pp.411-42135巻5054003

DOI : 10.2197/ipsjjip.30.411
論文URL : https://www.jstage.jst.go.jp/article/ipsjjip/30/0/30_411/_article