教育支援技術

絵本検索システム「ぴたりえ」

絵本の読み聞かせには様々な教育効果が期待できます。こどもの興味と発達段階に合った絵本なら、さらに効果が高まると考えられます。しかし、こどもの発達は個人差が大きく、興味も千差万別で、こども一人ひとりに合った絵本を探すのは困難です。そこで我々は、グラフ索引型類似探索・自然言語処理・幼児言語発達の3つの基礎研究を統合することで、こども一人ひとりに合った絵本を探す絵本検索システム「ぴたりえ※」を開発しました。具体的には、グラフ索引型類似探索技術によって、絵からでも文からでも検索できる高速・汎用的な検索を実現し、自然言語処理技術によって、これまでコンピュータでは解析が難しかったひらがなばかりの文章の形態素解析の高精度化を実現、こどもがいつ頃どんな語を獲得するかについて1500人以上という大規模調査を行った幼児言語発達研究により絵本の難易度推定を実現しています。

語彙数推定テスト

単語親密度とは、語のなじみ深さを評定実験によって数値化したものです。NTTが20年以上前に調査した約7万7千語の単語親密度は、語彙数推定テストをはじめ、今でも多くの分野で活用されています。我々は経年変化の調査や、新語追加のため、令和版単語親密度調査に取り組み、約16万3千語からなる『令和版単語親密度データベース』を構築しました。
また、小中高校生を含む約4,600人の語彙数調査を実施し、各学年・年齢における語彙獲得状況を、単語親密度に対応付けてモデル化しました。この結果は、児童・生徒がこれから獲得していくであろう、あるいは獲得した方がよい語を見つけ出す手がかりとして単語親密度が有効であることを示唆します。これらの分析結果を反映し、令和版語彙数推定テストを作成しました。
本成果は、言語心理学や自然言語処理などの学術分野では、基盤的言語資源として分野の発展に貢献するとともに、学校教育分野では、児童・生徒の学習支援を行う上での貴重な手がかりとなります。

学年年齢ごとの語彙数推定結果 (※青字は中央値)