文字自動認識技術の現状と課題 [東京情報大学] [情報文化学科] [平成16年度卒業研究概要集] [平成16年度ゼミのリスト] [ゼミ学生一覧]
中島 淳 ゼミ 平成16年度卒業論文
文字自動認識技術の現状と課題
小島 悠

いまの世の中は、様々な情報を家の中でも外でも時間を問わず、インターネットを利用することにより手にすることができる。しかし、それができるのも、いつのまにかどこかの誰かが、様々な情報を電子データに変え、世界中に発信しているから可能なのであるといえる。言い換えれば、どのような情報も電子データになってさえいれば、ITインフラ、マルチメディア技術の基盤の上で、自由に配信、入手、保存、加工ができるのである。

そのような新しい流れの中で、今後作り出されていく情報は最初から電子データ化を考慮した上で作成されることが基本になるので大きな問題はないが、問題なのはいままでにつくりだされ蓄積された多くの情報である。大量の紙などに記録された情報を電子化するには、人の手作業による地道な入力が基本になるが、今回はその他の方法のひとつであるOCR(光学式文字認識)をとりあげ、現在使われている数種のOCRソフトを使用し、精度、能力、問題点等の比較・検討を行った。