企業支援施策ガイドブックのテキスト検索ページを作成
2017年02月01日
島根県や支援機関等の企業向け支援策等が掲載されている「平成28年度企業支援施策ガイドブック」(島根県発行)の内容を、自然な日本語で検索し、関連がありそうな制度を紹介するサイトを作成しました。
http://gb.s-itoc.jp/
助成金や相談窓口等を調べようと思った時は、冊子のガイドブックを開き、目次インデックスで目当ての内容を探す必要があります。
今回試作した検索ページでは、取り組みたいことや気になることを自然な日本語で入力すると、関連しそうな制度を3つ紹介するものです。
検索精度を上げるためには更なるチューニングが必要ですが、まずは簡単に実装してみて、皆さんに紹介しようと思い、公開しました。
ぜひ一度使ってみていただき、ITOCまでご感想やご意見等いただけますと幸いです。
▼平成28年度企業支援施策ガイドブック(島根県商工労働部商工政策課ホームページ)
http://www.pref.shimane.lg.jp/shoko/kigyou_sien_sisaku_gaido.html
経緯
ITOCの研究テーマの一つに機械学習があり、機械学習のためのデータ加工に用いる形態素解析※の技術を紹介するため、企業の皆さまが普段冊子やPDFで閲覧されている情報を対象にしました。
技術的には、オープンソースの全文検索エンジン「Elasticsearch」を利用しています。
検索ボックスに入力された文章から企業支援施策ガイドブックのテキストを全文検索し、関連がありそうな情報を紹介する仕組みです。
※形態素解析とは
自然な文章から、文法や単語の品詞等の情報に基づいて、意味を持つ最小単位の言葉に分割し、品詞等を判別する作業のこと。
今後の展望や可能性
現在徐々に主流になりつつある質問応答(チャット等で自動応答する仕組みが増えています)にも応用できる技術であり、県内の事業者の皆さまのサービスや商品創造のヒントになることを期待しています。
また、「もっとこうした方が良い」「こんなことも出来るのではないか」といったようなアイデアを集めて、サービス展開を目指すようなアイデアソンやハッカソンの開催を実施することも検討しています。
お問い合わせ等(ご意見・ご感想)
しまねソフト研究開発センター TEL:0852-61-2225 MAIL:itoc@s-itoc.jp