【大学】 北海道教育大学様 | コーパス言語学研究の元になる音声データの録音で活躍するデジタル・ワイヤレス | Microflex Wireless

【大学】 北海道教育大学様 | コーパス言語学研究の元になる音声データの録音で活躍するデジタル・ワイヤレス | Microflex Wireless

はじめに

“音声認識の認識率がもの凄く、ほぼ完璧に近い精度で英語が変換されるのを見てビックリしました”

 

北海道教育大学教育学部 旭川校 教授(英語コミュニケーション学)片桐徳昭氏

お客様プロフィール

◎ 導入事業者

国立大学法人 北海道教育大学 旭川校
業種:教育機関
https://www.hokkyodai.ac.jp/asa/

 

◎ 導入場所

導入場所:北海道教育大学教育学部 旭川校

 

 

課題

北海道教育大学旭川校の教授である片桐徳昭氏は、教育現場における音声情報を集積化した“音声コーパス”の研究に長年取り組んでおられます。音声コーパスを作成するには授業や実習を録音して文字起こしを行う必要がありますが、それまで使用されていたビデオカメラ内蔵のマイクでは録音品質が低く、文字起こしに膨大な時間と労力がかかっていたのが課題でした。

ソリューション

録音品質の向上を模索していた片桐氏は、音響機器に精通した大学院時代の恩師に相談。そこで勧められたのがShureのマイクロホンで、実際に試したところ音声認識の精度が向上することが分かり、Microflex Wirelessの導入を決定されました。導入機器は、2chアクセスポイントMXWAPT2=-Z12、ハンドヘルド送信機MXW2/SM58=-Z12、ボディパック型送信機MXW1/O=-Z12、ラベリアマイクWL185-X、単一指向性バウンダリーマイクMXW6/C=-Z12、2ポート充電ステーションMXWNCS2-Jという構成で、オーディオプロセッサーのP300-IMXも導入。これらは常設ではなく、可搬用のキャリーに収納してあり、録音する際に教室や実習室にセッティングして使用されます。

 

効果

2019年夏から使用しているというMicroflex Wirelessについて、片桐氏はその音質と収音性能を高く評価。文字起こしを行う学生の評判も非常に良いと語ります。

「導入前にShureさんのショールームにお邪魔して体験させていただいたのですが、英語で音声認識をかけてみたところ、ほぼ完璧に近い精度で英語が変換されるのを見てビックリしました。これは使えるなと思い、導入を決定したという流れです。一昨年の8月末に導入し、翌月の教育実習で使った後、データを整理しているうちにコロナになってしまったので、それほど活用できていないのですが、音がキチンと入っているなと思います。学生たちに訊いても、Shureさんのマイクで録音した方がいい、文字起こしがしやすいと言っていますね。音声認識に関しても、人間よりコンピューターの方がはるかに言葉の認識率が高く、ノイズの無い明瞭な音で収音すれば音声コーパスを作りやすくなるので、Shureさんのマイクが間違いなく役に立つのではないかと思います」(片桐氏)

————————————————————————

スペシャルインタビュー

明瞭な録音品質で、大学の研究機関で活躍するワイヤレス・システム、Microflex Wireless。その使用感について、北海道教育大学教育学部旭川校教授の片桐徳昭氏にお話を伺いました。

————————————————————————

● 音声として流れてくる情報の集積=“音声コーパス”

————————————————————————

——— 北海道教育大学様は、教育学部のみの単科大学でありながら、道内に5つのキャンパスを有することで知られています。複数のキャンパスを有する単科大学は、国内では稀であると伺いました。

片桐 北海道がそれだけ広いということなんでしょう。キャンパスは、札幌、旭川、函館、釧路、岩見沢にあり、本学の校章も5つのキャンパスを表したデザインになっています。ただ、教育大学と言っても、教員養成課程をメインに据えているのは、私がいる旭川、札幌、釧路の3つだけで、函館は国際地域学科をはじめとする国際系、岩見沢は芸術とスポーツに特化したコースを編成しています。また、旭川は小学校と中学校、釧路は小規模校とへき地教育の教員養成に特化しており、カリキュラムもキャンパスによって大きく異なります。これは本学の特徴を表していると言っていいかもしれません。現在、すべてのキャンパス合わせて、約5,500名の学生が学んでいます。

 

——— 最近、学内で大きな変化はありましたか。

片桐 どの大学も同じだと思いますが、コロナ禍でICT(Information and Communication Technology/情報通信技術)の整備が一気に進みました。会議室にシーリング・マイクが付いたり、ワイヤレス・マイクのグレードが上がったり、これまで限られたエリアにしか飛んでいなかったWi-Fiも、4月からはほとんどの場所で繋がるようになりました。これまでほとんど使っていなかったソフトウェア面も整備され、Google ClassroomとMS Teamsが使えるようになり、昨年のオンライン授業はZoomを使って行いましたね。学生にはパソコンや携帯型のルーターを貸し出して、300名くらい入る大きな教室があるんですが、その部屋をWi-Fiスポットとして使ったりして。何とか時勢に遅れないように取り組んでいます。

 

——— 先生が取り組んでおられる“音声コーパス”について、ご紹介いただけますか。

片桐 コーパスはもともと「死体」という意味ですが、書籍や自然言語などをデジタル化したもののことをコーパスと呼んでいるんです。昔は本に書かれている文章を分析する場合、それらの情報をすべて打ち込むか、あるいは人間が頭で解釈するしかなかったわけですが、デジタル技術のおかげで大規模に集積したデータを高速に処理できるようになりました。例えば、過去に出版された本やインターネット上の文献を集めて、そこに書かれている文章ではどのような言葉が多く使われているか、その言葉はどのようなパターンで出現するか、どの言葉とどの言葉が一緒に出現する確率が高いか…… といった分析が容易に行えるようになったんです。こういった研究のことをコーパス言語学と呼んでいます。

 音声コーパスは、テキスト化されていない情報、つまり音声として聞こえてくる情報を集積化したものです。私は学校教育現場出身の人間ですので、授業ではどのような言葉が喋られているか、英語の授業ではネイティブスピーカーと非ネイティブスピーカーでは使用する言葉の傾向に違いがあるのかといったことを研究対象にしています。ネイティブスピーカーの英語は、日本人にとっては聴き取りにくいと言われますが、実際に分析してみると、ネイティブスピーカーだろうか非ネイティブスピーカーだろうか使っている単語は上位2,000語くらいに収まっていて、大きな違いはなかったりします。そういった研究成果を、英語教育にどのように応用できるかというのが次のステップなんです。

 

————————————————————————

● ノイズの無い明瞭な音で収音すれば音声コーパスを作りやすくなる

————————————————————————

——— 先生の研究所では、Microflex Wirelessを活用されていると伺いました。導入のきっかけをおしえていただけますか。

片桐 音声コーパスを作るには、音声情報を正確に文字起こしする必要があるのですが、人力での文字起こしはとても時間がかかります。授業を文字起こしする場合、慣れた私がやっても1クラス4時間くらいかかります。場合によっては、50分の授業を書き起こすだけでも10時間くらいかかってしまいます。なぜそんなに時間がかかるのかと言えば、単純に音質が悪く、聞き取りにくいからなんです。雑音が入っていたり、音がこもっていたり、反響してしまっていたり、複数の人の声が被ってしまっていたり……。同じ発話箇所を何度も聞き返す必要があります。それでもっと良い音で録音する方法はないものかと、大学院時代の恩師に相談してみたところ、“Shureのマイクがおすすめだよ”と教わったんです。それがMicroflex Wirelessを導入したきっかけですね。恩師に教わったときに“Shure”と記したメモは今でも持っています(笑)。

 

——— それまではどのような機材で授業を録音されていたのですか。

片桐 とてもシンプルで、家庭用ビデオ・カメラの内蔵マイクで録音していました。教室の後ろに三脚を立てて。場合によってはピン・マイクを付けてもらうこともあるのですが、休み時間は10分くらいしかないので、その間にセッティングするのは大変なんです。

 恩師にShureさんのマイクのことを教えてもらったのが約3年前のことになるんですが、東京出張が入ったタイミングで、Shureさんのホームページからダメ元で問い合わせてみたんです。そうしたらすぐに、“東京にショールームがあるので、ぜひそこで体験してみてください”という返事がきまして。それでお邪魔して体験させていただいたところ、音声の認識率の高さに驚きました。英語でGoogle Chromeの音声認識をかけてみたのですが、ほぼ完璧に近い精度で英語が変換されるのを見てビックリしました。これは使えるなと思い、導入を決定したという流れです。マイクについてよく分かっていなかったので、性能が良さそうな一番高いものを導入しようと。

 

——— Microflex Wirelessをどのように使用されているかおしえてください。

片桐 授業や実習を録音する際に教室に持ち込んで使用しています。据え置きでの使用を想定した機器だと思うのですが、いろいろな場所で使用したいので、キャリーに詰め込んで録音の度にセットアップして。授業を録音するときは、キャンプに行くような感じです(笑)。ボディパック型の送信機とラベリアマイク、バウンダリーマイクを導入したのですが、学生はみんなラベリアマイクを使っていますね。

 

——— 録音の品質は改善されましたか。

片桐 一昨年の8月末に導入し、翌月の教育実習で使った後、データを整理しているうちにコロナになってしまったので、それほど活用できていないのですが、音がキチンと入っているなと思います。学生たちに訊いても、Shureさんのマイクで録音した方がいい、文字起こしがしやすいと言っていますね。音声認識に関しても、人間よりコンピューターの方がはるかに言葉の認識率が高く、ノイズの無い明瞭な音で収音すれば音声コーパスを作りやすくなるので、Shureさんのマイクが間違いなく役に立つのではないかと思います。コーパスを研究されている先生とお話しする機会があったときに、“音声コーパスを作る際 、私はこういう機材を使っています”とShureさんのクリアな音声を収録するマイク等のシステムのことを紹介しました。そうしたら、同じMicroflex Wirelessのマイクに関しての相談を受けました。その後、私が使用しているものよりもチャンネル数が多いマイクを導入されたようです。(笑)。

 

——— Shureというメーカーに対するイメージをお聞かせください。

片桐 Shureさんについては恩師に教えてもらうまで知らなかったのですが、ショールームでいろいろなマイクを見せていただいて、凄いメーカーなんだなと驚きました。確かマイケル・ジャクソンが使ったマイクも紹介していただいたと思うんですが、スマホに装着できるものとかいろいろな種類のマイクがあって、これは本当に玉手箱だなと。それらを組み合わせれば、凄いことができるんじゃないかなと直感的に思いました。シーリング・マイクにもとても興味があって、この研究を始めたときに、アメリカのオレゴン州のある大学には録音専用の部屋があるという論文を読んだことを思い出しました。天井にマイクが付いていて、部屋のどこで喋っても音を拾ってくれるというものだったと記憶していますが、シーリング・マイクはまさしくその部屋を実現するものだなと。現在、授業のときにしかマイクを使っていませんが、シーリング・マイクが付いた部屋があれば、室内で学生が自由に喋っている会話をデータとして集めることができる。それは凄く貴重なデータで、マイクの指向性が10chあれば、10分会話してもらっただけでも、相当な量のデータを集めることができるわけです。パラレルに起きていることを拾えるマイクとして、シーリング・マイクには非常に興味がありますね。

 

——— 今後、Shureの音声技術に期待することはありますか?

片桐 先日も教え子が大学からかなり離れた地域の学校に転勤になりました。北海道って本当に広いので、Shureさんのスマホ用マイクを使って録音したら、Webアプリ経由で自動的に音声認識やノイズリダクション処理が行われて、データがサーバーに保管されるようになったらいいですね。もしそんなシステムが実現したら、簡単にデータを集められるようになって、私のような研究者はきっと喜ぶのではないかと思います。
 

Shure(シュア)の事例・製品に関するお問い合わせはこちら

 

  • hokkyodai-3.
  • hokkyodai-4.

導入製品

製品名 説明
MXWAPT2 MXWAPT2 1 Microflex Wireless マイクロホンシステム対応の、壁/天井にすっきりとマウントできる2チャンネルワイヤレスアクセスポイントです。
MXW2/SM58 MXW2/SM58 1 Microflex Wireless マイクロホンシステム対応のハンドヘルド送信機
MXW1 MXW1 1 無指向性マイクロホン搭載ハイブリッド ボディパック型送信機およびMicroflex Wireless マイクロホンシステム対応の外部マイクロホン入力
WL185 WL185 1 WL185はMX185のワイヤレスモデルです。
MXW6 MXW6 1 Microflex Wireless マイクロホンシステム対応のバウンダリー型送信機
MXWNCS2 MXWNCS2 1 Microflex Wireless マイクロホンシステム対応の、マイクロホン充電ポートを2基備えた充電ステーション
IntelliMix IntelliMix P300 1 シンプルながらも強力なDSPが、高品質、手軽、費用対効果に優れたビデオ会議アプリケーション向け音声を提供。