JST CREST「共創型音メディア機能拡張」中間シンポジウム 2022

JST CREST共生インタラクション研究領域の研究課題として、共創型音メディア機能拡張プロジェクトに取り組んでいます。研究開始から3年間が経過し、本プロジェクト前半で取り組んできた研究課題について、数多くの研究成果が得られました。本プロジェクト後半を迎えるにあたり、これまでの研究成果を皆様と共有させて頂き、ご意見を頂く場として、CREST共創型音メディア機能拡張シンポジウム2022を開催することに致しました。本シンポジウムを通しまして、ご参加頂く皆様同士の交流、本プロジェクトメンバーとの交流ができる場になればと願っています。

研究代表者 戸田 智基

日時  :2022年12月17日(土)9:30-17:30

会場  :名古屋大学 東山キャンパス ES総合館1階

アクセス:地下鉄名城線 名古屋大学駅 2番出口より徒歩4分(google map

参加登録:本シンポジウムへの参加は無料ですが、下記から事前登録が必要です。

事前登録

参加を予定されている方は、下記のリンクより12月16日までに事前登録をお願いいたします。

本シンポジウムでは、まず、研究代表者と2名の研究分担者が、JST CREST「共創型音メディア機能拡張」プロジェクトの研究成果を紹介する登壇発表を行います。その後、昼休憩をはさみまして、本プロジェクトメンバーが各種研究成果についてポスター発表およびデモ展示を行います。最後には、名古屋工業大学の徳田恵一教授をお招きして、音声合成技術に関する招待講演を行って頂きます。

セッション1(13:00-14:00)


01 発声障害者が再び発話するために

~喉頭摘出者のためのリアルタイム音声強調システムの開発~

小林 和弘(名大)


02 周囲の音も伝える音声変換

~Noisy-to-noisy voice conversion against variations of noisy condition~

Chao Xie (名大)


03 喉頭摘出者の声をより自然な声に

~Electrolaryngeal speech enhancement based on training using synthetic data~

Ding Ma (名大)


04 構音障害があっても普通に話したい

~Speaker identity preservation for dysarthric voice conversion~

Wen-Chin Huang

(名大)


05 音声波形を数式で表現

~Backpropagation-based quasi-harmonic modeling for speech waveform~

Shaowen Chen (名大)


06 いろいろな場所の音をコンピュータが”見て”分析

~音光変換デバイス「ブリンキー」を用いた分散音響センシングフレームワークのEnd-to-End学習~

木下 裕磨

(東海大/都立大)


07 小さな補聴器でも、人の声を聞き取りやすくします

~補聴器応用を目的としたDNN音声強調処理の低演算量化~

春田 智穂

(都立大/リオン株式会社)


08 小型デバイスで低遅延な処理を実現

~リアルタイム音源分離のための低遅延な均一分割畳み込みの評価~

栗城 結衣(都立大)


09 短い時間で音の周波数を調べる

~正弦波拘束微分方程式に基づく複数正弦波の短時間周波数推定~

山田 健太(都立大)


10 大規模データの一部のみを選択して効率よく扱う

~スパース最適化を用いた広範囲の復元誤差基準に対する要素選択~

河村 泰雅(都立大)


11 音声合成器を高速化・軽量化します

~ニューラルネットワークと信号処理を組合せたハイブリットアプローチ~

金子 卓弘

(NTT CS研)


セッション2(14:00-15:00)


12 入力テキストのノイズに強い音声合成

~拡散確率モデルを用いて音声合成を頑健にする~

安田 裕介 (名大)


13 合成音声のカスタマイゼーション

~High quality specific voice synthesis by fine-tuning with few data~

Jingyi Feng (名大)


14 合成音声の良し悪しを推定

~Naturalness score prediction of synthetic speech~

ChengHung Hu (名大)


15 自由に配置できるウェアラブルマイク

~Rotation-robust beamforming with flexibly wearable microphone array~

Shuming Luan (名大)


16 発声の仕組みを考慮した音声波形生成AI

~ピッチ制御可能な高品質音声合成~

米山 怜於 (名大)


17 ギター演奏の耳コピAI

~注意機構とマルチタスク学習を用いた音符単位の押弦ポジション推定~

金 世訓 (名大)


18 頭の向きを変えても聴きたい音だけ取り出せる

~円状マイクロホンアレイの回転移動に追従する音場補間と音源強調~

若林 佑幸

(豊技大/都立大)


19 音から頭の向きを推定

~円状マイクロホンアレイの自己回転角度推定~

連 冠三(都立大)


20 聞こえない場所の音を聞く

~音光変換デバイス「ブリンキー」を用いたスパースなスペクトルの圧縮センシング~

本山 智司(都立大)


21 同時に喋る18人を聞き分ける

~深層生成モデルを用いた多チャンネル音源分離の高性能化・高速化~

李 莉

(名大/NTT CS研)


22 リアルタイムに声の表情を変える

~系列音声変換モデルへの知識蒸留アプローチ~

田中 宏(NTT CS研)


セッション3(15:00-16:00)


23 選択的に聞きたい方向の音だけを聞く

~Direction-aware target speech extraction with dual-channel system~

Rui Wang (名大)


24 簡単に手に入る音で雑音除去AIを学習

~DNN音声強調におけるNoisy-target Trainingの挙動分析~

藤村 拓弥 (名大)


25 好きな曲の好きな要素を選んで曲を検索

~各楽器音に着目した距離学習に基づく楽曲間類似度計算~

橋爪 優果 (名大)


26 人の声をAIが聞き取りやすい声へ

~群論を用いた声道長正規化と音声認識への応用~

宮下 敦志 (名大)


27 カメラで撮り切れない光をより正確に

~音光変換デバイス「ブリンキー」の光信号飽和に頑健な伝達係数と信号の推定~

西田 光佑(都立大)


28 音情報から位置情報へ

~マイクロフォンアレイを用いた複数時間差の同時推定~

山岡 洸瑛(都立大)


29 特別なマイクで混ざった音を聞き分ける

~円状マイクロホンアレイの回転移動に頑健なブラインド音源分離~

中嶋 大志(都立大)


30 少ない計算量で高精度な信号処理を

~アレー信号処理のための瞬時線形次元削減~

植野 夏樹

(都立大/NTT CS研)


31 音をより良く分けるための”音声のAI表現”

~混合信号による符号化器再学習を用いたFastMVAE法に基づく音源分離~

山地 修平(都立大)


32 ひそひそ話して自然に伝える

~ささやき音声への音声変換アプローチ~

関 翔悟(NTT CS研)


33 声の高さと声質を個別に変換する

~情報論的規準による音声のDisentangled表現獲得に向けて~

渡邊 千紘

(NTT CS研)


34 体の動きで感情豊かな歌唱を

~喉頭摘出者のための歌唱支援システムにおける自然な身体動作を利用した歌唱表現付与~

石黒 祥生(名大)


(プログラミングは都合により変更になる場合がありますので予めご了承ください)

展示時間:13:00-16:00

来場者の方に体感して頂ける発声・聴覚機能拡張システムのデモ展示を行います。


発声機能拡張システム:あの人の声で話してみよう

~ Any-to-Many型ノンパラレル&リアルタイム音声変換 ~

丹羽希碩(名大)


歌唱機能拡張に向けて:何オクターブ出せる?

~ 発声機構を加味した深層音声波形生成 ~

米山 怜於(名大


低遅延リアルタイム音源分離システム

(都立大)


円状マイクロホンアレイのリアルタイム自己回転角度推定

(都立大)


音光変換デバイス「ブリンキー」

(都立大)


「音メディアコミュニケーションにおける共創型機能拡張技術の創出」

学術シンポジウムに参加したことがない皆様にも、是非ご参加いただければと願っておりますが、上記の説明だけでは、参加いただく上でわかりにくい点もあるかもしれません。

ご不明な点は遠慮なくcontact@crest-coaugmentation.com宛にご連絡ください。

事前登録

参加を予定されている方は、下記のリンクより12月16日までに事前登録をお願いいたします。

音メディアコミュニケーションにおける共創型機能拡張技術の創出

Copyright © JST CREST CoAugmentation Project, All rights reserved.