2024/08/10 更新

ミズマチ ミツノリ
水町 光徳
MIZUMACHI Mitsunori
Scopus 論文情報  
総論文数: 0  総Citation: 0  h-index: 5

Citation Countは当該年に発表した論文の被引用数

所属
大学院工学研究院 電気電子工学研究系
職名
教授
外部リンク

研究キーワード

  • 音響信号処理

  • 音情報処理

研究分野

  • 情報通信 / 知覚情報処理

出身学校

  • 1995年03月   九州芸術工科大学   芸術工学部   音響設計学科   卒業   日本国

出身大学院

  • 2000年03月   北陸先端科学技術大学院大学   情報科学研究科   情報処理学専攻   博士課程・博士後期課程   修了   日本国

取得学位

  • 北陸先端科学技術大学院大学  -  博士(情報科学)   2000年03月

  • 北陸先端科学技術大学院大学  -  修士(情報科学)   1997年03月

学内職務経歴

  • 2022年12月 - 現在   九州工業大学   大学院工学研究院   電気電子工学研究系     教授

  • 2010年12月 - 2022年11月   九州工業大学   大学院工学研究院   電気電子工学研究系     准教授

学外略歴

  • 2000年04月 - 2004年06月   株式会社国際電気通信基礎技術研究所(ATR)   研究員   日本国

所属学会・委員会

  • 2018年05月 - 2019年05月   電子情報通信学会 基礎・境界ソサイエティ ソサイエティ代表委員   日本国

  • 2017年05月 - 現在   日本音響学会 評議員   日本国

  • 2017年05月 - 2021年05月   日本音響学会 編集委員(会誌部会)   日本国

  • 2017年05月 - 2018年05月   日本音響学会 電気音響研究会 副委員長   日本国

  • 2017年05月 - 2018年05月   電子情報通信学会 応用音響研究会 副委員長   日本国

  • 2016年05月 - 2017年05月   電子情報通信学会 音響・超音波サブソサイエティ 会長   日本国

  • 2016年05月 - 2017年05月   日本音響学会 電気音響研究会 委員長   日本国

  • 2016年05月 - 2017年05月   電子情報通信学会 応用音響研究会 委員長   日本国

  • 2016年05月 - 2017年05月   電子情報通信学会 代議員   日本国

  • 2016年05月 - 2017年05月   電子情報通信学会 基礎・境界ソサイエティ 副会長   日本国

  • 2015年06月 - 2017年05月   電子情報通信学会九州支部会計幹事   日本国

  • 2015年05月 - 2016年05月   日本音響学会 電気音響研究会 副委員長   日本国

  • 2015年05月 - 2016年05月   電子情報通信学会 応用音響研究会 副委員長   日本国

  • 2015年01月 - 2017年05月   電子情報通信学会 Fundamentals Review 編集委員   日本国

  • 2014年04月 - 2016年03月   日本音響学会九州支部会計幹事   日本国

  • 2013年05月 - 2015年05月   日本音響学会 電気音響研究会 幹事   日本国

  • 2013年05月 - 2014年04月   電子情報通信学会 和文A論文誌 小特集号 編集幹事   日本国

  • 2012年05月 - 2015年05月   電子情報通信学会 応用音響研究会 幹事   日本国

  • 2012年04月 - 2014年03月   日本音響学会九州支部評議員   日本国

  • 2005年04月 - 現在   (社)電子情報通信学会   日本国

  • 2005年04月 - 現在   (社)日本音響学会   日本国

  • 2004年04月 - 現在   The Institute of Electrical and Electronics Engineering (IEEE)   アメリカ合衆国

  • 2004年04月 - 現在   The Acoustic Society of America   アメリカ合衆国

▼全件表示

研究経歴

  • 音の主観印象の定量化

    聴覚的印象,モデリング

    研究期間: 2008年06月  -  現在

論文

  • Efficient Frequency Bandwidth Limitation for Wireless-Based Ultrasonic Data Collection Systems 査読有り

    Shigyo Rio, Nobayashi Daiki, Tsukamoto Kazuya, Mizumachi Mitsunori, Ikenaga Takeshi

    信号処理 ( 信号処理学会 )   28 ( 4 )   129 - 132   2024年07月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)

    <p> IoT-based acoustic data collection systems have been proposed for detecting anomalies in mechanical equipment. However, traditional systems using audible sound do not work well due to interference from various sound sources. To solve this problem, we have previously proposed an ultrasonic data collection system, but the clear and high-quality sound required for anomaly detection results in an increase in data volume. This paper proposes a method for extracting only the necessary frequency band based on the periodicity of the target signal, aiming to reduce the amount of data. Our experiments demonstrate that the proposed method efficiently determines the appropriate frequency band in which the characteristics of the target equipment appear, thereby enabling the amount of data to be reduced by more than 45%.</p>

    DOI: 10.2299/jsp.28.129

    CiNii Research

    その他リンク: https://www.jstage.jst.go.jp/article/jsp/28/4/28_129/_pdf

  • 発声時の音環境操作ツールにおける実時間処理とインタフェースの実装について

    河原 英紀, 矢田部 浩平, 松井 淑恵, 程島 奈緒, 水町 光徳, 榊原 健一

    聴覚研究会資料   54 ( 3 )   247 - 252   2024年05月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)

  • Relationship between the Temporal Variation of Fundamental Frequency and Subjective Hoarseness 査読有り 国際誌

    S. Tomimatsu, M. Mizumachi

    Proc. 2024 RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing (NCSP’24)   28AM2-1-5   2024年03月

     詳細を見る

    担当区分:最終著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • An Efficient Method of Frequency Bandwidth Limitation for Wireless-based Ultrasonic Data Collection System 査読有り 国際誌

    R. Shigyo, D. Nobayashi, K. Tsukamoto, M. Mizumachi, T. Ikenaga

    Proc. 2024 RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing (NCSP’24)   28PM2-2-2   2024年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • ヘッドフォン装着時に外耳道入口において収録される信号の内容について

    河原 英紀, 矢田部 浩平, 松井 淑恵, 程島 奈緒, 榊原 健一, 水町 光徳

    聴覚研究会資料   54 ( 2 )   93 - 98   2024年02月

     詳細を見る

    担当区分:最終著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)

  • Contributions of temporal envelope and temporal fine structure to segregation of Lombard speech from background noise 査読有り

    Tamura S., Mizumachi M.

    Acoustical Science and Technology ( 一般社団法人 日本音響学会 )   45 ( 1 )   33 - 44   2024年01月

     詳細を見る

    担当区分:最終著者   記述言語:英語   掲載種別:研究論文(学術雑誌)

    Lombard speech is known to make it easier for listeners to perceive speech signals in the presence of background noise. The aim of this study was to investigate how temporal characteristics such as the temporal envelope and temporal fine structure (TFS) in Lombard speech contribute to improve the segregation of Lombard speech from background noises. In the speech production task, we confirmed that Lombard speech had increased low-frequency amplitude modulations in the temporal envelope and increased frequency modulations in TFS compared to plain speech in frequency ranges covering first and second formants. In a speech perception task, ease of speech segregation was compared between Lombard and plain speech. We also compared ease of segregation of tone-vocoded speech created from Lombard and plain speech to examine the effect of eliminating TFS. We found that Lombard speech with both high amplitude and frequency modulations had improved speech segregation in both original and tone-vocoded speech conditions, but the difference in ease of speech segregation between Lombard and plain speech tended to be larger in original speech than tone-vocoded speech conditions. The present findings suggest that an enhanced envelope is the main contributor to improved segregation of Lombard speech, while increased frequency modulation plays a complementary role.

    DOI: 10.1250/ast.e23.24

    Scopus

    CiNii Research

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85181966313&origin=inward

  • 様々な音響測定用信号を離散フーリエ変換に基づく測定法に用いる際の性能比較

    河原 英紀, 矢田部 浩平, 水町 光徳, 榊原 健一, 北村 達也

    信学技報   EA2023-57   2023年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)

  • Acoustic measurement framework for audio systems based on structured periodic test signals 査読有り 国際誌

    Kawahara H., Yatabe K., Sakakibara K.I., Mizumachi M., Kitamura T.

    GCCE 2023 - 2023 IEEE 12th Global Conference on Consumer Electronics   227 - 228   2023年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    We introduce a framework for acoustic measurement that allows everyday sounds into acoustic measurement test signals and standard test signals such as swept-sine and MLS (Maximum Length Sequence). The framework extends our extended Time-Stretched-Pulse generation method and safeguarding method for any signals to make them appropriate for acoustic measurement. The extension uses the periodic nature of discrete Fourier transform combined with orthogonalization based on the Walsh-Hadamerd matrix. This framework enables simultaneous measurement of acoustic attributes such as linear time-invariant response, signal-dependent non-linear and time-invariant components, and random time-varying components. We also discuss and demonstrate practical scenarios in classes and laboratory lessons using tools developed based on the proposed framework.

    DOI: 10.1109/GCCE59613.2023.10315633

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85179760475&origin=inward

  • Simultaneous Measurement of Multiple Acoustic Attributes Using Structured Periodic Test Signals Including Music and Other Sound Materials 査読有り 国際誌

    Kawahara H., Yatabe K., Sakakibara K.I., Mizumachi M., Kitamura T.

    2023 Asia Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2023   173 - 180   2023年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    We introduce a general framework for measuring acoustic properties such as liner time-invariant (LTI) response, signal-dependent time-invariant (SDTI) component, and random and time-varying (RTV) component simultaneously using structured periodic test signals. The framework also enables music pieces and other sound materials as test signals by “safeguarding” them by adding slight deterministic “noise.” Measurement using swept-sin, MLS (Maxim Length Sequence), and their variants are special cases of the proposed framework. We implemented interactive and real-time measuring tools based on this framework and made them open-source. Furthermore, we applied this framework to assess pitch extractors objectively.

    DOI: 10.1109/APSIPAASC58517.2023.10317411

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85180006417&origin=inward

  • 使える音声資料の作り方を再考する

    河原 英紀, 榊原 健一, 水町 光徳, 矢田部 浩平, 北村 達也, 森勢 将雅

    音声コミュニケーション研究会資料 ( 音声コミュニケーション研究委員会 )   3 ( 4 )   n/a   2023年09月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)

    <p>記録する音声資料をできるだけ価値があるものとする方法を検討している。そのような試みの一つとして、 2019 年に講習会を開催した。しかし、その講習会で紹介した内容の幾つかは、その後の技術の発展と検討により陳腐化しただけではなく、誤りであることが明らかになっている。ここでは、それらの発展と問題について説明し、新しい講習会をどのような内容・形式にすべきか議論したい。</p>

    DOI: 10.60274/asjsc.sc-2023-25

    CiNii Research

  • 使える音声資料の作り方を再考する 準備・録音・分析など

    河原 英紀, 榊原 健一, 水町 光徳, 矢田部 浩平, 北村 達也, 森勢 将雅

    音声コミュニケーション研究会資料   3 ( 4 )   SC-2023-25   2023年09月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)

  • 遠隔異常検知システムのための機器稼働音の周期性に基づいた特徴量抽出の検討

    執行律和, 野林大起, 塚本和也, 水町光徳, 池永全志

    信学技報   IA2023-28   2023年09月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)

  • 音場伝達関数の簡易な測定と臨界距離の推定のための試験信号について

    河原 英紀, 矢田部 浩平, 榊原 健一, 水町 光徳, 北村達也

    聴覚研究会資料   53 ( 6 )   261 - 264   2023年08月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)

  • Subband Optimization of Nonlinear Beamformer with Long Short-Term Memory in Low-Frequency Region 査読有り 国際誌

    M. Mizumachi, K. Nashiro

    Proc. 29th International Congress on Sound and Vibration (ICSV29)   Paper ID: 483   2023年07月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • 音メディアを用いた実験を支援するための対話的測定ツールについて

    河原 英紀, 矢田部 浩平, 榊原 健一, 水町 光徳, 程島 奈緒, 松井 淑恵

    音楽音響研究会資料   42 ( 3 )   41 - 44   2023年07月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)

  • Singing Voice Range Profiling Toolbox with real-time interaction and its application to make recording data reusable 査読有り 国際誌

    H. Kawahara, KI. Sakakibara, K. Yatabe, M. Mizumachi, T. Kitamura

    Proc. Stockholm Music Acoustics Conference 2023 (SMAC 2023)   160 - 166   2023年06月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Relationship between perceptual width of stereo stage and inter-channel cross-correlation 査読有り 国際誌

    M. Mizumachi, T. Horiuchi

    Proc. 154th AES Convention   Express Paper 68   2023年05月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Relationship between the Temporal Variation of Fundamental Frequency and Subjective Hoarseness 査読有り

    S. Tomimatsu, M. Mizumachi

    Proc. ICIAE2023   PS-4   2023年03月

     詳細を見る

    担当区分:最終著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Analysis of Temporal Changes in Prosodic Features of Positive and Negative Emotions in Spontaneous Speech 査読有り

    Y. Aoki, M. Mizumachi

    Proc. ICIAE2023   VS-2   2023年03月

     詳細を見る

    担当区分:最終著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • SUBBAND OPTIMIZATION OF NONLINEAR BEAMFORMER WITH LONG SHORT-TERM MEMORY IN LOW-FREQUENCY REGION 査読有り 国際誌

    Mizumachi M., Nashiro K.

    Proceedings of the International Congress on Sound and Vibration   2023年01月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Acoustic beamforming is essential to achieve signal enhancement, noise reduction, sound source localization, and acoustic imaging in various applications. Traditional beamformers, such as delay-and-sum beamformers, have been designed by linear signal processing and diversified in adaptive filtering, statistical signal processing, and machine learning. Nonlinear beamformers optimized by neural networks have great potential to optimize their beampatterns. The nonlinear beamformer trained with a single sinusoidal signal succeeds in sharpening its beam-pattern at the specific frequency. The authors have proposed a wideband nonlinear beamformer to sharpen the mainlobe in the speech band. It was, however, challenging to achieve a sharp mainlobe in a lower frequency range below 500 Hz with an 8-ch small-scale microphone array. This paper investigates sub-band optimization of the nonlinear beamformer in the lower frequencies. It is confirmed that the nonlinear beamformer with long short-term memory, suitable cell size, and unit number could sharpen the mainlobe without sidelobes in the lower frequency range.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85170649321&origin=inward

  • Relationship between perceptual width of stereo stage and inter-channel cross-correlation 査読有り

    Mizumachi M., Horiuchi T.

    AES Europe 2023: 154th Audio Engineering Society Convention   2023年01月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    It is desirable to properly generate inter-channel crosstalk while reproducing legacy stereo sound sources through earphones and headphones. The authors proposed amplitude-based and phase-based crosstalk generators, of which parameters were perceptually optimized by performing a listening test. The optimal parameters were determined based on the perceptual width of the stereo stage by comparing the proposed method with binaural rendering. This paper investigates the relationship between the perceptual stereo stage width and inter-channel cross-correlation. It is confirmed that the inter-channel cross-correlation has non-linear relation to the perceptual stereo stage width. This result contributes to efficiently optimizing the crosstalk generators without subject evaluation.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85174508475&origin=inward

  • Higher accuracy self-supervised visual odometry with reliable projection 査読有り

    Zhou S., Yang Z., Zhu M., Li H., Serikawa S., Mizumachi M., Zhang L.

    Artificial Life and Robotics   27 ( 3 )   568 - 575   2022年08月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)

    A complex outdoor environment includes variable illuminations, dynamic objects, and occlusion, making visual odometry in outdoor environments remains a challenging problem. This work trains a self-supervised pose estimation network based on the projection between adjacent frames. The pose between two adjacent frames is a 6D vector. It can be better solved with reliable pixels, instead of all the pixels. Thus, only reliable pixels are under consideration when training. This research proposed a boundary mask and inferior projection mask to eliminate the influence of unreliable pixels. Furthermore, we evaluated the proposed method on the KITTI datasets and compared it with other state-of-the-art deep learning-based visual odometry methods. The result shows that the proposed method can detect inferior projection and boundary pixels well. Moreover, it achieves higher accuracy in pose estimation.

    DOI: 10.1007/s10015-022-00766-7

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85131664759&origin=inward

  • Optimization of Nonlinear Beamformer with Long Short-term Memory 査読有り

    M. Mizumachi, S. Arase

    Proc. 28th International Congress on Sound and Vibration (ICSV28)   Paper ID: 707   2022年07月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Perceptual optimization of hybrid stereo width control method compared with loudspeakers reproduction 査読有り 国際誌

    M. Mizumachi, Y. Ueno, T. Horiuchi

    Proc. 152nd AES Convention   Paper Number: 10571   2022年05月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Perceptual optimization of stereo width shrinkage method in headphone reproduction 査読有り

    Ueno Y., Mizumachi M., Horiuchi T.

    Acoustical Science and Technology ( 一般社団法人 日本音響学会 )   43 ( 2 )   170 - 172   2022年03月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(学術雑誌)

    DOI: 10.1250/ast.43.170

    Scopus

    CiNii Article

    CiNii Research

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85125730029&origin=inward

  • 特集―高臨場感オーディオ―誌上座談会

    安藤 彰男, 小澤 賢司, 亀川 徹, 中原 雅考, 西口 正之, 青木 秀一, 杉本 岳大, 水町 光徳

    日本音響学会誌 ( 一般社団法人 日本音響学会 )   78 ( 3 )   108 - 113   2022年03月

     詳細を見る

    担当区分:最終著者   記述言語:日本語   掲載種別:記事・総説・解説・論説等(学術雑誌)

    DOI: 10.20697/jasj.78.3_108

    CiNii Research

  • Inter-channel Cross-correlations of Stereo Width Shrinkage Methods Based on Amplitude and Phase Differences 査読有り

    Y. Ueno, M. Mizumachi, T. Horiuchi

    Proc. ICIAE2022   VS2-2   2022年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Investigation of Suitable Training Conditions for Nonlinear Beamformer 査読有り

    S. Arase, M. Mizumachi

    Proc. ICIAE2022   PS-2   2022年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • 音声収録におけるスマートデバイスなどを用いた音圧較正の検討

    河原 英紀, 榊原 健一, 水町 光徳, 北村 達也

    音声コミュニケーション研究会資料 ( 音声コミュニケーション研究委員会 )   2 ( 1 )   n/a   2022年01月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)

    <p>音声研究のための利用価値の高い音声素材の収録のためには、収録の物理的条件を記録する必要がある。 録音系の音圧較正は、そのための出発点となる重要なステップである。ここでは、広く普及しているスマートデバイスを用いた較正の可能性についての検討状況について報告する。日常の環境において適切な較正を行うためには、機器そのものとあわせて、実施可能な手順と、それらに伴う誤差を把握しておく必要がある。ここでは、デジタルデバイスと離散時間系の信号処理の特徴を活かした、幾つかの方法について紹介する。</p>

    DOI: 10.60274/asjsc.sc-2022-1

    CiNii Research

  • Perceptual optimization of hybrid stereo width control method compared with loudspeakers reproduction 査読有り

    Mizumachi M., Ueno Y., Horiuchi T.

    AES Europe Spring 2022 - 152nd Audio Engineering Society Convention 2022   236 - 240   2022年01月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Legacy stereo music sources cause unnatural spatial impressions through the earphones and headphones reproduction due to the lack of crosstalk, which is naturally produced in loudspeakers reproduction. The amplitude-based and phase-based hybrid stereo width control method is proposed to generate the crosstalk components between channels in headphones reproduction. The control parameters for both the previously-proposed amplitude-based and hybrid methods are perceptually optimized compared with the loudspeaker reproduction. Suitable parameter values are successfully obtained for both methods with classical music sources. It is confirmed that the suitable parameter values have a different trend in those methods depending on the music sources.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85136323424&origin=inward

  • OPTIMIZATION OF NONLINEAR BEAMFORMER WITH LONG SHORT-TERM MEMORY 査読有り

    Mizumachi M., Arase S.

    Proceedings of the International Congress on Sound and Vibration   2022年01月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Nowadays, increasing demand for teleworking needs audio capturing systems that can suppress noises and emphasize the target speech. Beamforming, which achieves spatial filtering using a microphone array, is one of the widely-used techniques for speech enhancement and noise suppression. The state-of-the-art nonlinear beamformers are designed with neural networks. In this study, the neural network with the Long Short-Term Memory as a recursive neural network is employed for dealing with acoustic signals as time series. In this study, the proposed beamformer using the neural network is optimized based on the frequency characteristics of the training data and the results of objective evaluation. The training data were prepared using an 8-ch small-scale microphone array with 10 mm microphone spacing in a soundproofed room. The experimental results show that the training data, which consist of the mixture of 1 kHz and 4 kHz sinusoidal signals, achieve suppressing noises coming from non-target directions and enhancing the target signal with low distortion.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85149853200&origin=inward

  • A Method to Automatic Create Dataset for Training Object Detection Neural Networks 査読有り

    Zhou S., Yang Z., Zhu M., Li H., Serikawa S., Mizumachi M., Zhang L.

    IEEE Access   10   80505 - 80517   2022年01月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)

    Numerous high-accuracy neural networks for object detection have been proposed in recent years. Creating a specific training dataset seems to be the main obstacle in putting them into practice. This paper aims to overcome this obstacle and proposes an automatic dataset creation method. This method first extracts objects from the source images and then combines them as synthetic images. These synthetic images are annotated automatically using the data flow in the process and can be used directly for training. To the best of our knowledge, this is the first automatic dataset creation method for object detection tasks. In addition, the adaptive object extraction method and created natural synthetic images make the proposed method maintain strong adaptation and generalization ability. To validate the feasibility, a dataset that includes 44 categories of objects is created for the object detection task in a vending supermarket. Under the strictest metric AP75, both the trained EfficientDet and YOLOv4 achieve higher than 95% in accuracy on the common difficulty testing set and higher than 90% in accuracy on the high difficulty testing set.

    DOI: 10.1109/ACCESS.2022.3195490

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85135766558&origin=inward

  • 公共空間の音声明瞭度を改善するEGG解析に基づく話者指標の検討

    程島 奈緒, 榊原 健一, 水町 光徳

    日本音響学会春季研究発表会講演論文集   -   1123 - 1124   2022年01月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)

    CiNii Research

  • Study of Ultrasonic Data Collection System for Anomaly Detection for Mechanical Equipment 査読有り 国際誌

    Shigyo R., Nobayashi D., Tsukamoto K., Mizumachi M., Ikenaga T.

    Proceedings - 2022 International Conference on Computational Science and Computational Intelligence, CSCI 2022   1237 - 1238   2022年01月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    loT-based acoustic data collection systems have been proposed for detecting anomalies in equipment. However, such systems do not work well in outdoor environments due to interference caused by various sound sources (e.g., wildlife sounds and traffic noise). Outdoor noise has unique frequency characteristics, with energy localized in the low-frequency domain. In contrast, mechanical equipment such as motors mainly generates harmonics, including ultrasonic components, during operation. This paper proposes a noise-robust ultrasonic data collection system for outdoor use. To reduce the size of collected data, which increases in proportion to the sampling frequency, the proposed system uses bandpass filtering and data compression.

    DOI: 10.1109/CSCI58124.2022.00222

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85172008371&origin=inward

  • Hardware Development of Color Image Contrast Enhancement by High-level Synthesis 査読有り

    Yamawaki A., Mizumachi M., Serikawa S.

    TENSYMP 2021 - 2021 IEEE Region 10 Symposium   2021年08月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    To realize image processing as hardware module is an effective way to achieve high performance and low power processing. However, hardware development is a heavy burden for software engineer handling image processing usually. High-level synthesis, HLS, converting software program to hardware automatically is a desirable technology for software engineer with less skill of hardware design. On the other hand, the HLS has a significant problem such as it tends to generate a large and low performance hardware when the software program input has never consideration of hardware organization. This paper, focusing on color image contrast enhancement based on histogram equalization, investigates software description methods considering hardware to make HLS generate a good hardware module with high-performance and low power.

    DOI: 10.1109/TENSYMP52854.2021.9550810

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85117467339&origin=inward

  • Non-linear beamformer with long short-term memory network 査読有り 国際誌

    M. Mizumachi, R. Oka

    Proc. Inter-noise 2021   2021年08月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Power-saving Reproduction Algorithm for Speech Signals 査読有り

    M. Nakagawara, M. Mizumachi

    Journal of the Institute of Industrial Applications Engineers   9 ( 3 )   97   2021年07月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)

    DOI: 10.12792/jiiae.9.97

  • Performance evaluation of the nonlinear beamformer with the small-scall mems microphone array 査読有り 国際誌

    M. Mizumachi, R. Oka

    Proc. 27th International Congress on Sound and Vibration (ICSV27)   2021年07月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Stereo Matching Based on Features of Image Patch 査読有り

    S. Zhou, H. Li, M. Zhu, Z. Li, M. Mizumachi, L. Zhang

    Journal of the Institute of Industrial Applications Engineers   9 ( 3 )   91   2021年07月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)

    DOI: 10.12792/jiiae.9.91

  • Self-supervised monocular depth estimation with occlusion mask and edge awareness 査読有り 国際誌

    S. Zhou, M. Zhu, Z. Li, H. Li, M. Mizumachi, L. Zhang

    Artificial Life and Robotics   26 ( 3 )   354 - 359   2021年05月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)

    Depth estimation is one of the basic and important tasks in 3D vision. Recently, many works have been done in self-supervised depth estimation based on geometric consistency between frames. However, these research works still have difficulties in ill-posed areas, such as occlusion areas and texture-less areas. This work proposed a novel self-supervised monocular depth estimation method based on occlusion mask and edge awareness to overcome these difficulties. The occlusion mask divides the image into two classes, making the training of the network more reasonable. The edge awareness loss function is designed based on the edge obtained by the traditional method, so that the method has strong robustness to various lighting conditions. Furthermore, we evaluated the proposed method on the KITTI datasets. The occlusion mask and edge awareness are both beneficial to find corresponding points in ill-posed areas.

    DOI: 10.1007/s10015-021-00685-z

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85106505382&origin=inward

  • Perceptual optimization of stereo width control methods in headphones 査読有り 国際誌

    Y. Ueno, M. Mizumachi, T. Horiuchi

    Proc. 150th AES Convention ( Audio Engineering Society )   Paper Number: 10480   2021年05月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Proposal of Speed-Up Method for Pulse Type of Digital Switch and Expansion of Application Scope to Them 招待有り 査読有り

    R. Iwaizono, M. Mizumachi, S. Serikawa

    Proc. ICIAE 2021   VS-6   2021年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Proposal of a Digital Switch for Easy Changes of Number and Types 招待有り 査読有り

    R. Iwaizono, M. Mizumachi, S. Serikawa

    Proc. ICIAE 2021   VS-3   2021年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • [Keynote Lecture] Acoustic Signal Extraction Relying on Spatial Cues 招待有り

    M. Mizumachi

    Proc. ICIAE 2021   KS-1, Keynote Lecture   2021年03月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Sharpening Directivity of Beamforming based on Neural Networks using Virtual Observations 査読有り

    Kanekiyo Y., Mizumachi M., Miyazaki R.

    2021 IEEE 10th Global Conference on Consumer Electronics, GCCE 2021   512 - 513   2021年01月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Beamforming based on neural networks (NN) has been proposed as nonlinear beamforming. This method improves the performance with more microphones, but it may not be possible to easily increase the number of microphones due to hardware restrictions. Therefore, we focus on virtual observation, which is an estimation of the signal observed at a location where the microphone is not actually placed, using only actual observations. In this paper, we propose to apply virtual observation to NN-based beamforming. From the evaluation experiment, we confirmed that the proposed method can obtain sharper directivity than the case of using only actual microphones.

    DOI: 10.1109/GCCE53005.2021.9621789

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85123489127&origin=inward

  • Performance evaluation of the nonlinear beam-former with small-scale mems microphone array 査読有り 国際誌

    Mizumachi M., Oka R.

    "Advances in Acoustics, Noise and Vibration - 2021" Proceedings of the 27th International Congress on Sound and Vibration, ICSV 2021   2021年01月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Beamforming has been one of the most important techniques in noise reduction under adverse acoustic environments. Traditional beamformers were designed in analytical and adaptive schemes. On the other hand, recent neural network-based beamformers achieve great success in signal enhancement. The authors have also proposed a broadband neural network-based beamformer, which can deal with wideband speech signals. The proposed beamformer employs the long short-term memory to model the temporal relationship among multichannel observations. The performance of the proposed beamformer has been confirmed with an 8-ch small-scale linear microphone array, of which the spacing between neighbouring microphones is 10 mm. It is confirmed that the proposed nonlinear beamformer could sharpen the mainlobe and decrease the sidelobes, although an analytical linear beamformer, that is, delay-and-sum beamformer, could not achieve signal enhancement with the small-scale microphone array.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85117473124&origin=inward

  • Perceptual optimization of stereo width control methods in headphones 査読有り 国際誌

    Ueno Y., Mizumachi M., Horiuchi T.

    150th Audio Engineering Society Convention, AES 2021   2021年01月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Legacy 2-ch stereo music sources cause unnatural spatial impressions through earphones and headphones reproduction due to the lack of the crosstalk produced in loudspeakers reproduction. Perceptual widths of the stereo stage in amplitude-based and phase-based stereo width control methods for headphones reproduction were matched with that of the binaural rendering which simulates loudspeakers reproduction. Paired comparison between the stereo width control methods and binaural rendering was carried out to achieve the perceptual optimization for classic, jazz, and pop music sources. Concerning the amplitude-based stereo width control method, the suitable parameter value for each sound source could be determined from the results of the listening test. It is also found that the phase-based stereo width control method should be optimized in different parameter spaces.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85113887802&origin=inward

  • Non-linear beamformer with long short-term memory network 査読有り 国際誌

    Mizumachi M., Oka R.

    Proceedings of INTER-NOISE 2021 - 2021 International Congress and Exposition of Noise Control Engineering   2021年01月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Acoustic beamforming with a microphone array enables spatial filtering in a wide frequency range. It is a challenging issue to sharpen the mainlobe in the lower frequency region with a small-scale microphone array, of which the number and spacing of microphones are small. A neural network-based non-linear beamformer achieves a breakthrough in sharpening the main-lobe. The non-linear beamforming works well for the narrowband signals but is weak in wideband beamforming. The nonlinear beamforming with the long short-term memory is proposed to deal with wideband speech signals. The long short-term memory network is trained in the recurrent neural network architecture with the sequence of audio data such as speech signals. The performance of the proposed beamformer is confirmed using a small-scale 8-ch MEMS microphone array, where eight microphones are linearly arranged with the neighboring spacing of 10 mm, under a real environment. The beam-pattern of the proposed non-linear beamformer succeeds in sharpening the main-lobe although the linear delay-and-sum beamformer could not achieve frequency selectivity. The feasibility of the proposed beamformer is also confirmed in speech enhancement.

    DOI: 10.3397/IN-2021-2673

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85117405196&origin=inward

  • Interactive and real-time acoustic measurement tools for speech data acquisition and presentation: Application of an extended member of time stretched pulses 査読有り

    Kawahara H., Yatabe K., Sakakibara K.I., Mizumachi M., Morise M., Banno H., Irino T.

    Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH   3   2197 - 2198   2021年01月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Objective measurements of speech data acquisition and presentation processes are crucial for assuring reproducibility and reusability of experimental results and acquired materials. We introduce setting and measurement examples of those conditions using an interactive and real-time acoustic measurement tool based on an extended time-stretched pulse. We also introduce supporting tools.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85119206055&origin=inward

  • Development of a Wireless Communication System for Reliable Acoustic Data Collection Toward Anomaly Detection in Mechanical Equipment 査読有り 国際誌

    Takano C., Fujino S., Nobayashi D., Tsukamoto K., Mizumachi M., Ikenaga T.

    Proceedings - 2021 International Conference on Computational Science and Computational Intelligence, CSCI 2021   1544 - 1547   2021年01月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    With the recent proliferation of Internet of Things (IoT) devices that can send and receive data via wireless communication, we are able to monitor and operate these devices remotely. An example of an IoT system using wireless communication is a system for anomaly detection in mechanical equipment using acoustic data. In order to detect anomalies using acoustic data, continuous recording is essential, thereby increasing the data size. Although Wi-Fi networks provide high-capacity data transfer, performance degradation cannot be avoided due to reasons such as packet losses caused by collisions with data from other devices using the same frequency and the increase in distance between two communicating devices. In the present study, we developed a wireless communication system for reliable acoustic data collection for anomaly detection in mechanical equipment. First, as preliminary experiments, we investigated the communication characteristics for the transmission of large-size data by Wi-Fi in indoor and outdoor environments. The results indicated the communication performance was insufficient for transferring all recorded data handled by this system. Therefore, we developed a simple heuristic transmission timing control method and a method that can reduce the amount of transmission data in order to realize a stable acoustic data collection system. Finally, through demonstration experiments using mechanical equipment in the field, we verified the feasibility of the acoustic data collection system.

    DOI: 10.1109/CSCI54926.2021.00300

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85133931264&origin=inward

  • Simultaneous measurement of time-invariant linear and nonlinear, and random and extra responses using frequency domain variant of velvet noise 査読有り

    Kawahara H., Sakakibara K.I., Mizumachi M., Morise M., Banno H.

    2020 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2020 - Proceedings   174 - 183   2020年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    We introduce a new acoustic measurement method that can measure the linear time-invariant response, the nonlinear time-invariant response, and random and time-varying responses simultaneously. The method uses a set of orthogonal sequences made from a set of unit FVNs (Frequency domain variant of Velvet Noise), a new member of the TSP (Time Stretched Pulse). FVN has a unique feature that other TSP members do not. It is a high degree of design freedom that makes the proposed method possible without introducing extra equipment. We introduce two useful cases using two and four orthogonal sequences and illustrates their use using simulations and acoustic measurement examples. We developed an interactive and realtime acoustic analysis tool based on the proposed method. We made it available in an open-source repository. The proposed response analysis method is general and applies to other fields, such as auditory-feedback research and assessment of sound recording and coding.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85100949390&origin=inward

  • Performance evaluation of power-saving audio reproduction 査読有り 国際誌

    M. Mizumachi, T. Nakashima, M. Nakagawara

    Proc. E-Forum Acousticum 2020   Paper ID: 321   2020年12月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • [Keynote Lecture] Acoustic Beamforming for Selective Listening Under Noisy Environments 招待有り 査読有り

    M. Mizumachi

    Proc. 4th International Conference on Technology and Social Science (ICTSS2020)   IPS-12 Keynote Lecture   2020年12月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Perceptual Evaluation of Power-saving Audio Playback Algorithm Based on Auditory Characteristics 招待有り 査読有り

    M. Nakagawara, M. Mizumachi

    Proc. 4th International Conference on Technology and Social Science (ICTSS2020)   IPS-12-04   2020年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Comparison of Subjective Characteristics Between Binaural Rendering and Stereo Width Control Method 招待有り 査読有り

    Y. Ueno, M. Mizumachi, T. Horiuchi

    Proc. 4th International Conference on Technology and Social Science (ICTSS2020)   IPS-12-03   2020年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Proposal of Digital Touch Panel Switch for Easy Addition and Deletion of Panels 招待有り 査読有り

    R. Iwaizono, M. Mizumachi, S. Serikawa

    Proc. 4th International Conference on Technology and Social Science (ICTSS2020)   IPS-12-01   2020年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • 利用価値の高い音声データの録音手順 招待有り 査読有り

    榊原 健一, 河原 英紀, 水町 光徳

    日本音響学会誌 ( 一般社団法人 日本音響学会 )   76 ( 6 )   343 - 350   2020年06月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)

    DOI: 10.20697/jasj.76.6_343

    CiNii Article

    CiNii Research

    その他リンク: https://ci.nii.ac.jp/naid/130007948445

  • Relationship between objective and subjective evaluation of heavily-distorted speech signals 査読有り 国際誌

    M. Mizumachi

    Proc. 12th Speech in Noise Workshop   P-19   2020年01月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Perceptual evaluation of binaural rendering and stereo width control in headphone reproduction 査読有り

    Ueno Y., Mizumachi M., Horiuchi T.

    148th Audio Engineering Society International Convention   2020年01月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Two-channel stereophonic sound reproduction is one of the most important issues in audio engineering. Most of stereo music sources, however, cannot naturally reproduce spatial impression through earphones and headphones. In this study, stereo sources are converted by either binaural rendering or stereo width control. The former convolves head-related impulse responses into the original stereo sources, and the latter shrinks the perceptual spatial width by adding the monaural signal. Perceptual differences in between the above methods are investigated on several spatial attributes. It is confirmed that the binaural rendering is suited to reproduce the spatial impression related to the whole sound field and the stereo width control is suitable for naturally characterizing the spatial attributes for individual sound sources.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85091558861&origin=inward

  • Frequency domain variant of velvet noise and its application to acoustic measurements 査読有り 国際誌

    H. Kawahara, K. Sakakibara, M. Mizumachi, H. Banno, M. Morise, and T. Irino

    Proc. APSIPA ASC 2019   2019年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Frequency domain variant of Velvet noise and its application to acoustic measurements 査読有り 国際誌

    Kawahara H., Sakakibara K.I., Mizumachi M., Banno H., Morise M., Irino T.

    2019 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2019   1523 - 1532   2019年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    We propose a new family of test signals for acoustic measurements such as impulse response, nonlinearity, and the effects of background noise. The proposed family complements difficulties in existing families, the Swept-Sine (SS), pseudo-random noise such as the maximum length sequence (MLS). The proposed family uses the frequency domain variant of the Velvet noise (FVN) as its building block. An FVN is an impulse response of an all-pass filter and yields the unit impulse when convolved with the time-reversed version of itself. In this respect, FVN is a member of the time-stretched pulse (TSP) in the broadest sense. The high degree of freedom in designing an FVN opens a vast range of applications in acoustic measurement. We introduce the following applications and their specific procedures, among other possibilities. They are as follows. a) Spectrum shaping adaptive to background noise. b) Simultaneous measurement of impulse responses of multiple acoustic paths. d) Simultaneous measurement of linear and nonlinear components of an acoustic path. e) Automatic procedure for time axis alignment of the source and the receiver when they are using independent clocks in acoustic impulse response measurement. We implemented a reference measurement tool equipped with all these procedures. The MATLAB source code and related materials are open-sourced and placed in a GitHub repository.

    DOI: 10.1109/APSIPAASC47483.2019.9023247

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85082395969&origin=inward

  • Neural Network-based Broadband Beamformer with Less Distortion 査読有り

    M. Mizumachi

    Proc. International Congress on Acoustics (ICA 2019)   2019年09月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Kyutacar

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85073037682&origin=inward

  • Neural network-based direction-of-arrival estimation with cross correlation function 査読有り

    Mizumachi M., Okita K.

    Proceedings of the 26th International Congress on Sound and Vibration, ICSV 2019   2019年07月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    © Proceedings of the 26th International Congress on Sound and Vibration, ICSV 2019. All rights reserved. Direction-of-arrival (DOA) estimation has been one of the important issues in acoustic signal processing. It is well known that the DOA can be estimated based on the cross correlation with stereo observations. It is, however, difficult to accurately estimate the DOA because the cross correlation-based function could not yield the sharp spatial feature. On the other hand, the multiple signal classification (MUSIC) algorithm provides the pointed spatial feature but it requires the exact number of sound sources in advance. In this paper, the cross correlation-based spatial feature is sharpened using a neural network. The neural network is trained using the cross correlation-based spatial feature calculated from the stereo observations and the binary teacher signals. It is confirmed that the non-linear cross correlation-based spatial feature has an extremely sharp peak at the direction of the target sound source without the information on the number of sound sources

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85073037682&origin=inward

  • Performance evaluation of a neural network-based beamformer with a small-scale microphone array 査読有り

    M. Mizumachi,K. Eguchi

    Inter-noise   2019年06月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Proposal of power-saving audio playback algorithm based on auditory masking 査読有り

    Nakashima T., Nakagawara M., Mizumachi M.

    AES 146th International Convention   2019年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    © 2019 The Audio Engineering Society (AES). All rights reserved. Power consumption is an important issue while listening to music using portable audio devices. The authors have previously proposed a power-saving audio playback algorithm, which has adjusted filter-bank outputs according to our auditory characteristics. It succeeds in reducing power consumption but causes perceptual distortion. In this paper, the power-saving audio playback algorithm is improved based on auditory masking, which attenuates audio components below the masking threshold. As a result of a listening test, it is confirmed that the proposed method is subjectively superior to the previous method with the same power consumption.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85067129142&origin=inward

  • Neural network-based direction-of-arrival estimation with cross correlation function 査読有り

    Mizumachi M., Okita K.

    Proceedings of the 26th International Congress on Sound and Vibration, ICSV 2019   2019年01月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Direction-of-arrival (DOA) estimation has been one of the important issues in acoustic signal processing. It is well known that the DOA can be estimated based on the cross correlation with stereo observations. It is, however, difficult to accurately estimate the DOA because the cross correlation-based function could not yield the sharp spatial feature. On the other hand, the multiple signal classification (MUSIC) algorithm provides the pointed spatial feature but it requires the exact number of sound sources in advance. In this paper, the cross correlation-based spatial feature is sharpened using a neural network. The neural network is trained using the cross correlation-based spatial feature calculated from the stereo observations and the binary teacher signals. It is confirmed that the non-linear cross correlation-based spatial feature has an extremely sharp peak at the direction of the target sound source without the information on the number of sound sources

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85084016380&origin=inward

  • Neural network-based broadband beamformer with less distortion 査読有り

    Mizumachi M.

    Proceedings of the International Congress on Acoustics   2019-September   2760 - 2764   2019年01月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Beamforming has been one of the important issues in the field of multi-channel signal processing including acoustic signal processing. A wide variety of beamformers have been proposed for each application. In general, acoustic beamforming deals with broadband signals such as speech signals compared to narrowband beamforming for antenna array and radar applications. Recently, neural network-based non-linear beamformers become popular but have a problem that causes an annoying non-linear distortion on the output signal. In the case of speech enhancement, it is a serious problem because our auditory system is highly sensitive to artificial non-linear distortion on speech signals. This paper proposes to solve the problem with the relaxed dual cost functions in the neural network-based beamformer for speech enhancement. The primary cost function aims at sharpening the beam-pattern, and the second cost function is introduced to achieve decreasing speech distortion. Those cost functions are alternatively used for optimizing the beam-pattern in the frequency range of speech signals. The feasibility of the proposed method is confirmed by carrying out a listening test.

    DOI: 10.18154/RWTH-CONV-239926

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85095154960&origin=inward

  • Neural network-based beamformer with dual cost functions 査読有り

    M. Mizumachi,K. Eguchi

    Proc. WESPAC   2018年11月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Noise Reduction using Neural Network Trained with Amplitude Spectra 査読有り

    M. Mizumachi,R. Otani

    Inter-noise   2018年08月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • What is speech intelligibility? 査読有り

    M. Mizumachi

    Proc. 25th International Congress on Sound and Vibration (ICSV25)   2018年07月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Power Saving Audio Playback Algorithm Based on Auditory Characteristics 査読有り

    M. Mizumachi, W. Kubota, M. Nakagawara

    Proc. AES 144th Convention   Paper No. 9933   2018年05月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Noise reduction using neural network trained with amplitude spectra 査読有り

    Mizumachi M., Otani R.

    INTER-NOISE 2018 - 47th International Congress and Exposition on Noise Control Engineering: Impact of Noise Control Engineering   2018年01月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    © INTER-NOISE 2018 - 47th International Congress and Exposition on Noise Control Engineering: Impact of Noise Control Engineering. All rights reserved. Noise reduction has been one of the most important issues in acoustic signal processing. There are a wide variety of techniques to enhance the target signal and reduce interference. In recent days, neural network-based approaches achieve a great noise reduction performance. The authors have also proposed a neural network-based beamformer, that is, an autoencoder in the temporal domain. Channel-dependent waveforms obtained by an 8-ch linear microphone array were prepared as training data. It succeeds in forming a sharp main-lobe and suppressing side-lobes when the interference comes from the direction away from the target direction. Its performance drops when the direction of the interference is near that of the target signal. In this paper, the neural network-based beamformer is trained with amplitude spectra of the harmonic signals such as musical instruments. In other words, phase information is not used for noise reduction. The performance of the proposed method is evaluated based on signal-to-noise ratio and spectral distortion. The proposed method has an advantage in noise reduction for interferences, of which arrival directions are close to the target direction.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85059360819&origin=inward

  • What is speech intelligibility? 査読有り

    Mizumachi M.

    25th International Congress on Sound and Vibration 2018, ICSV 2018: Hiroshima Calling   6   3633 - 3636   2018年01月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Copyright © (2018) by International Institute of Acoustics & Vibration. All rights reserved. Speech intelligibility is an important factor but is partly considered for each purpose. The intelligibility of clean speech is difficult to be quantified, although the speech intelligibility indexes in noisy and reverberant environments are widely standardized. In this study, the relationship between the vowel space and subjective impressions is investigated for Japanese five vowels. The vowel space, that is the pentagon defined by the first and second formant frequencies, is considered in the Equivalent Rectangular Bandwidth scale, which is an auditory-oriented, non-linear frequency scale. Concerning the subjective evaluation, a listening test is carried out with five grade scale on subjective fluency and so on. It is found that the skewness of the vowel space is highly correlated with the subjective fluency of vowels.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85058781649&origin=inward

  • Power saving audio playback algorithm based on auditory characteristics 査読有り

    Mizumachi M., Kubota W., Nakagawara M.

    144th Audio Engineering Society Convention 2018   2018年01月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    © 2018 Audio Engineering Society. All Rights Reserved. Music appreciation can be achieved with a variety of manners such as smartphones, portable music players, car audio, and high-end audio systems. Power consumption is one of the important issues for portable electronic devices and electric vehicles. In this paper, a power saving audio playback algorithm is proposed in restraint of perceptual distortion. An original music source is passed through filterbanks and is reconstructed after increasing or decreasing the narrow-band component in each channel. The channel-dependent manipulation is carefully done not to cause perceptual distortion. The feasibility of the proposed method is evaluated by both measuring consumption current while music playback and carrying out a listening test.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85050035197&origin=inward

  • Relationship among speech intelligibility and non-parametric distortion measures under various noise conditions 査読有り

    M. Mizumachi, Y. Moriyama

    Proc. Inter-noise   Paper ID: 1324   2017年08月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Non-linear broadband beamformer with deep neural network 査読有り

    M. Mizumachi, M. Origuchi, and Y. Nishijima

    Proc. 24th International Congress on Sound and Vibration (ICSV24)   Paper ID: 873   2017年07月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • 音響・超音波研究がひらいた今日の生活と今後の展望

    水町 光徳

    電子情報通信学会誌 ( 電子情報通信学会 )   100 ( 6 )   419 - 423   2017年06月

     詳細を見る

    担当区分:責任著者   記述言語:日本語   掲載種別:記事・総説・解説・論説等(その他)

  • 加齢による聴力低下と発話変化の相互作用 招待有り 査読有り

    水町 光徳

    日本音響学会誌   73 ( 5 )   297 - 302   2017年05月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(学術雑誌)

  • Discussion on Subjective Characteristics of High Resolution Audio 査読有り

    M. Mizumachi, R. Yamamoto, K. Niyada

    Proc. AES 142nd Convention   EB02-07   2017年05月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Relationship among speech intelligibility and non - Parametric distortion measures under various noise conditions 査読有り

    Mizumachi M., Moriyama Y.

    INTER-NOISE 2017 - 46th International Congress and Exposition on Noise Control Engineering: Taming Noise and Moving Quiet   2017-January   2017年01月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    © 2017 Institute of Noise Control Engineering. All rights reserved. Speech intelligibility under noisy environments is one of important issues in noise control engineering. It is necessary to subjectively evaluate speech intelligibility, although listening tests require enormous time and costs. Then, objective speech distortion measures have been investigated with parametric models under noisy environments. It is, however, difficult to design an all-purpose parametric distortion measure for severely distorted speech. This study aims at investigating the relationship among subjective speech intelligibility and non-parametric speech distortion measures. The non-parametric distortion measures include signal-to-noise ratio, spectral distortion, and cepstral distortion, which are calculated in each short-term frame. The spectral distortion is prepared in each octave frequency band. The short-term distortion measures yield the means and standard deviations of speech distortion. Multiple linear regression analyses are carried out, where the speech intelligibility and the objective distortion parameters are dependent and independent variables, respectively. The signal-to-noise ratio dominated speech intelligibility as expected. It is also confirmed that speech intelligibility was strongly influenced by the temporal variation of the cepstral distortion under non-stationary noise conditions.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85042060858&origin=inward

  • Non-linear broadband beamformer with deep neural network 査読有り

    Mizumachi M., Origuchi M., Nishijima Y.

    24th International Congress on Sound and Vibration, ICSV 2017   2017年01月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Speech enhancement is indispensable for human-to-machine speech interfaces, because speech signals are extremely fragile against acoustical interferences. Spatial filtering, that is, beamforming, is one of the popular solutions using multiple microphones. In the case of linear beamformers, a number of microphones are required to make the main lobe sharp at the desired direction. On the other hand, non-linear beamformers efficiently form the sharp main lobe compared with the linear beamformers. Kobatake et al. proposed a pioneering non-linear beamformer with a neural network. This method considered the narrowband optimization of the network structure, and succeeded in both achieving a sharper main lobe and decreasing grating lobes. Narrowband nonlinear beamformers have been steadily developed in the field of antenna and propagation. In this paper, a non-linear broadband beamformer with a deep neural network is proposed for speech enhancement. The proposed beamformer substitute a deep neural network for a conventional neural network, and non-equally-spaced microphone arrangement is employed for making grating lobes disappear. It is confirmed that the proposed beamformer can achieve ideal beam-pattern under a real environment.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85029461029&origin=inward

  • 加齢による聴力低下と発話変化の相互作用 招待有り 査読有り

    水町 光徳

    日本音響学会誌 ( 一般社団法人 日本音響学会 )   73 ( 5 )   297 - 302   2017年01月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:日本語   掲載種別:記事・総説・解説・論説等(学術雑誌)

    DOI: 10.20697/jasj.73.5_297

    CiNii Article

    CiNii Research

  • Advanced delay-and-sum beamformer with deep neural network 査読有り

    M. Mizumachi and M. Origuchi

    Proc. 22nd International Congress on Acoustics (ICA2016)   Paper ID: 696   2016年09月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Speech intelligibility under in-car distant-talking environments 査読有り

    Mizumachi M., Takuma S., Ohsugi I., Hamada Y., Nishi K.

    Proceedings of the INTER-NOISE 2016 - 45th International Congress and Exposition on Noise Control Engineering: Towards a Quieter Future   389 - 393   2016年08月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    © 2016, German Acoustical Society (DEGA). All rights reserved. Speech intelligibility has been widely investigated for various purposes. Hands-free speech communication without any close-talking microphone becomes popular inside a vehicle for the safety reason. It is necessary to carefully install microphones so that speech signals are clearly captured under noisy in-vehicle environments. In this study, the relationship between the intelligibility of distant-talking speech and acoustical interferences is investigated inside car cabins. Target speech signals are prepared as the utterance of Japanese 4-digits random sequences. The acoustical interferences consist of exterior and interior noises. Difficulty in speech perception is defined by the speech reception threshold, which corresponds to the sound pressure level of speech at the 50 % correct score in an articulation test. It is suggested that the interior blower noise caused by an air-conditioner is the most dominant interferences in speech intelligibility. For further investigation, multiple regression analyses have been carried out using subjective indexes related to speech intelligibility. It is found that speech intelligibility can be modeled with thickness of speech, loudness of speech, and loudness of noise.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84994560619&origin=inward

  • Speech intelligibility under in-car distant-talking environments 査読有り

    M. Mizumachi, S. Takuma, I. Ohsugi, Y. Hamada, K. Nishi

    Proc. Inter-noise   Paper ID: 408   2016年08月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Perceptual restoration of intermittent speech using human speech-like noise 査読有り

    M. Mizumachi, S. Imanaga, and T. Horiuchi

    Proc. 23rd International Congress on Sound and Vibration (ICSV23)   Paper ID: 1050   2016年07月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Subjective evaluation of high resolution audio through headphones 査読有り

    M. Mizumachi, R. Yamamoto, and K. Niyada

    Proc. AES 140th Convention   Paper No. 9529   2016年06月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Singing support system using LPC residual wave for laryngectomee 査読有り

    Himeno T., Tanaka Y., Mizumachi M., Matsui K.

    2016 IEEE International Conference on Consumer Electronics, ICCE 2016   395 - 396   2016年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    © 2016 IEEE. In this paper, we propose a singing system to transmit the pseudo-vocal sound source to the vocal tract. The purpose is the quality improvement of singing voice when using an Electric-Larynx (EL), which is an alternative vocal apparatus of laryngectomee. Thus, we focus on the LPC residual wave, but it has a problem that the signal-power of the vowels /i/ and /u/ are largely reduced. Therefore we tried to improve the quality of sound by adding a signal-power compensation. We carried out listening experiments for the four sound sources «LPC residual wave», «LPC residual wave (signal-power Compensation)», «Rosenberg wave» and «EL». As a result, power-compensated LPC residual wave had the highest naturalness. However, the spectrum of the vowels /i/ differed greatly from the singing voice of the normal utterance.

    DOI: 10.1109/ICCE.2016.7430662

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84965132816&origin=inward

  • Perceptual restoration of intermittent speech using human speech-like noise 査読有り

    Mizumachi M., Imanaga S., Horiuchi T.

    ICSV 2016 - 23rd International Congress on Sound and Vibration: From Ancient to Modern Acoustics   2016年01月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Mobile phones have caused an explosive increase in packet distribution. It causes a serious problem, that is, packet loss. Packet loss concealment is indispensable for achieving smooth speech communication. As a packet loss concealment method on a client side, a waveform substitution is popular and standardized by ITU. The ITU-T G. 711 conceals packet loss by inserting a phase-adjusted amplitude-attenuating previous packet into each break, but cannot deal with long-term breaks over 60 ms, that is, burst loss. The authors have previously proposed an alternative packet loss concealment relying on a human auditory capability. This method does not aim at restoring a waveform of the intermittent speech signal, but achieves perceptual restoration relying on phonetic restoration. When a gap of a intermittent speech signal is filled up with a loud arbitrary signal, we can smoothly listen to restored speech even if some segments of the original speech signal are completely lost. There is a trade-off between smoothness of the restored speech and noisiness of the gap-filling signal. Previously, the gap-filling signal was composed of a harmonic complex and ambient noises. In this paper, a human speech-like noise is substituted for the gap-filling signal. The speech-like noise can be prepared by repeatedly overlapping short-term human speech signals. It is confirmed that the proposed gap-filling signal succeeds in reducing its noisiness.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84987899770&origin=inward

  • Subjective evaluation of high resolution audio through headphones 査読有り

    Mizumachi M., Yamamoto R., Niyada K.

    140th Audio Engineering Society International Convention 2016, AES 2016   2016年01月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Recently, high resolution audio (HRA) can be played back through portable devices, and spreads across musical genres and generation. It means that most people listen to HRA through headphones and earphones. In this study, perceptual discrimination among audio formats including HRA has been investigated using headphones. 36 subjects, who have a variety of audio and musical experiences in the wide age range from twenties to seventies, participated in listening tests. Headphones presentation is superior in discriminating the details to the loudspeakers presentation. It is, however, found that the headphones presentation is weak in reproducing presence and reality. Audio enthusiasts and musicians could significantly discriminate audio formats than ordinary listeners in both headphones and loudspeakers listening conditions.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84983565516&origin=inward

  • Study on the improvement of intelligibility for elderly speech using formant frequency shift method 査読有り

    Tanaka Y., Mizumachi M., Nakatoh Y.

    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)   9811 LNCS   683 - 690   2016年01月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    © Springer International Publishing Switzerland 2016. In general, aging is progressing in developed countries. Elderly people have difficulty controlling their articulation accurately due to aging. We need to improve the quality of elderly speech for smooth communication. In this paper, we analyzed the 1st formant frequency (F1) and 2nd formant frequency (F2) between the more intelligible speech and less intelligible speech of Japanese elderly people. In addition, we improved the intelligibility of less intelligible elderly speech by using the formant frequency shift method. This method is the correcting by shift value of formant frequency based on LPC. The shift value is the magnification such as expanding the F1-F2 size of less intelligible speech.

    DOI: 10.1007/978-3-319-43958-7_83

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84984829622&origin=inward

  • LPC残差駆動歌唱システムにおける音韻性除去による音質改善の検討 査読有り

    姫野 剛至, 田中 裕人, 水町 光徳, 松井 謙二, 中藤 良久

    産業応用工学会論文誌 ( 一般社団法人 産業応用工学会 )   4 ( 1 )   19 - 25   2016年01月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)

    We propose a singing system to transmit the pseudo-vocal sound source into the vocal tract. In this paper, we examine the pseudo-vocal sound source that is suitable for singing system. So we carried out a comparison of LPC residual wave and Bark-LPC residual wave that the phonological component included in pseudo-vocal sound source was removed by Bark spectrum. As a result, we found that although the singing voice using Bark-LPC residual is in the low natural tendencies, the Bark-LPC residual wave can reproduce a higher speaker information contributed by the speaker characteristics.

    DOI: 10.12792/jjiiae.004.01.04

    CiNii Article

    CiNii Research

    その他リンク: https://ci.nii.ac.jp/naid/130005263509

  • Acoustical Sensing of Approaching Vehicle by Non-Linear Filtering 査読有り

    M. Mizumachi

    Proc. 12th Western Pacific Acoustics Conference 2015 (WESPAC)   2015年12月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Design of elder-friendly auditory signals for microwave ovens 査読有り

    Kadota N., Mizumachi M., Nakatoh Y.

    2015 4th International Conference on Informatics, Electronics and Vision, ICIEV 2015   2015年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    © 2015 IEEE. Recent house electrical appliances generate a number of auditory signals, when a user operates an appliance or an appliance draws attention to a user. In this paper, we focus on multi-functional microwave ovens, which commonly have several auditory signals for user's operation, error occurrence, completion of cooking, and so on. A wide variety of auditory signals for current microwave ovens have two problems: it is difficult for users to image what the auditory signals inform, and the auditory signals including high frequency components are not friendly for elderly users. In this paper, popular auditory signals for microwave ovens were subjectively evaluated with/without an elderly-simulated band-pass filter, which simulated an averaged audiogram of elder people, on the five grade scales of easiness of perception, unpleasantness, and emergency. Experimental results suggest that young and elderly people might imagine different function for a single auditory signal. Finally, suitable auditory signals both for young and elderly users are proposed in the viewpoints of frequency and temporal patterns.

    DOI: 10.1109/ICIEV.2015.7333977

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84961778212&origin=inward

  • Perceptual restoration of intermittent speech under noisy environments 査読有り

    M. Mizumachi; S. Motomura; T. Takakura; T. Horiuchi

    Proc. 22nd International Congress on Sound and Vibration (ICSV22)   2015年07月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Subjective evaluation of high resolution audio under in-car listening environments 査読有り

    Mizumachi M., Yamamoto R., Niyada K.

    138th Audio Engineering Society Convention 2015   1   60 - 64   2015年01月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    High resolution audio (HRA) becomes increasingly popular both for music production and consumers. It enables to record a music performance in a wide-band and precise digital audio format. It is, however, unclear in its perceptual advantage under some listening environments. In this study, listening tests were carried out inside cars, where 34 participants listened to the same music in four different audio formats. The participants chose an audio format with better quality in paired comparison among 192 kHz/24 bits PCM, 48 kHz/16 bits PCM, and two kinds of lossy-compressed MPEG audio formats. The participants, who are familiar with HRA and live music performance, could significantly discriminate among the audio formats.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84943236951&origin=inward

  • 文字入力を用いた発話支援システムの開発 査読有り

    濱井 裕也, 水町 光徳, 中藤 良久, 松井 謙二

    産業応用工学会論文誌 ( 一般社団法人 産業応用工学会 )   3 ( 1 )   10 - 17   2015年01月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)

    Utterance is very important for us to communicate with others. However, many people have speech handicaps and can't produce utterance smoothly. They mainly rely on writing and sign language for communication. But they are not easy skills for them to master. In order to help them, we developed a new utterance support system which can function through an information terminal. We made predictions which includes two additional functions of fixed phrase dictionary and the class 2-gram – one of the statistical approaches for processing natural language. Fixed phrase dictionary includes phrases often used in our daily life conversations and class 2-gram uses co-occurrence frequencies of parts of speech in Japanese. There are two purposes for us to use class 2-gram, one is to generate next candidates and the other is to change frequency. We concluded two evaluation experiments. The results show that our system needs less numbers of inputs in helping with written utterance production and using our prototype permits us to input more characters in one minute than using iPhone IME. Hereafter, we intend to create more effective dictionaries and develop new GUI to make our system more effective and faster.

    DOI: 10.12792/jjiiae.003.01.02

    CiNii Article

    その他リンク: https://ci.nii.ac.jp/naid/130005263536

  • 単語発話音声の周波数特徴の加齢変化 (福祉情報工学)

    緒方 一仁, 水町 光徳, 中藤 良久

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 ( 一般社団法人電子情報通信学会 )   114 ( 261 )   49 - 54   2014年10月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)

    日本を含む先進諸国では,高齢化が深刻な社会問題となっている.加齢は,音声コミュニケーションにも影響を及ぼす.聴覚の加齢変化については精力的に研究が行われてきたが,発話器官の加齢変化についてはまだ明らかになっていない.本稿では,発話器官の加齢変化に着目し,発話音声の静的特徴について検討する.分析に用いた音声は,64歳から87歳までの男性話者21名による日本語単語発話である.各単語の語頭母音に対して,パワースペクトルを算出し,20代話者と高齢者話者グループの平均と分散を比較した.本分析の結果,加齢により2.5kHzから4.5kHzの周波数帯域でのパワー減少と,4.5kHz以上でのパワー上昇を確認し,すべての音素において周波数特性が平坦になることが判明した.

    CiNii Article

    その他リンク: https://ci.nii.ac.jp/naid/110009958972

  • Robust Sensing of Approaching Vehicles Relying on Acoustic Cue 査読有り

    M. Mizumachi, A. Kaminuma, N. Ono, and S. Ando

    Proc. IEEE IS3C2014   Paper No. 265   2014年06月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Best Paper Award受賞

    DOI: 10.1109/IS3C.2014.144

    Scopus

  • Robust Sensing of Approaching Vehicles Relying on Acoustic Cue 査読有り

    M. Mizumachi, Atsunobu Kaminuma, Nobutaka Ono, and Shigeru Ando

    Sensors   14 ( 6 )   9546 - 9561   2014年05月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(学術雑誌)

    DOI: 10.3390/s140609546

    Scopus

  • Applicability of perceptual evaluation of speech quality in evaluating heavily distorted speech 査読有り

    Mizumachi M.

    137th Audio Engineering Society Convention 2014   224 - 229   2014年01月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Speech quality assessment is indispensable to properly design a speech enhancement algorithm. Perceptual evaluation of speech quality (PESQ) is frequently employed as an objective speech distortion measure. The PESQ is a methodology for estimating subjective assessment of speech distortion caused by speech codecs for telephony systems. In case of noise reduction, however, a degree of speech distortion is heavier than those caused by the speech codecs. In this paper, applicability of the PESQ is investigated for noisy and noisereduced speech signals under severe noisy conditions. A relationship between PESQ scores and subjective mean opinion scores reveals that the PESQ can be applicable for heavily distorted speech only under nonstationary noisy conditions.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84938854653&origin=inward

  • Perceptual restoration of intermittent speech relying on illusory continuity 査読有り

    Mizumachi M., Motomura S., Takakura T., Horiuchi T.

    Proceedings of Forum Acusticum   2014-January   2014年01月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    A digital communication network makes our daily lives comfortable. It, however, causes a serious problem in speech communication due to a packet loss, which yields intermittent speech after decoding the packets. Packet loss concealment (PLC) is indispensable to achieve smooth speech communication over a digital network. There are various kinds of PLC methods based on wave substitution and feature prediction. Those methods aim to achieve intact restoration of a speech waveform. The ITU-T Recommendation G.711 offers a standard PLC method, but cannot conceal the packet loss, of which lost duration exceeds 60 ms. Then, G.711 PLC method is not enough to cope with the actual packet loss problem. On the other hand, the authors have proposed a perceptual restoration scheme of intermittent speech. We can listen to intermittent speech smoothly, when its gap is filled out with a loud, wide-band noise such as a white noise. This is an auditory illusion called illusory continuity, and is explained as the environmental adaptability of the human brain. In order to employ the illusory continuity for PLC, it is necessary to decrease the harshness of the loud gap-filling noise. A speech-like gap-filling signal is prepared with a mixture of less-harsh environmental noises in advance. Both dynamic and static properties of speech are incorporated into the proposed gap-filling signal. The feasibility of the proposed PLC method was examined by a listening test. Participants gave five-grade mean opinion scores on the smoothness of the restored speech, noisiness of the gap-filling signal, and the easiness of speech perception. It is confirmed that the proposed method has a significant advantage over the G.711 PLC method under long-term packet loss conditions.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84953311058&origin=inward

  • 加齢による聴覚と発話の相互作用 (福祉情報工学)

    水町 光徳

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 ( 一般社団法人電子情報通信学会 )   113 ( 272 )   61 - 66   2013年10月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)

    高齢化は大きな社会問題であり、加齢による音声コミュニケーションに生じる障害も切実な問題である。加齢による聴力低下は、60歳代以前にも見受けられるが、70歳を超えると急激に高周波数成分の聴力閾値が上昇する。70歳代では、聴覚障害の自覚がなくても、加齢による高音障害型感音性難聴と診断されることが多い。これにより、子音が聴き取りづらくなったり、雑音のなかでの音声の聞き取り能力が低下する。一方、音声知覚において、我々は、声からある程度の年齢を推定できる。つまり、我々は、聴覚的印象として、高齢者音声らしさを表す複数の特徴を知っている。その一つが嗄声であり、これは高齢者音声を特徴付ける聴感印象として数多く報告されている。著者は、高周波数帯域における発話エネルギー上昇が、嗄声の音響的特徴であることを確認した。従来の研究では、高齢者の聴力特性と音声の音響的特徴は、それぞれ独立して調査されてきた。本稿では、「ことばの鎖」を拠り所として、加齢による聴力低下と発話音声変形の相互作用について総合的に検討する。

    CiNii Article

    その他リンク: https://ci.nii.ac.jp/naid/110009783062

  • Speech enhancement by non-linear beamforming tolerant to misalignment of target source direction 査読有り

    H. Hayashi, M. Mizumachi, Y. Nakatoh

    Journal of the Institute of Industrial Applications Engineers   1 ( 2 )   97 - 104   2013年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)

  • Investigation on objective quality evaluation for heavily distorted speech 査読有り

    Mizumachi M.

    134th Audio Engineering Society Convention 2013   668 - 672   2013年09月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Demand for evaluating speech quality is on the increase. It is advisable for evaluating the speech quality to employ the common objective measure for the wide variety of adverse speech signals. Unfortunately, current speech quality measures do not suit for heavily distorted speech signals. In this paper, both the applicability and the limit of the perceptual evaluation of speech quality (PESQ) are investigated compared with the subjective mean opinion score (MOS) for noise-added and noise-reduced speech signals. It is found that the PEAQs are compatible with the MOSs for the noise-reduced speech signals in the non-stationary noise conditions.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84883431685&origin=inward

  • How do we perceive noisy and noise-reduced speech? 査読有り

    M. Mizumachi

    Proc. Inter-noise   2013年09月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Restoration of intermittent speech based on human auditory capability and temporal characteristics of speech 査読有り

    M. Mizumachi, S. Motomura, T. Takakura, and T. Horiuchi

    Proc. 20th International Congress on Sound and Vibration (ICSV20)   2013年07月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Relationship Between Subjective and Objective Evaluation of Noise-reduced Speech With Various Widths of Temporal Windows 査読有り

    M. Mizumachi

    Proc. 21st International Congress on Acoustics   Paper ID: 1aSCb13   2013年06月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    DOI: 10.1121/1.4799431

    Scopus

  • Investigation on objective quality evaluation for heavily distorted speech 査読有り

    M. Mizumachi

    Proc. AES 134th Convention   CD-ROM (Paper ID: 8830)   2013年05月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • How do we perceive noisy and noise-reduced speech? 査読有り

    Mizumachi M.

    42nd International Congress and Exposition on Noise Control Engineering 2013, INTER-NOISE 2013: Noise Control for Quality of Life   6   4818 - 4823   2013年01月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    It is important for speech applications to quantify the intelligibility and the quality of speech. There are some means of evaluating the intelligibility and the quality objectively and subjectively. The objective evaluation is economical, but the general-use distortion measure is not available. On the other hand, the subjective evaluation requires a cost-consuming formal listening test. The right evaluation should be carried out in the right purpose. No almighty methodology has been established at the moment. In this paper, brain activities involved in evaluating the noisy and noise-reduced speech are measured using the functional magnetic resonance imaging (fMRI) technique. It is found that the brain activity in evaluating the noise-reduced speech varies depending on the noise reduction approach. The noise-reduced signals, which are obtained by the linear processing such as the delay- And-sum beamforming, calm down the brain activity compared with the noisy speech signals. On the other hands, non-linear signal processing such as the spectral subtraction activates the auditory cortex intensely. It is necessary for designing the advanced speech distortion measure to independently consider how the noise is removed and how the speech is distorted by noise reduction.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84904515025&origin=inward

  • ハイレゾリューションオーディオの音質評価 査読有り

    山本 竜太, 金只 直人, 水町 光徳

    産業応用工学会論文誌 ( 一般社団法人 産業応用工学会 )   1 ( 2 )   52 - 57   2013年01月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)

    In this paper, sound quality of high resolution audio (HRA) is investigated in the view point of auditory perception. Perceptual characteristics of HRA have been examined by listening tests compared with the standard audio CD and the compressed MPEG audio layer-3 (MP3) qualities. The listening tests were carried out by the paired comparison, and the participants were asked to discriminate among HRA, CD, and MP3. Jazz music was selected out as the original HRA. Both CD and MP3 quality audio files were prepared from the original HRA file by the authors. It is found that the participants prefer the audio format with richer information, that is, HRA is most desirable and CD is better than MP3. The questionnaires filled in by participants indicate that subjective characteristics of HRA include much presence, high spatial clarity, and wide spaciousness. Additionally, perceptual discrimination in quantization distortion is also focused on in between 16 bits and 24 bits resolution. As the result of the listening test with 28 participants, the difference of the quantization resolution was discriminated with the accuracy of 60.3 %. Concerning the perceptual discrimination of HRA, quantization resolution is an important factor as well as its wide frequency range.

    DOI: 10.12792/jjiiae.001.02.003

    Kyutacar

    CiNii Article

    その他リンク: https://ci.nii.ac.jp/naid/130005263583

  • Restoration of intermittent speech based on human auditory capability and temporal characteristics of speech 査読有り

    Mizumachi M., Motomura S., Takakura T., Horiuchi T.

    20th International Congress on Sound and Vibration 2013, ICSV 2013   3   1896 - 1902   2013年01月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Recently, a new obstruction to speech communication, that is, the short-term intermittence of the speech signal, is occurred due to the congestion in the digital communication network. Mobile phones and smart phones have spread rapidly, and then the communication lines are occupied by the heavy traffic of the received/transmitted packets. Therefore, the packet associated with speech can also be lost in the congested communication line. It is not advisable to require the re-transmission of the lost packet in speech communication, because the re-transmission of the lost packet disturbs smooth speech communication and causes the further traffic in the communication line. The restoration of the intermittent speech should be completed on the user's client equipment. The copy of the previous packet should be the easiest approach in restoring the intermittent speech, although the restored speech must be perceived slowly and lazily. The authors have proposed a novel approach to the restoration of the intermittent speech relying on the human auditory capability [Proc. ICSV19, 2012]. This is not an exact physical restoration of the intermittent speech signal, but a perceptual restoration. When the gap of the intermittent speech signal is filled up with an extremely noisy noise signal, we can listen to the intermittent speech smoothly even if some segments of the original speech signal are lost completely. The authors have proposed a practical scheme of the restoration based on our phonemic restoration capabilities. The previously proposed method has employed the less harsh noise and the speech-like harmonic component designed in the frequency domain as the gap-filling signal. Furthermore, in this paper, the temporal characteristics of speech are introduced into the gap-filling signal. It is confirmed that the amplitude modulation and the temporal decay in the gap-filling signal improve the auditory impression of the restored speech signals.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84897035542&origin=inward

  • Relationship between subjective and objective evaluation of noisereduced speech based on temporal variation of speech distortion 査読有り

    Mizumachi M.

    41st International Congress and Exposition on Noise Control Engineering 2012, INTER-NOISE 2012   1   109 - 117   2012年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    It is indispensable for designing a noise reduction algorithm to evaluate the quality of the noise-reduced speech signals accurately and efficiently. Subjective evaluation is an ideal approach, but requires a time-consuming listening test with a number of subjects. Then, objective distortion measures are often employed for efficient evaluation. However, almost all the distortion measures do not consider the temporal variation of the speech distortion. In this paper, the temporal aspect of the short-term speech distortion is investigated based on higher-order statistics such as variance, skewness, and kurtosis for short-term segmental SNR distribution. It is interesting that the skewness of the segmental SNR gives a good explanation for the discrepancy between subjective and objective evaluation.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84883590418&origin=inward

  • Relationship between subjective and objective evaluation of noise-reduced speech based on temporal fluctuation of speech distortion 査読有り

    M. Mizumachi

    Proc. Inter-noise   CD-ROM (Paper ID: 808)   2012年08月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Relationship between subjective and objective evaluation of distorted speech 査読有り

    Mizumachi M.

    131st Audio Engineering Society Convention 2011   1   351 - 356   2011年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    It is important for designing a noise reduction algorithm to evaluate the quality of the noise-reduced speech signals accurately and efficiently. Subjective evaluation is ideal, but requires a time-consuming listening test with a lot of subjects. Then, objective distortion measures are often used for efficient evaluation. However, almost all the distortion measures do not consider the temporal variation of the speech distortion. In this paper, the temporal aspect of the short-term speech distortion is investigated based on higher-order statistics, that is, variance, skewness, and kurtosis. It is interesting that the skewness of the short-term SNR gives a good explanation for the discrepancy between subjective and objective evaluation.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84866309724&origin=inward

  • Versatile beamforming for speech enhancement in non-stationary acoustic environments 査読有り

    Mizumachi M.

    Proceedings of Forum Acusticum   311 - 316   2011年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Speech enhancement is indispensable for designing high-quality speech interfaces. Various kinds of beamformers have been proposed for speech enhancement by spatial filtering. Delay-and-sum beamforming is usually expensive for speech enhancement with numbers of microphones, but provides less-distorted speech signals due to linear signal processing. Null-steering subtractive beamforming achieves efficient speech enhancement, but resultant speech signals include artificial distortion by non-linear signal processing. Each beamformer has both an advantage and a drawback. Directionof- arrival (DOA) is the most important spatial feature for beamforming. The proposed versatile beamforming aims at integrating delay-and-sum beamforming with null-steering beamforming adaptively under time-varying acoustic environments. Confidence for each DOA estimate can be estimated based on a spatial feature, e.g., a cross-correlation function for stereo observations, and is the key for achieving the adaptive integration. Null-steering beamforming can be employed with a reliable DOA estimate, and delay-and-sum beamforming should be used with an unreliable DOA estimate. The DOA confidence varies time by time under non-stationary acoustic environments. The propose versatile beamformer chooses between delay-and-sum and null-steering subtractive beamformers relying on the confidence of each DOA confidence in non-stationary acoustic environments.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84866005187&origin=inward

  • Speech enhancement with adaptive integration between spatial and spectral filtering 査読有り

    Mizumachi M.

    40th International Congress and Exposition on Noise Control Engineering 2011, INTER-NOISE 2011   2   1432 - 1437   2011年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Speech enhancement is indispensable for robust speech processing in noisy environments. It is, however, difficult to achieve effective speech enhancement under practical, non-stationary, and unknown noisy environments. Challenge to design an almighty algorithm is not realistic for speech enhancement in real environments. In other words, the right scheme should be prepared for speech enhancement in the right noisy environment. In this paper, a novel approach is introduced to achieve robust speech enhancement. Provided that two or more microphones are available, we can estimate a direction of arrival (DOA) from a spatial feature, which can be also used for spatial filtering as a means of speech enhancement. The author has already proposed to give reliability, which is also estimated from the spatial feature, to each estimate of the DOA. The proposed method achieves speech enhancement by adaptively selecting the suitable approach relying on the reliability of each DOA estimate. Beamforming and spectral subtraction are prepared as candidates for spatial and spectral filtering, respectively. Each output is merged with the time-varying mixing ratio depending on the reliability of each DOA estimate. Then, the proposed method can deal with non-stationary noisy environments by introducing the adaptive integration between spatial and spectral filtering. Feasibility of the proposed idea is confirmed under a less-reverberant, non-stationary noisy condition. Copyright © (2011) by the Institute of Noise Control Engineering.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84867960160&origin=inward

  • Relationship between subjective and objective evaluation of distorted speech 査読有り

    Mitsunori Mizumachi

    Proc. AES 131st Convention   2011年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Speech enhancement with adaptive integration between spatial and spectral filtering 招待有り 査読有り

    Mitsunori Mizumachi

    Proc. Inter-noise   2011年09月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Versatile beamforming for speech enhancement in non-stationary acoustic environments 査読有り

    Mitsunori Mizumachi

    Proc. Forum Acusticum   2011年06月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Statistical confidence measure for direction-of-arrival estimate 査読有り

    Mizumachi M.

    European Signal Processing Conference   666 - 670   2010年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    This paper proposes to estimate the reliability of each direction-of-arrival (DOA) estimate explicitly. Observed spatial features, which give DOA estimates, are usually distorted by acoustical noise and reverberation. Then, distorted spatial features are filtered out by particle filters with a system model, which describes sound source dynamics on spatial state space. After particle filtering is carried out, set of the weighted particles can be considered as the discrete approximation of the true spatial feature. It is reasonable that particles with large weights concentrate around the true DOA on spatial state space. In this paper, crest factor, skewness, and kurtosis are calculated based on the second, third, and forth order moments from the particle set for representing how particles concentrate simply. It is confirmed that the skewness confidence measure is the most suitable for estimating DOA reliability under both directional and distributed noise conditions. © EURASIP, 2010.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84863793327&origin=inward

  • Speech enhancement based on spatial and acoustical features in non-stationary noisy environments 査読有り

    Mizumachi M.

    17th International Congress on Sound and Vibration 2010, ICSV 2010   5   3603 - 3608   2010年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Speech enhancement is essential for many audio applications with speech input. Those devices are supposed to be used under a wide variety of acoustic conditions. Then, speech enhancement should be effective even in unknown, time-varying, and non-stationary noisy environments. The author has proposed an efficient noise reduction method, which aims at making the most use of stochastic spatial information [Mizumachi, Proc. ICSV16, 2009]. The spatial and acoustical features have been prepared based on directions of sound sources and spectral characteristics of a target and acoustical interferences, respectively. In this paper, those stochastic features are extended including much richer spatial information. New spatial features are derived from higher order statistics of the spatial information extracted from the 2-ch observations. The proposed method can deal with non-stationary noisy environments, because it takes the suitable scheme in noise reduction relying on the spatial and acoustical features flexibly. In this paper, the feasibility of the proposed method is investigated under non-stationary noisy environments.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84871439200&origin=inward

  • Self-organized approach to noise reduction based on acoustic and spatial features 査読有り

    Mizumachi M.

    39th International Congress on Noise Control Engineering 2010, INTER-NOISE 2010   7   5645 - 5652   2010年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Noise reduction has been one of important issues in acoustic signal processing. Until now, various kinds of algorithms have been proposed to achieve noise reduction, but we have not established an almighty algorithm, which always works well in the real world. Each algorithm has both advantage and disadvantage in noise reduction. In this paper, a practical approach to noise reduction is proposed by introducing an idea of self-organization for determining the suitable algorithm in time-varying acoustic scenes based on acoustic and spatial features. Time evolution of acoustic and spatial features and reliability of direction-of-arrival estimates are used for selecting the suitable approach out of spectral subtraction with acoustic features and beamforming with spatial features. Feasibility of the self-organized approach has been confirmed under non-stationary noise environments.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84868667154&origin=inward

  • Confidence measure based on higher-order statistics for spatial feature in particle filtering 査読有り

    Mizumachi M.

    2010 World Automation Congress, WAC 2010   2010年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    This paper proposes to estimate the reliability of each direction-of-arrival (DOA) estimate explicitly. Observed spatial features, which give DOA estimates, are usually distorted by acoustical noise and reverberation. Then, distorted spatial features are filtered out by particle filters with a system model, which describes sound source dynamics on spatial state space. After particle filtering is carried out, set of the weighted particles can be considered as the discrete approximation of the true spatial feature. It is reasonable that particles with large weights concentrate around the true DOA on spatial state space. In this paper, crest factor, skewness, and kurtosis are calculated based on the second, third, and forth order moments from the particle set for representing how particles concentrate simply. It is confirmed that the skewness confidence measure is the most suitable for estimating DOA reliability under both directional and distributed noise conditions. © 2010 TSI Press.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=78651417406&origin=inward

  • Adaptive source separation based on reliability of spatial feature using multi-channel acoustic observations 査読有り

    Mizumachi M.

    128th Audio Engineering Society Convention 2010   2   1092 - 1098   2010年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    Separation of sound source can be achieved by spatial filtering with multi-channel acoustic observations. However, the right algorithm should be prepared in each condition of acoustic scene. It is difficult to provide the suitable algorithm under real acoustic environments. In this paper, an adaptive source separation scheme is proposed based on the reliability of a spatial feature, which gives an estimate of direction of arrival (DOA). As confidence measures for DOA estimates, the third and fourth moments for spatial features are employed to measure how sharp the main-lobes of spatial features are. This paper proposes to selectively use either spatial filters or frequency-selective filters without spatial filtering depending on the reliability of each DOA estimate.

    Scopus

    その他リンク: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84866026425&origin=inward

  • Confidence measure based on higher-order statistics for spatial feature in particle filtering 査読有り

    Mitsunori Mizumachi

    Proc. 2010 International Forum on Multimedia and Image Processing (IFMIP 2010)   2010年09月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Statistical confidence measure for direction-of-arrival estimate 査読有り

    Mitsunori Mizumachi

    Proc. 18th European Signal Processing Conference (EUSIPCO2010)   666 - 670   2010年08月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

  • Speech enhancement based on spatial and acoustical features in non-stationary noisy environments 査読有り

    水町 光徳

    Proc. 17th International Congress on Sound and Vibration (ICSV17)   2010年07月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2010年07月  -  2010年07月

  • Self-organized approach to noise reduction based on acoustic and spatial features 査読有り

    水町 光徳

    Proc. 39th International Congress and Exposition on Noise Control Engineering (INTER-NOISE 2010)   2010年06月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2010年06月  -  2010年06月

  • Adaptive source separation based on reliability of spatial feature using multi-channel acoustic observations 査読有り

    水町 光徳

    Proc. AES 128th Convention in London   2010年05月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2010年05月  -  2010年05月

  • Acoustic analysis of breathy and rough voice characterizing elderly speech 査読有り

    T. Miyazaki,M. Mizumachi,and K. Niyada

    Journal of Advanced Computational Intelligence and Intelligent Informatics   14 ( 2 )   135 - 141   2010年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)

  • Robust Estimation of Sound Source Direction with Deterministic Background Noise and Stochastic Source Dynamics Models 査読有り

    M. Mizumachi,and K. Niyada

    Journal of Advanced Computational Intelligence and Intelligent Informatics   14 ( 2 )   208 - 213   2010年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)

  • Analysis of ill-articulated speech by elderly speakers based on temporal transition of amplitude spectrum 査読有り

    D. Harada,K. Hamasaki,T. Miyazaki,M. Mizumachi,and K. Niyada

    Proc. 2010 RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing   PaperID: 40   2010年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2010年03月  -  2010年03月

  • Relationship among subjective impressions and room acoustic parameters for musical signals in large-scale sound field 査読有り

    M. Nakagawara,T. Nakano,M. Mizumachi,and K. Niyada

    Proc. 2010 RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing   PaperID: 82   2010年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2010年03月  -  2010年03月

  • Adaptive direction-of-arrival estimation using microphone array 査読有り

    水町 光徳

    Proc. 10th Western Pacific Acoustics Conference (WESPAC-X)   2009年09月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2009年09月  -  2009年09月

  • Flexible beamforming for speech enhancement using stochastic spatial information 査読有り

    水町 光徳

    Proc. 16th International Congress on Sound and Vibration (ICSV16)   2009年07月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2009年07月  -  2009年07月

  • Study on relationship among preference and subjective spatial impressions using multiple regression analysis 査読有り

    M. Nakagawara,M. Mizumachi,and K. Niyada

    Proc. AES 14th Regional Convention   P1-1   2009年07月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2009年07月  -  2009年07月

  • Robust noise reduction by optimized beamforming based on spatial features 査読有り

    水町 光徳

    Proc. AES 126th Convention   P10-5   2009年05月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2009年05月  -  2009年05月

  • Investigation on acoustic feature to characterize ill-articulated voice uttered by elderly people 査読有り

    K. Hamasaki,T. Miyazaki,M. Mizumachi,and K. Niyada

    Proc. 2009 RISP International Workshop on Nonlinear Circuits and Signal Processing (NCSP'09)   53 - 56   2009年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2009年03月  -  2009年03月

  • Spatial and acoustic feature extraction in time-variant acoustic environments 査読有り

    水町 光徳

    Proc. 2009 RISP International Workshop on Nonlinear Circuits and Signal Processing (NCSP'09)   41 - 44   2009年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2009年03月  -  2009年03月

  • Investigation on the difference of room impulse responses using multi-dimensional scaling - comparison among a traditional theater of Japan, an auditorium and a concert hall - 査読有り

    Y. Hamamura,M. Nakagawara,T. Saruwatari,M. Mizumachi,and K. Niyada

    Proc. Youngnam-Kyushu Joint Conference on Acoustics 2009   CD-ROM   2009年02月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2009年02月  -  2009年02月

  • The relationship between hoarseness and acoustic features for characterizing elderly speech 査読有り

    T. Miyazaki,M. Nishi,M. Mizumachi,and K. Niyada

    Proc. Youngnam-Kyushu Joint Conference on Acoustics 2009   CD-ROM   2009年02月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2009年02月  -  2009年02月

  • Relationship among preference and subjective spatial impressions in large-scale space 査読有り

    M. Nakagawara,Y. Hamamura,T. Saruwatari,M. Mizumachi,and K. Niyada

    Proc. Youngnam-Kyushu Joint Conference on Acoustics 2009   CD-ROM   2009年02月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2009年02月  -  2009年02月

  • Robust direction-of-arrival estimation by particle filtering with confidence measure based on effective sample size under noisy environments 査読有り

    M. Mizumachi,K. Niyada

    Proc. Joint 4th International Conference on Soft Computing and Intelligent Systems and 9th International Symposium on advanced Intelligent Systems (SCIS & ISIS 2008)   CD-ROM   2008年09月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2008年09月  -  2008年09月

  • Relationship between Room Acoustic Parameters and Auditory Impression Based on Binaural Hearing 査読有り

    M. Nakagawara,Y. Hamamura,M. Mizumachi,and K. Niyada

    Proc. AES Japan Conference   CD-ROM   2008年07月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2008年07月  -  2008年07月

  • Design of non-equally-spaced linear microphone arrangement for speech enhancement 査読有り

    M. Mizumachi,S. Yoshikuni,K. Niyada

    Proc. RISP International Workshop on Nonlinear Circuits and Signal Processing (NCSP2008)   236 - 239   2008年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2008年03月  -  2008年03月

  • Smart Noise Reduction Based on Reliability of Direction-of-arrival Estimate 査読有り

    水町 光徳

    Proc. NAG-DAGA International Conference on Acoustics   CD-ROM   2008年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2008年03月  -  2008年03月

  • Synergic integration of noise reduction and DOA estimation with stochastic target sound source and deterministic noise models 査読有り

    M. Mizumachi,K. Niyada

    Proc. 19th International Congress on Acoustics (ICA2007)   ELE - 03-012   2007年09月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)

    2007年09月  -  2007年09月

  • DOA estimation with hybrid modeling of stochastic dynamics of target sound source and deterministic environmental characteristics for mobile applications 査読有り

    M. Mizumachi,K. Niyada

    Proc. Biennial on DSP for in-Vehicle and Mobile Systems   TM-3   2007年06月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2007年06月  -  2007年06月

  • Acoustic analysis of hoarse voice and its application to elderly speech recognition 査読有り

    M. Watanabe,T. Miyazaki,M. Mizumachi,and K. Niyada

    Proc. RISP International Workshop on Nonlinear Circuits and Signal Processing (NCSP2007)   401 - 404   2007年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2007年03月  -  2007年03月

  • DOA Estimation based on Cross-correlation with Frequency Selectivity 査読有り

    Mitsunori Mizumachi,Katsuyuki Niyada

    Journal of Signal Processing   11 ( 1 )   43 - 49   2007年01月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)

  • DOA Estimation by Particle Filtering with Frequency Selectivity 査読有り

    M. Mizumachi,N. Ikoma

    Proc. Joint 3rd International Conference on Soft Computing and Intelligent Systems and 7th International Symposium on advanced Intelligent Systems (SCIS&ISIS2006)   2006年09月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2006年09月20日  -  2006年09月24日

  • DOA estimation based on cross-correlation by two-step particle filtering 査読有り

    M. Mizumachi,N. Ikoma,K. Niyada

    Proc. 14th European Signal Processing Conference (EUSIPCO2006)   2006年09月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2006年09月04日  -  2006年09月08日

  • Acoustic analysis of hoarse voice and its application to elderly speech recognition 査読有り

    T. Mouri,T. Miyazaki,M. Mizumachi,K. Niyada

    Proc. RISP International Workshop on Nonlinear Circuits and Signal Processing (NCSP2006)   170 - 173   2006年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2006年03月  -  2006年03月

  • DOA Estimation based on Cross-correlation Approach with Frequency Selectivity 査読有り

    M. Mizumachi,M. Yuji,K. Niyada

    Proc. RISP International Workshop on Nonlinear Circuits and Signal Processing (NCSP2006)   1 - 4   2006年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2006年03月  -  2006年03月

  • Estimation of Active Speaker's Direction Using Particle Filtering 査読有り

    M. Mizumachi,K. Niyada

    Proc. Biennial on DSP for In-Vehicle and Mobile Systems   CD-ROM   2005年09月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2005年09月  -  2005年09月

  • Passive hybrid subtractive beamformer for near-field sound sources 査読有り

    M. Mizumachi,S. Nakamura

    Acoustic Science and Technology   26 ( 6 )   495 - 501   2005年04月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)

  • AURORA-2J: An Evaluation Framework for Japanese Noisy Speech Recognition 査読有り

    S. Nakamura,K. Takeda,K. Yamamoto,T. Yamada,S. Kuroiwa,N. Kitaoka,T. Nishiura,A. Sasou,M. Mizumachi,C.i Miyajima,M. Fujimoto,and T.Endo

    IEICE Trans. Information and Systems (E)   E88-D ( 3 )   535 - 544   2005年04月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)

  • CENSREC-3: An Evaluation Framework for Japanese Speech Recognition in Real Driving Car Environments 査読有り

    M. Fujimoto,S. Nakamura,K. Takeda,S. Kuroiwa,T. Yamada,N. Kitaoka,K. Yamamoto,M. Mizumachi,T. Nishiura,A. Sasou,C .Miyajima,T. Endo

    Proc. International Workshop on Realworld Multimedia Corpora in Mobile Environment (RWCinME2005)   53 - 60   2005年04月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2005年04月  -  2005年04月

  • DOA estimation using cross-correlation with particle filter 査読有り

    M. Mizumachi,K. Niyada

    Proc. Joint Workshop on Hands-Free Speech Communication and Microphone Arrays (HSCMA2005)   CD-ROM   2005年03月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2005年03月  -  2005年03月

  • AURORA-2J: Japanese speech data collection for performance evaluation of speech recognition in noise 査読有り

    S. Nakamura,K. Yamamoto,K. Takeda,S. Kuroiwa,N. Kitaoka,T. Yamada,M. Mizumachi,T. Nishiura,M. Fujimoto,A. Sasou,and T. Endo

    Proc. International Conference on Speech and Language Technology (ICSLT2004/O-COCOSDA2004)   CD-ROM   2004年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2004年11月  -  2004年11月

  • Passive subtractive beamformer for near-field sound sources 査読有り

    M. Mizumachi,S. Nakamura

    Proc. IEEE Sensor Array and Multichannel Signal Processing Workshop (SAM2004)   74 - 78   2004年07月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2004年07月  -  2004年07月

  • Iterative Compensation of Microphone Array and Sound Source Movements Based on Minimization of Arrival Time Differences 査読有り

    T. Horiuchi,M. Mizumachi,and S. Nakamura

    Proc. IEEE Sensor Array and Multichannel Signal Processing Workshop (SAM2004)   566 - 570   2004年07月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)

    2004年07月  -  2004年07月

  • Iterative Estimation and Compensation of Signal Direction for Moving Sound Source by Mobile Microphone Array 査読有り

    T. Horiuchi,M. Mizumachi,and S. Nakamura

    IEICE Trans. Fundamentals   E87-A ( 11 )   2950 - 2956   2004年04月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)

  • Data collection and evaluation of AURORA-2 Japanese corpus 査読有り

    S. Nakamura,K. Yamamoto,K. Takeda,S. Kuroiwa,N. Kitaoka,T. Yamada,M. Mizumachi,T. Nishiura,M. Fujimoto,A. Saso,T. Endo

    Proc. IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU2003)   619 - 623   2003年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2003年12月  -  2003年12月

  • Noise reduction using paired-microphones on non-equally-spaced microphone Arrangement 査読有り

    M. Mizumachi,S. Nakamura

    Proc. 8th European Conf. on Speech Communication and Technology (EUROSPEECH2003)   1   585 - 588   2003年09月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2003年09月  -  2003年09月

  • Integration of noise reduction algorithms for AURORA2 task 査読有り

    T. Yamada,J. Okada,K. Takeda,N. Kitaoka,M. Fujimoto,S. Kuroiwa,K. Yamamoto,T. Nishiura,M. Mizumachi,and S. Nakamura

    Proc. 8th European Conf. on Speech Communication and Technology (EUROSPEECH2003)   3   1769 - 1772   2003年09月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2003年09月  -  2003年09月

  • 雑音環境下での音声認識システム

    葦苅豊,水町光徳,實廣貴敏,中村哲

    月刊バーコード   16 ( 7 )   35 - 39   2003年06月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(その他学術会議資料等)

  • An iterative compensation algorithm of coordinate systems for a mobile microphone array 査読有り

    T. Horiuchi,M. Mizumachi,and S. Nakamura

    Proc. 5th Intl. Workshop on Microphone Array Systems   CD-ROM   2003年05月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)

    2003年05月  -  2003年05月

  • The 2ch hybrid subtractive beamformer applied to line sound sources 査読有り

    M. Mizumachi,S. Nakamura

    Proc. Intl. Conf. On Spoken Language Processing (ICSLP2002)   3   1833 - 1836   2002年09月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2002年09月  -  2002年09月

  • Noise reduction using paired-microphones for both far-field and near-field sound sources 査読有り

    M. Mizumachi,S. Nakamura

    Proc. 7th European Conf. on Speech Communication and Technology (EUROSPEECH2001)   4   2607 - 2610   2001年09月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2001年09月  -  2001年09月

  • Noise reduction with the subtractive beamformer for mobile speech recognition 査読有り

    M. Mizumachi,S. Nakamura

    Proc. Intl. Conf. on Speech Processing (ICSP2001)   2   673 - 678   2001年08月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2001年08月  -  2001年08月

  • Robust MFCCs derived from differentiated power spectrum 査読有り

    J. Chen,K. K. Paliwal,M. Mizumachi,and S. Nakamura

    Proc. Intl. Conf. on Speech Processing (ICSP2001)   2   577 - 582   2001年08月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2001年08月  -  2001年08月

  • ハンズフリー音声通信に関する国際会議(HSC2001) を開催

    水町 光徳

    ATRジャーナル   44   11 - 11   2001年08月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(大学,研究機関等紀要)

  • Subtractive beamformer based on paired-microphones for near-field sound sources 査読有り

    M. Mizumachi,S. Nakamura

    Proc. Intl. Workshop on Hands-Free Speech Communication (HSC 2001)   79 - 82   2001年04月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2001年04月  -  2001年04月

  • マイクロホンアレーを用いた雑音に頑健な音声認識-音を聞き分ける音声認識を目指して-

    西浦敬信,水町光徳,中村哲

    ATRジャーナル   42   16 - 17   2001年02月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(大学,研究機関等紀要)

  • TSP信号を用いた室内伝達特性の測定

    青木淳,水町光徳

    ATR Technical Report   TR-S-0016   2001年02月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(大学,研究機関等紀要)

  • Noise reduction using a small-scale microphone array under non-stationary signal conditions 査読有り

    M. Mizumachi,M. Akagi

    Proc. 7th Western Pacific Regional Acoustic Conference (WESTPRAC VII)   1   421 - 424   2000年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2000年10月  -  2000年10月

  • Design of robust subtractive beamformer for noisy speech recognition 査読有り

    M. Mizumachi,M. Akagi,and S. Nakamura

    Proc. Intl. Conf. On Spoken Language Processing (ICSLP2000)   4   57 - 60   2000年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    2000年10月  -  2000年10月

  • The auditory-oriented spectral distortion for evaluating speech signals distorted by additive noises 査読有り

    M. Mizumachi,M. Akagi

    J. Acoust. Soc. Jpn. (E)   21 ( 5 )   251 - 258   2000年04月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)

  • An objective distortion estimator for hearing aids and its application to noise reduction 査読有り

    M. Mizumachi,M. Akagi

    Proc. 6th European Conf. on Speech Communication and Technology (EUROSPEECH1999)   6   2619 - 2622   1999年09月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    1999年09月  -  1999年09月

  • Noise reduction method that is equipped for a robust direction finder in adverse environments 査読有り

    M. Mizumachi,M. Akagi

    Proc. IEEE Workshop on Robust Methods for Speech Recognition in Adverse Conditions (ROBUST1999)   179 - 182   1999年05月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    1999年05月  -  1999年05月

  • マイクロホン対を用いたスペクトルサブトラクションによる雑音除去法 査読有り

    水町光徳,赤木正人

    電子情報通信学会論文誌A   82-A ( 4 )   502 - 512   1999年04月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)

  • Noise reduction by paired-microphones using spectral subtraction 査読有り

    M. Mizumachi,M. Akagi

    Proc. Intl. Conf. on Acoustics, Speech, and Signal Processing (ICASSP1998)   2   1001 - 1004   1998年05月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    1998年05月  -  1998年05月

  • Noise reduction by paired microphones 査読有り

    M. Akagi,M. Mizumachi

    Proc. 5th European Conf. on Speech Communication and Technology (EUROSPEECH1997)   1   335 - 338   1997年09月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)

    1997年09月  -  1997年09月

▼全件表示

著書

  • 音響キーワードブック

    日本音響学会 編(共著 ,  範囲: 音環境理解)

    コロナ社  2016年03月  ( ISBN:978-4-339-00880-7

     詳細を見る

    記述言語:日本語

口頭発表・ポスター発表等

  • 多様な測定信号を用いた音声の収録および聴取環境の測定例について

    河原 英紀,矢田部 浩平,榊原 健一,水町 光徳,北村 達也,牧 勝弘,坂野 秀樹

    日本音響学会第151回(2024年春季)研究発表会 

     詳細を見る

    開催期間: 2024年03月   記述言語:日本語  

  • ステレオ音源のチャネル間相互相関の周波数依存性

    水町 光徳, 堀内 俊治

    日本音響学会第151回(2024年春季)研究発表会 

     詳細を見る

    開催期間: 2024年03月   記述言語:日本語  

  • ヘッドホン受聴によるステレオステージ幅とチャネル間相互相関の関係

    水町 光徳, 堀内 俊治

    日本音響学会第150回(2023年秋季)研究発表会 

     詳細を見る

    開催期間: 2023年09月   記述言語:日本語  

  • ヘッドホン再生のための振幅と位相の制御によるクロストーク成分生成方式の知覚的最適化

    水町 光徳, 上野 裕生, 堀内 俊治

    日本音響学会第148回(2022年秋季)研究発表会 

     詳細を見る

    開催期間: 2022年09月   記述言語:日本語  

  • 音楽およびさまざまな音響コンテンツを用いた音響システム計測用ツールの試作について

    河原 英紀, 矢田部 浩平, 榊原 健一,水町 光徳, 北村 達也, 坂野 秀樹

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2022年03月   記述言語:日本語  

  • 公共空間の音声明瞭度を改善するEGG解析に基づく話者指標の検討

    小松悠人, 程島奈緒, 榊原健一, 水町 光徳

    日本音響学会2022年春季研究発表会 

     詳細を見る

    開催期間: 2022年03月   記述言語:日本語  

  • LSTMネットワークを用いた非線形ビームフォーマの検討

    荒瀬 新史, 水町 光徳

    日本音響学会2022年春季研究発表会 

     詳細を見る

    開催期間: 2022年03月   記述言語:日本語  

  • チャネル間振幅差と位相差のハイブリッド操作に基づくステレオ音像幅縮退方式の提案

    上野 裕生, 水町 光徳, 堀内 俊治

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2021年12月   記述言語:日本語  

  • ヘッドホン受聴に適したステレオ音源再生方式の特徴について

    上野 裕生, 水町 光徳, 堀内 俊治

    若手・学生のためのAESジャパンフォーラム 

     詳細を見る

    開催期間: 2021年11月   記述言語:日本語  

  • 音響データ収集システムでの音響特徴に基づいた通信データ量削減方法に関する研究

    藤野慎也, 髙野千愛, 水町光徳, 池永全志, 塚本和也, 野林大起

    電子情報通信学会ソサイエティ大会 

     詳細を見る

    開催期間: 2021年09月   記述言語:日本語  

  • 屋外施設を対象とする音響データ収集システムにおける無線LAN通信特性評価,

    髙野千愛, 藤野慎也, 野林大起, 塚本和也, 水町光徳, 池永全志

    電子情報通信学会ソサイエティ大会 

     詳細を見る

    開催期間: 2021年09月   記述言語:日本語  

  • ヴァーチャル観測信号を用いたニューラルネットワークビームフォーマの指向特性先鋭化

    金清 祐紀, 水町 光徳, 宮崎 亮一

    日本音響学会2021年春季研究発表会 

     詳細を見る

    開催期間: 2021年03月10日 - 2021年03月12日   記述言語:日本語  

  • 音声資料の収録・再生環境の簡易な把握に向けて:オールパスフィルタの従属接続に基づく拡張された時間伸長パルスの応用

    河原 英紀, 矢田部 浩平, 榊原 健一,水町 光徳, 森勢 将雅, 坂野 秀樹, 入野 俊夫

    日本音響学会2021年春季研究発表会 

     詳細を見る

    開催期間: 2021年03月10日 - 2021年03月12日   記述言語:日本語  

  • ヘッドホン受聴によるステレオ音像幅縮退アルゴリズムの主観的最適化

    上野 裕生, 水町 光徳, 堀内 俊治

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2021年03月03日 - 2021年03月04日   記述言語:日本語  

  • Versatile system analysis procedure based on a frequency domain variant of velvet noise,

    H. Kawahara, K. Sakakibara, M. Mizumachi, M. Morise, H. Banno

    The 179th Meeting of the Acoustical Society of America 

     詳細を見る

    開催期間: 2020年12月07日 - 2020年12月11日   記述言語:英語  

  • 音声収集と聴取における対話的実時間音響計測ツールの応用について

    河原 英紀, 榊原 健一, 水町 光徳, 入野俊夫

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2020年11月20日   記述言語:日本語  

  • バイノーラルレンダリングとステレオ音像幅制御の主観的特徴の比較

    上野 裕生, 水町 光徳, 堀内 俊治

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2020年11月20日   記述言語:日本語  

  • 音声の収録条件が音声パラメタの分析に与える影響について

    河原 英紀, 榊原 健一,水町 光徳

    日本音響学会2020年秋季研究発表会 

     詳細を見る

    開催期間: 2020年09月   記述言語:日本語  

  • 複数の音響センサノードによる機器異常検知システム

    髙野 千愛, 藤野 慎也, 野林 大起, 塚本 和也, 水町 光徳, 池永 全志

    電子情報通信学会ソサイエティ大会 

     詳細を見る

    開催期間: 2020年09月   記述言語:日本語  

  • 音響インパルス応答の位相補償への滑らかな局所的位相操作関数の応用について

    河原 英紀, 榊原 健一, 水町 光徳, 森勢 将雅, 坂野 秀樹

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2020年08月   記述言語:日本語  

  • 周波数領域ベルベットノイズを用いた音響計測の拡張 -4系列利用の効果と同時三次元位置計測への応用について-

    河原 英紀, 榊原 健一, 水町 光徳, 森勢 将雅, 坂野 秀樹

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2020年07月   記述言語:日本語  

  • ヘッドホン再生のためのステレオ音源加工方法の空間印象評価

    上野 裕生, 水町 光徳, 堀内 俊治

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2020年03月   記述言語:日本語  

  • 周波数領域velvet noiseを用いた音響インパルス応答計測用試験信号の拡張について

    河原 英紀, 榊原 健一,水町 光徳

    日本音響学会2020年春季研究発表会 

     詳細を見る

    開催期間: 2020年03月   記述言語:日本語  

  • 周波数領域ベルベットノイズを用いた残響時間の実時間可視化の検討

    河原 英紀, 榊原 健一, 水町 光徳, 森勢 将雅, 坂野 秀樹

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2020年03月   記述言語:日本語  

  • 小型マイクロフォンアレイを用いた非線形ビームフォーマの性能評価

    岡 遼太郎, 水町 光徳

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2019年12月   記述言語:日本語  

  • 省電力再生を目的とした音声加工が単語了解度へ及ぼす影響

    中嶋 司, 中川原 光洋, 水町 光徳

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2019年12月   記述言語:日本語  

  • 音響システムの各種特性の計測における周波数領域velvet noiseの応用について

    河原 英紀, 榊原 健一, 水町 光徳, 森勢 将雅, 坂野 秀樹, 入野 俊夫

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2019年10月   記述言語:日本語  

  • 音声の録音の基本手順と支援ツールについて

    榊原 健一,河原 英紀,水町 光徳

    日本音響学会2019年秋季研究発表会 

     詳細を見る

    開催期間: 2019年09月   記述言語:日本語  

  • 周波数領域velvet noiseを用いた音響計測手順の拡張について

    河原 英紀, 榊原 健一,水町 光徳

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2019年07月   記述言語:日本語  

  • マスキング特性を考慮した省電力音響再生法の有用性検証

    中嶋 司, 中川原 光洋, 水町 光徳

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2019年03月   記述言語:日本語  

  • スペクトル歪み評価関数と指向特性評価関数を用いた交互学習による非線形ビームフォーマ

    江口 航平, 水町 光徳

    日本音響学会2018年秋季研究発表会 

     詳細を見る

    開催期間: 2018年09月   記述言語:日本語  

  • 周波数領域velvet noiseとパワースペクトルの静的表現を用いた音響計測の可能性について

    河原 英紀, 森勢 将雅, 水町 光徳

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2018年08月   記述言語:日本語  

  • 聴覚特性を考慮した省電力音響再生のための音源加工 ~ 騒音環境下での主観評価 ~

    中川原 光洋, 中嶋 司, 水町 光徳

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2018年07月   記述言語:日本語  

  • 聴覚特性を考慮した省電力音響再生のための音源加工 ~ マスキング効果が音源加工に与える影響について ~

    中嶋 司, 中川原 光洋, 水町 光徳

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2018年07月   記述言語:日本語  

  • 日本語母音発話の主観印象と母音空間パラメータの関係

    松本 遥, 水町 光徳, 榊原 健一

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2018年03月   記述言語:日本語  

  • 信号劣化低減を目的とした広帯域非線形ビームフォーマの検討

    西嶋 祐哉, 水町 光徳

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2018年02月   記述言語:日本語  

  • 母音発話の明瞭性とフォルマント周波数分布の関係

    松本 遥, 水町 光徳

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2017年10月   記述言語:日本語  

  • ハイレゾ音源の知覚に対する再生環境の違いの影響

    山本 竜太, 二矢田 勝行, 水町 光徳

    日本音響学会2017年春季研究発表会 

     詳細を見る

    開催期間: 2017年03月   記述言語:日本語  

  • 聴覚特性を考慮した音源加工による省電力音源再生に関する検討

    中川原 光洋, 久保田 航, 水町 光徳

    日本音響学会2017年秋季研究発表会 

     詳細を見る

    開催期間: 2017年03月   記述言語:日本語  

  • ディープニューラルネットワークによる広帯域ビームフォーマの提案

    折口槙弥, 水町光徳

    日本音響学会2017年春季研究発表会 

     詳細を見る

    開催期間: 2017年03月   記述言語:日本語  

  • 音声明瞭度と物理的歪みの時間・周波数変動との関係

    森山 由美子, 水町 光徳

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2017年01月   記述言語:日本語  

  • 高齢者音声の主観印象と音響的特徴に関する検討

    竹森 州平, 水町 光徳

    福祉情報工学研究会 

     詳細を見る

    開催期間: 2016年10月   記述言語:日本語  

  • ディープニューラルネットワークを用いた遅延和ビームフォーマの学習方法についての検討

    折口 槙弥, 水町 光徳

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2016年07月   記述言語:日本語  

  • ディープニューラルネットワークを用いた遅延和ビームフォーマの最適化

    折口 槙弥, 水町 光徳

    応用/電気音響研究会 

     詳細を見る

    開催期間: 2016年03月   記述言語:日本語  

  • Individual interaction between hearing and speaking due to aging

    Mitsunori Mizumachi

    Meeting of the Acoustical Society of America 

     詳細を見る

    開催期間: 2015年11月   記述言語:英語  

  • 騒音環境下における数字読み上げ音声の桁数と了解度の関係

    堀川智帆, 詫間翔大, 水町光徳

    日本音響学会2015年春季研究発表会  日本音響学会

     詳細を見る

    開催期間: 2015年03月   記述言語:日本語  

  • 車室内における雑音の定常性と音声了解度の関係

    詫間翔大, 堀川智帆, 水町光徳

    日本音響学会2015年春季研究発表会  日本音響学会

     詳細を見る

    開催期間: 2015年03月   記述言語:日本語  

  • Change of Static Characteristics of Japanese Word Utterances with Aging

    Mitsunori Mizumachi

    Meeting of the Acoustical Society of America 

     詳細を見る

    開催期間: 2014年10月   記述言語:英語  

  • 加齢による聴覚と発話の相互作用

    水町光徳

    福祉情報工学研究会 

     詳細を見る

    開催期間: 2013年10月   記述言語:日本語  

  • 雑音除去音声聴取時の脳活動計測

    水町光徳

    日本音響学会春季研究発表会  日本音響学会

     詳細を見る

    開催期間: 2013年03月   記述言語:日本語  

  • 雑音除去音声の主観評価と客観評価との関係-音声歪みの短時間変動へ着目した考察-

    水町光徳

    日本音響学会研究発表会 

     詳細を見る

    開催期間: 2012年03月   記述言語:日本語  

  • 雑音除去音声に対する主観評価と客観評価との関係

    水町光徳

    日本音響学会電気音響研究会 

     詳細を見る

    開催期間: 2011年11月   記述言語:日本語  

  • Restoration of intermittent speech signal relying on auditory perceptual capability

    Mitsunori Mizumachi

    Meeting of the Acoustical Society of America 

     詳細を見る

    開催期間: 2011年10月   記述言語:英語  

  • 空間フィルタリングと周波数フィルタリングの適応的統合による雑音除去

    水町光徳

    日本音響学会研究発表会 

     詳細を見る

    開催期間: 2011年03月   記述言語:日本語  

  • 室内音響の肯定表現と否定表現による印象評価

    水町光徳

    日本音響学会聴覚研究会 

     詳細を見る

    開催期間: 2010年10月   記述言語:日本語  

  • Speech enhancement using adaptive spectral-spatial filter

    Mitsunori Mizumachi

    Meeting of the Acoustical Society of America 

     詳細を見る

    開催期間: 2010年10月   記述言語:英語  

  • パーティクルフィルタと音響信号処理

    水町光徳

    第3回横幹連合総合シンポジウム 

     詳細を見る

    開催期間: 2010年09月   記述言語:日本語  

  • 高齢者の「めりはりの無い声」を表す物理量に関する考察

    日本音響学会講演論文集(春) 

     詳細を見る

    開催期間: 2010年03月   記述言語:日本語  

  • 線形遅延和ビームフォーマの指向特性最適化の検討

    日本音響学会講演論文集(春) 

     詳細を見る

    開催期間: 2010年03月   記述言語:日本語  

  • 孤立単語の語頭母音部にみられる高齢者音声の音響的特徴

    日本音響学会講演論文集(春) 

     詳細を見る

    開催期間: 2010年03月   記述言語:日本語  

  • 高齢者の「めりはりのない声」に対応する物理量の検討

    日本音響学会九州支部第8回学生のための研究発表会講論集 

     詳細を見る

    開催期間: 2009年11月   記述言語:日本語  

  • マイクロホンアレーによる雑音除去音声の品質評価-線形遅延和アレーの最適化の検討-

    日本音響学会九州支部第8回学生のための研究発表会講論集 

     詳細を見る

    開催期間: 2009年11月   記述言語:日本語  

  • Spatial and acoustic feature extraction by particle filtering for efficient noise reduction

    本人

    J. Acoust. Soc. Am.(Proc. 158th MEETING OF THE ACOUSTICAL SOCIETY OF AMERICA) 

     詳細を見る

    開催期間: 2009年10月   記述言語:英語  

  • 高齢者音声の減り張りのなさとスペクトルの時間遷移の関係

    第62回電気関係学会九州支部連合大会講演論文集 

     詳細を見る

    開催期間: 2009年09月   記述言語:日本語  

  • 聴感上の好ましさと音響物理指標との関係について‐周波数帯域に着目した検討 -

    日本音響学会講演論文集(秋) 

     詳細を見る

    開催期間: 2009年09月   記述言語:日本語  

  • 音声認識のためのパラメータと距離尺度の検討

    第62回電気関係学会九州支部連合大会講演論文集 

     詳細を見る

    開催期間: 2009年09月   記述言語:日本語  

  • 音声認識における標準パターンに混入するノイズの検討

    第62回電気関係学会九州支部連合大会講演論文集 

     詳細を見る

    開催期間: 2009年09月   記述言語:日本語  

  • 高齢者音声に見られる「しゃがれ声」の医学的分類に基づく音響的特徴

    日本音響学会 2009年 春季研究発表会 講演論文集 

     詳細を見る

    開催期間: 2009年03月   記述言語:日本語  

  • 環境変化に頑健な空間・音響情報処理

    本人

    日本音響学会 2009年 春季研究発表会 講演論文集 

     詳細を見る

    開催期間: 2009年03月   記述言語:日本語  

  • 同一空間における聴感上の好ましさと音場の空間印象との関係について

    日本音響学会 2009年 春季研究発表会 講演論文集 

     詳細を見る

    開催期間: 2009年03月   記述言語:日本語  

  • マイクロホンアレーによる雑音除去音声の品質評価

    電子情報通信学会技術研究報告 

     詳細を見る

    開催期間: 2008年11月   記述言語:日本語  

  • 高齢者音声の聴覚的特徴を形容する語の抽出に関する検討

    電子情報通信学会技術研究報告 

     詳細を見る

    開催期間: 2008年10月   記述言語:日本語  

  • Direction-Of-Arrival (DOA) estimation by understanding global acoustic scene

    本人

    J. Acoust. Soc. Am.(Proc. 156th MEETING OF THE ACOUSTICAL SOCIETY OF AMERICA) 

     詳細を見る

    開催期間: 2008年10月   記述言語:英語  

  • 高齢者の「めりはりのない声」を表す音響的特徴の検討

    日本音響学会 2008年 秋季研究発表会 講演論文集 

     詳細を見る

    開催期間: 2008年09月   記述言語:日本語  

  • 高齢者音声の聴覚的特徴と対応する音響的特徴に関する検討

    第61回電気関係学会九州支部連合大会 講演論文集 

     詳細を見る

    開催期間: 2008年09月   記述言語:日本語  

  • マイクロホンアレーによる雑音除去音声の歪み評価

    日本音響学会 2008年 秋季研究発表会 講演論文集 

     詳細を見る

    開催期間: 2008年09月   記述言語:日本語  

  • 高齢者音声を印象付ける聴覚的特徴に関する検討

    日本音響学会 2008年 秋季研究発表会 講演論文集 

     詳細を見る

    開催期間: 2008年09月   記述言語:日本語  

  • 高齢者音声を特徴付ける表現語の抽出に関する検討

    日本音響学会 2008年 春季研究発表会 講演論文集 

     詳細を見る

    開催期間: 2008年03月   記述言語:日本語  

  • 雑音除去音声の品質評価線形遅延和アレーにおけるマイクロホン配置の検討

    日本音響学会九州支部 第7回 学生のための研究発表会 講演論文集 

     詳細を見る

    開催期間: 2007年10月   記述言語:日本語  

  • 大空間における好みの席の選定とその席における音響特性の解析

    日本音響学会九州支部 第7回 学生のための研究発表会 講演論文集 

     詳細を見る

    開催期間: 2007年10月   記述言語:日本語  

  • 大空間における主観的音響特徴と物理的音響特性との関係についての研究―座席位置の違いに着目した検討―

    平成19年度電気関係学会九州支部連合大会講演論文集 

     詳細を見る

    開催期間: 2007年09月   記述言語:日本語  

  • バズ音の長さに着目した高齢者音声の特徴解析

    平成19年度電気関係学会九州支部連合大会講演論文集 

     詳細を見る

    開催期間: 2007年09月   記述言語:日本語  

  • 音源と音環境の動特性を考慮した音源方向推定法

    日本音響学会講演論文集 

     詳細を見る

    開催期間: 2007年09月   記述言語:日本語  

  • 受音点の位置変化に頑健な適応的逆フィルタ設計法

    日本音響学会講演論文集 

     詳細を見る

    開催期間: 2007年03月   記述言語:日本語  

  • 高齢者発話の母音特徴に関する検討

    日本音響学会講演論文集 

     詳細を見る

    開催期間: 2007年03月   記述言語:日本語  

  • 音声認識のための高齢者音声の特徴分析

    パーティクルフィルタ研究会&ヒューマンインタフェース研究部会合同研究会 

     詳細を見る

    開催期間: 2007年01月   記述言語:日本語  

  • Direction-Of-Arrival (DOA) estimation by particle filtering with dominant frequency components in noisy environments

    Proc. 4th JOINT MEETING OF THE ACOUSTICAL SOCIETY OF AMERICA AND THEACOUSTICAL SOCIETY OF JAPAN, J. Acoust. Soc. Am., 

     詳細を見る

    開催期間: 2006年11月28日 - 2006年12月02日   記述言語:英語  

  • 高齢者音声のスペクトル特徴に関する検討

    日本音響学会講演論文集 

     詳細を見る

    開催期間: 2006年09月   記述言語:日本語  

  • 周波数選択とパーティクルフィルタリングによる雑音に頑健な信号到来方向推定

    日本音響学会講演論文集 

     詳細を見る

    開催期間: 2006年09月   記述言語:日本語  

  • 周波数選択性を持つ相互相関に基づく信号到来方向推定

    電気関係学会九州支部第58回連合大会講演論文集 

     詳細を見る

    開催期間: 2006年09月   記述言語:日本語  

  • 高齢者音声を特徴付ける「めりはり」に関する音響的解析

    電気関係学会九州支部第58回連合大会講演論文集 

     詳細を見る

    開催期間: 2006年09月   記述言語:日本語  

  • 周波数選択性を持つ相互相関に基づく信号到来方向推定

    日本音響学会講演論文集 

     詳細を見る

    開催期間: 2006年03月   記述言語:日本語  

  • SLP雑音下音声認識評価WG活動報告:評価用データと評価手法について

    第7回音声言語シンポジウム 

     詳細を見る

    開催期間: 2005年12月   記述言語:日本語  

  • 高齢者音声認識を目的としたしゃがれ声の分析

    電気関係学会九州支部第57回連合大会講演論文集 

     詳細を見る

    開催期間: 2005年09月   記述言語:日本語  

  • 高齢者音声標準パターンによる高齢者音声認識性能の評価

    電気関係学会九州支部第57回連合大会講演論文集 

     詳細を見る

    開催期間: 2005年09月   記述言語:日本語  

  • Particle filterによる長期記憶と短期記憶を用いた信号到来方向推定

    日本音響学会講演論文集 

     詳細を見る

    開催期間: 2005年09月   記述言語:日本語  

  • 音声認識へのパワーエンベロープを用いた残響除去法の有効性検証

    電気関係学会九州支部第57回連合大会講演論文集 

     詳細を見る

    開催期間: 2005年09月   記述言語:日本語  

  • Particle filterを用いた相互相関に基づく音源到来方向推定法

    日本音響学会講演論文集 

     詳細を見る

    開催期間: 2005年03月   記述言語:日本語  

  • 実走行車内音声認識の評価データベースCENSREC-3とその共通評価ベースライン

    日本音響学会講演論文集 

     詳細を見る

    開催期間: 2005年03月   記述言語:日本語  

  • 実走行車内単語音声データベースCENSREC-3と共通評価環境の構築

    第55回 音声言語情報処理研究会 

     詳細を見る

    開催期間: 2005年02月   記述言語:日本語  

  • 実環境下音声認識の評価の標準化とその動向

    音声言語シンポジウム 

     詳細を見る

    開催期間: 2004年12月   記述言語:日本語  

  • CENSREC-3: 実走行車内単語音声データベースと評価環境の構築

    音声言語シンポジウム 

     詳細を見る

    開催期間: 2004年12月   記述言語:日本語  

  • 歩行者支援GISにおける耐雑音性音声入力インタフェース

    ヒューマンインタフェースシンポジウム2004 

     詳細を見る

    開催期間: 2004年10月   記述言語:日本語  

  • 歩行者支援GISにおける音声入力インタフェースの検討

    信学技報 

     詳細を見る

    開催期間: 2004年07月   記述言語:日本語  

▼全件表示

工業所有権

  • 音響信号処理装置、音響信号処理方法、及びコンピュータプログラム

    水町光徳

     詳細を見る

    出願番号:'特願2010-00238  出願日:2010年01月04日

    本発明は、雑音環境下での音響観測信号より推定した音源方向の信頼性を推定する音響信号処理装置及び音響信号処理方法、並びにコンピュータに音源方向の信頼性を推定させる
    ためのコンピュータプログラムに関する。

  • ノイズ除去装置

    水町光徳,中村哲

     詳細を見る

    公開番号:'特開2005-258158  公開日:2005年09月22日

  • マイクロホンアレー座標系の逐次的補正方法、マイクロホンアレーにおけるマイクロホン受信信号の補正方法および補正装置

    堀内俊治,水町光徳,中村哲

     詳細を見る

    公開番号:'特開2004-112701  公開日:2004年04月20日

  • 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム

    スーン・フランク・ガーピン,ガスニエー・セバスチャン,水町光徳,中村哲

     詳細を見る

    公開番号:'特許公開2005-77205  公開日:2005年03月24日

  • マイクロホンアレー

    嵯峨山茂樹,鎌本優,西本卓也,堀内俊治,水町光徳,中村哲

     詳細を見る

    公開番号:'特開2005-260743  公開日:2005年09月22日

  • マイクロホンアレーにおけるマイクロホン受音信号の同相化方法および同相化装置

    堀内俊治,水町光徳,中村哲

     詳細を見る

    公開番号:'特許公開2005-260744  公開日:2005年09月22日

▼全件表示

科研費獲得実績

  • 連続聴効果を積極的に利用した断続音声の知覚的修復

    研究課題番号:26330197  2014年04月 - 2017年03月   基盤研究(C)

  • 音源・音環境の統一的モデリングによる雑音に頑健な音源方向推定に関する研究

    研究課題番号:20760266  2008年04月 - 2010年03月   若手研究(B)

  • 高齢者の音響的特徴抽出に基づく高齢者音声認識インタフェースに関する研究

    研究課題番号:19560387  2007年04月 - 2010年03月   基盤研究(C)

  • 音響空間情報を用いた環境依存性の低い雑音除去法に関する研究

    研究課題番号:17760338  2005年04月 - 2008年03月   若手研究(B)

  • ユビキタス時代の音声インタフェース実現のための高齢者音声認識に関する研究

    研究課題番号:17560345  2005年04月 - 2007年03月   基盤研究(C)

その他競争的資金獲得実績

  • 周波数・空間フィルタリングと目的音源追尾との有機的融合による雑音除去技術の研究開発

    2008年06月 - 2012年05月

    産業技術研究助成事業  

     詳細を見る

    課題番号:08A12002c

担当授業科目(学内)

  • 2023年度   先端電子工学特論

  • 2023年度   音響信号処理特論

  • 2023年度   信号処理Ⅰ

  • 2023年度   電気電子工学実験ⅢA

  • 2023年度   プログラミング技法

  • 2023年度   専門英語Ⅰ

  • 2023年度   電気電子工学PBL実験

  • 2023年度   信号処理Ⅰ

  • 2022年度   音響信号処理特論

  • 2022年度   信号処理Ⅰ

  • 2022年度   電気電子工学実験ⅢA

  • 2022年度   プログラミング技法

  • 2022年度   専門英語Ⅰ

  • 2022年度   電気電子工学PBL実験

  • 2022年度   信号処理Ⅰ

  • 2021年度   先端電子工学特論

  • 2021年度   音響信号処理特論

  • 2021年度   信号処理Ⅰ

  • 2021年度   電気電子工学実験ⅢA

  • 2021年度   プログラミング技法

  • 2021年度   専門英語Ⅰ

  • 2021年度   電気電子工学PBL実験

  • 2021年度   信号処理Ⅰ

  • 2020年度   音響信号処理特論

  • 2020年度   信号処理Ⅰ

  • 2020年度   プログラミング技法

  • 2020年度   専門英語Ⅰ

  • 2020年度   信号処理Ⅰ

  • 2019年度   音響信号処理特論

  • 2019年度   プログラミング技法

  • 2019年度   信号処理Ⅰ

  • 2018年度   プログラミング技法

  • 2018年度   専門英語Ⅱ

  • 2018年度   専門英語Ⅰ

  • 2018年度   信号処理Ⅰ

  • 2018年度   音響信号処理特論

  • 2018年度   電気電子工学概論

  • 2017年度   電気電子工学概論

  • 2017年度   音響信号処理特論

  • 2017年度   プログラミング技法

  • 2017年度   専門英語Ⅱ

  • 2017年度   専門英語Ⅰ

  • 2017年度   信号処理Ⅰ

  • 2016年度   信号処理Ⅰ

  • 2016年度   プログラミング技法

  • 2016年度   音響信号処理特論

  • 2015年度   信号処理Ⅰ

  • 2015年度   プログラミング技法

  • 2015年度   音響信号処理特論

  • 2014年度   プログラミング技法

  • 2014年度   信号処理Ⅰ

  • 2014年度   音響信号処理特論

  • 2014年度   先端通信・ネットワーク特論

  • 2014年度   電気電子工学PBL実験

  • 2014年度   電気電子工学実験ⅢA

  • 2013年度   信号処理Ⅱ

  • 2013年度   プログラミング技法

  • 2013年度   システムエレクトロニクス実験

  • 2013年度   先端エレクトロニクス特論

  • 2013年度   音響信号処理特論

  • 2012年度   信号処理Ⅱ

  • 2012年度   音響信号処理特論

  • 2012年度   システムエレクトロニクス実験

  • 2011年度   音響信号処理特論

  • 2011年度   信号処理Ⅱ

▼全件表示

学会・委員会等活動

  • (一社)日本音響学会   理事  

    2021年05月 - 現在

  • (一社)日本音響学会   九州支部 評議員  

    2023年05月 - 現在

  • (一社)電子情報通信学会   九州支部 学生会幹事  

    2019年06月 - 現在

  • (一社)産業応用工学会   理事  

    2022年09月 - 現在

  • Audio Engineering Society   Convention Papers Program Committee  

    2022年02月 - 現在

  • (一社)日本音響学会   電気音響研究会 専門委員  

    2019年06月 - 2024年05月

  • (社)日本音響学会   編集委員会(会誌部会)・編集幹事  

    2019年06月 - 2021年05月

  • (社)日本音響学会   九州支部 会計監査  

    2019年04月 - 2021年03月

  • International Congress on Sound and Vibration   International Scientific Committee  

    2018年07月 - 現在

  • (社)電子情報通信学会   応用音響研究委員会 専門委員  

    2018年06月 - 2024年05月

  • (社)日本音響学会   評議員  

    2017年06月 - 2021年05月

  • (社)日本音響学会   編集委員会(会誌部会)・編集委員  

    2017年06月 - 2019年05月

  • (社)日本音響学会   九州支部 評議員  

    2017年06月 - 2019年05月

  • (社)日本音響学会   電気音響研究会 副委員長  

    2017年06月 - 2018年05月

  • (社)電子情報通信学会   応用音響研究委員会 副委員長  

    2017年06月 - 2018年05月

  • (社)日本音響学会   電気音響研究会 委員長  

    2016年06月 - 2017年05月

  • (社)電子情報通信学会   代議員  

    2016年06月 - 2017年05月

  • (社)電子情報通信学会   応用音響研究委員会 委員長  

    2016年06月 - 2017年05月

  • (社)電子情報通信学会   基礎・境界ソサイエティ・副会長  

    2016年06月 - 2017年05月

  • (社)電子情報通信学会   音響・超音波サブソサイエティ・会長  

    2016年06月 - 2017年05月

  • (社)電子情報通信学会   九州支部 会計幹事  

    2015年06月 - 2017年05月

  • (社)日本音響学会   電気音響研究会 副委員長  

    2015年05月 - 2016年05月

  • (社)電子情報通信学会   応用音響研究委員会 副委員長  

    2015年05月 - 2016年05月

  • (社)電子情報通信学会   Fundamentals Review 編集委員  

    2015年01月 - 2017年05月

  • (社)日本音響学会   九州支部 会計幹事  

    2014年04月 - 2016年03月

  • (社)日本音響学会   電気音響研究会 幹事  

    2013年05月 - 2015年05月

  • (社)電子情報通信学会   応用音響研究委員会 幹事  

    2013年05月 - 2015年05月

  • (社)電子情報通信学会   和文論文誌A小特集号 編集幹事  

    2013年05月 - 2014年04月

  • 信号処理学会   編集委員  

    2012年12月 - 現在

  • (社)日本音響学会   電気音響研究会 幹事補佐  

    2012年05月 - 2013年05月

  • (社)電子情報通信学会   応用音響研究委員会 幹事補佐  

    2012年05月 - 2013年05月

  • (社)日本音響学会   九州支部 評議員  

    2012年04月 - 2014年03月

  • The Acoustic Society of America   Reviewer  

    2011年10月 - 現在

  • 電気関係学会九州支部連合会庶務幹事   庶務幹事  

    2010年04月 - 2011年03月

  • (社)電子情報通信学会   和文論文誌 A 編集委員  

    2009年04月 - 2013年05月

  • (社)日本音響学会   九州支部 庶務幹事  

    2009年04月 - 2011年03月

  • 電気関係学会九州支部連合会庶務幹事   役員  

    2009年04月 - 2010年03月

  • European Signal Processing Conference   Reviewer  

    2008年04月 - 現在

  • 情報処理学会   査読委員  

    2005年04月 - 現在

  • (社)日本音響学会   編集委員会 査読委員  

    2003年04月 - 現在

  • Elsevier Applied Acoustics   Reviewer  

    2003年04月 - 現在

  • 情報処理学会   雑音下音声認識ワーキンググループ 委員  

    2002年04月 - 2006年03月

▼全件表示

社会貢献活動(講演会・出前講義等)

  • 音声コミュニケーション支援システムの研究開発と応用

    2014年01月20日

     詳細を見る

    種別:セミナー・ワークショップ

    九州ニュービジネス協議会「第3回 大学シーズ活用促進セミナー」

  • 人の聴覚に学ぶ賢い音情報処理システム

    2013年10月19日

     詳細を見る

    種別:その他

    夢ナビライブ

  • 豊かな生活を支える音響信号処理技術

    2013年10月17日

     詳細を見る

    種別:セミナー・ワークショップ

    九州・国際テクノフェア2013出展社セミナー

国際会議開催(学会主催除く)

  • ICSV 25

    The International Institute of Acoustics and Vibration (IIAV), the Acoustical Society of Japan (ASJ)  2018年07月08日 - 2018年07月12日

  • NCSP'17

    The Research Institute of Signal Processing Japan  2017年02月28日 - 2017年03月03日

  • YKJCA2017

    Youngnam Chapter of the Acoustical Society of Korea, Kyushu Chapter of the Acoustical Society of Japan, Pukyong National University  2017年02月