AI 嗓音分析最新學術研究（2024–2025）

一、聲音病理偵測與嗓音疾病分類

📄 Liu GS et al. — Scoping Review（Stanford, Otolaryngol Head Neck Surg, 2024） PMID: 38738887 來自 Stanford 大學耳鼻喉科團隊，系統性回顧 AI 應用於聲音病理偵測與分類的現況，分析其挑戰與機會。發表於 Otolaryngol Head Neck Surg 2024 Sep;171(3):658–666。 PubMed

📄 Özcan F. — Explainable AI for Dysphonia Classification（Sci Rep, 2025） DOI: 10.1038/s41598-025-03444-3（尚無獨立 PMID，PMC: PMC12104310） 使用遷移學習技術（fine-tuned OpenL3）對 8 種嗓音病理（含 Hyperkinetic dysphonia 等）進行分類，並結合可解釋性 AI（XAI），以公開資料集驗證。2025 年 5 月發表於 Scientific Reports。 PubMed Central

📄 AI Detection of Glottic Neoplasm（Laryngoscope, 2024） PMID: 38864282 結合深度神經網路，整合聲音訊號、人口學資料與結構化病歷，偵測聲門新生物。發表於 Laryngoscope 2024，Level of evidence: NA。 PubMed

二、喉癌聲音篩檢

📄 Moothedan E et al. — AI and Laryngeal Cancer Review（Front Digit Health, 2025） PMID: 40302934 Bridge2AI-Voice Consortium 參與，涵蓋喉癌從篩檢到預後的 AI 應用 state-of-the-art review。2025 年 4 月發表。 PubMed

📄 Systematic Review & Meta-Analysis — AI in Laryngeal Cancer Detection（PMC, 2025） PMC: PMC12191837（PROSPERO: CRD420250656619） 納入 15 篇研究、共 17,559 名患者，Meta 分析顯示 AI 偵測喉癌的整體敏感度 78%、特異度 86%，Pooled Diagnostic Odds Ratio 為 53.77（95% CI: 27.38–105.62）。搜尋時間涵蓋至 2025 年 2 月，依 PRISMA 指引執行。 PubMed Central

📄 Kim S et al. — Enhanced WGAN for Laryngeal Carcinoma（Cancers, 2024） PMID: 39456576 Enhanced WGAN（生成對抗網路）模型用於喉癌診斷，2024 年 10 月發表。

三、神經性嗓音疾病（帕金森病、痙攣性發聲困難）

📄 Shen M et al. — XAI for Early Parkinson’s Disease via Voice（Sci Rep, 2025） PMID: 40188263 結合 CNN、RNN、MKL 與 MLP 的混合模型，分析 MFCC、jitter、shimmer 等聲學特徵，達到 AUC 0.9125、準確率 91.11%。為非侵入性、低成本的帕金森早期篩檢工具。2025 年 4 月發表於 Sci Rep。 PubMed

📄 Dudek M et al. — Voice Biomarkers of PD in Mixed Reality（Sensors, 2025） PMID: 40285095 在混合實境環境中採集帕金森病患者的聲音、語音與語言生物標記，2025 年 4 月發表於 Sensors。 PubMed

📄 Applications of AI in Neurological Voice Disorders（World J Otorhinolaryngol HNS, 2025） PMC: PMC12753207 系統性回顧 2010–2025 年 ML/DL 應用於喉部肌張力不全、痙攣性發聲困難、帕金森病、聲帶麻痺等神經性嗓音疾病。強調深度學習（CNN、Transformer）在聲學生物標記提取的成效，也點出資料集不足與臨床驗證的挑戰。 PubMed Central

📄 Systematic Review — Voice-Based PD Detection ML/DL（2020–2025） PMC: PMC12649940 搜尋 PubMed、Web of Science、IEEE Xplore、Scopus 共 69 篇符合條件研究，全面分析資料集特性、語音任務、特徵萃取技術、模型架構與驗證策略。 PubMed Central

四、LLM 在嗓音評估的應用（新興議題）

📄 ChatGPT/Perplexity AI vs. Expert Auditory-Perceptual Assessment（Eur Arch Otorhinolaryngol, 2024） PMID: 39174679 研究目的在評估 ChatGPT 與 Perplexity AI 在判斷嗓音嘶啞程度（perceived dysphonia level）的角色，以 50 名成人嗓音病患為對象，結果顯示 AI chatbot 與專家聽知覺評估之間的 Cohen’s Kappa 未達統計顯著。 PubMed

AI 嗓音分析最新學術研究（2024–2025）

一、聲音病理偵測與嗓音疾病分類

二、喉癌聲音篩檢

三、神經性嗓音疾病（帕金森病、痙攣性發聲困難）

四、LLM 在嗓音評估的應用（新興議題）

發佈留言取消回覆

Support TLA

贊助台灣喉科醫學會

Useful Links

Info

一、聲音病理偵測與嗓音疾病分類

二、喉癌聲音篩檢

三、神經性嗓音疾病（帕金森病、痙攣性發聲困難）

四、LLM 在嗓音評估的應用（新興議題）

發佈留言 取消回覆

Support TLA

贊助台灣喉科醫學會

Useful Links

Info

關注我們

發佈留言取消回覆