一、聲音病理偵測與嗓音疾病分類

📄 Liu GS et al. — Scoping Review(Stanford, Otolaryngol Head Neck Surg, 2024) PMID: 38738887 來自 Stanford 大學耳鼻喉科團隊,系統性回顧 AI 應用於聲音病理偵測與分類的現況,分析其挑戰與機會。發表於 Otolaryngol Head Neck Surg 2024 Sep;171(3):658–666。 PubMed


📄 Özcan F. — Explainable AI for Dysphonia Classification(Sci Rep, 2025) DOI: 10.1038/s41598-025-03444-3(尚無獨立 PMID,PMC: PMC12104310) 使用遷移學習技術(fine-tuned OpenL3)對 8 種嗓音病理(含 Hyperkinetic dysphonia 等)進行分類,並結合可解釋性 AI(XAI),以公開資料集驗證。2025 年 5 月發表於 Scientific ReportsPubMed Central


📄 AI Detection of Glottic Neoplasm(Laryngoscope, 2024) PMID: 38864282 結合深度神經網路,整合聲音訊號、人口學資料與結構化病歷,偵測聲門新生物。發表於 Laryngoscope 2024,Level of evidence: NA。 PubMed


二、喉癌聲音篩檢

📄 Moothedan E et al. — AI and Laryngeal Cancer Review(Front Digit Health, 2025) PMID: 40302934 Bridge2AI-Voice Consortium 參與,涵蓋喉癌從篩檢到預後的 AI 應用 state-of-the-art review。2025 年 4 月發表。 PubMed


📄 Systematic Review & Meta-Analysis — AI in Laryngeal Cancer Detection(PMC, 2025) PMC: PMC12191837(PROSPERO: CRD420250656619) 納入 15 篇研究、共 17,559 名患者,Meta 分析顯示 AI 偵測喉癌的整體敏感度 78%、特異度 86%,Pooled Diagnostic Odds Ratio 為 53.77(95% CI: 27.38–105.62)。搜尋時間涵蓋至 2025 年 2 月,依 PRISMA 指引執行。 PubMed Central


📄 Kim S et al. — Enhanced WGAN for Laryngeal Carcinoma(Cancers, 2024) PMID: 39456576 Enhanced WGAN(生成對抗網路)模型用於喉癌診斷,2024 年 10 月發表。


三、神經性嗓音疾病(帕金森病、痙攣性發聲困難)

📄 Shen M et al. — XAI for Early Parkinson’s Disease via Voice(Sci Rep, 2025) PMID: 40188263 結合 CNN、RNN、MKL 與 MLP 的混合模型,分析 MFCC、jitter、shimmer 等聲學特徵,達到 AUC 0.9125、準確率 91.11%。為非侵入性、低成本的帕金森早期篩檢工具。2025 年 4 月發表於 Sci RepPubMed


📄 Dudek M et al. — Voice Biomarkers of PD in Mixed Reality(Sensors, 2025) PMID: 40285095 在混合實境環境中採集帕金森病患者的聲音、語音與語言生物標記,2025 年 4 月發表於 SensorsPubMed


📄 Applications of AI in Neurological Voice Disorders(World J Otorhinolaryngol HNS, 2025) PMC: PMC12753207 系統性回顧 2010–2025 年 ML/DL 應用於喉部肌張力不全、痙攣性發聲困難、帕金森病、聲帶麻痺等神經性嗓音疾病。強調深度學習(CNN、Transformer)在聲學生物標記提取的成效,也點出資料集不足與臨床驗證的挑戰。 PubMed Central


📄 Systematic Review — Voice-Based PD Detection ML/DL(2020–2025) PMC: PMC12649940 搜尋 PubMed、Web of Science、IEEE Xplore、Scopus 共 69 篇符合條件研究,全面分析資料集特性、語音任務、特徵萃取技術、模型架構與驗證策略。 PubMed Central


四、LLM 在嗓音評估的應用(新興議題)

📄 ChatGPT/Perplexity AI vs. Expert Auditory-Perceptual Assessment(Eur Arch Otorhinolaryngol, 2024) PMID: 39174679 研究目的在評估 ChatGPT 與 Perplexity AI 在判斷嗓音嘶啞程度(perceived dysphonia level)的角色,以 50 名成人嗓音病患為對象,結果顯示 AI chatbot 與專家聽知覺評估之間的 Cohen’s Kappa 未達統計顯著。 PubMed

發佈留言