
Весь контент iLive перевіряється медичними експертами, щоб забезпечити максимально можливу точність і відповідність фактам.
У нас є строгі правила щодо вибору джерел інформації та ми посилаємося тільки на авторитетні сайти, академічні дослідницькі інститути і, по можливості, доведені медичні дослідження. Зверніть увагу, що цифри в дужках ([1], [2] і т. д.) є інтерактивними посиланнями на такі дослідження.
Якщо ви вважаєте, що який-небудь з наших матеріалів є неточним, застарілим або іншим чином сумнівним, виберіть його і натисніть Ctrl + Enter.
Голос як аналіз: ранні сигнали раку та доброякісних уражень
Останній перегляд: 18.08.2025

Дослідники з Університету охорони здоров'я та науки Орегону проаналізували записи мовлення з нового загальнодоступного набору даних Bridge2AI-Voice та виявили просту акустичну ознаку, яка може виявити патологію голосових складок. Йдеться про співвідношення гармонік до шуму (HNR) — співвідношення «музичних обертонів» до шуму. Його рівень та мінливість відрізняли голоси людей з раком гортані та доброякісними ураженнями від здорових та деяких інших розладів голосу. Ефект був особливо помітний у цисгендерних чоловіків; статистичної значущості для жінок було недостатньо — автори звинувачують у цьому малий розмір вибірки та закликають до розширення даних. Робота була опублікована як короткий звіт у Frontiers in Digital Health.
Передумови дослідження
- Навіщо взагалі шукати «голосові маркери»? Охриплість — поширена скарга. Причини різноманітні: від застуди та рефлюксу до вузликів/поліпів та раку гортані. Наразі шлях до постановки діагнозу — це візит до ЛОР-лікаря та ендоскопія (камера в носі/горлі). Це точний метод, але не завжди швидко доступний і не підходить для домашнього самоконтролю. Потрібне попереднє обстеження: простий спосіб зрозуміти, кому слід звернутися до лікаря в першу чергу.
- Що таке голосовий біомаркер? Мова – це сигнал, який можна легко записати на телефон. Її «візерунок» можна використовувати для оцінки вібрації голосових складок. Ураження роблять вібрації нерівномірними: більше «шуму» та менше «музики».
- Чому нові набори даних важливі. Раніше такі роботи спиралися на невеликі, «саморобні» зразки — моделі були крихкими. Bridge2AI-Voice — це великий, багатоцентровий, етично зібраний набір аудіозаписів, пов’язаних з діагнозами. Він був створений як «спільний тестовий майданчик» для остаточного навчання та тестування алгоритмів на великих та неоднорідних даних.
- Де основні труднощі?
- Голос змінюється через мікрофон, шум у приміщенні, холод, куріння, мову, стать та вік.
- Традиційно менше жіночих даних, а жіночий голос використовується частіше – метрики поводяться по-іншому.
- Жоден «домашній» тест не замінить огляду чи не поставить діагноз – максимум, що допоможе вирішити: «чи необхідно терміново звернутися до ЛОР-фахівця?»
- Навіщо це клініці та пацієнтам? Якщо людей з високим ризиком лімфатичних вузлів/пухлин можна буде обрати для пріоритетного прийому за короткий термін, це пришвидшить діагностику, зменшить кількість непотрібних направлень та надасть інструмент для самоконтролю між візитами (після операції, під час терапії).
- До чого це має призвести: До валідованих телемедицинських програм/модулів, які:
- написати промову відповідно до стандарту (фраза + розтягнуте «ааа»),
- обчислити основні характеристики (HNR, тремтіння, мерехтіння, F0),
- видати рекомендацію звернутися до спеціаліста, якщо профіль викликає тривогу,
- зберегти динаміку після лікування.
Ідея проста: «піднесіть телефон до вуха ЛОР-лікаря» – не для постановки діагнозу, а щоб не пропустити тих, кому потрібна швидка особиста допомога.
Що саме вони зробили?
- Ми взяли перший реліз багатоцентрового, етично зібраного набору даних Bridge2AI-Voice, флагманського проекту NIH, де голосові записи пов'язані з клінічною інформацією (діагнозами, анкетами тощо).
- Було сформовано дві аналітичні вибірки:
- «рак гортані / доброякісні вузли / здорові»;
- «рак або доброякісні вузлики» проти спастичної дисфонії та паралічу голосових складок (інші поширені причини хрипоти).
- Основні голосові характеристики були визначені зі стандартизованих фраз: основний тон (F0), тремтіння, мерехтіння та підвищена чутливість (HNR), а групи порівнювали за допомогою непараметричної статистики. Результат: найбільш стабільні відмінності були в HNR та F0, причому HNR та його варіабельність найкраще відрізняли доброякісні ураження як від норми, так і від раку гортані. Ці сигнали були більш виразними у чоловіків.
Чому це важливо?
- Раннє обстеження без зонда. Наразі шлях до діагностики часто означає назоендоскопію та, за підозри, біопсію. Якщо прості акустичні ознаки в поєднанні зі штучним інтелектом можуть надати пріоритет тим, хто потребує ендоскопії, пацієнти швидше потраплять до ЛОР-спеціаліста, а кількість непотрібних направлень зменшиться. Це доповнення, а не заміна лікаря.
- Великі дані для голосу. Bridge2AI-Voice – це рідкісний проєкт, де голос збирається за допомогою єдиних протоколів та пов’язується з діагнозами; дані доступні дослідникам через PhysioNet / Health Data Nexus. Це прискорює розробку надійних голосових біомаркерів замість «чудодійних програм» на невеликих вибірках.
Що таке ГНР?
Коли ми говоримо, голосові складки вібрують і створюють обертони (гармоніки). Але вібрація ніколи не буває ідеальною — у сигналі завжди присутній шум. HNR (рівень шуму, що передається) — це просто те, наскільки більше «музики» в голосі, ніж «шипіння». Коли складки пошкоджені, вібрація стає менш рівномірною — з'являється більше шуму, HNR падає, а його стрибки (мінливість) збільшуються. Саме цю закономірність і помітили автори.
Важливі застереження
- Це пілотний, дослідницький аналіз: без клінічної валідації, з обмеженнями щодо вибірки жінок – тому їхній вплив не був значним. Потрібні більші та різноманітніші дані та «обсмажування» моделей у різних клініках та різними мовами.
- Голос — річ «багатозначна»: на нього впливає застуда, куріння, рефлюкс, мікрофон, шум у кімнаті. Будь-який «домашній тест» має враховувати контекст — і все ж служити фільтром для направлення до ЛОР-спеціаліста, а не діагнозом, поставленим за кліком.
Що далі?
- Розширте набір даних (включаючи для жінок та вікових груп), стандартизуйте завдання та акустику (читання фрази, тривале «ааа» тощо), спробуйте мультимодальні моделі (голос + симптоми/фактори ризику за анкетою).
- Пов’язати акустичні ознаки з результатами обстежень (ендоскопія, стробоскопія) та динамікою після лікування, щоб профіль HNR також можна було використовувати для моніторингу.
- Продовжуйте «відкриту науку»: Bridge2AI-Voice вже публікує версії набору даних та інструментів – це шанс швидко охопити реальних пілотних проектів у клініках.
Висновок
Можна «почути» проблеми з голосовими зв’язками по голосу — і, можливо, раніше направити людину до потрібного спеціаліста. Поки що це непогана підказка (HNR та її мінливість), але завдяки великим відкритим даним, голосові біомаркери нарешті мають шанс стати надійним інструментом скринінгу.
Джерело: Дженкінс П. та ін. Голос як біомаркер: дослідницький аналіз доброякісних та злоякісних уражень голосових складок. Frontiers in Digital Health, 2025 (прийнято до публікації). Дані — Bridge2AI-Voice (NIH/PhysioNet).