Группа учёных из Национального технологического института имени Сардара Валлабхаи в Сурате, Индия, использовала машинное обучение, чтобы отличить голос здорового человека от голоса человека, болеющего простудой.
Исследование основано на том, что человеческая речь, как музыкальный инструмент, не воспроизводит звуки одной частоты. Доминирующие ноты в человеческом голосе сопровождаются рядом более высоких обертонов. Амплитуда (громкость) нот в речи обычно уменьшается по мере продвижения по шкале частот. Эксперты предположили, что простуда может изменить процесс затухания волн.
Учёные использовали записи голосов 630 человек в Германии, 111 из них болели простудой. Каждый испытуемый должен был посчитать от 1 до 40 и рассказать, как он провёл выходные. Люди также читали вслух басню Эзопа «Северный ветер и солнце», которая с 1949 года является популярным текстом для фонетических исследований.
Исследователи разложили речь каждого человека на спектр составляющих её длин волн и определили доминирующие частоту и гармоники в каждом случае. Затем специалисты с помощью алгоритмов машинного обучения (Machine Learning, ML) проанализировали взаимосвязи между амплитудами гармоник и обнаружили закономерности, позволяющие отличить «простуженный» голос от здорового. Однако, результаты эксперимента показали, что таким способом правильно диагностировать простуду можно в 70% случаев.
Отмечается, что по речи можно диагностировать не только простуду. Другие учёные изучают, как различные болезни, от болезни Паркинсона и депрессии до рака шеи, могут влиять на частотные характеристики голоса человека. Такие исследования являются частью более широкой программы медиков, психиатров и программистов по дистанционному обнаружению биомаркеров заболеваний в данных, основанных на том, как люди говорят, пишут и даже ходят.