通过语音检测COVID-19的高科技探索

从识别发烧的无人机到3D打印的呼吸机组件,再到移动位置数据的跟踪,技术专家们不乏利用现代技术来跟踪(并有望帮助减缓)冠状病毒大流行扩散的方法。

卡内基梅隆大学的研究人员提出了迄今为止最复杂且听起来不太像的方法之一,但如果能奏效,那么对于一个严重缺乏适当COVID-19测试套件的世界来说,它可能会改变游戏规则。这个主意?一个免费的应用程序,可以通过以下方式诊断COVID-19: 听和分析用户的声纹

“首先,我们这里要做的是数据收集工作,” 比克莎·拉吉(Bhiksha Raj)卡内基·梅隆大学(Carnegie Mellon)一位从事该项目的教授告诉《数字趋势》。 “在对COVID和非COVID声音和咳嗽进行分析并进行了初步测试后,我们相信通过分析声音,可能会获得潜在COVID的可靠标志。我们建立了一个鼓励人们贡献录音的系统。我们需要成千上万来自感染了COVID的受试者的录音,以及成千上万的未感染者,既健康又有其他问题。我们希望人们能有所贡献。”

该应用程序名为 COVID语音检测器,而不仅仅是收集尚未确定的某些端点的数据。该应用程序现已上市,用户可以自行测试。

通过访问卡内基·梅隆(Carnegie Mellon)的专用网站,用户可以提交一系列测试,以确定其估计的“ COVID-19得分”。为此,他们必须首先在简短的个人资料中填写有关其年龄,体重,性别,身高以及他们最认同的种族或族裔群体的信息。他们还必须回答有关当前表现出的任何咳嗽或发烧问题,以及以前诊断过COVID-19的问题。之后,它进行了一系列音频测试,例如,麦克风三声咳嗽,长时间发出“ ooo”和“ eee”声音,以及重复输入字母。然后将数据提交给研究人员,研究人员将使用它进一步完善系统。一分钟之内,用户就可以找到自己的结果,这些结果以滑动量表的形式显示,表明我们应该如何关注。

Raj承认:“您目前所获得的COVID分数更多是猜测您的声音中的特征与我们到目前为止分析的其他COVID患者的特征相匹配的程度。”肺部感染者的咳嗽听起来有所不同。像“ aaaa”这样的细长元音不仅听起来有所不同,而且缩短了保持它们的持续时间。当您说一长串数字,紧接着是字母时,系统会要求您说更长的时间。 COVID患者倾向于呼吸困难,流鼻涕,喉咙有些酸痛且容易疲劳。所有这些都会影响他们的讲话方式,尤其是当他们必须长时间讲话时。”

但这有效吗?

当然,数万亿美元的问题(至少可以用自冠状病毒大流行开始以来股票市场损失的资金来衡量)才是有效的方法。关于冠状病毒,有这么多问题-从是否有人捕获这种问题到我们目前的冠状病毒锁定将持续多长时间的问题而来-简单的答案是我们尚不知道。

COVID语音检测器团队强调,这仍然是一个正在开发的工具,不应视为官方诊断的有效替代方法。用户创建个人资料时,该网站上的复选框显示:“我知道这是一个实验系统,仍在开发中。” “这不是诊断系统。它尚未得到医学专家的验证。它未经FDA或CDC批准,不得用作医学检验或检查的替代品。”

通过语音检测COVID-19的高科技探索 1

尽管如此,还是有一些令人印象深刻的人才参与其中。这不是夜间飞行操作。 丽塔·辛格(Rita Singh)卡内基·梅隆(Carnegie Mellon)的计算机科学教授,在开发人工智能方面起着领导作用,长期致力于识别人声中的微特征。她认为语音可以用来挖掘有关个人的大量心理,生理和医学数据。 (其他研究人员以前曾使用语音作为诊断数据的可能来源, 帕金森氏症等疾病。

同时,COVID语音检测器对肺活量评分的使用由A.I.创建。公司叫 告诉,通过与医院和医生合作的多年研究,开发出准确的肺活量测量方法。 (由于缺乏数据,现阶段尚不清楚的是这与已知会侵袭肺部的COVID-19有何关系。)

COVID语音检测器等工具的可用性凸显了技术界当前面临的挑战。一段时间以来,显而易见的是,硅谷著名的“快速行动并打破事物”的口号与现实世界对经验证据,适当测试和验证的需求之间存在冲突。简而言之,技术人员坚信将工具合在一起并将其推向世界,相信敏捷的方法学可以使它们进行调整和磨练,直到最终产品达到预期的效果,这并不总是与慢,但需要同行评审和临床测试所需的稳定方法。在医学领域,这一挑战尤其明显。

冠状病毒大流行进一步检验了这一点,其中还增加了第三个因素:缺乏时间和资源。这种情况会鼓励基于速度的实验,必须明智地采用这种实验,以确保可以迅速部署最佳构想,而不会给蛇油解决方案带来不应有的氧气。

快速行动并…对待事物?

COVID语音检测器将属于两种解决方案中的哪一种?它自己的开发人员自由地承认,关于功效,还有很多地方需要证明。比克莎·拉吉(Bhiksha Raj)指出,例如,仅仅因为某人获得了冠状病毒的可能匹配分数,并不一定意味着他们做到了。只是对COVID-19患者的分析还不够充分,无法明确这一联系。 “我绝不希望任何人将其误认为专业或半专业意见,并根据 [this],”拉杰说。 “如果这样做,他们可能会危害自己和他人。”

目前,这充其量不过是一种分类工具,可以促使人们寻求进一步的医学意见。但是,如果它能够按预期运行,则潜在的上升空间可能很大。

拉吉说:“如果这行得通,我们将有一种非常简单的方法来监视数百万人。” “我们不仅可以进行即时评估,还可以观察反复使用它的受试者的纵向趋势。这可以为将来一般情况下的健康暴发提供一种跟踪方式,尤其是那些影响声音的暴发。”

因此,卡内基·梅隆(Carnegie Mellon)计划与世界各地的其他研究人员共享收集的数据,以鼓励他们合作或独立进行研究。一抓? “我们将需要使用我们数据的任何人的保证,即他们也不会保护或商业化由此产生的任何IP。”