Microsoft分析了Web搜索,查找早期癌症检测的线索
微软研究人员在本周发布的一篇文章中显示,分析在线活动可以提供关于患有癌症的人员的线索。
具体而言,研究人员展示了通过分析Web查询日志,他们能够识别甚至在诊断出来之前具有胰腺癌的互联网用户。该研究是一种更大趋势的一部分,数据分析正在用于改善医疗保健。
研究人员得出结论,可以创建“低成本,高覆盖监测系统”,并为胰腺癌提供预警,并为其他具有挑战性的癌症提供方法的预警。““监视系统还可以随着时间的推移提供数据和地标的自动捕获和总结,以便在与医疗专业人员讨论中为患者提供谈话点。”
研究人员在微软自己的Bing搜索引擎上使用了920万个网上查询的专有日志,而是专注于美国于2013年10月至2015年5月的英语人口。他们跟踪了用户的特征“搜索,然后单击活动以捕获意图,为构建统计模型提供数据。
Thinkstock.由Microsoft研究人员组成的研究团队Eric Horvitz博士和Ryen White和Columbia大学学生John Paparrizos博士表示,他们匿名数据,但是每个搜索链接到Web浏览器的标识符。使搜索日志历史的提取。
首先,该团队在线搜索活动的日志确定了“特殊疑问”的搜索者,这是暗示最近对胰腺癌的诊断造成的。那些疑问包括短语,如“为什么我在胰腺中得到癌症”和“我被告知我有胰腺癌,想什么。”
当假设搜索者正在由医疗保健专业人员进行时,研究人员也能够将特殊的Bing创造的过滤器从用户中杂草出去了来自用户的审核。留下720万个网上查询来检查。
然后,该团队在初步查询之前回到了“很多月”,以检查症状模式,因为它们由网络搜索有关胰腺癌症状的症状。
“我们特别展示了我们可以识别5%至15%的案件,同时保持极低的假阳性率,”研究人员在纸上说。假阳性范围从10,000个中的一个人数分为100,000人。
微软微软研究人员认为,他们可以根据以前的搜索历史确定5%至15%的胰腺诊断的用户。
与许多其他癌症不同,这可能缓慢生长,胰腺癌是最具侵略性的,意义早期诊断可能导致更好的结果。
另外,研究人员指出,胰腺癌的早期迹象和症状常为微妙,通常作为非特异性症状出现并随着时间的推移而发展。
分析Web查询的结果指向早期癌症检测 - 在医生诊断前五个月。
“Web搜索日志可以提供胰腺[癌症]筛选的有用信号来源,具有重要的交货时间,”研究人员表示。“因为胰腺[癌症]在近1年内可能从I阶段进入阶段IV,这种筛查能力可以增加5年的生存。”