尽管人类在医学研究领域取得了很多重大进展,但目前仍然没有开发出应对HIV感染的有效疫苗,尽管最近研究人员希望能够发现有效的抗体来中和多种HIV毒株,然而有时候HIV仍然会通过一些突变途径来躲避已知的广泛中和抗体的反应,这就使得研究人员设计出一种有效的解决方案变得非常困难了。
一种理想的疫苗能够产生广泛中和性抗体来靶向作用HIV的突起蛋白,该部位的突变会明显减弱病毒的适应性或者病毒的再生和复制能力,这或许就需要疗法HIV的适应性蓝图,为了完成这一目标,来自香港科技大学和MIT的科学家们就通过研究开发出了一种计算方法,该方法能够评估HIV gp160蛋白的“适应性图像”,gp160是包含HIV突起蛋白的多聚蛋白,随后研究人员通过多种实验性测量进行对比就能证实他们所推荐的图像结构了。
相关研究刊登于国际杂志PNAS上。研究者Raymond Louie表示,如果没有大数据机器学习方法,我们或许就无法简单做出这些预测,而我们所需要估计的参数数量或许接近440万。文章中,研究人员通过对1918名HIV感染个体进行研究,获得的数据包括815个残基和20,043个序列。
研究者Matthew McKay说道,这种计算方法能够给我们快速且准确的结果,相关研究结果也能帮助生物学家提出新的免疫原和疫苗接种策略,来迫使病毒变异为不适应的状态以逃避免疫反应,这可能就会阻止或抑制病毒的感染。当研究人员所开发的方法能解决HIV gp160蛋白带来的特殊挑战时,利用相同的方法或许无法获取其它HIV蛋白的适应性图像信息,而这项研究中,研究者所开发的新技术或许是通用的,其同样适用于一些高维最大熵的推理问题。
最后研究者Mckay表示,未来在临床应用中,我们发现的适应性图像信息或能用于bnAb组合性疗法的选择和免疫原的设计。本文中研究人员展示了一项数据应用的多学科领域研究,尤其是能够解决很多生物学难题的大数据机器学习方法。