摘要:生物学家和化学家有一种新的编程语言,可以以惊人的速度发现以前未知的环境污染物 - 而无需他们编码。...
生物学家和化学家有一种新的编程语言,可以以惊人的速度发现以前未知的环境污染物 - 而无需他们编码。通过使搜索大量化学数据集变得更加容易,该工具已经确定了隐藏在平坦视线中的有毒化合物。
质谱数据就像是一种化学指纹,向科学家展示了样品中的分子,例如空气,水或血液以及多少。它有助于识别从水中的污染物到新药的化学物质的所有物品。
在UC Riverside,大众查询语言或MassQL上开发的功能像搜索引擎的质谱数据,使研究人员能够找到需要先进的编程技能的模式。有关该语言的技术细节,以及如何帮助识别公共水道中的阻燃化学物质的一个例子自然方法期刊文章。
UCR创建该语言的UCR助理计算机科学助理教授Mingxun Wang说:“我们想给化学家和生物学家,他们通常也不是计算机科学家,他们可以准确地挖掘他们的数据的能力,而不必花几个月或数年的时间来编码。”
在展示了该语言的有效性时,现在位于圣地亚哥分校的UCR博士后生Nina Zhao使用MassQL筛选了全世界的质谱数据,介绍了已经可以向公众提供的水样品。她正在寻找有机磷酸酯,通常在阻燃剂中发现。
王说:“从字面上看,这些数据中有十亿个分子的测量。您不能手动浏览它。” “但是,对于这些化学物质,该语言就像过滤器一样,它拔出了数千种。”
除了在水样中找到已知的化学物质外,他们还发现了先前尚未描述或分类的有机磷酸化合物,以及一些有机磷酸盐的产物随着时间的推移而分解的一些化学物质。
赵说:“这些化学物质可能会给人类和动物的健康带来很多问题,以及整个生态系统。它们被设计为阻燃剂或增塑剂,但它们可能导致内分泌和性系统中断以及心血管问题。”
在可以从我们的环境中处理或去除有毒化学物质的计划之前,科学家需要知道存在的情况。这就是Massql对Zhao等科学家的方便。
她说:“该语言使我能够所有在空气,土壤,水甚至人体中所有数据中发现的所有内容。无论存在什么,我们都可以在其中搜索化学物质。”
创建MASSQL的挑战之一是使生命科学家达成共识,以同意软件使用的术语的定义。王说:“化学家和计算机科学家都必须了解它,并且该软件必须能够在其上进行操作。”
因此,大约70名科学家在开发阶段进行了咨询。他们都对最重要的信息术语以及如何用MassQL语言表示反馈。
研究团队还想证明该语言在各种现实生活中可能很有用。除了Zhao的项目外,本文还详细介绍了30多个可以应用MassQL的应用程序。
样品使用案例包括发现脂肪酸作为酒精中毒的标志,寻找新药物来解决迫在眉睫的抗生素耐药性危机,了解细菌用来彼此交流的化学物质,并在操场上找到永远的化学物质。
过去,Wang会收到可以查找特定于所有这些不同类型应用程序的数据模式的软件的请求。
他说:“我认为我可以做些节省时间。” “我想创建一种可以处理多种查询的语言。现在我们有了。我很高兴听到可能来自此发现的发现。”