挖掘机械网 >> 水银笔

蛋白质序列竟让编码成乐谱麻省理工学院告诉你可行石墨垫片

2022-07-13

06-28

如何创造出全新的蛋白质?麻省理工学院(MIT)的研究人员可能会告诉你:哼首小曲儿就能行!他们创造了一套能将蛋白质的氨基酸序列转换成音乐序列的系统方法,利用分子的物理特性来确定声音。为了让这些声音落入人类可以听到的听觉范围内,研究人员对它们进行了变调转换,但这些音调是完全基于每个氨基酸分子本身的实际振动频率发出的,而振动频率又是根据量子化学理论计算出来的。

在将科学与艺术完美结合的道路上,MIT的研究人员开发出了一套非常厉害的系统,它能将所有生物的基本组成——蛋白质的分子结构,转换成类似于音乐段落的声音。然后,他们可以让音乐发生一些变化,再逆转这一过程,就将音乐转化成了自然界中从未见过的新蛋白质。好吧,其实并没有真的像哼首小曲儿那么简单,但这个新的系统已经很接近这样的操作了。

这项研究被发表在了 ACS Nano 杂志上(IF=13.903)。据描述,这个系统将20种氨基酸转换成20个音调的音阶,而氨基酸是蛋白质链的组成部分。如此一来,任何蛋白质的氨基酸序列都可以转变成音符序列。

?描绘了溶菌酶结构的分子示意图,这是研究人员在转化为音乐实验中所使用的蛋白质之一。

乍听之下,这些音阶听起来有点奇怪,但一旦熟悉了这些声音,就可以很容易地辨别出它们之间的关系和区别。Markus Buehler是这篇论文的作者之一,他说,在听了这些旋律后,他已经可以分辨出具有特定结构功能的蛋白质的氨基酸序列。

学习蛋白质的语言

这项研究的概念是为了更好地理解蛋白质以及它们的变体。蛋白质不仅是构成皮肤、骨骼和肌肉的结构材料,同时也是酶、信号化学物质、分子开关和许多其他构成了所有生物机制的功能材料。但是它们的结构,折叠方式、决定了它们功能的形状等许多问题都是极其复杂的。Buehler解释说:“它们有自己的语言,而我们却不知道它们是如何运作的。我们不知道是什么使丝蛋白之所以成为丝蛋白,也不知道在一种酶中发现的某种模式能反映它的什么功能。我们不知道它们的密码。”

通过将蛋白质的语言翻译成另一种我们熟悉的形式,可以对它们所蕴含的不同方面的信息在不同的维度(例如音高、音量和时长)进行编码。研究人员希望能获取到关于不同的蛋白质家族及其变化之间的关系的新见解,并以此作为一种探索这些蛋白质的结构和功能的许多可能的调整和修饰。与音乐一样,蛋白质的结构也是分层的,在不同的长度或时间尺度上会有不同的结构层次。

?

音乐与蛋白质结构之间的转换。图中间用不同颜色的条形部分显示了蛋白质中氨基酸的序列。左边显示的是这个氨基酸序列折叠成的形状,形成一个功能性蛋白。右边是每个氨基酸所代表的声音频谱。

然后,研究人员会用人工智能系统来分析不同蛋白质所产生的旋律。他们让人工智能系统在音乐序列中加入微小的变化,或者创造出全新的序列,然后将音乐转化回蛋白质,从而得到相应的修改过或重新设计过的新蛋白质。通过这个过程,他们就能够创造出现有蛋白质的变体,从而制造出不同于任何自然进化所产生的新蛋白质,例如在蜘蛛丝中的一种蛋白质是自然界最强的材料之一。

尽管研究人员还不知道潜在的规则是什么,但人工智能已经学会了设计蛋白质的语言,而且它还可以对蛋白质进行编码,创造出现有版本的变体,或设计出全新的蛋白质。蛋白质可以存在数万亿种可能的组合,在创造新的蛋白质时,我们不可能从零开始,但人工智能却可以做到。

“谱写”新的蛋白质

通过使用这样一个系统,用一组特定种类的蛋白质数据来训练人工智能系统可能需要几天的时间,但一旦训练完成,它就能在几微秒的时间内设计出一种新的变体。这是其他方法无法与之媲美的高效。研究人员笑说:“它的缺点是这无法告诉我们里面到底发生了什么。只让我们知道它很管用。”

这种将结构编码到音乐中的方式确实反映了更深层次的现实。我们在教科书上看到分子是静态的,但实际中的分子根本不是静止的,它们会运动和振动。每一点物质都是一组振动。我们可以用这个概念来描述物质。

不过这个方法还不允许任何形式的定向修改,即发生任何性质的变化,如机械强度、弹性或化学反应性等性质基本上都将是随机的。因此,当一种新的蛋白质变体产生时,我们还是需要通过实验的测试才能了解它的性质,无法做到预测它会发生什么。

研究人员还创作了由氨基酸的声音构成的音乐作品,这些氨基酸定义了这种新的20音音阶。这篇音乐作品完全是由氨基酸产生的声音组成的,目前还没有使用任何合成或天然的乐器。从自然存在的蛋白质和人工智能生成的蛋白质中提取的音乐主题贯穿整个例子,所有的声音,包括一些类似于低音或军鼓的声音,也都来自氨基酸本身。

研究人员还开发了一款名为“氨基酸合成器”(Amino Acid Synthesizer)的免费智能手机APP,可以用它来播放氨基酸的声音,并将蛋白质序列录制成音乐。

对于这项研究,加州大学的一位材料学教授Marc Meyer评论说,这是最富创意的天才之作,这对生物分子的内部运作的探索,以一种最显著的方式推进了我们对生物材料的力学响应的理解。他认为,这种对音乐的想象是一个新颖而有趣的方向,这是最好的实验音乐。生命的节奏,心脏的搏动,都是重复的声音的最初来源,是它们带来了美妙的音乐世界。而新的研究已经进入到纳米空间,提取出构成了生命的氨基酸的韵律。

蛋白质序列是非常复杂的存在,对蛋白质序列进行对比也是非常复杂的工作。创造出这种方法的研究人员为了解和解释这种复杂性提供了一种精妙、有趣、不寻常的方法。我们大多数人都具有听懂复杂的音乐模式的能力,通过听音乐中的细节的“和谐”与否,我们现在有了一个可以有效对比氨基酸序列的工具。

关于蛋白质序列数据库

蛋白质序列数据库指应用计算机功能分析生物学信息的数据库。应用计算机的运算法则,比较DNA和蛋白质序列而检测结构、功能和序列之间的进化关系。各种基因组的序列产生大量的DNA序列数据和生物信息,已经被应用于研究基因的功能,预测以前未知的基因功能。现在人们的注意力主要集中在从仅有的氨基酸序列预测蛋白质结构和功能。

杭州皮肤划痕症医院

沈阳甲状腺医院哪家好

南昌浸渍足医院

海口黄体不足医院

郑州子宫颈肉瘤医院

友情链接