华尔兹的哀的头脑风暴
注册日期:
2012-12-29 01:37:33
上次登录:
2017-05-09 08:49:14
邮件地址:
kaiwentn@gmail.com
兴趣领域:
物理,心理学
  
华尔兹的哀的精华标签
物理(14)
耗散的一个可能来源:不稳定性导致不可逆计算
接连写了两篇脑洞大开文,觉得有点不好意思,这里就写篇干货稍微多些的文平衡下吧 ;-)

Jake今年年初曾发过一贴,感叹“为什么有耗散”(http://www.swarma.org/swarma/detail.php?id=185050)。而Planeheart在他的帖子“信息与物理学:观察者的迷失”(http://www.swarma.org/swarma/detail.php?id=18474)里,也谈到了耗散或者说熵增问题。Planeheart在详细分析了Landauer原理和热力学第二定律后,吐槽到:

不少书籍均将热力学第二定律作为“耗散过程必然发生”的说明,但其实这是以完全错误的方式在使用这个定律。在这种用法中,该定律实际上是一切“可能给人类带来不幸”的因素的总称,例如各种含义下的阻尼作用。将那些原文中的“热力学第二定律”换为“魔鬼撒旦”丝毫不影响作者们试图表达的原意,因为从心理角度来看,这些作者似乎就是这么看待它的。但这个定律只是陈述了孤立体系的熵不可能自发减少,并未陈述孤立体系的熵必然增加的结论。同时,熵增的必要条件是不可逆过程的发生,但这条定律从未陈述孤立体系必定要自发进行不可逆过程,它甚至也没有对普遍情形支持不可逆过程发生概率较高的结论。一个只进行可逆过程的孤立体系根本不会为理论所禁止,也不会被给予低概率。现实中不可逆过程如此常见,仅仅是一种出于不同机制而被强行概括的普遍事实,不是一个原理。正如地球上所有的科学实验中都有人类的参与不是一个科学原理一样。”

在该贴的回帖中,计算士回复说:

也许“耗散必然发生”是犯了个错误,不过也许这个错误是个“高级错误”,实际上会导出某种非常深刻的东西。这种深刻的东西已经被一些人通过直觉感受到了,只是在现有的严格的数学体系里,并没有足以支撑这个直觉的东西,所以它变成了一种“错误的感觉和期待”。目前可以说这种感觉是错的,但也有可能现在的热二的严格形式还不够深刻,没有真正讲清楚信息论和热力学之间的关系。”

确实,按照传统的看法,“不可逆物理过程一定伴随熵产生,从而产生耗散”。但这个不可逆物理过程有点像planeheart说的“强行总结”的东西,一种混杂了时间箭头和我们日常经验的东西。 我们如何在数学上严格证明一个过程是不可逆物理过程呢? 非常难吧。因为这本身就是物理的东西,含有经验成分。而且不可逆过程类型非常多,很难统一描述。所以既然“不可逆物理过程”和“耗散”都是经验的总结,那么用“不可逆物理过程”来解释“耗散”就显得不恰当了。

关于不可逆过程,熵,和耗散,一个基本的例子是热力学第二定律的玻尔兹曼诠释,用气体分子小球的扩散来说明不可逆过程的熵产生。这个在微观上可逆的扩散过程,为什么在宏观不可逆呢?这里玻尔兹曼引入了scale。就是说在宏观层面,我们测量的每个宏观态都对应相应数目的可能的微观态,我们能用这些微观态数目计算出宏观态的熵。而扩散过程,就是可能的微观态数目增加的过程。这样,就可以用这样“粗粒化”的思路解释扩散过程的不可逆和熵增了。

然而,其他还有很多类型的不可逆过程并没有扩散,比如两个分子的化学反应,无法用粗粒化方法解释熵产生。这时,该怎么解释熵产生乃至耗散呢?(因为我对非平衡热力学了解的不多,这里请懂的网友指点下)。

虽然不可逆物理过程似乎无法用数学证明,但是,Landauer原理中的不可逆计算(如信息清零)确是在逻辑和数学上明显的东西,不需要参杂物理。所以如果能把关于耗散的解释建立在不可逆计算这样基于数学而不是物理的基础上(至少可以作为耗散和熵产生的一个可能源头),那么就会非常扎实。

本文就试着说明+猜想耗散的一个可能来源是我们这个宇宙的现实所决定的普遍存在的微观的力学不稳定性,乃至更普遍的不稳定性所导致的不可逆计算。这样,因为不稳定性是严格的数学,Landauer原理也是比较严格的定律,只要我们利用测量和实验解释了广泛存在的不稳定性,就能沿着不稳定性-不可逆计算-耗散的逻辑链解释耗散的一个来源了。

因为耗散的类别非常多,我这里就选普遍存在的具有代表性的固体间的摩擦耗散,作为耗散来源之一来讨论。

让我们先scale down,达到纳米尺度,这个尺度的摩擦学又被称为纳米摩擦学(nanotribology)。

纳米摩擦学领域的一大基石就是在上世纪初由Prandtl提出并由Tomlinson发展的Prandtl-Tomlinson model (http://en.wikipedia.org/wiki/Tomlinson_model),开始是用来研究固体形变的。 当80年代后期原子力显微镜(AFM:http://en.wikipedia.org/wiki/Atomic_force_microscopy)发明后,纳米摩擦学研究有了有力的工具,人们发现用PT model能够很好描述AFM的针尖和样品组成的体系。PT model简单来说,就是认为AFM的针尖同时受到来自cantilever(简单理解就是弹簧)的弹力和样品表面作用力,整个体系的势能是弹簧弹性势能和针尖-样品表面作用势能的相加。 对于晶体来说,针尖-样品的表面作用势能可以简单用cos函数描述,于是整个体系的总体势能表达式就非常简单。

AFM出现后,摩擦学家立刻用AFM的针尖在晶体表面扫,AFM给出的水平方向的力的map就直观地展示出晶格的形貌,或者展现了单个的原子。

在2004年,Bennewitz和Meyer等人仔细考察了PT model给出的力学稳定性(http://journals.aps.org/prl/abstract/10.1103/PhysRevLett.92.134301),从数学上和AFM实验上证明了存在一个临界相变点,由某个系数控制。这个系数由弹簧stiffness,样品晶体的晶格常数,和针尖-样品作用的energy corrugation共同决定。当这个系数大于1时, 针尖运动就会出现不稳定性,在摩擦学里,这被称为stick-slip (http://en.wikipedia.org/wiki/Stick-slip_phenomenon, 这种原子尺度的stick-slip也叫atomic stick-slip),  这时AFM就会给出上一段说得晶格(或者原子排布)的起伏形貌,这时,能够测出显著的摩擦力(准确说,是来回扫的friction loop围的面积,也就是能量耗散,显著大于0)。而当这个系数低于1时(比如可以减小压力使energy corrugation减小),stick-slip消失,针尖会在样品表面随着energy landscape的地貌光滑稳定的滑动,晶格的起伏形貌依然可见,但没有stick-slip时分明了。 更重要的是,这时会发生神奇的现象:friction loop围的面积为0 (或者说摩擦力为0,完全无耗散,至少AFM测不出来,小于pN量级)。Meyer等人把这种friction消失的现象称为超润滑(superlubricity)。

但是,Meyer等人并没有深入下去,解释为什么instability会导致耗散,stable就没耗散。(一些人的看法是instability产生的冲击和震荡会造成电子激发,声子激发等,不过现在我还没有看到更多的理论和实验跟进)。

为了理解为什么stick slip导致耗散(我这里说的其实是一个最小耗散,后文会进一步解释),就必须要清楚AFM针尖stick-slip的物理图景:从energy landscape(http://en.wikipedia.org/wiki/Energy_landscape) 的视角看,整个体系先处于一个势能valley中。外加的水平力让valley的energy barrier逐渐降低(一般认为,外加水平力和barrier的减小呈线性或者3/2的指数关系),当barrier减小到0时,体系就会瞬间跳到下一个valley中。如果考虑到温度的效应,则即使barrier没减小到0,在热扰动的作用下,体系也可以以一定概率跳到下一个valley。

而这个过程,也可以看做最开始有势能的double wells,体系处于其中一个well,然后在水平外力的作用下,这个well的底部提高,同时double wells中间的barrier减小,体系开始以一定概率在两个well之间跳,直到最后变成single well,体系确定地处于另一个well。

现在考虑Landauer原理(http://en.wikipedia.org/wiki/Landauer%27s_principle),开始体系在一个well,意味着系统的状态数目是1,信息熵为0; 后来体系可以同时在两个well出现,意味着体系状态可能数目是2, 信息熵为ln2。 体系最后又跳到一个确定的well里,意味着状态数回1,信息熵归0.

注意,如果stick-slip发生,那么前半过程(状态数从1到2)就是可逆的,后半过程(状态数从2到1)就是不可逆的。 这个不可逆性,本质上是计算的不可逆性, 因为状态数从2强行减小到1是种“信息清零”的不可逆计算过程。 按照Landauer原理,不可逆计算因为有ln2的信息熵减,为了维持总熵不减,体系至少需要伴随 kln2 的热力学熵增,加上温度就是kTln2的热量耗散了。而这个热力学熵增就以热耗散的形式表现出来。 

所以,虽然现在还没有实验证明,我猜测atomic stick slip的最小耗散就是kTln2。当然,slip过程中针尖和和周围物质的冲击震荡会带来向环境中的其他耗散,比如电子激发,声子激发,撞击空气分子等, 而且这个最小耗散kTln2也可能是以以上的几种耗散方式表现出来

我以上用Landauer原理分析double well的过程,是受到Lutz等人2012年的一篇的Nature(原文:http://www.nature.com/nature/journal/v483/n7388/full/nature10872.html, 科普:http://physicsworld.com/cws/article/news/2012/mar/12/wiping-data-will-cost-you-energy)中工作的启发。Lutz等人是用光镊技术操控纳米小球在double well和single well间变换,从而第一次在实验上证明了Landauer原理。

由以上分析可以看出,这个来自Landauer原理的耗散,本质上是把物理过程看做是信息计算过程,用不可逆计算(信息清零)来解释物理世界的耗散现象。其中,熵是联系信息世界和物理世界的桥梁。

因此,耗散的一大来源可能就是普遍存在的局部乃至原子尺度的力学不稳定。 力学不稳定的原因是组成我们宇宙的物质stiffness不是太大,并且有相互滑动。

(从另一个极端情况想,设想一个铁板(stiffness极大)一块的宇宙,之间没有任何部分的相互滑动,那么肯定没有耗散;现在stiffness减小,当stiffness小到一定程度的时候,铁板开始解体,分成许多部分,有表面出现,可以相互滑动,并且stiffness小也有利于Bennewitz等人说的那个系数大于1。Bennewitz等人给出的公式显示,stiffness越大,越难出现stick slip)。

更广泛地,因为本文所分析的不稳定性造成的那个势能的double well变成single well的不可逆计算过程是比较普遍的存在于自然科学中, 所以也许确实可以说“不稳定性造成的不可逆计算”是“普遍存在耗散”的一个原因。这里的不稳定不一定是力学不稳定,可以是更普遍甚至抽象的不稳定,而势能也可以是更抽象的势能。




当然,还有许多东西需要进一步探讨,比如

1.以上分析我的一个潜台词是:不稳定性导致计算不可逆。但这只是出于物理直觉,不知道不稳定性和计算不可逆能不能用数学严格证明有关听说动力系统学对不稳定性和不可逆性关系有研究,希望知道的网友能指点下。


还有,Landauer原理说不可逆计算一定需要不可逆物理过程实现,但反过来,是不是不可逆物理过程不一定是不可逆计算? 请懂的网友指点下。

总之,我的猜想是:不稳定性导致不可逆计算(需要进一步数学证明),再由Landauer原理,不可逆计算必然存在最小的耗散。这样,耗散的根源就建立在扎实的数学基础上了。这个思路,绕过了“不可逆物理过程”这个概念。我们能够直接从我们的宇宙是“普遍局部力学不稳定”的这个出发点沿着这个不稳定-不可逆计算-耗散的逻辑链条解释耗散。

2.这个针尖不稳定在什么时间尺度上才能看做不稳定(和量子的关系是什么);

3.在原子尺度为什么就有这个最小的kTln2存在(同样,这里和量子的关系是什么?照理说普朗克尺度才是最小尺度);

4.光镊技术造成的电磁场似乎能做到场本身不产生耗散(否则Lutz的实验就不会给出精确的kTln2的结果了),那么热力学第二定律是如何应用在电磁场里的呢(熵的概念是用分子小球体系的图像引入的,我一直不清楚在电磁场之类的地方怎么使用熵这个概念,希望懂这块的网友能指点下);

5.以及Jake提到的更抽象的耗散比如网络节点耗散流能不能也用不稳定性和不可逆计算来研究。

6.“体系可以同时在两个well出现,意味着体系状态数目是2, 信息熵为ln2”这句话仔细考察会发现是不严格的。信息熵的值似乎和两个well的形貌有关系。如果两个well不对称,一高一低,那么信息熵的计算结果可能并不是ln2。这个问题我也给Lutz发邮件问过,但没收到回信。我也曾仿照统计力学里计算总熵的方法,对所有位形积分,但后来发现还是困难很大,没成功。所以我想在这里问问有没有网友对信息熵的计算比较熟悉,看看能不能给出严格的计算。

7. stick-slip instability造成的声子激发耗散的本质是什么?为什么声子可以耗散?说声子耗散时仅仅是指固体被加热了么(加热和声子的关系是什么?)?在固体内部的耗散过程能够用表面摩擦的方法用Landauer原理解释么?(因为固体体系也能用energy landscape看待,也许声子,或者振动模会造成体系在两个energy valley之间跳跃,从而可以类似用本文的不稳定性-不可逆计算的方法分析其耗散根源)。 如果可以的话,那么本文这个“不稳定性-不可逆计算”的分析就能解释广泛存在的固体耗散了。当然,这些kTln2的最小耗散们最终还是以把固体加热(增加原子振动速度)的方式表现出来。

更新一下,收到Qunyang前辈的一个非常赞的解释了:声子一开始是有序振动,后来不同模耦合后变成无序(热)振动了,也就是耗散了。 我的理解是有序振动的时候振动能量还能重新自发来对外做功,而耦合后的无序振动就完全是热振动无法自发对外做功了,所以就耗散了。 不过这个解释,特别是“无法对外做功”,似乎还是有scale的概念在里面,类似玻尔兹曼的粗粒化思路。我还是YY可能可以用类似的不稳定性+Landauer原理进一步解释从有序到无序的转变。

8. 本文的“不稳定性-不可逆计算” vs 热力学第二定律波尔兹曼诠释里的“粗粒化”方法。从粗粒化的方法看,一个分子小球体系的宏观态对应着很多微观态,微观态数目决定了热力学熵的大小;而本文中,在信息层面上,一个信息熵为ln2的“信息态”(我自己造的词)对应着物理层面上针尖-样品体系的两种可能的宏观态,物理宏观态数目决定了信息熵的大小。 由此可见,从微观层面到宏观层面到信息层面,层面间的关系具有相似性。 看上去Landauer原理描述宏观和信息层的关系, 玻尔兹曼粗粒法描述微观和宏观层面的关系。   

 现在问题来了,微观和宏观并没有明显的界限,那么Landauer原理能够直接联系微观层和信息层么?  用Landauer原理能够直接描述那个经典的气体分子小球体系熵增么? 一个有趣的视角是,在玻尔兹曼的粗粒化方法里,从微观层面到宏观层面是有信息损失的,这个信息损失,也许对应着某种信息熵的减少,而为了维持总熵不减,必须要热力学熵增加,这是不是和Landauer原理的两种熵的转化的图景很类似呢,两者有关系么?


这些就等着集智的各位给点子了;-)     

我也想听听有没有其他点子和思路,还有其他领域的知识(特别是动力系统,分岔,稳定性分析,信息物理学的知识)。
2015-01-03 16:37:27
   楼主你在哪里读书,有机会可以交流下
登录后才可以评论,马上登录