5.信息論可以度量什么?
有關(guān)信息在生物過程中的作用,以及生物學(xué)是否需要一種不同類型信息的形式化(在現(xiàn)代信息論中通常被稱為功能信息或語義信息),一直存在著長期爭論[例如, Yockey (2005)&Godfrey-Smith & Sterelny(2007)]。我們認為,目前闡述的信息理論,特別是考慮到分布相關(guān)性(Schreiber 2000)和因果信息(Hoel et al. 2013; Ay &Polani 2008)測量方面的最新研究,足以在信息如何構(gòu)成生命的問題上取得進展。
具體而言,我們認為生命系統(tǒng)最與眾不同之處是它們的因果結(jié)構(gòu)和信息架構(gòu)(Walker 2017)?,F(xiàn)代信息測量方法,如傳遞熵(Schreiber 2000)、因果信息流(Ay&olani 2008)、有效信息(Hoel et al. 2013)、因果特異性(Griffiths et al. 2015)、整合信息(Oizumi et al. 2014)和整合時空模式(Polani et al. 2016)等等,所有這些都有希望從信息論角度對生物過程提供多樣而豐富的見解,使我們有能力了解如何在各種時空尺度上描述生命的信息架構(gòu)和因果結(jié)構(gòu)。
例如,速度和方向信息通常是在魚群(H&egard et al. 2012)和椋鳥群(Cavagna et al. 2010)協(xié)調(diào)運動的背景下研究的物理量,此類信息在群體中的傳播已經(jīng)用統(tǒng)計物理工具進行了建模(Bialek et al. 2012),各種行為機制[如群感響應(yīng)(quorum response)——許多動物采用的一種共識機制(Pratt et al. 2002;Wardal et al. 2008;Sumpter&Pratt,2009)]——也進行了類似的研究。這些機制允許集體中的個體建立反饋回路,以放大或抑制信息的傳遞(Couzin 2009)。盡管研究這些群體信息傳遞、存儲和處理的形式化方法還不太成熟(Dall et al. 2005),但對這些現(xiàn)象的大量關(guān)注為形式化應(yīng)用方法和發(fā)展新理論提供了有力依據(jù)。
在下面內(nèi)容中,我們并不認為存在一種量化生物集群行為“正確的信息度量“立場,而是主張在適當(dāng)?shù)目刂葡?,通過在不同的生物數(shù)據(jù)集上應(yīng)用多樣化的測量方法,解決生物系統(tǒng)如何在空間和時間上操縱因果相關(guān)結(jié)構(gòu)以執(zhí)行功能。我們會通過解析生物系統(tǒng)區(qū)別于非生物系統(tǒng)的信息架構(gòu)(Walker et al. 2016),并希望利用這些見解構(gòu)建解釋“生命是什么”的新理論。
信息架構(gòu)
形式上就我們旨在本節(jié)中提出的意義而言,集群行為的信息結(jié)構(gòu)(以生命作為旨趣實例)是相對未被探索的開放的研究領(lǐng)域。盡管如此,一些研究已經(jīng)概述了它的一些顯著特征。例如,Danchin 等(2004)將個體可獲得的信息分成個體信息(personal information)和社會信息(social information),前者通過與環(huán)境的直接互動獲得的,后者則受益于其他同伴的行為獲得。進一步又可以將社會信息分為通過信號傳遞(signaling)和間接觀察(indirect observation)獲得的社會線索或公共信息。信號傳遞是有意傳遞的信息,而社會線索(如覓食者的位置揭示了食物來源)和公共信息(如覓食者的表現(xiàn)提供了食物來源質(zhì)量的信息)則缺乏此類特征。在集群行為背景下,Moussaid等(2009)強調(diào)了直接信息傳遞和間接信息傳遞的區(qū)別。按照 Danchin等(2004)的說法,直接信息傳遞對應(yīng)明確的信號傳遞以及對社會線索和公共信息的間接觀察,間接信息傳遞則是個人信息的一個子集(Danchin et al. 2004),它只包括個體之間通過環(huán)境中介傳遞的信息。間接信息傳遞通常被稱為共識自主性(stigmergy),它包含了一種溝通形式,在這種形式中環(huán)境的功能是一塊共享的黑板,個人可以修改黑板來書寫信息,也可以感知閱讀信息(Grassé 1959)。間接信息傳遞最突出的例子無疑是某些種類螞蟻的信息素鋪設(shè)和跟隨行為(Goss et al. 1989;Hlldobl Wilson 1990)。
然而上述定義,主要關(guān)注的是個體獲取與可能傳遞信息的不同方式。一個量化集群行為信息結(jié)構(gòu)的形式框架,還應(yīng)該考慮信息加工的其它基本方面。事實上,一個集群系統(tǒng)的內(nèi)部計算不僅是組成部分之間信息傳遞的結(jié)果,還可能要求它們具有存儲和轉(zhuǎn)換信息的能力(Crutchfield 1994;Feldman et al. 2008)。這其中一些特征可能存在爭議,例如目前還不清楚,在什么意義上,集體趨化作用(collective chemotaxis)會要求個體存儲它們位置以外的信息,或可能只是要求它們做出反應(yīng)——無論這是否是由進化編程存儲的一組反應(yīng)之一。
因此,集群行為信息架構(gòu)的正式框架可以包含所有這些元素,重點在它們間的相互作用及隨時間的演變。在這個方向上的第一步是接受一種獨立于應(yīng)用領(lǐng)域的通用語言,使我們有可能對信息處理的所有方面進行正式建模。當(dāng)然這種共同語言要由信息論提供。
度量復(fù)雜系統(tǒng)的信息架構(gòu)
信息論度量方法引入后不久就首先被用于研究集群行為:推斷蜜蜂的搖擺舞(Haldane & Spurway 1954)和螞蟻信息素蹤跡(Wilson,1962)所編碼食物來源的方向信息大小。但應(yīng)用信息論對集群現(xiàn)象進行系統(tǒng)研究卻相當(dāng)零散(Dall et al. 2005)。例如,統(tǒng)計物理學(xué)將互信息用于研究二維伊辛模型(Ising model)中的相變(Matsuda et al. 1996;Gu et al. 2007),由維切克模型[1](Vicsek model)驅(qū)動的自推進粒子蜂群模擬(Wicks al.,2007),以及調(diào)節(jié)模型(regulatory models)中的隨機布爾網(wǎng)絡(luò)(Ribeiro et al. 2008)。在所有這些情況下,互信息在無序或接近相變階段時均達到峰值?;バ畔⒑蛪K熵(block-entropy)——一種測量有限連續(xù)事件不確定性熵的變體(Shannon 1948),已被用于研究螞蟻信息素鋪設(shè)模擬中的群體決策(Klyubin et al. 2004),此項研究表明有限的噪聲有利于信息傳遞(Meyer 2017)。最近,Gelblum 等人(2015)的研究則顯示,附著在集體運輸上的螞蟻會向系統(tǒng)輸入信息,但這種信息只在短時間內(nèi)有效。以上這些測量方法不僅被用作分析工具,還被應(yīng)用于人工進化控制器,設(shè)計模塊化的集群運動行為(Prokopenko et al. 2006)和多機器人系統(tǒng)(Sperati al et al. 2008)等等。
信息論涉及大量不同科技領(lǐng)域信息的量化、存儲和傳遞(Cover &Thomas 2005)。例如在生物學(xué)的背景下,信息論被廣泛用于研究神經(jīng)系統(tǒng)的功能并確定相關(guān)腦區(qū)結(jié)構(gòu)(Honey et al. 2007;Vakorin et al. 2009;Nigam et al. 2016;Ito et al. 2011;Lizier et al. 2011;Vicente et al. 2011)。主動信息(見前面公式)被用于研究元胞自動機的信息存儲(Lizier et al. 2012b)、神經(jīng)信息處理(Wibral et al. 2014)以及蜂群動力學(xué)(Wang et al. 2012)等,而超額熵則主要應(yīng)用于復(fù)雜物理現(xiàn)象的研究(Crutchfield&;Feldman 2003)。