??rainbow rainbow rainbow
bring a more beautiful smile??
tea tea tea??
sweet beauty of the world??
tree tree tree??
growing up on the road??
---^^Bonjour. Fr?hlichen Sonntagnachmittags Tee??
休息休息??(《Send to you.》):“大家關(guān)注下鼠疫?!薄昂??!薄班?,蔓姐,這是歷史上各大洲曾出現(xiàn)的鼠疫資料……”“哇,你動(dòng)作快嘛!”“感覺(jué)蔓姐會(huì)問(wèn),哈哈哈,現(xiàn)在有一種答題答對(duì)了的快樂(lè)感。”……短暫的網(wǎng)絡(luò)視頻會(huì)議結(jié)束后,司徒景蔓看了幾份資料,便起身進(jìn)了廚房。……“阿幕,這個(gè)世界上最能裝東西的硬盤(pán)是什么?”“emmm?最能裝的硬盤(pán),其實(shí)是我們的遺傳物質(zhì)?!薄鞍??”司徒景蔓被蘇幕的回答笑著瞪大了眼睛?!坝植皇恰抖呃?A 夢(mèng)》里的記憶面包,第一步,把信息存儲(chǔ)到面包上;第二步,吃下面包,讓信息進(jìn)入人體。第三步,消化信息?!薄斑€真有哦,簡(jiǎn)單看步驟的話,現(xiàn)在的科技就能做到前兩步了,DNA 存儲(chǔ)技術(shù)已經(jīng)能大規(guī)模寫(xiě)入數(shù)據(jù)了。美國(guó)科技公司 Catalog 已能將 16 GB的維基百科英文版全部文本保存到了一條人工合成的 DNA 中?!薄八??”“所以DNA 存儲(chǔ)最直接的優(yōu)點(diǎn)是存儲(chǔ)量大。我給你畫(huà)個(gè)東西,你看那塊黃黃的液體重 3克,但其中 DNA 重量微乎其微。根據(jù)紐約基因組中心的數(shù)據(jù),一克 DNA 可存儲(chǔ) 215 PB 數(shù)據(jù)。把這些數(shù)據(jù)存到 1T 容量7毫米規(guī)格的硬盤(pán)里,硬盤(pán)堆在一起,有 1505 米高。世界最高建筑,迪拜塔也只有 828 米。DNA 存儲(chǔ)不僅存儲(chǔ)量大,壽命還長(zhǎng)。正常硬盤(pán)使用壽命在 5到10年,遇到斷電沖擊等情況還會(huì)更短。常溫下 DNA 的可讀性能保持很久。保存得當(dāng),簡(jiǎn)直一克永流傳,甚至萬(wàn)年前的 DNA 都被還原了。以目前水平, DNA 可以存一些政府文件,歷史材料。估計(jì)以后也沒(méi)什么歷史、文化遺產(chǎn)之爭(zhēng)了。隨著技術(shù)發(fā)展, DNA 存儲(chǔ)可以取代數(shù)據(jù)中心?!薄拔矣H愛(ài)的personal computer,那電子數(shù)據(jù)是怎么存進(jìn) DNA 里的呢?”“記得生物課上講過(guò), DNA 脫氧核糖核酸是一種雙螺旋結(jié)doublehelix的生物大分子,由堿基組成。DNA 鏈條上的長(zhǎng)條就是堿基,DNA 中通常有四種堿基,大家直接理解成 A,T,C,G 就可以。堿基的排列順序決定了長(zhǎng)相、智力,不同病癥的發(fā)病風(fēng)險(xiǎn)等。舉個(gè)例子, ACA 的排列讓人眼神不好,按 CAC 排能讓人長(zhǎng)高。其實(shí)就是遺傳信息?!薄澳蔷褪荄NA 鏈條能儲(chǔ)存遺傳信息也能儲(chǔ)存數(shù)字信息。”“對(duì),但這么簡(jiǎn)單的邏輯,當(dāng)時(shí)卻根本沒(méi)人細(xì)想,大家都在忙著破解基因密碼。只要找出堿基排列的規(guī)律和意義,就像擁有了人類修改器,改長(zhǎng)相改素質(zhì)改壽命,變白變美變高變長(zhǎng)壽。于是人類基因組計(jì)劃開(kāi)始了一項(xiàng)工程。這項(xiàng)工程花費(fèi) 30 億美元和十幾年時(shí)間,測(cè)出完整的人類基因序列。如果把破解堿基排列比作翻譯一本書(shū),此時(shí)相當(dāng)于終于把書(shū)拿到手里?!薄澳沁M(jìn)展呢?”“雖說(shuō)沒(méi)有立竿見(jiàn)影的成果,但這工程推動(dòng)了 DNA 測(cè)序技術(shù)的發(fā)展。巨大需求量的刺激,讓 DNA 測(cè)序進(jìn)入自動(dòng)化時(shí)代。破解不了堿基序列,人們就變實(shí)際了。畢竟都要吃飯的嘛,看不懂沒(méi)關(guān)系,排成咱看得懂的樣子,好歹當(dāng)個(gè) U 盤(pán),于是 DNA 存儲(chǔ)技術(shù)就這樣出現(xiàn)?!薄罢φf(shuō)?”“如果把堿基看成 A , T , C , G 四個(gè)字母,堿基序列實(shí)際上就是一串英文。而數(shù)據(jù)實(shí)際上就是一串?dāng)?shù)字。把數(shù)字和堿基字母對(duì)應(yīng)起來(lái),重新排列,就能表達(dá)內(nèi)容。知道轉(zhuǎn)換規(guī)則,就能從排列中讀取信息。DNA 存儲(chǔ)就是通過(guò)把堿基看成固定數(shù)字,將數(shù)字化的數(shù)據(jù)轉(zhuǎn)換成堿基序列的方式。把 A,G 視為 0 ,C,T 視為 1 ,排列后合成。這就是最早的 DNA 存儲(chǔ)。為了存儲(chǔ)更多數(shù)據(jù),人們嘗試了把 A ,T ,C,G 看成 0 ,1,2,3 的四進(jìn)制。雖然四進(jìn)制能縮短數(shù)據(jù)長(zhǎng)度,但同一堿基連續(xù)出現(xiàn),會(huì)讓序列不穩(wěn)定,影響數(shù)據(jù)的準(zhǔn)確。更高的進(jìn)制,四種堿基又不夠用,為了解決這個(gè)問(wèn)題,人們用了一種三進(jìn)制的方案。這種方案里從第二位開(kāi)始編碼,以前一位堿基來(lái)決定后一位。前一位堿基是 A ,下一位就把 A 排除,用 C,G,T 來(lái)代表 0,1,2 ?!薄按髱?,我的腦子繞暈了”,司徒景蔓一屁股坐在木板上,蘇幕看得莞爾一笑,也隨地而坐?!昂冒?,要不今兒講到這?”“不,我要聽(tīng),繼續(xù)!”“好,那我們可以試一試。剛才的數(shù)字用三進(jìn)制表達(dá)是 211101 。假設(shè)堿基序列第一位是 A ,轉(zhuǎn)換結(jié)果就是 ATCTCGA。第一個(gè)字母是 A 時(shí),按照表格,代表 2 的字母是 T,T 后面代表 1 的字母是 C,C 后面代表 1 的是 T,依此類推。解決了編碼問(wèn)題,大家玩嗨了,動(dòng)圖、音頻、電影先后被存入 DNA 。2017 年,紐約基因組中心將電影火車(chē)進(jìn)站存入 DNA 。存入數(shù)據(jù)大小的記錄也快速刷新著, 2012 年哈佛 650KB 的記錄很快被 MB 級(jí)碾壓。2016 年記錄到了百兆級(jí),微軟存了 200M 電子書(shū),大概等同 789 本高中語(yǔ)文必修一。今年微軟做了個(gè) DNA 自動(dòng)存儲(chǔ)系統(tǒng),但是hello 這 5 個(gè)字母的存儲(chǔ)和讀取花了 21 個(gè)小時(shí)。emmmm,這就是 DNA 存儲(chǔ)的缺點(diǎn)了。但有關(guān) DNA 存儲(chǔ)的科技在不停進(jìn)步。2001 年至今,DNA 測(cè)序從上億美元降到了不到一千美元。今年 Catalog 的寫(xiě)入速度已經(jīng)到了 4M 每秒。成本降到十萬(wàn)分之一,寫(xiě)入速度快了千萬(wàn)倍。這種進(jìn)步幅度,足以對(duì) DNA 存儲(chǔ)技術(shù)保持期待。在不久的將來(lái),也許電腦里的硬盤(pán)就換成瓶裝 DNA 了”,蘇幕笑著舉起手中的畫(huà)。“噗嗤,太逗啦!”“所以的所以,記憶面包不需要,多想想我,就對(duì)啦!”“yes!”……四季有夢(mèng),天涯相隨;春夏秋冬,海角相伴。你說(shuō),我是你體內(nèi)的力量;我說(shuō),你是我腦中的硬盤(pán)。我們約好,一起白頭。^~^(2019.11.17點(diǎn)滴隨筆)