8.質(zhì)疑
呂振羽可沒有想到自己會(huì)被如此高地評(píng)價(jià)。之后的幾天里,他都一直忙著鉆研語(yǔ)言學(xué)。
一直到10月12日,一個(gè)陌生的電話打到了他的手機(jī)上。
“你好。請(qǐng)問是呂振羽嗎?”又是一個(gè)陌生的男性中年的聲音。
“對(duì)。您是?”
“我是復(fù)旦大學(xué)中文系的方治強(qiáng)。我女兒的同學(xué)跟我說,你有一些語(yǔ)言學(xué)方面的問題需要解答。”
“是的。您是方悠均的父親?”
“對(duì),你也別您啊您的了,叫我一聲伯父吧?!?p> “好的,伯父,我想和你當(dāng)面談?wù)劊闶裁磿r(shí)候方便?”
“現(xiàn)在我就在你們學(xué)校里,你到心中書社邊上的那個(gè)茶室,我在那里等你。路音和均兒一會(huì)也會(huì)過來?!?p> “好的?!睊焐狭穗娫?,呂振羽連忙出門了。
呂振羽趕到茶室的時(shí)候,路音和均兒都已經(jīng)到了,一個(gè)頭發(fā)有點(diǎn)花白的中年人帶著一副式樣極其古老的黑框眼鏡。兩個(gè)年輕女子和一個(gè)很有學(xué)術(shù)氣質(zhì)的中年人坐在一起,樣子頗為奇怪。
“伯父,你好。路音,均兒,你們好?!眴柡蛑?,呂振羽坐了下來。
方治強(qiáng)沒有多客套,直接問道:“這所大學(xué)的中文系也很強(qiáng),為什么你不去找學(xué)校方面幫忙呢?”
呂振羽說:“首先,我只是個(gè)大一的學(xué)生,這個(gè)項(xiàng)目就算我上報(bào)給學(xué)校,沒有任何人會(huì)相信我有能力做好這個(gè)項(xiàng)目。如果上報(bào)了,不知道有多少人會(huì)覺得我不自量力,是個(gè)瘋子。但是,我自己知道,我有機(jī)會(huì)做好這個(gè)項(xiàng)目,雖然不是百分之百的把握,但我同樣不是貿(mào)然提出這個(gè)項(xiàng)目的。其次,就算學(xué)校覺得這個(gè)項(xiàng)目不錯(cuò),我也沒有把握學(xué)校一定會(huì)讓我來主導(dǎo)這個(gè)項(xiàng)目的走向,中文系的老師們姑且不論,就算我自己的系里,學(xué)院里,多少專家要指手畫腳?而關(guān)鍵在于,他們?cè)绞侵甘之嬆_,這個(gè)項(xiàng)目失敗的可能性就越大。最后一個(gè)原因,我自己已經(jīng)有了核心技術(shù),我沒有為他人作嫁衣的打算?!?p> 呂振羽說得很自信。方治強(qiáng)點(diǎn)了點(diǎn)頭,問:“你所說的核心技術(shù)是什么呢?”
“人工智能?,F(xiàn)在開發(fā)這樣一個(gè)引擎,很關(guān)鍵的一個(gè)地方就在于智能判斷,我手里有自己開發(fā)的人工智能核心,問題是我不知道怎么將這個(gè)核心用在關(guān)鍵的地方?!?p> “人工智能?你獨(dú)立開發(fā)的?能讓我看看嗎?”方治強(qiáng)雖然是研究語(yǔ)言學(xué)的,但看得出來他的興趣頗為廣泛。而呂振羽的言辭,也已經(jīng)引起了均兒和路音的興趣。
呂振羽看到均兒腳邊的筆記本包,問:“能用一下你的筆記本嗎?”
均兒點(diǎn)了點(diǎn)頭,在父親的面前她顯得無比乖巧,一點(diǎn)也沒有在高中的時(shí)候,聞名遐邇的“小魔女”的樣子了。她開機(jī)之后,將筆記本推到了呂振羽面前。
呂振羽從口袋里拿出優(yōu)盤,將一段程序拷貝到了電腦上,輸入了密碼之后,運(yùn)行起了程序,他解釋道:“這是我這一階段的成果,將智能核心和我能理解的一部分中文語(yǔ)法結(jié)合起來,編了個(gè)造句的程序。界面是臨時(shí)寫的,因?yàn)槭亲约旱臏y(cè)試,也就沒太在乎,在上面那個(gè)框輸入要用來造句的詞匯,下面的框里就會(huì)顯示完整的句子,因?yàn)樵炀涫莻€(gè)不可預(yù)期的隨機(jī)過程,我在邊上設(shè)了個(gè)按鈕,對(duì)句子不滿意可以更換。句型方面,目前只有陳述句,一般疑問句,特殊疑問句,祈使句和反問句我還沒寫進(jìn)去?!?p> 呂振羽的這段程序,其核心是從小羽的主程序中分離出來的一小段代碼。這一小段代碼的作用,比起現(xiàn)在已經(jīng)有60g空間的小羽主體來說,具有的能力幾乎可以忽略不計(jì),但用在這樣一個(gè)簡(jiǎn)單的智能程序里,卻已經(jīng)有殺雞用牛刀的感覺了,僅僅這段代碼,已經(jīng)超越人工智能的國(guó)際領(lǐng)先水平很多了。這個(gè)被命名為“三年級(jí)”的小程序,造句的能力上差不多是能和三年級(jí)的小學(xué)生相比,只是不具備常識(shí)判斷的能力,雖然造出的句子在語(yǔ)法上都沒有任何問題,但有時(shí)候含義卻很搞笑。這種造句,很想有些人喜歡玩的一個(gè)游戲,幾個(gè)人,每人寫一個(gè)句子的一個(gè)部分,然后隨機(jī)組合起來,變成一堆搞笑材料之類的。
但是,方治強(qiáng)和路音,還有均兒則興致勃勃地一遍又一遍地輸入各種詞匯,看下面的框里變幻出非常有趣的句子。
“這個(gè)東西要使真的讓小學(xué)生拿到手,那就麻煩了,糊弄語(yǔ)文老師應(yīng)該是沒問題了?!狈街螐?qiáng)評(píng)論道。
“這個(gè)小程序的作用僅僅是檢驗(yàn)一下我的階段性成果而已,不會(huì)再有副本了。”
“其實(shí),你能做到這個(gè)地步,已經(jīng)是非常厲害了,你覺得我在什么地方能幫上你的忙?”
“伯父,市面上也有不少語(yǔ)音輸入和語(yǔ)言輸出的軟件。語(yǔ)音輸出就不提了,基本上是按照每個(gè)字的發(fā)音,連續(xù)生成而已,比較好的軟件或許還有虛詞的輕讀,但語(yǔ)氣語(yǔ)調(diào)方面都沒有什么變化。而語(yǔ)音輸入的問題更加復(fù)雜,一方面是對(duì)于語(yǔ)音的識(shí)別率,目前最好的還是幾年前開發(fā)的viavoice,而且對(duì)于輸入裝置的要求也不低,而且,語(yǔ)音輸入后,即時(shí)字詞方面都沒問題,斷句,標(biāo)點(diǎn)也都一塌糊涂,基本上,語(yǔ)音輸入之后,還要靠人工改寫一遍,效率比手打還要差。原來我覺得,通過了解一些語(yǔ)言學(xué),可以找到解決這個(gè)問題的辦法,但是,語(yǔ)言學(xué)實(shí)在是個(gè)很怪的學(xué)說,看的資料越多,反而越不知道該怎么下手了?!眳握裼鹫f。
“這樣說吧,從語(yǔ)言學(xué)的角度要解決這個(gè)識(shí)別的問題,這個(gè)大家都明白,我也參與過一個(gè)叫‘言語(yǔ)的產(chǎn)生、識(shí)別與編碼’的項(xiàng)目。目前,所有的機(jī)器識(shí)別,都是基于字詞和語(yǔ)音的,語(yǔ)法是一個(gè)從屬的地位,因?yàn)闈h語(yǔ)的語(yǔ)法和其他語(yǔ)種區(qū)別太大了,規(guī)律性并不明顯,雖然按照西方的語(yǔ)法范式,能夠總結(jié)出現(xiàn)代漢語(yǔ)使用的大部分規(guī)律,但是這并不足夠。字詞的語(yǔ)音識(shí)別,產(chǎn)生的素材,被語(yǔ)法模塊排列組合起來。而標(biāo)點(diǎn)符號(hào),機(jī)器自己是無法添加的,因?yàn)闆]有斷句的功能。這也就是基于語(yǔ)音的機(jī)器語(yǔ)言學(xué)。”
“那又沒有什么解決方法呢?”呂振羽問。
“索緒爾在《普通語(yǔ)言學(xué)教程》里有一句話,聲音脫離了書寫符號(hào),就只是一些模模糊糊的概念。但又有另外一句話,文字越是不表示它所應(yīng)該表現(xiàn)的語(yǔ)言,人們把它當(dāng)作基礎(chǔ)的傾向就越是增強(qiáng)。……這兩句話有同一個(gè)核心,那就是文字,而位于文字兩邊的則是語(yǔ)音和語(yǔ)義。我想,現(xiàn)在主要的瓶頸在于,語(yǔ)言的識(shí)別智能停留在語(yǔ)音到文字的階段,而從文字到語(yǔ)義,則需要一個(gè)人自己去進(jìn)行操作。語(yǔ)義是一個(gè)很復(fù)雜的東西,憑著你現(xiàn)在掌握的這個(gè)人工智能,你肯定可以做出能比較好的理解語(yǔ)義,從而對(duì)文本進(jìn)行修正的軟件,你剛才也說了,你的這個(gè)造句程序,缺乏的就是常識(shí)層面的東西。如果加上這一塊,對(duì)于語(yǔ)音辨識(shí)的判讀是不是就完整了呢?也不是,因?yàn)檫@個(gè)常識(shí)本身就是有彈性的東西,很多不合乎常識(shí)的表達(dá)方式平時(shí)我們一直在用,你說那是修辭手法也可以,但我們平時(shí)都是能理解的,為什么?因?yàn)槲覀兪褂谜Z(yǔ)言,無論文字形式還是語(yǔ)音形式,都是基于一個(gè)基本的使用環(huán)境,也就是所謂的語(yǔ)用。在語(yǔ)用的前提下,語(yǔ)義才會(huì)完整?!狈街螐?qiáng)的說法已經(jīng)非常非常淺顯,大部分的概念都沒有解釋,但中文的強(qiáng)大適應(yīng)性也從這些名詞上體現(xiàn)了出來,不需要解釋,相信呂振羽也能夠理解大致的含義,而在這個(gè)局面下,大致理解也就足夠了。
呂振羽回味著方治強(qiáng)的話,反反復(fù)復(fù)地想著,突然說:“那是不是說,如果這樣一個(gè)引擎能基于語(yǔ)義學(xué)和語(yǔ)用學(xué)來進(jìn)行開發(fā),然后結(jié)合語(yǔ)音識(shí)別現(xiàn)有的成果,就能夠比較完善了?”
方治強(qiáng)贊賞地說:“說得對(duì),只要你能做到。這并不容易。但只要你能將語(yǔ)用和語(yǔ)義的層面形成程序,語(yǔ)音方面的問題就是小問題了,什么語(yǔ)音流變什么的根本不用太當(dāng)回事?!?p>