第十四章 圖片比對算法
晚上的派對舉辦的很成功,氣氛非常濃厚。
商務(wù)白領(lǐng)們放下了平日的嚴(yán)謹(jǐn)和肅穆,程序員也沒有想象中那么不善交際。
加盟奧創(chuàng)的四個人也很受歡迎,大家都是在為同一個老板打工,業(yè)務(wù)范圍也不一樣,而且將來避免不了交叉合作,提前熟悉一下,對雙方都有好處。
王正拿著一瓶啤酒坐在角落悠閑的慢慢喝著,今晚他足足炒了三大鍋小龍蝦……真是有點(diǎn)兒累。
謝莉爾端著一杯雞尾酒走過來坐在他身旁,道:“賈斯汀,感覺怎么樣?”
拿起酒瓶跟謝莉爾輕輕碰了一下:“非常好。謝謝你雪莉,是你讓Meta成長的這么快?!?p> 謝莉爾輕輕抿了一口,笑道:“是這里每一個人的功勞,尤其是你,否則我們不會擁有這么輕松愉快的工作?!?p> 王正謙虛了一下:“我只是更被命運(yùn)眷顧而已。”
謝莉爾怔了一下,說道:“時間差不多了賈斯汀,提一杯祝酒詞吧?!?p> 王正點(diǎn)點(diǎn)頭,拿起啤酒走到場地中央,大喊了一聲“祝酒”,音樂漸消,人們的目光都聚集了過來,看著自家的老板。
王正環(huán)視了一圈,最終高舉啤酒喊道:“為了創(chuàng)造一個奇跡!干杯!”
三十多人齊齊的喊道“創(chuàng)造一個奇跡”,大笑著跟旁邊的人互相碰杯。
大約10點(diǎn)左右,派對正式結(jié)束。
員工們自發(fā)的將派對用的物品都整理好,紛紛告辭回家。
王正洗了澡躺在床上回想著,其實還挺有成就感。
不過越是融入,他就越是想念家鄉(xiāng),越是想念葉子同學(xué)。
睡不著,索性起床打開電腦,登錄到國內(nèi)火云那邊的服務(wù)器上,給葉子發(fā)消息,順便處理今天的工作。
然后繼續(xù)學(xué)習(xí)。
經(jīng)過仿寫瀏覽器之后,王正對于倉頡語言已經(jīng)掌握的很熟練了。
但是熟練掌握不代表就能想要啥就寫啥。
沒有經(jīng)過系統(tǒng)培訓(xùn)的人,給他源代碼可能都看不懂為什么要這么寫。
這里面有個邏輯問題。
比如王正知道人工智能,知道區(qū)塊鏈,知道深度學(xué)習(xí)算法,20年后誰還不知道點(diǎn)兒這個。
但是他不可能寫的出來——根本不知道怎么用代碼實現(xiàn)的。
這玩意兒真就是不知道就是不知道,蒙都沒地方下手。
瞎幾把一通亂寫,別說人工智能了,大夏版Siri那種人工智障他都寫不出來。
成長是有的,起碼在經(jīng)過瀏覽器仿寫的那段時間后,他終于明白了所謂的算法、代碼、程序之間的關(guān)系。
算法是解題步驟,代碼解題用的筆,程序是得出的結(jié)果,編程語言就相當(dāng)于那張紙。
他現(xiàn)在這情況就等于已經(jīng)知道答案,有紙有筆但是沒步驟,解不了題。
不過王正也沒想過一口吃個胖子,指望一個高中都沒上完純靠自學(xué)那點(diǎn)兒英語,能看的懂一門高級語言就很不容易了。
更別說就他那初中水平的數(shù)學(xué),放在二十年后連個小學(xué)孩子都教不了。
學(xué)學(xué)不會,抄還不會嗎?
先甭管步驟是怎樣的,抄個100分出來比啥都強(qiáng)。
現(xiàn)在無論是火云還是Meta,迫切的急需圖片識別技術(shù)、圖片壓縮技術(shù)、包括視頻內(nèi)容識別技術(shù)和視頻壓縮技術(shù)。
圖片識別和視頻識別,目的是為了減少M(fèi)eta社區(qū)和小云書社區(qū)網(wǎng)站的內(nèi)容審核工作量,同時也能給用戶提高更好的體驗。
目前,美聯(lián)這邊稍微好一些,沒那么夸張。但是國內(nèi)……一言難盡,比基尼都得屏蔽一下。
太低估大夏人民的心里承受能力了。
雖然社區(qū)現(xiàn)在還沒上視頻播放功能,但這個是遲早的,未雨綢繆,這是必須要做的。
圖片還好說,但是視頻識別真不太好解決。王正還記得一篇新聞,大概是逗音平臺,有大約兩千人的視頻審核團(tuán)隊。
在國內(nèi)成本還好,在美國……實在太貴了。
還有圖片和視頻的壓縮技術(shù),同樣非常重要。
圖片越清晰,所占的體積肯定就越大,加載也會更慢。像Meta這種社區(qū),圖片越多,占用的存儲就越多,這是巨額的成本。
更別說未來上了視頻,那需要的存儲更是天文數(shù)字。
讓王正自己解決問題是不現(xiàn)實的,但是他有掛。
U盤里的軟件加倉頡編譯器,能幫他直接得到解題步驟。
王正打開U盤,找到了《云網(wǎng)網(wǎng)吧管理系統(tǒng)》這個軟件。
這里面有一個程序,就是人臉比對模塊,當(dāng)初王正著手買來的。
人臉比對嘛,和照片對比相比,已經(jīng)是進(jìn)階版的技術(shù)了。
能搞定人臉比對,照片比對還不是手到擒來?
所以他把人臉比對這個模塊拖進(jìn)了倉頡開發(fā)套件,很快,左側(cè)是程序運(yùn)行虛擬機(jī),右側(cè)是轉(zhuǎn)換為倉頡語言的源代碼。
不管是什么語言寫的程序,只要最終能被識別為機(jī)器語言,計算機(jī)就能理解并執(zhí)行。
理論上,倉頡語言是能夠在win系統(tǒng)下運(yùn)行的。
不過王正還沒開始學(xué)win系統(tǒng)的格式,但這影響不大。
將這個程序掛在到一個運(yùn)行鴻蒙系統(tǒng)的服務(wù)器上,要求網(wǎng)頁服務(wù)器把接收到的上傳照片,傳送到這個服務(wù)器上,經(jīng)過程序比對,通過的就返回放行,通不過的就拒絕接收。
這個思路還是靠譜的。
至于說數(shù)據(jù)量太大,那就多搞一些高性能服務(wù)器唄。
王正也沒偷懶,直接拿源代碼出去。這些東西終究是身外之物,知識才是自己的。
多學(xué)點(diǎn)兒,虧不了。
依舊是仿寫,但是速度快了很多。
而且隨著這種模仿,編程到底是一個什么樣的邏輯,王正的認(rèn)知會越來越透徹。
三十多萬行代碼,王正越寫就越清醒。
哪些代碼分析人臉位置,哪些代碼提取人臉特征,哪些代碼用于圖片比對,哪些代碼用于輸出結(jié)果。
光是這些,就足以讓王正受益無窮。
別的不說,這里面每一項都可以生成一個專利,兩兩組合,三三組合,至少可以申請下來二三十項專利。
就人臉識別這個技術(shù),光專利授權(quán)都夠吃一輩子的。
而且有后人智慧結(jié)晶在手,他不用再重復(fù)造車輪子,開發(fā)新技術(shù)時用得到就直接套用,省去了大量的時間。
一直肝到清晨,實在是肝不動了,這才關(guān)掉顯示器,順利入眠。
后面,還有很多種先進(jìn)算法在等著他呢。