點(diǎn)亮建筑新夢(mèng)想
LIGHT BUILDING NEW DREAM
企業(yè)BIM定制培訓(xùn)服務(wù)經(jīng)典案例
柏慕聯(lián)創(chuàng)為中國(guó)電建集團(tuán)成都勘測(cè)設(shè)計(jì)研究院有限公司提供全國(guó)BIM技能等級(jí)考試考前專場(chǎng)培訓(xùn)(一)
柏慕聯(lián)創(chuàng)為中國(guó)電建集團(tuán)成都勘測(cè)設(shè)計(jì)研究院有限公司提供全國(guó)BIM技能等級(jí)考試考前專場(chǎng)培訓(xùn)(二)
柏慕聯(lián)創(chuàng)為中國(guó)電建集團(tuán)成都勘測(cè)設(shè)計(jì)研究院有限公司提供全國(guó)BIM技能等級(jí)考試考前專場(chǎng)培訓(xùn)(三)
柏慕聯(lián)創(chuàng)為中國(guó)電建集團(tuán)成都勘測(cè)設(shè)計(jì)研究院有限公司提供全國(guó)BIM技能等級(jí)考試考前專場(chǎng)培訓(xùn)(四)
柏慕聯(lián)創(chuàng)為中國(guó)電建集團(tuán)成都勘測(cè)設(shè)計(jì)研究院有限公司提供全國(guó)BIM技能等級(jí)考試考前專場(chǎng)培訓(xùn)(五)
BIMBOX | 始于一戰(zhàn)的拍照建模技術(shù) 二維碼
今天我們聊聊用拍照的方式自動(dòng)建立3D模型,測(cè)繪圈兒里把它稱為傾斜攝影,計(jì)算機(jī)領(lǐng)域則把它稱為基于圖形的三維重建(image-based modeling)。 如果只是介紹一下這個(gè)技術(shù),幾乎可以用一兩句話來(lái)概括:用相機(jī)繞著一個(gè)場(chǎng)景拍若干張照片,導(dǎo)入到軟件里,經(jīng)過(guò)一系列的計(jì)算,就能生成一個(gè)可以旋轉(zhuǎn)瀏覽的3D模型。 但我們希望再往前走一步,通過(guò)這個(gè)技術(shù)的發(fā)展,來(lái)聊一個(gè)更大的話題:一項(xiàng)技術(shù)是怎樣成為技術(shù)的,它又是如何與其他技術(shù)融合的。 如果你不了解傾斜攝影,可能會(huì)以為,拍個(gè)照片就能建模,這太神奇了,肯定是最近才誕生的黑科技吧?其實(shí)還真不是。 和傾斜攝影相對(duì)應(yīng)的是正向攝影,就是從正上方往下拍攝。 傾斜攝影說(shuō)的是拍照的時(shí)候攝像機(jī)和被拍攝物體有個(gè)傾斜角。 它和正向攝影只有拍攝角度這么一點(diǎn)區(qū)別,后來(lái)怎么能成為自動(dòng)建模的黑科技呢?咱們還得從頭說(shuō)起。 第一次世界大戰(zhàn)的時(shí)候,為了能讓指揮官對(duì)戰(zhàn)場(chǎng)的地形、敵方的部署有清晰的了解,戰(zhàn)爭(zhēng)雙方都會(huì)派出偵查機(jī)進(jìn)行偵查。那時(shí)候相機(jī)還都是大塊頭,飛行員就把這種叫Graflex的相機(jī)扛上飛機(jī),航拍之后沖洗出來(lái)給領(lǐng)導(dǎo)使用。 受限于當(dāng)時(shí)的相機(jī)技術(shù),只能低空飛行才能拍出足夠清晰的照片,而低空飛行就會(huì)帶來(lái)被打下來(lái)的風(fēng)險(xiǎn)。所以,手持Graflex相機(jī)的飛行員們,只能在很遠(yuǎn)的地方,偷偷摸摸的拍下照片,然后掉頭就跑。 在指揮官心目中,理想的戰(zhàn)場(chǎng)偵查影像應(yīng)該是能夠縱覽全局,最好能體現(xiàn)出一些地形的三維信息來(lái),就像這張圖的樣子: 但是飛行員遠(yuǎn)遠(yuǎn)拍下來(lái)的傾斜影像,掛在指揮官墻上的作戰(zhàn)地圖成了這樣: 指揮官對(duì)此當(dāng)然是很不滿。于是人們就開始考慮:能不能通過(guò)某種辦法,把這種傾斜的影像恢復(fù)成真實(shí)的三維場(chǎng)景呢? 傾斜攝影的故事,就從此拉開了帷幕。 我們知道,在拍照的過(guò)程中,三維物體投影在二維影像上,被「壓扁」了,有一個(gè)維度的信息不可逆的丟失了。 那有沒有一種機(jī)器,能把這個(gè)丟失的信息還原呢?還真有,而且這部機(jī)器我們每天都隨身攜帶,那就是我們的大腦和雙眼。 我們的眼睛看到的是世界在視網(wǎng)膜上面的二維投影,那么我們?yōu)槭裁茨芨惺艿饺S空間呢?大腦是怎樣通過(guò)眼睛來(lái)進(jìn)行三維建模的呢? 物體上下左右的位置我們可以直接從眼睛獲得的二維圖像加以判斷,要建立三維模型,我們還要知道物體距離我們有多遠(yuǎn),這叫深度信息。 在上面這張圖里,最下方是我們的兩只眼睛,中間兩條黑線代表了視網(wǎng)膜成像的平面。我們是怎么判斷綠色的樹距離我們比紅色的花要近呢? 你可以看到,我們的左眼和右眼看到的是不一樣的圖像——在左眼里,樹在花的右側(cè),而在右眼里,樹的圖像跑到了左側(cè)。 現(xiàn)在你就可以停下來(lái),找一近一遠(yuǎn)兩樣?xùn)|西,先閉上左眼再閉上右眼,是不是它們的位置關(guān)系發(fā)生變化了? 大腦就是靠這種雙眼看到圖像不一樣的結(jié)果,再輔助一套算法,就可以把上面這張圖中的光線變化逆向推演,從而得出物體遠(yuǎn)近的深度坐標(biāo)。這套算法我們用一張圖說(shuō)明: 假設(shè)兩只眼睛在一個(gè)平面上,只有水平方向的變化。 想知道P點(diǎn)在空間里的深度坐標(biāo)z,已知數(shù)有這么幾個(gè): 左視圖和右視圖光心距離B(也就是我們雙眼的距離) 眼睛的焦距f(就是視網(wǎng)膜和光線交點(diǎn)的距離) 兩張圖上的橫坐標(biāo)視差Xleft-Xright=D(就是P點(diǎn)在兩個(gè)圖像里位置變化了多少) 推導(dǎo)的過(guò)程我們不給了,只給出結(jié)果: 上面這段數(shù)學(xué)過(guò)程,你看不懂也完全沒關(guān)系,你只需要知道:想把一個(gè)點(diǎn)在三維空間中的位置還原出來(lái),我們必須知道這三個(gè)數(shù): ? 相機(jī)的焦距 ? 兩個(gè)鏡頭之間的距離 ? 同一個(gè)點(diǎn)在兩張照片上位置的變化 后邊說(shuō)到所有利用照片建模都是基于這樣一個(gè)最簡(jiǎn)單的原理。 當(dāng)然,大腦在還原三維世界的時(shí)候,并沒有套用這個(gè)公式,我們感受不到大腦進(jìn)行了計(jì)算,只是自然而然的「看到」了三維物體。 算法是人們根據(jù)數(shù)學(xué)和光學(xué)知識(shí)反推出來(lái)的,所以傾斜攝影也被叫做「逆向建?!?。有了基本的數(shù)學(xué)算法,人們就開始想辦法來(lái)模擬我們的雙眼和大腦,來(lái)逆向還原三維世界。 這個(gè)用機(jī)器模擬大腦的工作一直在不停進(jìn)步,在測(cè)量學(xué)里,利用照片進(jìn)行逆向建模稱為「攝影測(cè)量學(xué)」,它的發(fā)展分為三個(gè)階段: 模擬攝影測(cè)量、解析攝影測(cè)量、和數(shù)字?jǐn)z影測(cè)量。咱們一個(gè)一個(gè)來(lái)說(shuō)說(shuō)。 前面我們說(shuō)到,一戰(zhàn)之后,人們開始希望通過(guò)攝影來(lái)進(jìn)行三維地形的重建。 那時(shí)候計(jì)算機(jī)還沒有被發(fā)明,在無(wú)法進(jìn)行大量計(jì)算的時(shí)候,人們采用的辦法最為簡(jiǎn)單粗暴:既然雙眼成像能建立模型,那我就直接照著雙眼的原理造出一臺(tái)機(jī)器來(lái)。 一戰(zhàn)后,維也納軍事地理研究所率先制成了一臺(tái)「自動(dòng)立體測(cè)圖儀」,后來(lái)由德國(guó)卡爾蔡司廠進(jìn)一步發(fā)展,把這種制圖儀量產(chǎn)化。 它的原理很簡(jiǎn)單,就是事先按照兩只眼睛的距離同時(shí)拍攝兩張照片,然后用幻燈機(jī)把照片投影到桌面上,用金屬桿子模擬光線的傳輸路徑,一個(gè)個(gè)逆向?qū)ふ医稽c(diǎn)的位置,然后在桌面上按比例還原地形模型。 因?yàn)闆]有計(jì)算條件,這種方式干脆就不進(jìn)行計(jì)算。你可以想象一下,要建立一個(gè)三維模型,要用金屬桿模擬多少個(gè)點(diǎn)。這個(gè)階段,攝影測(cè)量非常耗費(fèi)人力。這種沒有計(jì)算,純靠機(jī)械模擬的階段,就被命名為模擬攝影測(cè)量時(shí)代。 到了上個(gè)世紀(jì)50年代,第一臺(tái)計(jì)算機(jī)問(wèn)世,人們終于可以借助機(jī)器進(jìn)行大量的計(jì)算,攝影測(cè)量也準(zhǔn)備邁入下一個(gè)時(shí)代。 也許你會(huì)想,求解三維空間坐標(biāo),不就是上面那個(gè)z=BF/D的公式嗎?用得著驚動(dòng)計(jì)算機(jī)來(lái)幫忙嗎? 要說(shuō)清楚這個(gè)問(wèn)題,咱們還得先說(shuō)說(shuō)人腦的另一項(xiàng)逆天的功能。 前面我們說(shuō),人腦通過(guò)雙眼視差,可以區(qū)分物體的遠(yuǎn)近,但這種方法只能區(qū)分比較近的物體。當(dāng)兩個(gè)物體都離我們比較遠(yuǎn)的時(shí)候,我們就很難通過(guò)視差效應(yīng)來(lái)區(qū)分遠(yuǎn)近了。 回憶一下,你看遠(yuǎn)處山的時(shí)候,是不是很難分辨哪座山離你更遠(yuǎn)? 不過(guò)沒關(guān)系,人是會(huì)動(dòng)的動(dòng)物,我們只要隨便移動(dòng)一段距離,或者轉(zhuǎn)一個(gè)角度,視野的改變量就遠(yuǎn)遠(yuǎn)大于雙眼的距離了。 大腦可以通過(guò)對(duì)比運(yùn)動(dòng)前后看到的畫面,來(lái)重建更復(fù)雜的三維模型了。這個(gè)過(guò)程相當(dāng)于是通過(guò)移動(dòng)把原來(lái)的視差效應(yīng)放大了。 另外,通過(guò)雙眼視差基本上只能看到物體的同一面,而通過(guò)移動(dòng),我們能看到物體的另一側(cè),從而在大腦中建立更全面的模型。 你看這張圖,樹枝交匯在一起,是不是很難分辨哪個(gè)近哪個(gè)遠(yuǎn)? 而只要我們稍微旋轉(zhuǎn)一下角度,是不是馬上就有強(qiáng)烈的空間感了? 大腦的這項(xiàng)功能,叫運(yùn)動(dòng)視覺。對(duì)大型場(chǎng)景進(jìn)行三維重建時(shí),雙目測(cè)距原理已經(jīng)不夠用了。 進(jìn)入解析攝影測(cè)量時(shí)代后,人們不再用兩臺(tái)相對(duì)位置固定的相機(jī)來(lái)模擬兩只眼睛了,而是模擬這個(gè)運(yùn)動(dòng)視覺功能,通過(guò)不斷改變相機(jī)的位置,拍攝物體不同角度的照片,來(lái)重建三維模型。 這個(gè)工作叫做運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)(Structure From Motion)。 為什么運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)會(huì)帶來(lái)大量的計(jì)算量呢? 在雙目測(cè)距法中,兩張照片是在一個(gè)平面里的,相對(duì)距離也始終保持不變。而運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)中,兩張照片不在一個(gè)平面里,空間位置和角度都發(fā)生了變化。 相當(dāng)于兩張照片分別有自己的三個(gè)方向的位置坐標(biāo),以及三個(gè)方向的角度坐標(biāo)。 我們最終要得到某個(gè)點(diǎn)的坐標(biāo)信息,不在任何一張照片自己的坐標(biāo)系里,而是要通過(guò)復(fù)雜的坐標(biāo)變換,得到它在真實(shí)世界里的坐標(biāo)。 這些多出來(lái)的未知坐標(biāo)數(shù)據(jù),叫做照片的外方位元素。加上我們本來(lái)就要求解的某點(diǎn)空間坐標(biāo),未知數(shù)變得非常多。對(duì)這些未知數(shù)求解的方法很多,公式一個(gè)比一個(gè)復(fù)雜,你可以感受一下: 你不需要看懂方程,只需要知道:對(duì)于照片外方位元素信息知道的越少,計(jì)算就越復(fù)雜,誤差就越大;相反,想要降低運(yùn)算難度,就要提前把盡可能多的信息告訴計(jì)算機(jī),比如在地面上設(shè)置控制點(diǎn),預(yù)先定義拍攝相機(jī)的坐標(biāo)。 這些龐大的計(jì)算量,靠人力幾乎是不可能完成的,必須依靠計(jì)算機(jī)。 至此,攝影測(cè)量的發(fā)展出現(xiàn)了兩個(gè)分支:一是通過(guò)發(fā)展硬件設(shè)備,提前得知更多的相機(jī)方位和角度;二是通過(guò)發(fā)展軟件算法,更快速的求解相機(jī)的方位和角度。 1957年,美國(guó)人海拉瓦發(fā)表了解析測(cè)圖儀原理的論文,70年代中期解析測(cè)圖儀開始在市場(chǎng)上廣泛應(yīng)用,攝影測(cè)量正式進(jìn)入解析攝影測(cè)量時(shí)代。 解析攝影測(cè)量有兩個(gè)特點(diǎn): 一是處理的還是沖洗出來(lái)的照片,除了需要進(jìn)行上述計(jì)算,還要對(duì)照片本身在曝光、沖洗和老化過(guò)程中的變形進(jìn)行修正計(jì)算; 二是雖然使用了計(jì)算機(jī),但還只是利用它進(jìn)行大量公式的計(jì)算,沒有開發(fā)專門的處理軟件,仍需要大量的人工操作,主要的工作就是靠人眼挑選出兩張照片中哪些點(diǎn)是相同的關(guān)鍵點(diǎn),再輸入計(jì)算機(jī)進(jìn)行計(jì)算。 這個(gè)時(shí)代并沒有持續(xù)很久,隨著數(shù)字技術(shù)和軟件技術(shù)的快速發(fā)展,人們很快進(jìn)入了數(shù)字?jǐn)z影測(cè)量時(shí)代。 有兩項(xiàng)關(guān)鍵技術(shù)標(biāo)志著時(shí)代的跨越。 一是數(shù)碼攝影技術(shù)的誕生。 對(duì)大型三維場(chǎng)景的還原,需要的照片數(shù)量動(dòng)輒就是上萬(wàn)張,如果一張張沖洗,對(duì)照片的形變進(jìn)行矯正,再一張張人工比對(duì),工作量大的可怕。數(shù)碼相片的結(jié)果直接儲(chǔ)存在電腦里,可以更快速的進(jìn)行處理和分類,這無(wú)疑把數(shù)據(jù)處理的效率提上一個(gè)大臺(tái)階。 二是專業(yè)處理軟件的誕生。 前面為了方便你理解,我們一直說(shuō)的是一組照片上一個(gè)點(diǎn)的位置比對(duì)。而實(shí)際上為了建立一個(gè)完整的模型,每組照片上需要處理的點(diǎn)都至少要幾百個(gè)。 在數(shù)字?jǐn)z影測(cè)量時(shí)代之前,關(guān)鍵點(diǎn)匹配的工作都是靠人工來(lái)完成的。到了這個(gè)時(shí)期,人們開發(fā)出專門的軟件,在兩張圖片中自動(dòng)找到大量匹配點(diǎn),這又進(jìn)一步提高了效率。 至此,用照片進(jìn)行三維建模的技術(shù)核心已經(jīng)發(fā)展完畢,沒有什么本質(zhì)上的東西需要突破了,但它距離我們今天看到蓬勃發(fā)展的傾斜攝影技術(shù)還差一大截。我們的故事,也就在這里準(zhǔn)備進(jìn)入高潮。 我們先來(lái)梳理一下,用照片建模需要做哪幾件事情: ? 利用無(wú)人機(jī)在空中采集大量的照片,每?jī)蓮堈掌g要有一定的重疊,以便后期找到匹配點(diǎn); ? 盡量多的提前獲取每張照片的原始數(shù)據(jù),比如拍攝坐標(biāo)、拍攝角度、焦距等,以減少后期的運(yùn)算量; ? 利用軟件對(duì)大量照片進(jìn)行整理,自動(dòng)選出匹配點(diǎn),反算出沒能獲取的原始數(shù)據(jù); ? 計(jì)算出每個(gè)匹配點(diǎn)的空間坐標(biāo),再通過(guò)算法補(bǔ)齊其他關(guān)鍵點(diǎn)的坐標(biāo),貼上材質(zhì),形成模型。 在數(shù)字?jǐn)z影測(cè)量時(shí)代的初期,這幾項(xiàng)工作就都可以完成了,質(zhì)量也說(shuō)得過(guò)去。但因?yàn)槌杀靖摺⑿实?,只能由大型機(jī)構(gòu)來(lái)完成這項(xiàng)工作,而很少有機(jī)構(gòu)能從整體上優(yōu)化這些關(guān)鍵工作。 技術(shù)發(fā)展到一定程度,當(dāng)它的基礎(chǔ)理論完備之后,再想要大幅度的進(jìn)步,只有一個(gè)方法,我們叫它商業(yè)化大爆炸。 簡(jiǎn)而言之,就是構(gòu)成這項(xiàng)技術(shù)的幾個(gè)分支技術(shù),分別由不同的公司、以不同的商業(yè)目的,進(jìn)行極致的優(yōu)化。 我們來(lái)快速看看這幾個(gè)分支技術(shù)的發(fā)展。 無(wú)人機(jī)支線: 2006年,影響世界消費(fèi)級(jí)無(wú)人機(jī)格局的大疆無(wú)人機(jī)公司成立。 2013年量產(chǎn)全世界首款一體化小型無(wú)人機(jī),此后不斷迭代,把風(fēng)中懸停、三軸穩(wěn)定云臺(tái)、折疊便攜、高清圖像傳輸、智能避障、屏幕遙控等技術(shù)不斷塞進(jìn)越來(lái)越小的機(jī)型里。 成本也是一再降低,最新發(fā)布的Mavic Air價(jià)格跌破了5000元,讓無(wú)人機(jī)真正進(jìn)入了消費(fèi)領(lǐng)域。 相機(jī)支線: 以尼康、佳能、索尼為代表的制造商,在數(shù)碼相機(jī)領(lǐng)域相互競(jìng)爭(zhēng),不斷推出更好、更輕的產(chǎn)品。 其中,索尼公司在2010年開辟了微單產(chǎn)品線,主打「在最有限的空間中集成最優(yōu)秀的性能」,在2015年更是把密集混合快速對(duì)焦、大光圈廣角蔡司鏡頭、35毫米全畫幅傳感器等黑科技塞進(jìn)了重量只有500克的RX1R2相機(jī)里。 定位技術(shù)支線: 經(jīng)過(guò)十幾年的發(fā)展,民用GPS全球定位系統(tǒng)精度已經(jīng)達(dá)到了米級(jí),2016年美國(guó)加州研發(fā)人員開發(fā)了一種全新的GPS算法,可以將精確度提高到厘米級(jí)。 GPS定位可以讓無(wú)人機(jī)拍攝的時(shí)候無(wú)需安排地面控制點(diǎn),就可以獲取相機(jī)空間坐標(biāo),從而大幅度減少求解方程中的未知數(shù),而其成本到今天幾乎已經(jīng)是全民免費(fèi)。 軟件支線: 以ContextCapture、Street Factory為代表的專業(yè)軟件,給傾斜攝影的后期處理運(yùn)算帶來(lái)了極大的便利。 最重要的就是可以無(wú)視相機(jī)初始坐標(biāo),完全通過(guò)自動(dòng)算法生成超高密度點(diǎn)云。算法優(yōu)化的結(jié)果,就是對(duì)初始攝影條件的要求不斷降低。 此外,像Altizure、dronedeploy這樣的自動(dòng)飛行路線規(guī)劃軟件,可以直接在手機(jī)上選定一個(gè)拍攝區(qū)域,對(duì)無(wú)人機(jī)自動(dòng)進(jìn)行飛行路線規(guī)劃,完全傻瓜操作就可以實(shí)現(xiàn)高重疊、不漏拍的影像獲取;單次飛行拍不完,可以自動(dòng)進(jìn)行續(xù)拍,從而降低了無(wú)人機(jī)的續(xù)航要求。 軟件進(jìn)步最大的成果,就是中小型地區(qū)的航拍相機(jī)數(shù)量需求不斷減少,從最早的5鏡頭,到雙鏡頭,再到現(xiàn)在單鏡頭就可以完成整個(gè)拍攝,大大降低了無(wú)人機(jī)的負(fù)載需求,也進(jìn)一步降低了硬件成本。 同時(shí),以BIM技術(shù)為代表的建筑建模技術(shù)進(jìn)入市場(chǎng),人工和自動(dòng)相結(jié)合的方式快速補(bǔ)足了傾斜攝影拍攝建筑精度不夠的短板。 軟件領(lǐng)域一旦進(jìn)入消費(fèi)級(jí),就會(huì)出現(xiàn)更具有顛覆性的產(chǎn)品問(wèn)世,那就是以云計(jì)算為代表的在線后處理工具,它們學(xué)習(xí)模仿專業(yè)軟件的核心算法,然后在商業(yè)上通過(guò)低價(jià)甚至免費(fèi)來(lái)獲取用戶,再通過(guò)其他方式獲利。 這對(duì)于傳統(tǒng)專業(yè)軟件來(lái)說(shuō)是壞消息,但對(duì)于民用測(cè)量市場(chǎng)來(lái)說(shuō),無(wú)疑是引發(fā)「全民傾斜攝影」的好消息。 關(guān)于這個(gè)話題,我們放到下一期來(lái)給你說(shuō)。 當(dāng)然,上面說(shuō)的這幾項(xiàng)消費(fèi)級(jí)技術(shù),對(duì)于大型地貌的專業(yè)級(jí)測(cè)量建模,還是不能滿足需求的,但現(xiàn)在普遍存在的、幾平方公里的建模需求,不到萬(wàn)元的成本就完全能滿足了。 除了專業(yè)軟件之外,我們看到的無(wú)人機(jī)、相機(jī)、GPS等技術(shù),全都不是專門為了傾斜攝影這一項(xiàng)技術(shù)而研發(fā)的,它們各自有著更廣闊的用途和商業(yè)前景,但就是這種分支散葉的商業(yè)化大爆炸,才會(huì)先獨(dú)立、再融通,最終回到一起,促進(jìn)一個(gè)「跨界技術(shù)」的不斷進(jìn)步。 前面我們說(shuō)的所有技術(shù),都是建立在一個(gè)基礎(chǔ)上:通過(guò)雙目視差運(yùn)算、運(yùn)動(dòng)結(jié)構(gòu)恢復(fù),用機(jī)器模擬人的大腦進(jìn)行建模。 而在另一些與傾斜攝影無(wú)關(guān)的領(lǐng)域,一些更牛的科技正在蠢蠢欲動(dòng),準(zhǔn)備徹底顛覆掉我們前面講到的一系列麻煩,和為了解決這些麻煩發(fā)展出來(lái)的分支技術(shù)。 這些科技正在做的事是:別模仿大腦了,讓我們超越自己,實(shí)現(xiàn)那些人腦不能實(shí)現(xiàn)的功能吧。 給你看兩個(gè)例子。 在自動(dòng)駕駛和機(jī)器人領(lǐng)域,深度相機(jī)的發(fā)展正在日趨成熟。簡(jiǎn)單來(lái)說(shuō),深度相機(jī)就是不需要進(jìn)行多張照片的匹配和坐標(biāo)計(jì)算,而是在拍攝單張照片的同時(shí),就獲得每一個(gè)點(diǎn)的深度坐標(biāo)數(shù)值,從而直接實(shí)現(xiàn)建模。 深度相機(jī)技術(shù)在民用領(lǐng)域最有代表性的就是iphoneX的3D人臉建模功能。 在游戲和影視制作領(lǐng)域,基于計(jì)算機(jī)視覺的深度學(xué)習(xí)技術(shù)也在不斷發(fā)展。諾丁漢大學(xué)和金斯頓大學(xué)的幾名人工智能專家在2017年發(fā)布了一個(gè)開源算法,只要上傳一張照片,就可以自動(dòng)生成3D人臉模型。 將網(wǎng)址復(fù)制到瀏覽器可以嘗試哦?https://cvl-demos.cs.nott.ac.uk/vrn/ 這背后是通過(guò)大量數(shù)據(jù)進(jìn)行學(xué)習(xí)的人工智能技術(shù),讓計(jì)算機(jī)只通過(guò)一張照片上的光影變化就能「猜」到實(shí)際的3D模型應(yīng)該怎么建立。 目前國(guó)內(nèi)也有人進(jìn)行這方面的研究,比如上海交通大學(xué)在2015年就通過(guò)機(jī)器學(xué)習(xí),做到單張照片半人工進(jìn)行三維建模: 在未來(lái),這樣的技術(shù)很有可能從根本上解決多照片匹配所帶來(lái)的一些列問(wèn)題,把三維重建技術(shù)帶向新的未來(lái)。 當(dāng)然,隨之而來(lái)的是那些為解決老問(wèn)題而存在的舊技術(shù)逐漸退出舞臺(tái)。 傾斜攝影的故事到這里就告一段落了。最后我們看看,通過(guò)這個(gè)故事,能看到技術(shù)發(fā)展的哪些特點(diǎn)。 技術(shù)有自己的生命周期,我們可以把它比喻成一個(gè)人。 ● 任何一個(gè)技術(shù)都不是生來(lái)強(qiáng)悍的,剛剛誕生的時(shí)候,它只能笨拙地解決少量問(wèn)題,有著無(wú)數(shù)的缺陷,還會(huì)帶來(lái)很多麻煩。就像最早期的模擬攝影測(cè)量,甚至比不上如今一個(gè)最差勁的建模員純手工建模的效率。 ● 進(jìn)入青年期,它開始四處亂撞,逐漸找到自己的方向,并且慢慢知道,很多事情靠自己解決不了。于是它開始求助于其他成熟的技術(shù),正如攝影測(cè)量借助相機(jī)、飛機(jī)、計(jì)算機(jī)來(lái)發(fā)展自己。 ● 成年之后,技術(shù)終有一天會(huì)走出象牙塔,進(jìn)入商業(yè)社會(huì),在那里迎接它的是殘酷的商業(yè)競(jìng)爭(zhēng)。那里也會(huì)有更多幫助它的朋友,即便那些朋友并不是以幫助它為唯一目的。相機(jī)和無(wú)人機(jī)都是商業(yè)競(jìng)爭(zhēng)下獨(dú)立發(fā)展的典范。 ● 就像人會(huì)結(jié)婚生子,技術(shù)會(huì)和其他技術(shù)融合到一起,融合誕生的新技術(shù)會(huì)重新開始自己的生命周期,并遲早會(huì)與父母揮手告別,走上完全不同的路。 ● 最終,一項(xiàng)技術(shù)會(huì)隨著新技術(shù)的誕生而衰老,逐漸無(wú)人問(wèn)津,但被替代或者被淘汰,并不意味著它沒有存在的價(jià)值,舊技術(shù)歸于歷史的塵埃,終會(huì)化為土壤,供未來(lái)的技術(shù)生根發(fā)芽。 今天的話題就聊到這兒,希望能給你一些思考。有態(tài)度,有深度,BIMBOX,我們下次再見!
文章分類:
BIMBOX理論知識(shí)
|