97情色五月天,人妻的色诱伦理片,曰韩AV久久AV,99视频在线播放,久久国产黄色电影,999美女激情,婷婷AV一区二区三区,久草精品视频网站,操青青在线观看

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能開發(fā)者 正文
發(fā)私信給skura
發(fā)送

0

Facebook 又出黑科技,手機照片一鍵切成 3D 大片

本文作者: skura 2020-03-13 09:21
導語:CNN 網(wǎng)絡還可以這樣用!

隨著科技的發(fā)展,現(xiàn)在人們可以隨時隨地用手機等設備拍照記錄自己喜歡的瞬間??赡懿簧偃硕枷脒^,假如出現(xiàn)一種黑科技,讓我們拍攝的平面 2D 照片變成立體的 3D 照片......

Facebook 也早就想到了這個問題。為改善用戶體驗,2018 年,F(xiàn)acebook 就推出了 3D 照片功能。這是一種全新的沉浸式格式,你可以用它與朋友、家人分享照片。但是,這項功能依賴于高端智能手機才具備的雙鏡頭「肖像模式」功能,無法在尋常的移動設備上使用。

為了讓更多人體驗到這種新的視覺格式,F(xiàn)acebook 利用機器學習開發(fā)了一個系統(tǒng)。這個系統(tǒng)可以推斷出任何圖像的 3D 結構,任何設備、任何時間拍攝的圖像都可以被轉換成 3D 形式。這就可以讓人們輕松使用 3D 照片技術。

不僅如此,它還可以處理幾十年前的家庭照片和其它珍貴圖像。任何擁有 iPhone7 及以上版本,或中端以上 Android 設備的人,現(xiàn)在都可以在 Facebook 應用程序中嘗試這個功能。

Facebook 又出黑科技,手機照片一鍵切成 3D 大片

估計 2D 圖像不同區(qū)域的深度,以創(chuàng)建 3D 圖像

構建這種增強的 3D 圖片需要克服不少技術挑戰(zhàn),例如,要訓練一個能夠正確推斷各種主題 3D 位置的模型,并優(yōu)化系統(tǒng),使其能夠在 1 秒鐘內(nèi)運行在典型的移動處理器設備上。為了克服這些挑戰(zhàn),F(xiàn)acebook 在數(shù)百萬公共 3D 圖像及其附帶的深度圖上訓練了卷積神經(jīng)網(wǎng)絡(CNN),并利用 Facebook AI 之前開發(fā)的各種移動優(yōu)化技術,如 FBNet 和 ChamNet。團隊最近也討論了 3D 理解的相關研究。

現(xiàn)在,所有使用 Facebook 的人都可以使用這個功能,那么,它究竟是如何構建的?我們可以一起來看看其中的技術細節(jié)。

Facebook 又出黑科技,手機照片一鍵切成 3D 大片

小狗的原始照片是用單鏡頭相機拍攝的,沒有任何深度圖數(shù)據(jù),系統(tǒng)將其轉換成了上圖顯示的 3D 圖像

在移動設備上提供高效性能

給定一個標準的 RGB 圖像,3D Photos CNN(3D 照片卷積神經(jīng)網(wǎng)絡)可以估計每個像素與攝像機的距離。研究人員通過四種方式實現(xiàn)了這一目標:

  • 使用一組可參數(shù)化、可移動優(yōu)化的神經(jīng)構建塊構建網(wǎng)絡架構;

  • 自動化架構搜索,以找到這些塊的有效配置,使系統(tǒng)能夠在不到 1 秒鐘的時間內(nèi)在各種設備上執(zhí)行任務;

  • 量化感知訓練,在移動設備上利用高性能 INT8 量化,同時使量化過程中的性能下降最小化;

  • 從公開的 3D 照片獲取大量的訓練數(shù)據(jù)。

神經(jīng)構建塊

Facebook 的架構使用受 FBNet 的構建塊啟發(fā)。FBNet 是一個為移動設備等資源受限的設備優(yōu)化 ConvNet 架構的框架。一個構建塊由逐點卷積(pointwise convolution)、可選的上采樣、kxk 深度卷積和附加的點逐點卷積組成。Facebook 實現(xiàn)了一個 U-net 風格的架構,該架構已被修改為沿著跳過連接放置 FBNet 構建塊。U-net 編碼器和解碼器各包含 5 個階段,每個階段對應不同的空間分辨率。

Facebook 又出黑科技,手機照片一鍵切成 3D 大片網(wǎng)絡架構概述:一個 U-net 沿著跳過的連接放置額外的宏級構建塊

自動化架構搜索

為了找到一個有效的架構配置,F(xiàn)acebook AI 開發(fā)的 ChamNet 算法自動完成搜索過程。ChamNet 算法不斷從搜索空間中抽取點來訓練精度預測器。該精度預測器用于加速遺傳搜索,以找到在滿足特定資源約束的情況下,使預測精度最大化的模型。

這個設置中使用了一個搜索空間,它可以改變通道擴展因子和每個塊的輸出通道數(shù),從而產(chǎn)生 3.4x1022 種可能的體系結構。然后,F(xiàn)acebook 使用 800 Tesla V100 GPU 在大約三天內(nèi)完成搜索,設置并調(diào)整模型架構上的 FLOP 約束,以實現(xiàn)不同的操作點。

量化感知訓練

默認情況下,其模型使用單精度浮點權值和激活進行訓練,但研究人員發(fā)現(xiàn),將權值和激活量化為 8 位具有顯著的優(yōu)勢。尤其是,int8 權重只需要 float32 權重所需存儲量的四分之一,從而減少首次使用時必須傳輸?shù)皆O備的字節(jié)數(shù)。

Facebook 又出黑科技,手機照片一鍵切成 3D 大片

每幅圖像都是從一個規(guī)則的 2D 圖像開始,然后用深度估計神經(jīng)網(wǎng)絡轉換成 3D 圖像

與基于 float32 的運算符相比,基于 Int8 的運算符的吞吐量也要高得多,這要歸功于 Facebook AI 的 QNNPACK 等經(jīng)過優(yōu)化的庫,后者已經(jīng)集成到 PyTorch 中。我們使用量化感知訓練(QAT)來避免量化導致的質(zhì)量下降。QAT 現(xiàn)在是 PyTorch 的一部分,它在訓練期間模擬量化并支持反向傳播,從而消除了訓練和生產(chǎn)性能之間的差距。

Facebook 又出黑科技,手機照片一鍵切成 3D 大片

神經(jīng)網(wǎng)絡處理各種內(nèi)容,包括繪畫和復雜場景的圖像

尋找創(chuàng)造 3D 體驗的新方法

除了改進深度估計算法之外,研究人員還致力于為移動設備拍攝的視頻提供高質(zhì)量的深度估計。

由于每個幀的深度必須與下一幀一致,視頻處理技術具有一定挑戰(zhàn)性,但它也是一個提高性能的機會。對同一物體進行多次觀測,可以為高精度的深度估計提供額外的信號。隨著 Facebook 神經(jīng)網(wǎng)絡性能的不斷提高,團隊還將探索在實時應用(如增強現(xiàn)實)中利用深度估計、曲面法向估計和空間推理等技術。

除了這些潛在的新經(jīng)驗,這項工作將幫助研究人員更好地理解 2D 圖像的內(nèi)容。更好地理解 3D 場景還可以幫助機器人導航以及與物理世界互動。Facebook 希望通過分享 3D 圖片系統(tǒng)的細節(jié),幫助人工智能社區(qū)在這些領域取得進展,并創(chuàng)造利用先進的 3D 新體驗。

via:https://ai.facebook.com/blog/-powered-by-ai-turning-any-2d-photo-into-3d-using-convolutional-neural-nets/

雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)

Facebook 又出黑科技,手機照片一鍵切成 3D 大片

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說
宁津县| 寻乌县| 邮箱| 安泽县| 东源县| 宣武区| 亳州市| 白城市| 拉萨市| 宁河县| 青州市| 安庆市| 手游| 正安县| 汉寿县| 常熟市| 米泉市| 浏阳市| 明水县| 江城| 保德县| 平乐县| 石家庄市| 墨脱县| 登封市| 西城区| 翼城县| 北票市| 武穴市| 嘉善县| 三门县| 昆山市| 高碑店市| 孙吴县| 华安县| 蓬莱市| 谢通门县| 宜章县| 阿勒泰市| 东乡族自治县| 太仆寺旗|