【作者】
張業成a,?, 趙慧敏,?, 龍瀛,*
a ,b 清華大學建筑學院
c 清華大學建筑學院和恒隆房地產研究中心,教育部生態規劃與綠色建筑重點實驗室
?共同第一作者
通訊作者郵箱
ylong@tsinghua.edu.cn
原文鏈接
https://www.nature.com/articles/s41597-025-04730-5
內容導讀
快速獲取三維(3D)建筑數據,包括屋頂、高度和結構等幾何屬性,以及功能、質量和年齡等指標屬性,對于準確的城市分析、模擬和政策更新至關重要。當前的建筑物數據集存在多維屬性時空覆蓋缺失。龍瀛課題組開發了一個用于大規模建筑建模的人工智能框架(圖1),提出了第一個國家規模的多屬性建筑物數據集CMAB,覆蓋了中國3667個實體城市,3100萬個建筑和236億m2的屋頂,在基于OCRNet的提取中F1值為89.93%,總計3630億m3的建筑存量。基于城市行政等級分類訓練了機器學習模型,包含形態、區位和功能等特征。使用多源數據,包括數10億張高分辨率遙感圖像和6000萬張街景圖像,通過深度學習、機器學習和多模態大模型為每棟建筑生成了屋頂、高度、結構、功能、風格、年齡和質量屬性。準確性通過模型基準、現有的類似產品和人工檢查進行了驗證,準確率超過80%。數據集和結果對于全球可持續發展目標和城市規劃至關重要。
圖1 CMAB的整體建模框架
研究背景
在過去幾十年的城市化進程中,世界各地的城市經歷了快速擴張,建筑物成為空間基本細胞單元,城市在三維形態和社會功能方面呈現出日益復雜的變化。通過構建數據集全面了解城市的精細三維物理和社會結構,對于研究城市化進程、城市能源、城市生態系統以及與碳排相關的政府決策至關重要。建筑屬性可以大致分為兩類:幾何屬性,包括建筑二維形態、高度、結構和方位;和指標屬性,包括功能、風格、年齡、質量和空置。幾何屬性對于分析城市物理結構和規劃城市空間至關重要,而指標屬性是理解建筑性能和生命周期的關鍵。
一方面,由于以往數據的空間和時間分辨率不足、訓練樣本有限以及訓練成本高昂,三維城市形態信息由于測繪成本和技術限制一直難以大規模展開,尤其是在發展中國家。因為傳統航空測量經濟成本高、時間長,使用開源數據快速提取三維建筑數據是未來的發展趨勢。另一方面,目前對城市結構的理解仍主要停留在物理層面,以現有的建筑屋頂和高度數據為代表,缺乏建筑物的綜合社會屬性,如功能、風格、年齡和質量。據調查,CMAB是世界上第一個在建筑單體層面提供這些屬性的國家規模的尺度開放建筑物數據集。
圖2. 建筑屬性和數據來源可視化
主要解決問題
1. 空間抽樣策略
首先定義實體城市的邊界,以明確數據產品的提取范圍。根據中國的氣候區劃和行政城市級別選擇建筑樣本,并將所有建筑物按照其對應的行政級別分為五類。
圖3. 中國實體城市抽樣、行政等級分類與所用多源數據的空間完備性
圖4. 實體城市GES影像的時間分布
2. 構建指標體系,提取三維建筑
利用手工標注增強的屋頂樣本來訓練OCRNet模型,并采用空間聚合方法提取所有實體城市的建筑屋頂。在此基礎上,計算不同尺度下的建筑形態、密度和區位特征。針對每個行政級別的建筑,訓練合適的分區模型以完成三維建筑的提取。同時在建筑高度的指標體系上加入建筑功能特征。
圖5. 用于標注增強的高密度區域重采樣過程
圖6. 百度建筑數據集的統計與預處理
圖7. 用于高度和功能估計的建筑物特征構建
圖8. 建筑特征計算——以臨街和功能區位為例
3. 提取指標屬性
使用多源數據進一步提取不同尺度下的功能特征,生成功能特征。通過結合長時序不透水面和6000萬條街景圖像,通過空間匹配和目標檢測為每個建筑單體分配建筑年代和質量。此外,建筑的結構、風格屬性通過微調CLIP多模態模型獲得。
圖9. 通過街景評估沿街建筑的質量
圖10. 使用GAIA數據為建筑物添加建筑年齡
4. 數據驗證
對建筑的屋頂、高度和功能進行了模型評估和數據對比,并通過手工標注的街景數據集對建筑的高度、結構、功能、風格、質量和年代進行了驗證。
圖11. 建筑物多屬性的人工驗證方法
成效分析
1. 數據產品整體介紹
該數據集可在Figshare網站:https://doi.org/10.6084/m9.figshare.27992417獲得。該產品按實體城市和行政區劃組織,并以標準GIS格式保存。每個建筑物屋頂被保存為由地理坐標系WGS1984下有限數量的點繪制的多邊形,包括建筑物屋頂、高度、結構、功能、年齡、風格和質量作為建筑物屬性。
圖12. 北京多屬性建筑物數據集的可視化
2.建筑輪廓結果
評估基于一個驗證集,包含來自七個不同氣候區的城市中23,415個手動標注的建筑屋頂。結果顯示,建筑屋頂分割模型在相關數據集上的交并比(mIoU)、召回率(Recall)和精度(Precision)方面優于現有研究。在補充了114,783個建筑單體的標注數據后,屋頂分割模型達到了91.59%的準確率,81.95%的 mIoU,89.93%的 F1 分數,以及79.86%的 Kappa 系數。
3.建筑高度結果
通過可視化和高度分類和 GABLE 數據集進行了比較。GABLE 是一個通過光學影像識別中國所有建筑高度的產品,提供了 0-10、10-30、30-50、50-100、100-500 米高度區間的 RMSE 值。根據這些區間分類數據后發現,在50米以下的區間內,表現出更低的 RMSE 值。根據使用的 Baidu 數據統計,98% 的建筑高度低于50米。另外,根據2020年中國人口普查,超過10層的住宅建筑(大致相當于建筑高度超過30米)僅占1%。
圖13. 與GABLE建筑高度的可視化與比較
圖14. 分區模型和組合模型的相對誤差和絕對誤差值表示的不確定性
4. 建筑功能結果
劃分模型的表現優于組合模型,住宅功能識別的精度更高,F1 分數接近 0.90。而其他功能類別,如辦公樓的識別精度略低,F1 分數接近 0.80。相比之下,商業和公共服務功能的模型表現較差,F1 分數約為 0.5。使用街景數據對 2500 棟建筑的功能進行了人工驗證,發現 88% 的建筑功能分類是準確的。這表明方法能夠正確識別大多數建筑的功能用途。
圖15. 建筑功能模型的準確度
5.建筑質量和年代結果
各種建筑質量類別的識別準確率如下:“外立面損壞的建筑”(83.4%)、“非法/臨時建筑”(71.6%)、“涂鴉/非法廣告”(80.7%)、“門面差的商店”(89.8%)、“外立面不整潔的建筑”(79.9%)和“招牌差的商店”(84.6%)。建筑年代的準確性則依賴于 GAIA 數據的精度。GAIA 各年份的平均總體準確率高于 90%。利用安居客的住房交易數據,其中包括 3771892 條房屋租賃,包含建筑年份和坐標信息。發現在省級層面上,住房交易數據中的建筑年代與估計值之間存在顯著正相關關系。與 GAIA 的建筑年代數據相比,結果顯示平均差異為 8.7 年,GAIA 的建筑年代通常比住房交易記錄的時間要早。使用街景通過人工審核對 2500 棟建筑的質量和年代進行了手動標注,給建筑質量問題分配了從 0 到 6 的嚴重程度評分。與現有結果進行相關性分析,得到了 R2 值為 0.78。關于建筑年代,將手動標注的建筑年代分為五個類別(1985、1990、2000、2010和 2018),并統計所識別的建筑年代是否符合觀察到的真實類別值,發現 82% 的建筑分類驗證是準確的。
6.建筑結構和風格結果
目前,大型多模態模型(LMMs)如 GPT-4o 等已經顯著改變了機器學習應用建模的范式。測試并微調了CLIP 和 GPT-4o等模型。比較深度學習和大模型訓練成本、精度差異和識別效率,發現LMMs 在推斷建筑結構和風格方面表現良好(見圖 S9)。
圖16. 通過街景微調LMMs預測建筑物屬性的準確性
介紹
研究團隊介紹
論文共同第一作者為清華大學城市規劃系博士生張業成、博士生趙慧敏,清華大學龍瀛教授為通訊作者。研究由國家自然科學基金重大項目(項目號:62394335和62394331)、面上項目(城市收縮背景下城市空置的智能測度、機理認知與規劃設計響應研究,項目號:52178044)和能源基金會項目(項目號:G-2306-34815)資助。
同時,龍瀛課題組已發布的相關數據集“全球1公里網格人口數據集(2020-2100)”,關聯論文入選ESI高被引論文,論文共同第一作者為清華大學城市規劃系博士生王新宇,清華大學出站博士后、中國礦業大學講師孟祥鳳,清華大學龍瀛教授為通訊作者。該數據集覆蓋全球248個國家或地區,其空間分辨率為30弧秒(約1公里),間隔時間為5年。數據集同5個社會經濟共享路徑情景(Shared Socioeconomic Pathways, SSPs)相統一。通過與WorldPop數據集在省級層面和網格層面的比較得到驗證,可以作為各領域預測研究的輸入數據。成果于2022年9月在Scientific Data上以數據論文形式發布,目前數據瀏覽量超過14200次,下載量超過13400次。
文章URL:
建筑數據:https://www.nature.com/articles/s41597-025-04730-5
人口數據:https://www.nature.com/articles/s41597-022-01675-x
數據和代碼:
建筑數據:https://doi.org/10.6084/m9.figshare.27992417
人口數據:https://doi.org/10.6084/m9.figshare.19608594
聲明:本文系轉載自互聯網,請讀者僅作參考,并自行核實相關內容。若對該稿件內容有任何疑問或質疑,請立即與鐵甲網聯系,本網將迅速給您回應并做處理,再次感謝您的閱讀與關注。
不想錯過新鮮資訊?
微信"掃一掃"