洛桑聯(lián)邦理工學院數(shù)字人文研究中心
[洛桑聯(lián)邦理工學院數(shù)字人文研究中心]專題生成時間為:1557412256
數(shù)字人文實驗室
瑞士洛桑聯(lián)邦理工學院數(shù)字人文研究中心(DHI)致力于促進和發(fā)展數(shù)字人文研究項目,借助EPFL的校內(nèi)項目或與其他瑞士和國際性大學進行合作,為EPFL提供本土化和全球化的視角和理念。
數(shù)字人文實驗室(Digital Humanities Laboratory, DHLAB)是瑞士洛桑聯(lián)邦理工學院數(shù)字人文研究中心(DHI)下屬的實驗室,由Frédéric Kaplanin在2012年設立。實驗室利用前沿計算方法對歷史進行深度探索,對未來進行預測。其開展的項目從古城市的再現(xiàn)到算法對寫作的影響研究,無所不包。旗艦項目威尼斯時光機便是由DHLAB與威尼斯大學(Ca’ Foscari University)聯(lián)合開展,希望能夠對威尼斯1000多年的歷史記錄進行數(shù)字化,并向公眾開放使用。
DHLAB培養(yǎng)的是新一代的數(shù)字人文學家,開展和實施的是具有創(chuàng)新性的教育項目和教學方法。
部分數(shù)字人文項目介紹
1. ScanVan(2016-2020)
在未來幾年,對城市進行系統(tǒng)和全面的3D數(shù)字化是信息通信技術(ICT)所面臨的重大挑戰(zhàn)之一。事實上,可靠的3D城市建模是發(fā)展自主式汽車、城市無人機等的先決條件,更概括地說是城市數(shù)字管理的先決條件。而反過來,這些汽車和無人機又能夠對3D模型進行實時更新和升級,為可持續(xù)的4D城市建模創(chuàng)造條件。
如果利用攝影測繪技術對一座建筑物或一個小型社區(qū)進行掃描代表的是當下最尖端的技術,那么可以說我們現(xiàn)在還無法實現(xiàn)對整個城市的大規(guī)模掃描。對某座城市進行數(shù)字化的一個重大挑戰(zhàn)就是收集到的數(shù)據(jù)的絕對數(shù)量以及將這些圖像轉化為有效的3D模型的處理能力。
ScanVan這個項目是朝這一目標前進一次嘗試,它希望通過研發(fā)一種名為ScanVan的交通工具,實現(xiàn)對城市的掃描。將多輛ScanVan部署在不同的街道就可以獲得高質(zhì)量的實時城市模型。ScanVan搭載的是球型攝像機(4π),能夠一邊行駛,一邊將周邊環(huán)境轉化為點云。ScanVan還能夠依托現(xiàn)場可編程門陣列(Field - Programmable Gate Array, FPGA)和其他專門為攝影測繪計算而設計和優(yōu)化的計算資源,通過自己的計算系統(tǒng)處理數(shù)據(jù)。因此可以說ScanVan能夠完成從圖像收集到3D點模型計算的整個工作流程。
使用這樣的分布式計算系統(tǒng)的優(yōu)勢如下:
1. 由于步的計算工作都是在車上完成的,因此大大減少了數(shù)據(jù)的傳輸量。
2. 計算的加速工作由硬件完成。利用FPGA,不僅可以實現(xiàn)計算視角下的擬最優(yōu)計算方案,從能源的角度看也十分高效。
3. 計算工作得到了分化。有需要的時候,ScanVan會使用移動系統(tǒng)自動進行計算,因此不必進行大量的數(shù)據(jù)傳輸工作,也不再需要復雜的靜態(tài)集中計算基礎設施。從這一點上來說,這套系統(tǒng)從本質(zhì)上講是可擴展的。
當不同的ScanVan建立起3D模型后,這些模型會和原始數(shù)據(jù)一起被存儲在移動硬盤上。移動硬盤上的內(nèi)容晚些時候會被下載至“擴展塢”中,擴展塢負責模型的上傳及其與前期數(shù)據(jù)的結合。
該項目致力于構建ScanVan的初始模型,其研究重點在于如何通過車載計算系統(tǒng)將硬件/軟件與球形攝像機連接起來。該項目作為測試項目,希望最終能夠利用ScanVan的原型,為瑞士瓦萊州的西昂(Sion)市建立精準的4D城市模型。測試數(shù)據(jù)集將全部向公眾開放,以期能夠推動新的潛在服務項目的開發(fā)。
2. Impresso (2017 - 2020)
“Impresso”項目的開展是對歷史媒體進行研究,開展時間為2017年9月至2020年8月!癐mpresso”對過去200年間的歷史新聞報紙進行挖掘,通過技術性框架對紙質(zhì)媒體檔案進行數(shù)據(jù)提取、處理、關聯(lián)和探索,實現(xiàn)對新聞檔案的批判性文本挖掘!癐mpresso”由一個跨學科的項目組負責,項目組人員包括計算語言學家、數(shù)字人文學家、設計人員、歷史學家、圖書館員和檔案員等,他們共同應對來自內(nèi)容增強以及數(shù)據(jù)表示、可視化和分析方面的挑戰(zhàn),希望最終能夠從方法論和認識論兩個角度引發(fā)人們的思考。
該項目的預期成果包括:一套專門處理歷史紙質(zhì)媒體的自然語言處理(NLP)工具、對報紙語料庫進行積極探索和批判性分析的可視化界面,以及一個有關19世紀末到20世紀初期間的歐洲統(tǒng)一的數(shù)字歷史研究項目。
3. Replica (2015 - 2019)
數(shù)字工具如何輔佐研究人員進行藝術品研究?它們又如何幫助公眾對文化和藝術史進行探索和發(fā)現(xiàn)?
博物館、圖書館和文化機構對成百萬上千萬的藝術品進行了數(shù)字化,為公眾提供了前所未有的機會與這些藏品進行近距離接觸。但同時,這也對視覺史料的搜索、檢索和分析提出了新的挑戰(zhàn)。
當下,人們只能夠通過關鍵詞或標簽對藝術品的在線數(shù)據(jù)庫進行檢索,也就是說只能通過原始對象的文本元數(shù)據(jù)進行檢索。然而文本查詢無法實現(xiàn)對未建立索引的視覺信息的檢索——例如他們無法找到相似的形狀、圖形和圖像。這也是該項目構建通過可視屬性對藝術品進行搜索的新工具的必要性所在。
DHLAB所開展的Replica項目致力于建立個針對藝術館藏(包括畫作、素描、雕刻、塑像和攝影)進行搜索和探索的搜索引擎。其中在信息檢索和信息顯示和部分應用到了最前沿的藝術人工智能技術,如深度學習和卷積神經(jīng)網(wǎng)絡。
DHLAB與威尼斯的Giorgio Cini基金會(Giorgio Cini Foundation)以及馬德里的Factum Arte公司合作,希望能夠利用檢索出的圖像對大約100萬的藝術品進行數(shù)字化重塑。這樣不僅可以推廣新的搜索引擎,同時也可以為新的藝術歷史研究打下基礎。
Factum Arte與Giorgio Cini基金會之間的合作從很早之前就已經(jīng)開始了,如今他們已經(jīng)建立了經(jīng)過專門設計的環(huán)型掃描系統(tǒng),每分鐘能夠對12個A3大小的雙面圖像進行記錄,像素達到400DPI,同時還能夠自動下載正反面圖像和其對應的元數(shù)據(jù)標簽,并進行存儲。掃描儀還搭載了能夠對物品進行自動掃描的系統(tǒng),一個受控光源以及即時可視化裝置。
Replica為藝術館藏的探索開辟了新的路徑。它能夠幫助歷史學家進行圖像學研究,進行圖像形狀、風格和模式的傳輸,也能夠讓更多人參與到藝術品學習和探索的過程中來。
4. Linked Books(2015 - 2018)
“關聯(lián)圖書”(Linked Books)項目利用引文來研究威尼斯的歷史,通過開發(fā)的網(wǎng)頁應用在檢索結果的索引網(wǎng)絡中進行導航,希望能夠將數(shù)字檔案和數(shù)字圖書館中的內(nèi)容相互連結起來。
為了實現(xiàn)這一目標,“關聯(lián)圖書”項目組開發(fā)了從大量有關威尼斯歷史的數(shù)字圖書和雜志中進行自動引文抽取的系統(tǒng),而且還特別注意對引文與原始文獻和二次文獻之間的關系進行分析。