• 15535
撰文 / 採訪整理:江沛航

(續上篇)
縮小影音檔案搜尋範圍,是國內外近年來不斷努力的方向,在網際網路亦趨發達的現下,Youtube等影音平台大受歡迎,視訊多媒體的應用和影響層面也越來越廣泛,乃致於Google、Yahoo、Microsoft皆致力於視訊搜尋的技術。中央研究院資訊科學研究所廖弘源研究員為了龐大的數位典藏多媒體影音資料,多年來不斷研發出各種好用的多媒體技術,在開發視訊搜尋技術的同時,也成功地將這些技術應用於廣告看板等不同的領域,更獲得了經濟部中小企業創新研究獎等殊榮。就讓我們一同看看,這些新奇的技術,有什麼引人入勝的魔力吧!

廖弘源特聘研究員

一、電視牆看板人數計次
還記得電影〈哈利波特〉中無數的動態海報,以及海報與主角互動的場景嗎?透過動態電視牆看板人數計次技術(People Counting),這種活潑的廣告呈現方式將再也不是夢想囉!隨著數位看板(Digital Signage)的普及,我們在捷運站、百貨公司、校園常常可以看到以豐富多媒體聲光效果呈現的動態影音,其作為訊息傳播的管道之一,廣泛地應用於廣告、行銷、教育等用途。電視牆看板人數計次技術則有別於一般電子廣告看板,由板上內建或是外加的攝影設備,可自動識別人體、人臉特徵,準確記錄媒體刊播的瀏覽人次及駐足時間的統計,一方面能掌握訊息傳遞效益,一方面也能進一步即時分析現場觀看民眾的數量。

廖研究員提到當初的發想,其實是因為數位典藏計畫收藏了非常大量的影音資料,而影片資料檢索的困難點往往在於資料量過於龐大,如果我們想要透過一小段Video去搜尋大量的資料,人數計次是一個很好的切入點,我們可以透過人數偵測縮小影片搜尋的範圍。因此他開始發展人數計次技術,嘗試先應用於電視牆看板,用以計算觀看廣告牆的人數。開發出電視牆看板人數計次技術後,再整合人臉辨識等技術,將之技術轉移予桓基科技,進一步讓「TeraMedia數位看板廣告計次系統」問世,這種創新的電視牆看板概念,推出後即引起各方關注,並先後於2008年獲得「第十五屆經濟部中小企業創新研究獎」、2009年獲得「Linux 黃金企鵝產品獎」及台北國際電腦展「Best Choice of COMPUTEX TAPEI Award」。建立在識別人體的基礎上,TeraMedia數位看板更能結合體感偵測與觀眾互動,透過偵測使用者的四肢,讓使用者可以即時選擇想要細看的內容,甚至是進行互動小遊戲,以更直覺更具親和力的方式,讓觀眾輕鬆自在地與數位看板互動。

TeraMedia 互動數位看板

圖6:TeraMedia 互動數位看板

應用人數計次技術的數位看板,整合了各種格式多媒體影音輪播、觀眾瀏覽次數精確計算、使用者互動等強大功能,為數眾多的數位化影像資料、影音資料,甚至是因而開發出的多媒體資源和小遊戲,也終於獲得全新的呈現契機。活潑的動態海報不只出現於〈哈利波特〉中,也讓我們一起期待數位看板打造的互動資訊生活環境吧!

二、General People Counting技術
由於數位典藏的老影片中,畫面上人物往往不同於電視牆的觀眾是正面出現於畫面上,也不會以固定的角度或是高度出現,影片中往往有更多的側面影像。因此,延續電視牆看版人數計次技術,廖研究員也為此發展了新的General People Counting技術,透過辨識一小段影片中的人,嘗試描述他的動作或姿勢來進行搜尋。

General People Counting除了能夠縮小檢索範圍,也能以人物描述為基礎,達到視訊訊息的傳遞。例如透過不同高度、不同角度攝影機拍攝而得的畫面,對一位行進中的人進行正確而詳細的描述,描述完後更能從下一個角度不同、距離不同的攝影機畫面,自動抓取到所描述的對象。這種人物計算的技術不僅能有效搜尋數位典藏龐大的資料量,縮小大量視訊資料庫的搜尋空間,也能夠透過人物資訊的描述技術進而應用到更多層面。這項技術論文已經獲2012年20th ACM Conference on Multimedia接受,將於本年度10月份發表,除了顯見國際間的多媒體研究對此技術的肯定,我們也期待透過這些先進、新奇、有趣的技術,讓數位典藏的影音世界變得更加寬廣。

開發了這麼多的影像和視訊修補技術、自動視訊分鏡技術、人數計次等技術,除了讓數位典藏的影音資料有了更好的搜尋工具,也向國際展現了台灣的數位典藏技術實力。廖研究員表示,他在選擇題目時往往以富科學性的方向為主,並尋求具有技術轉移潛力、有競爭力的技術進行研發。在10月份最新技術發表的前夕,他感性地說:「最有成就感的部分在於和我的研究團隊共同努力,把數位典藏所需的工具,發展成具有國際競爭力的技術。當論文被知名期刊接受時,我高興地眼淚都快掉下來了!」這些孜孜矻矻的研究成果,也讓技術支援不再只是基礎工作,更能發展成極具市場潛力、具有國際競爭力的技術成果。諸多在國內外指標性期刊發表的論文、技術移轉成功的案件、獲得的各種獎項,都說明了這些「神乎其技」不但各有妙處,也將能夠被更多典藏機構善用,更讓我們的數位典藏多媒體世界變得繽紛而多采。(全文完)


延伸閱讀:

(1) Y. Y. Chen, Winston H. Hsu, and H. Y. Mark Liao, "Discovering Informative Social Subgraphs and Predicting Pairwise Relationships from Group Photos," 20th ACM Multimedia Conference, October 2012.

(2) M. F. Weng, Y. Y. Lin, Nick C Tang, and H. Y. Mark Liao, "Visual Knowledge Transfer among Multiple Cameras for People Counting with Occlusion Handling," 20th ACM Conference on Multimedia, October 2012.

(3) S. W. Sun, W. H. Cheng, Y. L. Hung, Ivy Fan, Chris Liu, Jacqueline Hung, C. K. Lin, and H. Y. Mark Liao, "Who's Who in a Sports Video ? An Individual Level Sports Video Indexing System," International Conference on Multimedia and Exposition, July 2012.

(4)〈TeraMedia 新世代數位看板〉,《桓基e週報》,第19期,2012年3月,檢索:2012年8月,http://tw.hgiga.com/Epaper/files/120302/final.htm


複製

了解台灣典藏計畫