Posted in Gesture, Interaction, Photo, image on Sep 13th, 2008
Hitachi 在 TechCrunch 50 上面推出 GazoPa,使用者可以用圖片來找到相似的圖片,也可以藉由塗鴉 (graffiti) 來找到類似的圖。這個是不是聽起來很熟悉? 的確,這個跟我們之前介紹的 retrievr 的概念是一模一樣,所實作的 paper 是 SIGGRAPH 2005 年的 “Fast Multiresolution Image Querying“.而且類似的概念 like.com 也有了,所以…Hitachi 這個東西創新性足夠上 TechCrunch 50 @@?
Demo 如下:
via: Gizmodo
熱門程度: 34%
熱門程度: 34%
Read Full Post »
Posted in Interaction, Photo, brain on Sep 3rd, 2008
癮科技的 Andy 寫了一篇 <眼、腦與照相>,這一篇的文章實在是太符合我的胃口了。這邊特此轉錄跟大家分享。希望 Andy 會有這種類似的專欄囉 :)======== 轉錄分隔線 ==== ====
渡邊謙& 50D (YOSHIKAZU TSUNO/AFP/Getty Images)
稍微回想一下 — 就是一秒鐘前的事 — 上面那張照片剛閃過的時候,你先看到的是什麼?科學家已經有毫無疑問的答案:渡邊謙的臉。Canon 的相機(你有看到他拿著台相機吧 @@)在這裡是剛好沾光,因為它擋到了臉的一部份,如果再拿遠一點的話,可能會完全被忽略掉也不一定。這就是科學家在研究的眼、腦與照相之間的關系的一個例子。照相真實地重現了一個人眼見到的畫面,這個瞬間,攝影師所見到的畫面被定格,永遠的存下來。所以,照相機的功能不僅是在模擬人眼看到的景像,最後的輸出,也是要給人眼看的。在了解這點後,人眼的能力與照相機的能力的比較,以及相片中的影像如何被腦部解讀就成為了一個很有趣的課題。PopPhoto.com 整理了幾點人眼和相機的不同處,以及這些不同處對照相而言所代表的意義…解析度原則上:人眼的總可視角差不多有 120 度,總計約 5 億 7600 萬畫素(576mp)。實作上:照相機的解析度(目前來說)遠遜於人眼。但人類的大腦是個很神奇的東西,會自動把解析度不足的部份自動用「補插點法」補足,因此普通 3mp 的照相機照出來的畫面顯示在螢幕上,我們也不會覺得解析度不夠。景深原則上:人眼的構造也和相機不太相同,因此不大能套用相同的理論來解釋,不過人眼的「焦段」大約在 22mm,「光圈」約為 f/3.5,視角幾近 180 度。有趣的是,人眼看到的範圍中,只有中間的 2 度左右是銳利的,其他是愈向外愈模糊。實作上:這大概也是為什麼淺景深照片一般比較受喜愛的原因。因為人眼視線範圍中只有一點點是銳利的,自然將不重要的背景做糊焦處理,會有助於將人眼的視線(那窄窄的 2 度)集中在主體上。感光度原則上:人眼的感光度是會自動調整的。晚上的時候大約在 ISO 800 左右,大白天時則大約只有 ISO 1。但又一次的,人眼的運作原理和照相機有很大的不同 — 人眼會自動將很多「格」的畫面疊加,來增強夜視能力。實作上:因此照相機可以輕易地超過人眼的 ISO 極限,就算晚上從觀景窗看出去一抹黑,用 ISO 6400 仍然能拍出照片來也說不定。動態範圍原則上:人眼的動態範圍非常廣,從正午的太陽到午夜的星星都看得見,整體算下來大約有十億比一之譜,照相機就差得遠了。實作上:技術上照相機可以用 HDR 的技術來模擬出人眼在某些環境下的高動態範圍,但即使如此,目前的呈現媒介(螢幕、照片)還是無法複製人間的動態範圍。只能說,有些真正的美景仍然是只能看在眼裡,記在心裡的。線條原則上:當畫面有線條時,人眼的視線會沿著線條走,並且短暫停留在轉角處。實作上:線條不一定要是線,也可以是色彩間的變化、或是強對比產生的線條。應用在照片上,就是多拍地平線、多拍藍天白雲的意思。如果有重要的目標,可以放在線條交叉的地方,有助於引導觀看者在目標上停留。光線原則上:科學家發現,當無法從畫面的光影判斷光線來向時,右撇子會自動認定光線來自畫面的左上方,而左撇子則會自動認定光線來自畫面右上方。實作上:反過來說,拍攝時將光線設置為從左上方打入,會看起來最自然(抱歉了,左撇子們 XD)。人臉原則上:人類是完全被「臉」制約的生物。只要視線中有臉出現,視線幾乎毫無例外地會立刻被吸引過去,判斷對方是敵、是友、還是可能的交配對象 (!?)實作上:看你是要拍什麼樣的照片囉?如果是拍景的話,那就要極力避免畫面中出現臉。如果是同時拍人和拍物的話,就要設法將物靠近臉,增加「曝光」的機會。如果實在不知道拍什麼好的話,拍帥哥正妹絕對是萬靈丹啦!視線追移原則上:如果畫面中的人眼不是對著鏡頭的話,看照片的人會自然地跟著畫面中視線的方向移動,試圖找出畫面中的人在看什麼。實作上:讓畫面中的人(如果他不是主角的話)看著畫面中的重點。如此一來看照片的人的視線,就會自然從人臉移到物體上。預期運動原則上:當人眼追蹤移動中的物體時,會自然的把視線放在移動物體的前上一點點的位置,以避免追蹤時丟失了目標。實作上:照相時在物體的前方稍微留一點白,會形成好像物體在移動的假像。–所以為什麼廠商喜歡找 Showgirl?為什麼 Showgirl 每次的 pose […]
熱門程度: 27%
Read Full Post »
Posted in Interaction, Microsoft, Photo, web on Aug 16th, 2008
在一年一度的 SIGGRAPH 盛會上面,Microsoft 展現了跟華盛頓大學合作的新版 Photosynth,在這新版的 Photosynth 當中加入了許多的新元素,包括 Lighting 的改變/針對圈選區塊做攝影機環繞/偵測攝影機的數量 (在一個環繞軌道上面的照片數量) 然後偵測出可以觀看物體的各種環狀軌道,實在太厲害了,各位可以看一下 Demo:
via: WebWare
熱門程度: 37%
熱門程度: 37%
Read Full Post »
Posted in Interaction, Photo, image, mobile on Aug 6th, 2008
IBM 最近在進行一項 Project 叫做 PENSIEVE,是要用來幫助大家來做名片管理,只要對人照一張相,然後再對名片照一張照片,就可以把 information 都 match 起來:
via: TechCrunch
熱門程度: 33%
熱門程度: 33%
Read Full Post »
Posted in entertainment, image, search, web on Aug 5th, 2008
由 Mr. Wednesday 所製作的漫畫自動產生器,很有趣,我和 Mr. Wednesday 在半年多前有討論過這個 Idea,當然強大的 Mr. Wednesday 當時就把它完成了。不過,對於僅僅 KUSO 的東西,不是我關注的部份。如何利用圖片來表達文章幫助回憶,這是我思考的部份,不過我還沒有解答。
=====
漫畫自動產生器,這是很久以前無聊時的突發奇想,剛好碰上這次有幸參與Demomo Show的活動,跟大家分享一下我的點子。
簡單來說,這是一個四格漫畫自動產生器,輸入一篇文章就會根據文章內容自動產生四格漫畫。
按這裡瀏覽簡報投影片。
系統分成以下幾個步驟處理:
從文章中找出有代表性的關鍵字:
將使用者輸入的文章利用抽詞工具將其中的關鍵字抽取出來,並利用改良後的TF-IDF概念計算每個關鍵字的分數並加以排序,找出代表性高的關鍵字(分數高的)。
找出重要的句子:
將文章拆成一個一個句子,每個句子的分數就是其中所含有的關鍵字的分數總和,排序選出最重要的四句,作為漫畫的四個字幕。
找出圖片:
將四個最重要的句子丟到Flickr與Google Image Search找出相關的圖片,選出相關的四張圖片。
將字幕與圖片結合
完成
概念上很簡單,但是許多細節的處理累積起來都會造成結果不夠理想,其中最難處理的問題就是要如何定義『好笑』這件事。
歡迎大家試玩,有任何疑問或建議非常歡迎提出來一起討論。
特別感謝Mr. Friday在百忙之中還抽空幫我去現場報告,大感謝。
熱門程度: 35%
熱門程度: 35%
Read Full Post »
在 Mr. Wednesday 的社交網站收集與研究上看到的,正如 Mr. Wednesday 所說的,這個最大的問題在於圖片的上的意義,對於一張圖片,每個人的意義可能不太一樣,因此,在用文字搜尋時,反而效率是比較低的。
=====
今天發現一個好玩的新服務,應該是由國人自行開發的部落格搜尋引擎,叫做fhkkta。
fhkkta分成白天版與夜晚版,夜晚版的介面比較有趣。輸入一個查詢關鍵字後,畫面中間就會列出搜尋結果,但是這個搜尋結果與傳統的列表式的結果 不一樣,它是利用每篇文章中的圖片作為代表並橫向排列,而且當滑鼠在各張圖片上移動時就會看到圖片放大的效果。對於內含精采圖片的部落格文章來說(食記, 遊記等),這個介面的設計還滿有用的,可以利用精采的圖片吸引讀者的目光,不過對於需要查找文字訊息的需求就比較用不上了。
熱門程度: 50%
熱門程度: 50%
Read Full Post »
Posted in Interaction, Photo, web, web2.0 on Jul 14th, 2008
我在電腦玩物上面看到的介紹,很有趣:
由「Photojojo」提供的「PhotoTimeCapsule」服務,只要妳提供自己的Flickr帳號,它就能幫你挖出3個月、6個月或一兩年前的「老照片」,然後用Email寄給妳;誰說新照片才會有驚喜,我想當妳「收到」一張一年前在某個值得回憶的地點,和某個值得回憶的人所拍的相片時,那種感動或許才是最好的心情良藥。
而我最近對回憶以及照片這件事情還蠻感興趣的。「照片 + 回憶 + Interaction」,這樣子的研究,我自以為的冠上了一個名詞,我稱之為 Memento Computation (回憶運算)。不過我不知道是否有這樣子的領域存在,但是是蠻值得研究的
熱門程度: 32%
熱門程度: 32%
Read Full Post »
Posted in Photo, social, web, web2.0 on Jul 12th, 2008
直接轉述 Mr. Wednesday 在社交網站收集與研究的描述,看起來有點像是 Flickr 的擴大版本:
這兩天不經意發現一個社會化書籤網站,Vi.sualize.us,不過它很特別,只專注在圖片的書籤。
它的呈現簡潔,操作簡單,非常好上手。這也是網站本身的訴求,在兩次點擊內就可以幫你存下圖片並在將來再度取出瀏覽,這一點處理的非常好。 Vi.sualize.us使用標籤整理圖片,沒有用分類,在首頁可以透過『最常被使用的標籤』或是『熱門瀏覽標籤』來瀏覽圖片,很web2.0的作法。
這是一個相當簡單而且實用的社會化圖片書籤網站,對於想要輕鬆收藏並且分享圖片的使用者絕對值得一試。
熱門程度: 46%
熱門程度: 46%
Read Full Post »
Posted in Interaction, Microsoft, Photo, web on Jul 8th, 2008
Kit 在 <Luis von Ahn: 人腦運算> 的回文當中跟我分享了 Microsoft 的最新研究 Asirra (Animal Species Image Recognition for Restricting Access) ,我覺得很有趣,這邊就分享給大家。主要的 idea 是認為以前的文字版 capcha 太弱,因此,他們用圖片辨認的方式來改進。由於我們對於圖片的辨認非常簡單,但是對於電腦來說卻是異常複雜的事情。實作方式是,他們跟 Petfinder.com 合作,這家網站有 300 萬張貓貓狗狗的圖片,而且每一張都標示好是貓還是狗,因此,使用者在認證的時候,必須點選方格中所有含有貓的照片,或是所有含有狗的照片。
(via: diovo.com)
值得一提的是, Petfinder.com 是專門幫流浪貓、流浪狗尋找新主人的網站,因此 MS 跟 Petfinder.com 合作還可以順便做善事,讓大家看看還未被領養的貓跟狗,如果有興趣的話,就可以直接領養了。
相關的 idea 其實有 CMU 的 PIX CAPTCHA, 主要是給你一組照片,你必須從一堆關鍵字中挑選跟這一組照片 semantic 意義相關的字。不過這樣子的方式其實準備上面很費人工,所以,準備的範例就無法很多,還是可以被暴力法破解。
另外,其實還有類似的網站,是Frozen Bear所設計的 HotCaptcha,主要 idea 是給你9張圖,你要選三個最 hot 的 girl 出來。這樣子的作法很有爭議,因為所謂的美醜主觀性質偏多,而且任意把別人的圖片拿上來評分,可說是沒什麼道德,所以這個網站理所當然的關了起來。
所以,現在我們看到 Capcha 的系統不斷地在演進,從文字進階到圖片,設計的越來越符合人性。下一個 Capcha […]
熱門程度: 37%
Read Full Post »
這一篇文章是根據之前的一篇文章 <玩遊戲,做研究> 所改寫而成。本文並可在 <密技偷偷報【密】字第肆拾號> 雜誌中看到。
2005年,一個帶著眼鏡、身材略微發福的年輕小伙子接過了卡內基梅隆大學(Carnegie Mellon University)所頒發的博士畢業證書,領取這個畢業證書是必然的,因為他的博士研究使得電腦界開拓出了一個全新的研究領域 — 人腦運算 (Human Computation)。這個年輕人的名字是 Luis von Ahn,人機介面(HCI)跟人工智慧(AI)領域的新星。
Luis von Ahn 暸解到了電腦智慧的極限,也暸解到電腦如果要模仿人類的思考的話,需要大量的資料來做訓練。比如說,如果我們要讓電腦知道什麼是狗的話,我們就必須拿出一張有狗的照片,然後把狗所在的位置給標示出來;同樣的道理,如果我們需要讓電腦理解什麼是貓的話,我們就必須給電腦貓的圖片;依此類推。然而,我們不可能聘請這麼多人來標記所有的東西,因為這樣子所牽涉到人力跟範圍將是非常地大的,而且聘用的金額將是非常昂貴。試想想,如果付錢給一個工讀生,每小時 100 塊,請工讀生來幫忙標記圖片,一個小時標記 100 張圖片,一天 8 小時,如果需要標記的圖片是數千萬張的範圍,我要請多少工讀生來做這些事情呢? 而且,我又怎麼知道他們有沒有標記錯誤呢? 我又該要花多少錢來做驗證?
對於上述的問題,Luis von Ahn 想到了解決的方法。他認為根本不需要付錢,大家就會自動來幫忙做這件事情,只要他們覺得這件事情是好玩的。這讓我想到馬克吐溫的名作 <湯姆歷險記> 裡的橋段,故事的主人翁湯姆由於被交代要將所有的籬笆上油漆,因此不能跟其他的小朋友一起去玩耍,不過聰明的湯姆想到了好方法,他讓其他的小朋友認為刷油漆是很有趣的一件事情。因此,其他的小朋友不但爭先恐後地來幫湯姆刷油漆之外,還會給湯姆玩具或是糖果,就只是為了能夠刷到油漆。
(圖片來源: ESP Game網站)
而 Luis von Ahn 借著觀察,發現許多人會在網路上面玩一些小遊戲來打發零星瑣碎的時間,因此他決定著手設計一款遊戲,這款遊戲叫做 EPS Game。遊戲規則很簡單,玩家一進入遊戲畫面,會看到一張圖,針對這張圖,玩家必須給一個關鍵字,而在網路的彼端,會有一個玩家跟你配對起來,一但你所輸入的關鍵字跟你配對的玩家一樣,那麼你們兩個就獲得分數,雙方進入下一關。當然,如果沒有沒有人跟你玩的話,就會有機器人跟你配對起來。藉由這個遊戲,Luis von Ahn 就可以讓大家在玩樂的同時取得大量有意義的配對資料,而這些跟圖片配對的關鍵字,將可以用來訓練電腦來認識圖片的內容物。
因為這一款遊戲,也讓 Google 發覺了這位超級新星,因此在 2004 年 12 月邀請他到 Google 演講;其後在他畢業之後,又邀請他到 Google 給了另外一個演講 […]
熱門程度: 54%
Read Full Post »